COLUMN製品コラム

ロングリードシークエンサーとは?原理やメリット・最新の研究内容

revio-product

遺伝子(DNA)に関する研究において必須とも言える技術の一つが、「ゲノムシークエンス」です。その歴史は第一世代シークエンサー技術から始まり、より高速に配列を決定する第二世代のショートリードシークエンサー技術へと進化を遂げます。そして、第三世代シークエンスとして登場したのが「ロングリードシークエンサー」です。

当記事では、ロングリードシークエンサーの概要から原理、メリット・デメリット、近年の研究内容までを説明します。

目次

1. 【基礎知識】ロングリードシークエンサーとは?

2. ロングリードシークエンサーの原理
2-1. PacBioの場合
2-2. Oxford Nanopore Technologiesの場合

3. ロングリードシークエンサーのメリット・使用目的

4. ロングリードシークエンサーのデメリット

5. ロングリードシークエンサー技術に関する研究開発
5-1. 複雑なゲノムの構造変化を解明する手法の開発
5-2. 後天的構造異常を検出するソフトウェアの開発
5-3. 植物共生微生物叢の分子基盤の解明

まとめ

まとめ

1. 【基礎知識】ロングリードシークエンサーとは?

ロングリードシークエンサーとは、1万塩基対などのようにリード長が長いDNA配列を一度に読み取れる第三世代のゲノム解読装置です。

第二世代のゲノム解読装置であるショートリードシークエンサーでは、DNAを小さい断片に切断し、各断片を個別に解読していました。しかし、ショートリードシークエンサーには、DNA断片の長さよりも長いリピート領域があったり、大きな欠損があったりしたときに正確な解読ができないという欠点があります。

ロングリードシークエンサーは、ショートリードシークエンサーのようにDNAを断片化する必要がなく、長い状態のままでDNA配列を読み取れることが利点です。リピート領域や構造的変異などを正確に分析できるため、未知のDNA配列を解読する際の手法として適しています。

2. ロングリードシークエンサーの原理

ロングリードシークエンス技術の主なプラットフォームとしては、下記の2つが挙げられます。

  • PacBioの「SMRT」
  • Oxford Nanopore Technologiesの「ナノポアシーケンシング」

以下では、それぞれのプラットフォームにおけるロングリードシークエンサーの原理を解説します。

2-1. PacBioの場合

PacBioの「SMRT」では、数百万個のzero-mode waveguide(ZMW)を含有したSMRT Cellを使用して、DNAの配列を解読します。

1個あたりのZMWには、DNA複製の働きを持つ1分子のDNAポリメラーゼ酵素が固定されていて、テンプレートのDNA分子を1分子ずつ取り込みます。DNA複製時に、蛍光標識ヌクレオチドが発している蛍光をリアルタイムで検出することにより、配列決定ができる仕組みです。
PacBioの「SMRT」は、DNAメチル化がされた塩基の直接検出もできる点で優れています。

2-2. Oxford Nanopore Technologiesの場合

Oxford Nanopore Technologiesの「ナノポアシーケンシング」は、ナノポア(数ナノメートルの微小な穴)を使用する方法です。

ポリマー製の膜に埋め込まれたタンパク質のナノポアにDNAやRNAを通して、DNA分子・RNA分子が通過する際の電流を計測します。通過する際の電流は塩基によって異なるため、計測結果から塩基配列を決定できる仕組みです。

ナノポアシーケンシングはDNAポリメラーゼ酵素による複製や蛍光標識を使用する必要がなく、素早いデータ解析ができます。

3. ロングリードシークエンサーのメリット・使用目的

ロングリードシークエンサーには、主に下記のようなメリットがあります。

・特殊な構造のDNA配列を高精度で復元できる
ショートリードシークエンサーでは、数百塩基対くらいの長さでしか計測できず、リピート配列やGCリッチな領域を正確に解読できないケースがありました。ロングリードシークエンサーは1万塩基対のように非常に長い配列を一度に読み取れるため、リピート配列やGCリッチな領域をまたいで全体を解読できます。より正確な検出が可能となり、DNA配列の復元を高精度で行うことが可能です。

・構造変異を直接的に検出できる
ロングリード配列は長い配列を切断せずに解読できるため、検出した配列と既知の配列を簡単に比較することが可能です。遺伝病やがんなどの原因となるDNA配列の構造変異を直接的に検出できます。ショートリードシークエンサーでは難しいゲノムの挙動調査も、ロングリードシークエンサーは行いやすくなっています。

・RNAシークエンスの全長トランスクリプトを解析できる
従来のショートリードシークエンサーでは、RNAの全長トランスクリプトを解析する際にスプライシングバリアントの全体像を把握しにくいという問題がありました。ロングリードシークエンサーは非常に長い塩基配列の解読にも対応可能であり、スプライシングバリアントの全体像を把握できます。RNAシークエンスで全長トランスクリプトを解析する手法に適しています。

ロングリードシークエンサーは、特殊なDNA・RNA配列の検出や、既知の配列との比較を行う際などに多くのメリットがある手法です。

4. ロングリードシークエンサーのデメリット

ロングリードシークエンサーは、ショートリードシークエンサーに比べて読み取り時のエラーが発生しやすい傾向があります。特に塩基の長さが短い場合は正確性が低くなる点に注意してください。

ショートリードシークエンサーと比べてランニングコストが高い点も、ロングリードシークエンサーのデメリットです。ただし、エラー率の高さやコスト面のデメリットは、将来的なゲノム解析技術の進歩などによって解決できる可能性があるでしょう。

5. ロングリードシークエンサー技術に関する研究開発

近年では、さまざまな大学や研究機関でロングリードシークエンサー技術に関する研究開発が行われています。最後に、ロングリードシークエンサー技術に関する研究開発の例を3つ挙げて、それぞれの研究内容や研究成果を解説します。

5-1. 複雑なゲノムの構造変化を解明する手法の開発

横浜市立大学大学院医学研究科遺伝学の研究グループは、ロングリードシークエンサーを用いて複雑なゲノムの構造変化を解明する手法を開発しました。DNAの塩基変化やコピー数多型、染色体転座・染色体破砕など、ゲノムの構造変化には遺伝性疾患の原因となるものがあります。疾患のゲノム解析にロングリードシークエンサーを用いる際、複数の個人での構造変化の比較や、複雑な構造変化を検出できる効率的な手法が待ち望まれていました。

研究では、遺伝性疾患の症状4例でロングリードシークエンサーでの全ゲノム解析を行い、新規開発の「dnarrange」というソフトウェアで構造変化を検出しました。疾患を引き起こさない構造変化をdnarrangeで除外することにより、疾患の原因候補となる構造変化の効率的な発見に成功しています。

(出典:国立研究開発法人日本医療研究開発機構「新技術ロングリード・シークエンサーで複雑なゲノムの構造変化を解明する手法を開発」/https://www.amed.go.jp/news/release_20200731-02.html

5-2. 後天的構造異常を検出するソフトウェアの開発

国立研究開発法人国立がん研究センター研究所の研究グループは、ゲノムの後天的構造異常を検出するソフトウェア「nanomonsv」を開発しました。従来、腫瘍と対照正常のペアでロングリードシークエンスデータを利用して、後天的構造異常の検出に対応できるソフトウェアはほとんど開発されていませんでした。

nanomonsvを使うと、高深度ショートリードデータで検出できる構造異常の大部分をロングリードデータでも検出可能となり、高精度での検出を達成しています。さらに、消化器系や肺のがんで見られる「モバイルエレメント挿入」の検出や、セントロメアやテロメア配列を巻き込む構造異常の検出にも成功しています。

(出典:国立研究開発法人国立がん研究センター「ロングリードシークエンスデータから複雑な後天的構造異常を高精度に検出するソフトウェアを世界に先駆けて開発」/https://www.ncc.go.jp/jp/information/pr_release/2023/0627_3/index.html

5-3. 植物共生微生物叢の分子基盤の解明

理化学研究所環境資源科学研究センター植物免疫学の研究グループは、ロングリードメタゲノム解析により、植物共生微生物叢の遺伝情報における分子基盤を解明しました。従来用いられていたショートリードシークエンサーでは、約1,500塩基対の長さがある微生物の遺伝情報全体を解読できないという問題がありました。

研究グループはロングリードシークエンサーを用いたメタゲノム解析を行い、植物共生微生物叢の基本的な分子基盤の解明に成功しています。研究によって16S rRNA遺伝子配列のうち4分の3が新種のものであり、新規の完全長染色体・プラスミド・バクテリオファージなどの配列も得られました。また、培養が難しい微生物の完全長染色体配列を得ることにも成功しています。

(出典:東京大学大学院新領域創成科学研究科「ロングリードメタゲノムによる植物共生微生物叢の分子基盤の解明-新規微生物のゲノム配列が次々と明らかに-」/https://www.k.u-tokyo.ac.jp/information/category/press/10857.html

まとめ

ロングリードシークエンサーとは、リード長が長いDNA配列を一度に読み取れる第三世代のゲノム解読装置のこと。リピート配列やGCリッチな領域をまたいで全体を解読できる点、検出した配列と既知の配列を簡単に比較できる点、スプライシングバリアントの全体像を把握できる点などが、メリットに挙げられます。

その一方で、ショートリードシークエンサーに比べるとエラー率やコストが高いことはデメリットと言えます。しかし、さまざまな研究機関がロングリードシークエンサーを使った解明手法やソフトウェアを開発しているため、今後デメリットが解消される可能性もあるでしょう。

PAGE
TOP