
毎秒9600兆回の演算能力を持つテキサスのスーパーコンピューターが、シベリア中南部のマルタで2万4000年前に死亡した少年の骨を調べることで、遺伝学の難問を解決した。
既存の遺伝子モデルは、現代ヨーロッパ人が3つの異なるグループとDNAを共有していることを示唆しています。1つは、約4万年前にヨーロッパに到着した青い目と浅黒い肌の狩猟採集民、もう1つは、約7000年前に近東から移住してきた、肌の色が薄く茶色い目の農民グループ、そして3つ目は、より最近になって到着し、遺伝子を共有している謎のグループです。しかし、この「幽霊集団」が誰なのかは誰も知りませんでした。
論文の共著者であるハーバード大学のデビッド・ライヒ氏と彼のチームは、この古代の少年のゲノムデータをテキサス大学オースティン校の9.6ペタフロップスのスーパーコンピューター「スタンピード」に入力することで、少年の「古代北ユーラシア人」のグループが確かに失われた集団であるという説を確認することができた。
初期のヨーロッパに住んでいた「幽霊人口」とは誰だったのでしょうか?
「彼らは、交配と集団の分岐に関する非常に複雑なモデルを構築してきました」とワシントン大学のゲノム科学の博士研究員であるジョシュア・シュライバー氏は言う。同氏は古代人9人のゲノムコンピューター解析を行い、それをPOPRESとして知られる現代ヨーロッパ人2,345人のゲノムデータベースと相互参照した。
輝くデータの塊
24,000 年前の骨から、ダウンロードに 1 週間かかるほどの大規模なスーパーコンピュータ対応データ セットを作成するにはどうすればよいでしょうか。
最初のステップは、古代の骨に穴を開け、その粉末の中に分析に十分な量の古代DNAが含まれていることを祈ることです。DNAは高温多湿の環境では急速に劣化するため、今回の研究で使用された古代DNAサンプルがドイツ、ルクセンブルク、スウェーデン、シベリアといった寒冷地から採取されたのは偶然ではありません。(実際、科学者たちは抽出したDNAをマイナス80度の冷凍庫で保管することを好んでいます。)
「ロシュブール(ルクセンブルク)、ドイツのシュトゥットガルトの洞窟、そしてマルタから、本当に素晴らしいサンプルが集まっています。亡くなった人のDNAがかなりの割合で含まれています」とシュライバーは言う。「内因性DNAを多く含む骨が見つかるまで検査を続けます。そして、もしそのような骨が見つかったら、嬉しくてビールを一杯飲みます。たまには幸運に恵まれることもあるんです。」

サンプルが大量にあるということは、ソフトウェアが古代人の DNA を見た目が全く異なる真菌や細菌の侵入者から簡単に選別できることを意味します。
2010年にネアンデルタール人のゲノム概略が初めて解読されて以来、ハイスループットシーケンシングマシンは遺伝子解析に革命をもたらしました。「膨大な量の分子を一度に解析できるということは、たとえ特定のサンプルに含まれる古代人のDNAがわずか1%であっても、サンプル数は膨大になることを意味します。つまり、それは膨大な数の1%に相当します。そして、そこから実際にゲノムを再構築できるのです」とシュライバー氏は言います。
しかし、高スループットのシーケンシングマシンは、エラーが発生しないことを確認するため、通常、特定のヌクレオチドを10~30回サンプリングするため、膨大なデータ量になります。研究者たちは、ファイルをウェブ経由で送信するよりも、2テラバイトのハードドライブを郵送でやり取りする方が迅速であることを発見しました。
そこでスーパーコンピュータの出番が来た。シュライバー氏の仕事は、膨大な、様々な形式のデータセットを「ビーグル」と呼ばれるDNA解析プログラムに詰め込むことだった。そして、古代人と現代人の間に相互関係があることを示す統計的に有意な証拠を探す必要があった。
完全なヒトゲノムは約30億塩基対から成り、個人間で数百万もの部位が異なります。各個人のゲノムデータを他のすべての個人と比較する必要があったため、シュライバーはコンピュータ科学者が通常可能な限り避けようとするようなアルゴリズムを使用せざるを得ませんでした。コンピュータ演算の回数は時間の経過とともに2乗的に増加し、テストデータのNサンプルごとにN^2回の演算が必要になりました。シュライバーとビーグルは、プログラムを数日間実行し、一度に最大100GBのRAMを使用しました。
幽霊は別の大陸から来たのか?
膨大な計算力と洗練された集団分岐モデルにもかかわらず、チームが第 3 の祖先集団を突き止めるという発見の瞬間には、幸運も必要でした。
シュライバー氏によると、研究中、ライヒ氏とハーバード大学の同僚イオシフ・ラザリディス氏は、一部のアメリカ先住民のDNA配列と非常によく似たDNA配列を含む「幽霊集団」の暫定モデルを使用していたという。
「デイビッドとイオシフは、ネイティブアメリカンのゲノムに近いものが現代ヨーロッパ人の祖先集団の1つであれば、数学的に物事がよりよく当てはまることに気づいた」
同じ頃、2013年11月にコペンハーゲンの科学者が率いるチームがマルタの少年のゲノムに関する論文を発表し、この少年はアメリカ先住民とDNAの遺伝的特徴を共有していると結論付けた。
マルタの少年のDNAをモデルに組み込むと、研究チームはDNAの一致を確認しました。その結果は9月にNature誌に掲載されました。現代ヨーロッパ人は、この北ユーラシア人集団と少なくとも一部のDNAを共有していました。北ユーラシア人集団は、約1万5000年前に凍土の橋を渡ってアメリカ大陸に移住した先祖のアメリカ先住民と近縁です。古代北ユーラシア人は現代アメリカ先住民の祖先であるだけでなく、現代ヨーロッパ人のDNAの最大20%も提供していました。
過去を解き明かす
「幽霊個体群」がいつ、どのようにしてヨーロッパに移住したのかを解明するための追加研究が進行中で、来年には答えが出ると期待されている。
最先端のDNA抽出技術、ハイスループットシーケンシングマシン、そして豊富なスーパーコンピューティング能力の強力な組み合わせにより、人類の起源に関する膨大なデータが生み出されています。また、かつては手の届かないと思われていた遠い過去に関する発見も可能になっています。
数週間前、コペンハーゲン大学地質遺伝学センターのチームは、ロシア南部コステンキで発見された3万7000年前の男性のDNAを復元しました。これは、これまでに収集されたヨーロッパ人ゲノムとしては最古のものです。また10月には、ドイツ・ライプツィヒのマックス・プランク研究所のチームが、西シベリアで発見された4万5000年前の初期人類「ウスチ=イシム」の内因性DNAの配列を解析しました。これは、これまでに作成された初期人類の遺伝子記録としては、はるかに古いものです。
今のところ。