プロジェクト・エンコードに関するドラマ、そして大規模科学と小規模科学の違い プロジェクト・エンコードに関するドラマ、そして大規模科学と小規模科学の違い

プロジェクト・エンコードに関するドラマ、そして大規模科学と小規模科学の違い

プロジェクト・エンコードに関するドラマ、そして大規模科学と小規模科学の違い

もしすべての新しい論文要旨がダン・グラウアー氏の最新の論文のように読めるなら、人々はTLCのリアリティ番組など必要としなくなるだろう。研究論文から望むドラマをすべて得られるのだ。グラウアー氏の新しい論文は、大々的に宣伝されたゲノム科学プロジェクトを批判するもので、堅苦しく、典型的には礼儀正しい科学文献の世界に、かつてないほど激しい言葉が使われている。

電話でのグラウル氏も、同じように率直にこう語った。「彼らのデータ分析はひどい。ひどい。これは科学ではない」

経緯はこうです。DNA要素百科事典(ENCODE)プロジェクトは、数百人が参加した5年間の取り組みで、ヒトゲノムのいわゆる非コード領域、つまり「ジャンク」領域の機能を解明しようと試みました。昨年9月にこのプロジェクトが発表された際、プロジェクトを率いた科学者たちは、ゲノムの仕組みに関する数十年にわたる仮説を覆し、教科書の書き換えにつながると主張しました。ゲノムの大部分は生物学的に活性であり、機能的であると彼らは主張しました。しかし、多くの進化生物学者は、この説明と「機能」という言葉の曖昧な定義に憤慨しました。

「マーケティング、マスメディアの誇大宣伝、広報を扱った多くの教科書は書き直さなければならないかもしれないということに我々は同意する」とグラウアー氏とその同僚は雑誌「ゲノム生物学と進化」に書いている。

ヒューストン大学の分子進化バイオインフォマティクス教授であるグラウアー氏は、進化生物学者から多大な不満を招いた遺伝学およびバイオインフォマティクス研究者の世界的コンソーシアムに対する激しい反論の筆頭著者である。

「ヒトゲノム計画のような大規模科学はデータを公開すべきだ。小規模科学は分析を行うべきだ。」主な不満の一つは、Encodeの著者が計算科学者であり、生物学者ではないということだ。「彼らはコンピューターオタクだ」とグラウアー氏は言う。「ヒトゲノム計画のような大規模科学はデータを公開すべきだ。小規模科学は分析を行うべきだ。」

進化生物学において、「機能」という言葉には重みがあります。臓器、DNA片、細胞は、選択された機能と因果関係のある機能を果たすことができます。簡単に言えば、選択された機能は進化上の利点をもたらすものであり、因果関係のある機能はそうではありません。グラウアー氏は論文の中で、人間の心臓を例に挙げています。心臓の進化上の機能は体内に血液を送り出すことです。因果関係のある機能は音を出す能力です。ちなみに、これは医師やパーソナルトレーナーにとっては役立ちますが、心臓の主要な機能ではありません。

ヒトゲノムを教科書に例えると、Encode はすべてのヌクレオチドが何をしているのかについての洞察を提供することを目的とした脚注のようなものだ。Encode は、遺伝子とその調節領域を構成する A、C、G、T ヌクレオチドを合わせた 32 億すべてに注釈を付ける。Encode の論文では、このようにして機能を緩く定義し、DNA が行うことすべてを含めた。研究によると、DNA の大部分は、少なくとも 1 種類の細胞で少なくとも 1 つの「生化学的イベント」に関与しており、これを機能とみなしている。しかし、この定義はせいぜい自由主義的で、プロジェクトの目標ですらなかったと、セントルイスのワシントン大学のシステム生物学者マイク・ホワイト氏は述べた。ホワイト氏は Encode の誇大宣伝を批判しながらも、(グラウアー氏とは異なり) 科学に対するその価値を称賛している。むしろ、Encode の目的は、ゲノムの生化学的特徴を包括的に測定し、科学者がその測定を試みることだったのだ。

「これらの特徴は、他の科学者が実際に機能領域を発見するのに役立つだろう」と彼は語った。

ウィキメディアコモンズ

生化学的機能には、RNAに転写されるDNA配列、遺伝子のオンオフを切り替える調節タンパク質によって束縛される領域、細胞内でDNAを包むクロマチンにしっかりと包まれていない領域など、幅広い活動が含まれます。(これらの生物学的機能の詳細な説明については、機能これらのアクティビティについて詳しくは、Scientific American の化学者兼ブロガーの Ashutosh Jogalekar による詳細な分析をお読みください。) 重要なのは、これらが何かを実行するという意味では「機能」であることは事実ですが、実行していること自体が必ずしも意味のあるものではないということです。

グラウル氏は電話でこう説明した。「チューインガムを踏んだことはありますか? 靴の底にくっつきます。でも、暑い日に靴にくっつくのはチューインガムの役目ではありません。」

ホワイト氏は、これらの活動は機能と関連付けられる可能性があるものの、必ずしも機能と関連付けられるとは限らないため、測定に有用だと述べた。機能を確立するのは難しく、より多くの作業が必要だと彼は述べた。

ホワイト氏は自身の研究室で、ゲノム上の約1万箇所のDNAに結合し、遺伝子のオンオフを制御する特定の調節タンパク質を研究しています。彼は、この結合が遺伝子活性化に関係しているかどうか、そしてこのタンパク質が細胞内を漂いながらゲノム上をどのように移動するのかを解明しようとしています。1万箇所の結合はそれぞれ機能的なものである可能性もあれば、タンパク質がショットガンアプローチをとる際に非特異的な「ノイズ」DNA結合が生じる可能性もあるでしょう。あるいは、何か他のことが起こっているのかもしれません。

「その疑問を解決するには、Encodeデータが役立ちます。ゲノム上で制御タンパク質が結合する領域のリストを持っているので、それらを検査することで、特定のDNA特性が遺伝子を活性化し、他のDNA特性が活性化しないのはなぜなのか、という洞察を得ることができます」と彼は述べた。「Encodeデータから、まさにそのような発見が生まれるのです。」

他の生物学者もこのデータの使用を喜んでいるものの、データの提示方法には依然として不満を表明している。エディンバラ大学ロスリン研究所のARK-Genomics所長、ミック・ワトソン氏はブログ記事で、Encodeの定義に同意できないと述べている。

「しかしながら、科学は他の多くの分野と同様に、反対意見を持つ人々を必要とし、彼らから恩恵を受けていることを私は理解しています。機能性に関するあなたの見解は確かに私の見解とは相容れません。しかし、少なくともあなたが成し遂げたことは、このテーマに関する議論を刺激し、すべての人にとって有益なことです」と彼は記し、グラウアーの論文は若い科学者にとって悪い例を示していると付け加えた。

グラウアー氏はこの研究について、データ分析をはじめとするいくつかの問題点を挙げている。彼は、Encodeのアナリストや研究者の多くが生物学者ではなくコンピューター科学者であることを嘆き、声を上げなければならないと感じたと語った。その後、学生、ポスドク、そして他の若手研究者から、論文の出版に感謝の声が上がっているという。

「多くの人がその論調に異議を唱えますが、実際には論調こそが重要なのです。私は教授であり、終身在職権を持っています。…時には、私のようなベテランでないと、そういうことはできないのです」と彼は言った。「科学とは仮説を提示し、それを反証することです。データに取り組んで分析している人の多くは、そのことを忘れてしまっています。」

ホワイト氏も、一部の寄稿者に進化生物学の知識が不足していること、そしてそれが科学者が研究結果を誇張していたことによる誇大宣伝の一因となった可能性があることに同意した。また、それが反発や根強い憤りの一因にもなっている可能性があるとホワイト氏は述べた。

「異なる分野から来た人が自分の分野について大まかな発言をし始めると、人々は憤慨するが、彼らはその分野について何も知らず、その大まかな発言は間違っている」と彼は語った。

「これほど怒りに満ちた論文が修正なしに通過したことには少し驚いています。あからさまに扇動的な発言で、少し行き過ぎた部分もありました。しかし一方で、その怒りも理解できます。私たちの多くが本当に怒っていたのです」と彼は述べた。「さて、このデータは役に立つのか、そして、これを基に真の研究を発表し始めるのかを見極める必要があります。どうなるか見守るしかありません。」