
多くの著名な科学者がWikipediaのページを持っています。しかし、特定の人物がWikipediaのページを持っているかどうかはGoogle検索で簡単に確認できますが、Wikipediaに掲載されるべきなのに掲載されていない人物を見つけ出し、その人物のために記事を書くのははるかに困難です。
例えば、クリスティーナ・エコノモスという名前を聞いたことがある方も、そうでない方もいるかもしれません。彼女はタフツ大学の教授であり、ニューバランスの小児栄養学科の教授でもありますが、Wikipediaには彼女に関するページがありません。しかし、Wikipediaのページがない一方で、Primerという会社が作成したウェブサイトには、彼女の職業について簡潔にまとめた記事が掲載されています。この短い記事は、将来本格的なWikipedia記事になる可能性を秘めていますが、QuicksilverというAIシステムによって作成されたものです。
このプロジェクトの根底にある考え方は、AIを出発点として活用することです。人間はAIを活用することで、Wikipediaのページを作成できる可能性があります。AIは、Wikipediaのページを作成していないが、作成する資格のある科学者のために役立ちます。例えば、エコノモスのPrimerページには、彼女について言及しているCBSボストンの記事へのリンクがあります。これは、彼女の記事を作成したいと考える人間のWikipedia編集者にとって、良い情報源となる可能性があります。
Primerは昨年正式にローンチされ、AIを用いて情報を読み取り、レポートを生成します。その焦点の一部は、諜報アナリストが行うような業務です。顧客にはウォルマートや、In-Q-Telという組織を通じて米国政府などが含まれます。人工知能は通常、学習するためのデータを必要とします。そのため、このプロジェクトでは、Primerは約3万件の既存の科学者に関するWikipediaページを用いて機械学習システムを学習させました。
次に、20万人の名前と関連する雇用情報をAIシステムに入力しました。これらの名前は、アレン人工知能研究所からPrimerに提供された、コンピュータサイエンスと生物医学研究を専門とする科学論文の著者リストに載っていたものです。
「それがQuicksilverへの入力でした。入力して家に帰るだけで、あとは実行しただけです」と、Primerの科学ディレクター、ジョン・ボハノン氏は語る。「一夜にして4万人もの新たな人材を生成したのです。」
もちろん、システム全体はそれよりも複雑です。まず、AIシステムは曖昧性解消(おそらくWikipediaで見たことがあるような奇妙な用語です)を行う必要があります。この場合、システムが同じ名前を持つ2人の人物を混同しないようにすることを意味します。また、各科学者についてより詳しく知るために、大量のニュースソースを読み込みます。「人物のモデルを構築するのです」と彼は言います。
また、ニュースをスキャンして各名前を探す際に「イベント検出」も行います。これは、ニュース文書を「それぞれの塊が現実世界の出来事を説明しているように見える」塊に整理することを意味します。この「ニュースイベント」とは、科学者がメディアの注目を集める研究を発表し、それがWikipediaの記事に掲載される価値があるかもしれない場合などです。
このプロジェクトのもう一つの側面は、女性科学者がWikipediaで正当な評価を受けやすくすることだ。人間の編集者に権限を与え、「科学界における女性の代表性における男女格差をなくす」ことだとボハノン氏は言う。その実現方法の一つとして、女性科学者に焦点を当てたWikipediaページをもっと作りたいグループが、Quicksilverのデータを利用することが考えられる。ボハノン氏によると、Quicksilverは性別でフィルタリングできるという。
「私たちの目標は、ボットにWikipediaを書かせることではありません」とボハノン氏は言います。そうではなく、新しいページを書いたり、古いページを更新したりしたい人のための出発点となるのです。Quicksilverの出力結果のサンプルをご覧になりたい方は、こちらのページをご覧ください。AIが生成したWikipedia風の宣伝文句の例が100件掲載されています。