ウォームアップマッチでジェパディ・オールスターズがIBMのスーパーコンピュータ「ワトソン」に敗北 ウォームアップマッチでジェパディ・オールスターズがIBMのスーパーコンピュータ「ワトソン」に敗北

ウォームアップマッチでジェパディ・オールスターズがIBMのスーパーコンピュータ「ワトソン」に敗北

ウォームアップマッチでジェパディ・オールスターズがIBMのスーパーコンピュータ「ワトソン」に敗北

本日、ニューヨーク州ヨークタウンにあるIBM本社で歴史的な戦いが繰り広げられました。アメリカで最も難しいクイズゲーム「Jeopardy!」のプレビューラウンドで、元クイズ番組「Jeopardy!」のスーパースター2人(ケン・ジェニングスとブラッド・ラター)がIBMのスーパーコンピューター「Watson」と対決しました。私たちは、このスリリングな人間対機械の対決を間近で見届けることができました。

IBM創業者の名にちなんで名付けられたWatsonは、まさに驚異的なスーパーコンピュータです。クイズ番組「Jeopardy!」で競い合うという途方もない課題をこなすため、IBMは2,800基のPower7コアを搭載したコンピュータの開発に何年も費やしました。このパワーは絶対に不可欠です。多くの現代のコンピュータと同様に、シングルコアCPUでは標準的な「Jeopardy!」の質問に回答するのに約2時間かかりますが、Watsonは現在平均3秒で回答しています。

Jeopardy! の質問に答えられるアルゴリズムを開発する上での課題の多くは、問題自体にあります。これらの問題で使われる言葉は決して単純ではなく、言葉遊び、なぞなぞ、皮肉がしばしば盛り込まれています。しかし、リスクが加わることも問題です。出場者は一瞬のうちに、問題への自信を評価し、その自信と間違えた場合のペナルティを比較検討し、それらの要素に基づいて、その問題に答える価値があるかどうかを判断しなければなりません。これは人間にとっては直感的な作業ですが、Watson に同じことを行うには、非常に複雑な推論をプログラムする必要がありました。

ダン・ノソウィッツ

Watsonはある程度の自己認識力を持っています。すべての答えに正解できるわけではないことを理解しており、答えを出す前に一定の自信レベルに達しなければなりません。Watsonのロゴは自信を示す色に変わります。Watsonが自信を持っている場合、その「アバター」を構成する線は青く光り、自信がない場合はオレンジ色に光ります。

言語の気まぐれさは、質問がさまざまな方法で解釈される可能性があることを意味しているため、質問が何を尋ねようとしているのかを理解することが、ワトソンにとっての苦労の大部分を占めます。そのために、コンピューターは実際に何千もの異なる可能性のある回答を考え出し、正確さの可能性によってそれらをランク付けします。クイックマッチを見たとき、上位3つの回答と信頼度が画面に表示され、2位と3位の回答は通常、大幅に間違っていました。ワトソンが、たとえば、ある児童書の著者と別の児童書の著者を混同する可能性は低いです。ワトソンが質問が何を尋ねているのかさえ完全に読み間違え、「子供とは何か?」のような答えを出す可能性が高いです。

この初戦で、通常よりも機械的な存在であるワトソンを番組に迎え入れるために行われた調整について、いくつか学びました。質問フィードはワトソンに直接送られるため、人間の出場者のように質問を「読み上げる」必要はありません。しかし、ケン・ジェニングスやブラッド・ラターのように、ワトソンは物理的なボタンを押して電話をかける必要があり、コンピューターが持つ一瞬のアドバンテージはほぼ失われています。

興味深いことに、Watsonはインターネットに接続されないため、Wikipediaを即座に検索することはできません。(IBMの考えは、「ケン(ジェニングス)とブラッド(ラター)はインターネットに接続されていないので、Watsonも接続すべきではない」というものです。)では、このAI脳はどこから情報を取得するのでしょうか?インターネットの恩恵を受けられないIBMのエンジニアは、百科事典、シソーラス、辞書、書籍、脚本、その他人間の知識の集大成など、Watsonの情報をすべて手動で読み込む必要があります。

最終的なゲームでは音声や動画によるヒントはなくなるが、賭けが必要な質問(デイリーダブルとファイナルジェパディ)はそのまま残る。ワトソンはこれらの種類の質問に与えられたカテゴリーについてリスク分析を行うが、彼の精密な推論により賭け金はしばしば通常とは異なる金額になる(人間は本能的に 2,000 ドルを賭けるかもしれないが、ワトソンのリスク評価では 1,986 ドルを賭ける方が賢明だと示すかもしれない)。ワトソンは実際にはカテゴリー内でリアルタイムに学習する。つまり、あるカテゴリーをすぐに理解できない場合は、そのカテゴリーで 1 つか 2 つの質問が行われるまで待機し、そのデータを使用してパターンを把握する。ワトソンは競争も考慮する。負けている場合は、大きくリードしている場合よりも自信のない質問に答えるように調整するかもしれない。

IBMでWatsonのDeepQA技術の主任研究員を務めるデイビッド・フェルッチ氏に、Watsonが苦手とする点について話を聞きました。「Watsonにとって最も難しいのは、これまで文献に書かれていないことです」と彼は言いました。人の記憶に残り、雑学クイズの答えにつながるような小さな情報は、たとえ膨大なメモリバンクを備えていても、Watsonのような人工知能プログラムにとっては非常にアクセスしにくいのです。

人間の言語にも、扱いにくい要素があります。最も難しそうなもの(語呂合わせや言葉遊びなど)は、カテゴリ名に含まれる「トリガーワード」(例えば「sounds like」など)によって探知されます。しかし、同義語の方が大きな問題となることがよくあります。「この液体は脳の損傷を防ぎます」という回答の場合、Watsonは「liquid」が「fluid」と互換性があり、「cushions」が「surrounds」と互換性があることを確認する必要があります。人間は質問が何を尋ねているかを本能的に理解しますが、Watsonはあらゆる角度から分析する必要があります。

私が見たプレビューマッチはあまりにも早すぎたが、ワトソンは驚くほど好成績を収めた。ただ好成績だっただけでなく、4,400ドルを獲得し、ケン・ジェニングスの3,400ドルとブラッド・ラターの1,200ドルを圧倒して勝利したのだ。人間も機械も、実際に間違った質問をした参加者はいなかったが、ワトソンは最も早く答えを出したようだ。最も苦手だったカテゴリーは「児童書のタイトル」で、ケン・ジェニングスがほぼ独走し、ブラッド・ラターは後に「ワトソンにも私にも子供はいない」とジョークを飛ばした。

コンテストは2日間のトーナメント形式で行われ、2日間の終了時点で最も多くの賞金を獲得した参加者が優勝者となります。優勝者には100万ドル、2位には30万ドル、3位には20万ドルが授与されます。IBMはワトソンの賞金全額を慈善団体に寄付し、ケン・ジェニングスとブラッド・ラターは賞金の半分を寄付します。

巨額の賞金を懸けたこの勝負に勝利するのは誰でしょうか? 生身の人間であるワトソンは、生身の人間であるワトソンに狡猾さを与え、ワトソンに有利に働くのでしょうか? トレベックの見下したようなインタビューで、ワトソンはどんな逸話を披露するのでしょうか? (トレベックは「おそらく彼を少しからかってみるつもりだ」と語っている。) 答えは2月14日まで待たなければなりません。

ダン・ノソウィッツ