人工知能は今やポーカーテーブルを支配するようになり、Facebookがすべてのカードを握っている 人工知能は今やポーカーテーブルを支配するようになり、Facebookがすべてのカードを握っている

人工知能は今やポーカーテーブルを支配するようになり、Facebookがすべてのカードを握っている

人工知能は今やポーカーテーブルを支配するようになり、Facebookがすべてのカードを握っている

人生における競争的な状況をチェスゲームに例えたことがあるなら、ポーカーの方がより適切な比喩かもしれません。チェスは2人対戦で、両プレイヤーは共通の情報にアクセスできます。これは「完全情報」ゲームとして知られています。しかし、現実の世界はそうではありません。よくあるけれど複雑なシナリオを考えてみましょう。ある企業が誰かを採用しようとしていますが、その候補者が他にどの企業と面接を受けているか、あるいは他にどのようなオファーを受けているかを知りません。これはチェスというよりポーカーに近い状況です。面接を受ける側は自分のカードを隠しておき、自分の手札の強さについてブラフをかけることさえあります。

このような状況が人工知能研究の原動力となっています。コンピューター科学者たちは、複数の隠れた変数が存在するシナリオでもアルゴリズムが成功することを望んでいます。同様の流れで、FacebookのFAIR(Facebook AI Research)という部門とカーネギーメロン大学は、ポーカーにおいて「超人的」なAIを開発しました。そして、このような技術は、ゲームテーブルの仮想的なフェルトをはるかに超えた影響を与える可能性があります。

「6人制ノーリミット・テキサス・ホールデムの世界最強プレイヤーです」と、FAIRの研究科学者ノーム・ブラウン氏は、同社のAIポーカーの達人について語る。

ソフトウェアは、チェス、チェッカー、囲碁などのゲームで既に優れた成績を収めています。AIは既に2人対戦のポーカーで勝利を収めていますが、今回の画期的な点は、「Pluribus」と呼ばれる新しい人工知能システムがマルチプレイヤーゲームで圧倒的な勝利を収められることです。Pluribusに関する研究は、本日、 Science誌に掲載されました。

人間と同じように、AIは手札が弱い場合はブラフをかけることができます。「予測不可能な戦略を駆使することに集中しているのです」とブラウン氏は言います。「AIは、良い手札を持っている時だけベットすれば、相手はフォールドするだろうと分かっているのです。」

AIはブラフを嘘とは見なさず、相手が弱い手札を持っていてもフォールドさせる戦略だと認識します。「同様に重要なのは、ボットは相手がベットした際に強い手札を持っていない可能性があることを認識できるということです」と彼は付け加えます。つまり、ボットはコールすべきかもしれないということです。

ボットは人間の行動を見て戦略を変えようとはせず、「固定された戦略」を貫くだけだ。Facebookはこれをテストするために、このAIを15人のポーカーのプロプレイヤーと対戦させ、12日間で数千ハンドをボットと対戦させた。「対戦相手はボットに効果的に適応する方法を見つけることができていない」とブラウン氏は言う。「彼らはボットがつけこむ弱点を見つけられていないのだ」。これほど優れたAIになるために、このAIは8日間、自身のコピーと対戦した。

「私はボットをテストした最初期のプレイヤーの一人だったので、初期バージョンを見ることができました」と、プロポーカープレイヤーのダレン・エリアス氏はFacebookが提供した声明の中で述べています。「ボットは、数週間で、倒せる程度の平凡なプレイヤーから、世界のトッププレイヤーと渡り合えるプレイヤーへと成長しました。」もう一人のプレイヤー、ジェイソン・レス氏は、「最善を尽くしましたが、ボットを悪用する方法を見つけることはできませんでした」と述べています。

AIはこれらすべての変数に対応できるため、より実用的なシナリオへの展開が期待できます。「AIを現実世界に導入するには、世界のこうした側面に対応できなければなりません」とブラウン氏は言います。「私たちはその方向へ大きく一歩踏み出しています。」

カーネギーメロン大学のコンピュータサイエンス教授で、今回の研究論文の主任著者であるトゥオマス・サンドホルム氏によると、ポーカーは1970年以来、AIコミュニティにおける不完全情報ゲーム(一部の情報が他者から隠されている競技)の世界で主要なベンチマークとなってきたという。「現実世界の多くのアプリケーション(全てではないが、多くのアプリケーション)は、2人対戦のゼロサムゲームではないことは明らかです」とサンドホルム氏は言う。

複数当事者間の交渉やオークションを、無敵のポーカー スタイルのボットがそれを導入する当事者にとって重要な資産となるシナリオとして考えてみましょう。

ブラウン氏は、人間がポーカーアルゴリズムの弱点を見つけられなかったという事実は、現実世界でこのようなAIボットを使用する上で重要だと述べています。「AIシステムを大規模に展開する場合、そこに弱点があれば、誰かがその弱点を見つけるでしょう」と彼は言います。「そして、悪用されないAIが必要です。」