協調アルゴリズムにより自律ロボットがチームを組み、互いに学習できるようになる 協調アルゴリズムにより自律ロボットがチームを組み、互いに学習できるようになる

協調アルゴリズムにより自律ロボットがチームを組み、互いに学習できるようになる

協調アルゴリズムにより自律ロボットがチームを組み、互いに学習できるようになる
httpswww.popsci.comsitespopsci.comfilesimport2014robots_side_sept2010_0.jpg
自律型ロボット間の連携は、従来、高度に専門化されたタスクを伴ってきました。ミシガン大学のチームが編成した14台のロボットからなるこのチームは、2010年のマッピングコンテストで最優秀賞を受賞しました。チーム・ミシガン

先週、MITは刺激的だがやや知られていない画期的な成果を発表しました。AMPSと呼ばれる新しいアルゴリズムは、ロボットのチームをより優れた学習者に変えるものです。このアルゴリズムにより、自律システムはそれぞれの移動中に観察した内容を迅速に比較し、統合された世界観を構築できるようになります。

ロボット工学報道における最悪の誘惑、つまり機械を擬人化したいという衝動、そして個別の研究成果をより消化しやすく広くアクセスしやすいスラリーにまとめ上げたいという衝動に、私が既に屈してしまったように思われるなら、ご容赦ください。開発者たちはこれを画期的とは呼んでいませんが、このアルゴリズムはまさに画期的と言えるでしょう。

AMPS(近似的事後確率の対称性マージ、ベイズ統計分析への言及)は、7月に開催される人工知能における不確実性に関する会議で発表される。このアルゴリズムは、極めて特殊なロボット工学の問題に取り組む。機械が特定の環境で動作するには、可能な限り意味ラベルを割り当てる必要がある。これらは実質的に、認知的な近道である。つまり、蝶番と取っ手が付いた長方形の壁は、必ずしも毎回ゼロから解かなければならないパズルではない。それは開閉可能なドアなのだ。そして、意味ラベルのセットはより大きなラベルに積み重なっていく。例えば、中央に大きなテーブル(別のラベル)とたくさんの椅子(さらに多くのラベル)がある部屋に通じるドア(ラベル)は、会議室かもしれない。

このような過剰なラベル付けは、人間にとっても自律型ボットにとっても同様に重要です。しかし、人間との違いは、ラベルの作成と認識において人間は一般的により柔軟であるということです。「人間は、物事が何であるかを示す、かなり明確な語彙を持っている傾向があります」と、MITの航空宇宙工学教授であるジョナサン・ハウは言います。「私たちは、物事を全体的に一貫した方法でラベル付けする方法、あるいは周囲の他のものからラベルを拾い上げる方法を知っています。」ですから、椅子のない会議室に入っても、突然時空に漂流したような気分になることはありません。私たちはそういう意味で賢いのです。

ロボットは、比較するとかなり愚かだ。少なくとも、融通が利かない。椅子のない会議室は倉庫と間違われ、誕生日パーティーが終わって椅子を戻した後もずっとそうラベル付けされる可能性がある。ロボットを擬人化するどころか、この認知的柔軟性のなさは、ロボットがいかに非人間的であるかを思い起こさせる。そして、機械がデータセットを共有し、それぞれの経験をより大きな環境ラベルのコレクションに組み合わせようとすると、さらに多くの問題が発生する可能性がある。1 台のボットがあるエリアを会議室として登録し、もう 1 台のボットがそれを倉庫としてラベル付けした場合、どのようにして食い違いを調整するのだろうか。人間であれば大きな口とさらに大きな脳を使って意見の相違を整理できるが、ロボットは対立する頑固なラベルから抜け出せない。

AMPSアルゴリズムは、ロボットがさまざまなラベルの重要性を再考できるようにすることで、これらの行き詰まりを打破することを約束しています。「ものがどこにあるのかだけでなく、それが何であるか、何で構成されているかが重要です」とハウは言います。たとえば、会議室に椅子があることはどれほど重要ですか?そして、1台のロボットがすでに箱、キャビネット、棚を備えた保管室であると見なす場所を発見した場合、そのすぐ近くに(それらの特徴をまったく持たない)別の保管室が本当にあるでしょうか?大学院生のトレバー・キャンベルとともにアルゴリズムを作成したハウによると、その秘訣は、インターフェイスマシンがラベルの新しい優先順位を確立し、世界観を再構築できるようにすることです。椅子がある場合もない場合もある会議室を許可し、さまざまな経験を考慮してラベルを並べ替えることで、ロボットはハウとキャンベルが意味的対称性と呼ぶものを実現できます。

これは、正直に言って、まだそれほど大きな問題ではない問題に対する解決策です。自律システムは、明確に定義され、慎重にラベル付けされた製造施設の境界以外では比較的珍しく、学習するように設計されたシステムはさらに稀です。しかし、自己誘導ロボットがより一般的になり、それらがナビゲートしなければならない環境や行動がより多様化するにつれて、協調学習は大きな資産となる可能性があります。「これは、あなたが定義した最終的な目標の一つではありません。どうすればいいのかわかりません」と、常に手を上げて諦めるようなロボットを作ることではありません」とハウ氏は言います。

言い換えれば、AMPS はロボットカーなどの将来の世代の自律マシンのためのものであり、プログラマーが先見の明や準備する余裕がなかった状況に必然的に陥ることになります。たとえば、一部の都市では、日が沈むと横断歩道を渡らない歩行者があふれ、車両は大胆になった人々の間をゆっくりと進んでいかなければなりません。横断歩道で辛抱強く待っている歩行者しか見たことのない、屋根のある郊外のロボットカーは、ロボットが目新しい不可解な状況でよく行うように、急停止する可能性があります。一方、より都市ベースの自動運転車は、このような夜間の気まぐれな命知らずと低速でのリスク評価の泥沼に陥る経験を豊富に持っている可能性があります。これら 2 台のロボットが同じ信号で停止し、データを効果的に共有できれば、異なる観察結果を調和させることができるかもしれません。郊外型モデルは、麻痺状態から抜け出し(あるいはそもそも麻痺状態に陥らないようにし)、十分な注意と決意を持って前進できるかもしれない。都会派のロボットは、車文化が支配する場所での人間の行動を学ぶことで必ずしも恩恵を受けるわけではないが、見通しの悪い私道や、故障車線を猛スピードで駆け抜ける悪質な車に関するちょっとしたコツを身につけるかもしれない。

協調学習は、マシンを広範囲にわたる常時接続のネットワークに接続するなど、他の手段でも実現できます。このネットワークでは、サーバーファーム全体で衝突するラベルを処理でき、必要に応じてロボットを更新できます。また、自称「ロボット用のウィキペディア」である RoboEarth プロジェクトは、ボットがアクセスできる普遍的な知識ベースを確立したいと考えています。しかし、AMPS の利点は、オーストラリアの奥地の砂利道であれ、火星の表面にえぐられたクレーターであれ、常時ネットワークにアクセスできない場所でも機能できることです。このアプローチは、強力なバックエンドシステムを必要とせずに、ロボット間の通信に重点を置いています。本質的には、自律マシンの自律性を高め、有意義な学習の基盤を作成します。「私たちはこれを生涯学習の文脈で考えています」とハウは言います。 「つまり、ロボットはどこかで1年間も自力で活動することができ、何度も戻って質問をする必要がなくなるのです。ロボットは人間と同じように歩き回り、個別に、あるいはペアで交流し、互いに学び合う方法を見つけることができるのです。」

AMPSアルゴリズムが自動運転車に採用されるかどうかはまだ分からない。しかし、ハウ氏が指摘するように、無人運転車は情報・意思決定システム研究所(彼が所属するMITの研究センター)の主要な関心事の一つだ。より短期的な応用としては、探索または観察ベースのロボットが挙げられるだろう。このプロジェクトが海軍研究局の資金提供を受けていることを考えると、チームワークに長けた軍事システムは十分に実現可能と思われる。しかし、長期的には、協調学習はどんな種類のロボットよりも大きな意味を持つ。その可能性は、あらゆるタスクを手順を追って教えたり、関連するデータをすべて手取り足取り教え込んだりする必要のない、より自立したボットを生み出すことだ。なぜなら、ロボットを擬人化したい衝動に負けてしまうと(そして負けずにはいられない)、自動運転車はまだかろうじて立ち上がっている程度で、たまにおむつを外したくらいだからだ。