テクノロジーはデータの氾濫から軍隊を救えるか? テクノロジーはデータの氾濫から軍隊を救えるか?

テクノロジーはデータの氾濫から軍隊を救えるか?

テクノロジーはデータの氾濫から軍隊を救えるか?

米軍はデータ問題を抱えている。情報を得ることが戦いの半分だとすれば、少なくとも理論上は、国防総省が決して失うべき半分と言えるだろう。しかし実際には、軍のデータ問題は重大かつ厄介で、現在の技術革新のスピードを考えると、脅威となっている。わずか2年前までは、アフガニスタン上空で偵察任務にあたるNATO軍の航空機は常時12機程度だった。しかし今では、プレデターとリーパーの無人機が50機以上も同時に飛行し、その全てが膨大なデータを地上に送り続けている。

一方、アフガニスタンやパキスタン、アフリカの角、イラクやイエメン上空など、様々な地域で戦闘に参加するドローンが増加しています。情報収集・監視・偵察(ISR)センサーは、従来型の有人航空機に搭載されることが多くなっています。データストリームは国防総省の整理・保存能力をはるかに超え、膨大なノイズと役に立たない情報を生み出しているため、アナリストは必要な情報と役に立たない情報を選別できていません。そして、これらすべてが、リアルタイムよりも遅い情報があれば人命に危険を及ぼしかねない環境で発生しています。

「私たちはセンサーに囲まれており、データに溺れないように注意する必要があります」と、防衛技術問題解決企業MAV6のCEO兼マネージングディレクター、デイブ・デプチュラ氏は語る。デプチュラ氏がこのように発言するのは今回が初めてではなく、今後も続くだろう。デプチュラ中将は、前職で情報監視偵察担当第一副参謀長を務め、米空軍のISR戦略全体の立案と実施を担い、データの洪水が堤防を越える様子を目の当たりにしてきた。

「私たちはセンサーに囲まれており、データに溺れないように注意する必要があります。避けられない真実は、データの速度が加速しており、現在のデータ処理方法ではこの津波に圧倒されてしまうということです」とデプチュラ氏は言います。「ですから、ハイパースケールワークロードの増大する課題に対処するために、新たな方法を模索し始めなければならないでしょう。」

軍のラックスペースを単に拡張するだけでは(そしてそれがこれまでこの問題への対処戦略の大部分を占めてきた)、この洪水を鎮めることはできないだろう。国防総省に必要なのは、新たなストレージ方式だけでなく、斬新なストレージアーキテクチャ、あらゆる種類のデジタルセマンティクス、そして(極めて重要な点として)十分な量の人工知能を融合させた、全く新しい運用コンセプトである。

近い将来、コンピュータプログラムは数百、数千ものビデオストリームを同時に閲覧、タグ付け、整理、保存し、どのセンサーデータが目の前の戦闘に関連し、どのデータが即時対応を必要とし、どのデータは保存しておくべきかを判断するようになるでしょう。言語インターフェースにより、アナリストはまるで『スタートレック』から飛び出してきたかのように、自然言語クエリでデータベースを瞬時に検索できるようになります。ドローン自体もコンピュータ化された情報分析装置となり、自身のデータストリームをリアルタイムで精査し、厳選された情報だけを抽出します。これらの技術はすでに開発段階にあり、軍隊をテクノロジーの脅威から救うことになるのです。

アメリカ陸軍(ウィキメディア経由)

コンピュータに話すことを教える

自然言語でコンピューターに話しかけるというアイデアはSFの世界では広く浸透しており、iPhone 4SとそのソフトウェアアシスタントSiriの登場により、現実が理想に追いついたと言えるでしょう。実際、Siriの系譜を見れば、この種の自然言語インターフェースは常に戦闘員のために考案されたことがわかります。そして間もなく、情報分析官は、コンピューターが理解できるという確信を持って、自分のコンピューターに、そしておそらくもっと重要なのは、情報機関内の他のコンピューターに話しかけることができるようになるでしょう。

「例えば、私が非常に明確に定義された戦闘空間で情報分析官として働いているとしましょう」と、元海兵隊情報将校のトニー・バレット氏は語る。「私は海兵隊に所属していますが、隣には陸軍部隊があり、彼らは全く異なるシステムを使ってデータを分類・保管しています。しかし、彼らは私の戦闘に関連する情報を持っており、私も彼らの戦闘に関連する情報を持っています。問題は、彼らが自分にとって重要なデータを持っていることが明確にわかるように、どのようにデータを関連性のあるものにするかということです。」

バレット氏は現在、フロリダに拠点を置くソフトウェア開発会社Modus Operandiのシニア事業開発マネージャーを務めている。同社は国防総省の膨大なデータ整理を効率的に支援している。しかしバレット氏もDeptula氏と同様に、自身の疑問の答えはストレージソリューションの域を超えていることを理解している。Modus Operandiをはじめとする企業は、機械と人間が共通の言語を共有できる自然言語処理とテキスト分析の開発に奔走している。

機械に人間のように話すことを教え、自然な人間の話し言葉を理解させることができれば、軍や諜報機関のデータベースに蓄積された情報に、全く新しいレベルの意味を付与できるようになります。そして、そのようなシステムで関連データを呼び出すのは、Siriで最寄りのスターバックスに電話するのと同じくらい簡単になります。アナリストはただ尋ねるだけで済むのです。

「ソフトウェアはユーザーの発言から認知の飛躍を起こします。つまり、発言を翻訳し、語彙とその背後にある意味を理解し、適切な結果を返します」とバレット氏は言います。「『アブ・バカールが最後に目撃された場所を教えてください』と平易な言葉で検索ワードを入力すると、そのリクエストの言語、オントロジー、文法が翻訳され、意味が付与されます。同じことがもう一方の側でも起こり、使いやすく関連性のある形でユーザーに返します。」

つまり、アナリストはメタデータタグに関連付けられたキーワードを入力するのではなく、コンピュータを使って会話をしているのです。共通の自然言語があれば、データ間の関連性がより明確になり、検索が高速化し、異なるシステムやデータベース間の壁がなくなり、企業全体の効率が向上します。

アメリカ空軍写真/ウィキメディア経由、レスリー・プラット中佐

コンピュータに見ることを教えよう

コンピュータと人間が互いにより良く連携できるように訓練すれば、データの保存と検索は向上するが、そもそも分析が必要な生データの量という根本的な問題には対処できない。こうしたデータの多くはドローンなどの航空機から撮影された動画であり、アナリストは何時間もかけて映像を視聴し、動画データを分類し、関連性の高い情報が得られることを期待している。軍が無駄な労働時間を削減し、情報分析をリアルタイムに近づけたいのであれば、コンピュータに「見る」方法を教えなければならないだろう。

言うは易く行うは難しです。人間が瞬時に行う動作、つまり物体を視認し、識別し、評価することは、ソフトウェアにとって極めて困難です。人間の脳は、膨大な量の事前知識を物体に瞬時に関連付けることができます。一方、コンピューターはピクセル、つまり様々な輝度値のマトリックスを視覚化します。物体認識アルゴリズムは急速に進化していますが、コンピュータービジョンは人間の目に比べるとまだかなり原始的なものです。

しかし、こうしたビデオはデータ問題の大きな部分を占める一方で、コンピュータービジョンの観点からも役立つと、ソフトウェア開発会社Kitwareのコンピュータービジョン担当ディレクター、アンソニー・フーグス博士は述べています。Kitwareは現在、DARPAのビデオ画像検索・分析ツール(VIRAT)プログラムのフェーズIIを主導しており、国防総省のデータ問題の解決に役立つ可能性のあるビデオ分析ツールを開発しています。

「動画はかなり役に立ちます」と、フーグス氏は今年初めのPopSciのインタビューで語った。「動画には重要な手がかりとなる動きがあります。動きは比較的簡単に検知でき、対象物が何であるかを知らなくても検知できることがわかりました。何かが動いている場合、その対象物がある場所、あるいは以前あった場所の輝度値が変化します。これは比較的簡単に検知できるのです。」

フーグス氏はVIRATやDARPAのコンピュータービジョン研究の現状について直接語ることはできませんが、VIRATプログラム自体を見れば、今後の方向性が見えてきます。VIRATは、リーパーやプレデターといった無人航空機(UAV)からの映像に焦点を当てており、建物を出入りする人や、ある場所から別の場所へ移動する車両といった行動を認識する能力に重点を置いています。つまり、VIRATは映像を迅速かつ自動的に精査し、特定の動きを見つけることを目的としています。そして、その動きを検知するとタグ付けすることで、アナリストの膨大な時間を節約します。

もちろん、コンピュータービジョンの機能はビデオデータの量と並行して加速しています。「ビジョンアプリケーションの数は指数関数的に増加しています」とフーグス氏は言います。機械がデジタルデータを解析する能力が向上するほど、情報機関に流れ込むデジタルビデオを分類し、関連性を付与する能力も向上します。近い将来、ドローンは特定の顔や車両を認識・追跡し、特定の人物が移動中や人混みの中で目撃された際にアナリストに警告を発するようになるでしょう。しかし、そのデータはすべて、まだどこかに送らなければなりません。

アメリカ空軍

オンザフライで分析

「ビデオ処理は、コンピューターのパワーによって真に実現可能になったものの一つです」とフーグス氏は言います。「ビデオ(コンピュータービジョン)が本格的に普及したのは90年代半ばでした。当時、デジタルビデオは珍しかったからです。デジタルビデオと、それをある程度効率的に処理する能力は、より大型のコンピューターと、より大容量のコンピューターディスクによって可能になったのです。」

しかし、リーパーやプレデターのようなペイロード容量が限られた無人航空機(UAV)の場合、大型のコンピュータやストレージアーキテクチャは問題となります。現在、軍は処理能力を超える量のデジタルビデオを保有しており、センサーの軽量化と堅牢化に伴い、ドローンはより多くのデータをより高解像度で地上ステーションにストリーミング送信しています。データ収集地点と地上のエンドユーザーとの間のデータダウンリンクがボトルネックとなっています。

スーパーコンピュータを搭載できる航空機は、機内でリアルタイムにデータを処理できる。デプチュラ氏が考える解決策の一つは、役に立たないデータの95%を上空に留め、最も関連性の高い情報のみをダウンリンクすることだ。つまり、データ処理をオンザフライで実行するのだ。スーパーコンピュータを搭載できる航空機は、機内でリアルタイムにデータを処理でき、タグ付け、整理、保存を逐次行うことができる。こうすることで、複数のアナリストが地上から機内データベースに同時にアクセスし、必要な前処理済みデータのみをオフロードできるようになる。テラバイト単位の生データがダウンリンクされて地上で処理されるのを待つ必要はない。

まさにこれが、DeptulaとMAV6が空軍に提供しようとしている能力です。MAV6のブルーデビル飛行船は、現在アフガニスタンの情報分析官を悩ませているデータ過剰への潜在的な解決策として、米空軍との8,620万ドルの契約に基づき開発されています。スピードはそれほど速くありませんが、ブルーデビルは長時間のISRミッション(有人または無人)に対応し、強力なセンサー群を搭載し、リーパードローンなどの他のISR機能との連携が可能です。

しかし、鍵となる革新は搭載されているスーパーコンピュータです。シングルコアサーバー2,000台相当の容量と500テラバイトの不揮発性メモリを搭載し、収集された情報を即座に処理・分類することができます。このデータをリアルタイムで処理し、最も関連性の高い情報のみを抽出してダウンリンクする能力により、地上の意思決定者に有用なデータが届くまでの速度が飛躍的に向上し、データ過剰の一因となるノイズを大幅に削減できます。

アメリカ空軍

すべてを結びつけ、人間を再び巻き込む

飛行船搭載型スーパーコンピュータモデルは、プレデター無人機単体には対応できないのは明らかです。プレデター無人機には、独自のオンボードプロセッサスイートを搭載するスペースや容量がないからです。しかし、コンピュータ言語とコンピュータビジョンがより堅牢になり、ストレージアーキテクチャが小型化し、ISRプラットフォームが将来のニーズに合わせて変化するにつれ(そしてこれらはすべて既に起こりつつあります)、近い将来、軍がデータ問題の解決に再び取り組む日が来ることは容易に想像できます。そうなると、問題は、軍と諜報機関が機械の信頼性と人間の意思決定の適切なバランスを見つけ、両方を最大限に活用できるようにすることです。

「人間を常にループの中に入れておくべきだと常に言っています」と、Modus Operandiのバレット氏は言います。「常に判断を下さなければならない場面があります。しかし、ポップカルチャー全体を見渡し、人工知能の継続的な発展を見ると――コンピューターがクイズ番組「Jeopardy」で勝利するのを見ると――途方もない可能性が秘められていることに気づきます。」

人工知能(AI)は、将来のISR(情報偵察・偵察)の実現に不可欠な要素です。将来のドローンは、これまで以上に多くのセンサーデータを収集し、それらをほぼリアルタイムで処理し、戦闘に関連する情報を特定して即座にダウンリンクし、人間の注意を引くことができるようになります。残りの情報はメタデータでタグ付けされ、慎重に保管され、人間のアナリストが後から簡単な言語クエリで呼び出せるようになります。

言い換えれば、私たちは多くの作業と、いくつかの低レベルの判断を機械に大きく依存することになるだろう。人命が危険にさらされている状況では、このようなテクノロジーへの依存は問題となるかもしれないが、データが氾濫する戦場においては、ほぼ唯一の前進の道と言えるだろう。

「世界が誕生してから2003年までの間に、5エクサバイトもの情報が生み出されました」とデプチュラ氏は言います。「今では2日ごとに5エクサバイトもの情報が生成されており、そのペースは加速しています。ですから、この大規模データの問題は深刻であり、これまでと同じ方法でデータ管理を続けていても解決には至りません。」

その観点からすると、テクノロジーは米軍をテクノロジーから救うことができるだけでなく、おそらく唯一の希望でもある。