
Googleストリートビューの画像は車で溢れています。これは単純で当たり前の事実ですが、人工知能(AI)の研究者たちはこの事実を利用して驚くべきことを成し遂げました。彼らは車の種類を分析することで、研究対象都市の住民の人口統計情報を予測することに成功したのです。
例えば、スタンフォード大学を中心とした研究チームは、ある都市でピックアップトラックとセダンのどちらが多いかを分析しました。ピックアップトラックが多い都市部では、共和党に投票する確率が82%、セダンが多い都市部では民主党に投票する確率が88%でした。
人工知能システムは、膨大な量のデータを処理し、そこに何が写っているかを予測する際に真価を発揮します。今回のデータとしては、Googleストリートビューから200都市の5000万枚以上の画像が使用されました。研究者たちは、これらの画像から物体認識技術を用いて、画像内の物体から自動車を識別しました。そして、これらの車両(米国の自動車総数の8%に相当、実に2200万台)をメーカー、モデル、年式で分類する必要がありました。そのために、ニューラルネットワークと呼ばれるAIツールを訓練し、車両を識別させました(具体的には、画像処理に優れていることで知られる畳み込みニューラルネットワークを使用しました)。
ニューラルネットワークはわずか2週間で5000万枚の画像を処理し終えた。PNAS誌に掲載されたこの研究に関する新たな論文によると、運の悪い人間なら約15年かかる計算になるという。
研究の著者らは、車種が地域の政治的傾向やその他の人口統計情報といった要因とどのように関連しているかを明らかにする必要もありました。そのために、彼らは回帰分析という数学的・統計的手法を用いて、車種が投票データや国勢調査から得られた情報とどのように相関しているかを調べました。
最終的に、彼らが学んだことは「驚くほど正確だった」と、研究の筆頭著者であり、以前はスタンフォード人工知能研究所の研究員だったティムニット・ゲブル氏は述べている。例えば、彼らのシステムはワイオミング州キャスパーが共和党支持であると予測した。これは、チームが現実世界の指標として用いた2008年の大統領選挙結果によって裏付けられている。
しかし、彼女は、このシステムは国勢調査の実施に代わるほど正確ではないと警告している。ただし、国勢調査を補完することはできる。あるいは、資源の乏しい国では、このような方法は、本格的な国勢調査にかかる費用をかけずに人口統計情報を収集するのに役立つ可能性がある。
しかし、全体像は車の画像や投票履歴の予測だけにとどまりません。ゲブル氏によると、この戦略は、Googleストリートビューの画像のような膨大なデータにAI技術を駆使することで、社会科学者が活用できる新しいツールとなるとのことです。もちろん、車や政治だけに焦点を当てる必要はありません。研究者は例えば樹木や公衆衛生といったデータにも着目できるとゲブル氏は言います。また、街路の画像だけに限定する必要もありません。衛星写真も対象にできるのです。
そして結局のところ、AI システムにそれを実行させる方が、人間の目だけで行うよりも桁違いに効率的になるでしょう。