
機械知能の追求は、コンピューターと双方が理解できる方法でコミュニケーションをとる方法を見つけ出すことを意味します。しかし、コンピューターは口頭の指示をそのまま処理するのに対し、人間はより洗練された話し方をし、スラングや記号を用いて考えを伝える傾向があります。そこで、イスラエルの研究チームは皮肉を認識できる機械アルゴリズムを開発しました。
SASI(半教師あり皮肉識別アルゴリズム)は、オンライン商品レビュー内の皮肉な文章を驚異的な77%の精度で認識できます。このアルゴリズムを作成するために、研究チームはAmazon.comの商品レビュー66,000件をスキャンし、3人の異なる人間の注釈者が皮肉のタグを付けました。そして、レビューに現れた特定の皮肉のパターンを特定し、それぞれの文を皮肉のクラスに分類する分類アルゴリズムを作成しました。
その後、アルゴリズムはレビュー集から抽出した80文のシードセットを用いて学習されました。これらの注釈付き文は、皮肉な発言(文字通りの意味とは正反対の意味を持つ発言、あるいは文字通りの読み方とは矛盾する感情を伝える発言)を区別する単語やパターンをアルゴリズムが学習するのに役立ちました。
その後、このアルゴリズムを評価セットに適用しました。パターン評価効率は81%の確率で正確にスコアリングされ、パターン認識/皮肉分類アルゴリズムの全体的な精度は77%の確率で正確でした。コンピューターが人間のユーモアセンスを解釈するという初めての試みとしては、悪くない結果です。
これは、ルンバに「これはひどい」と伝えた時に、ルンバがそれを理解できるようにするためだけのものではありません。皮肉な発言を認識できるコンピュータープログラムは、「レシートは保管しておきましょう」というタイトルの商品レビューを、オンラインショッピングに関する的確なアドバイスと間違えないようにすることで、よりパーソナライズされたコンテンツを生成し、人間のユーザーにより適切なレコメンデーションを提供できる可能性があります。また、製品やアイデアに対する世論を測るためにウェブ上で情報収集を行う意見マイニングシステムにも役立つ可能性があります。
[ヘブライ大学、スラッシュドット経由]