コンピューター分析でJ・K・ローリングの秘密小説が発見される コンピューター分析でJ・K・ローリングの秘密小説が発見される

コンピューター分析でJ・K・ローリングの秘密小説が発見される

コンピューター分析でJ.K.ローリングの秘密小説が発見される

ロバート・ゲイルブレイスが初めて手がけた推理小説『カッコウの呼び声』が、ついに大きな謎に包まれました。今週末、イギリスのタイムズ紙は、『カッコウの呼び声』の著者が実はハリー・ポッターの作者J・K・ローリングであると報じました。タイムズ紙が直接質問したところ、ローリングは小説の執筆を認めたそうです。

ニューヨーク・タイムズがローリング氏に提示した証拠の中には、論争の的となっている文章の著者を突き止めるためのコンピュータープログラムを作成した二人の大学教授による分析結果が含まれていた。結局のところ、どんな作家にも癖はあるものだ。分かりやすい例の一つは、地方語の使用(例えば、車の「boot」と「trunk」の違い)だが、他にももっと微妙で無意識的な癖がある。コンピュータープログラムがそれらを見抜くというのは、実に不気味だが、同時に素晴らしい。

ニューヨーク・タイムズ紙がプログラマーたちに『カッコウの呼び声』を調べるよう依頼したのは、ローリングが真の著者かもしれないという匿名の情報を得た後のことでした。ニューヨーク・タイムズ紙の記者、アレクシ・モストラスは当初、なぜ『カッコウの呼び声』を他の小説と比較させたいのかを教授たちに伝えませんでした。

では、どんな習慣が著者の見分け方を左右するのでしょうか?分析担当者の一人、ピッツバーグのデュケイン大学のパトリック・ジュオラ氏が、自身のプログラムの仕組みについて詳細なブログ記事を書いています。記事全文は大変興味深い内容ですが、ここでは要点をまとめます。

ジュオラは基本的に、 『カッコウの呼び声』のデジタルコピーに加え、ローリングと3人の著名なミステリー作家の作品のデジタルコピーを入手しました。そして一連の分析を行い、 『カッコウの呼び声』に登場する習慣がどの作家の習慣に最もよく当てはまるかを調べました。それぞれの分析は、作品に登場する異なる「習慣」に焦点を当てていました。

  1. ジュオラは各書籍の単語の長さの分布を調べました。つまり、「この本の単語のXパーセントはちょうどY文字の長さである」といった数値をいくつも得たのです。
  2. ジュオラさんは、それぞれの本の中で最もよく使われる100語を調べました。
  3. 彼はよく一緒に現れる単語のペアに注目しました。
  4. 彼は文字列中に現れる4文字のグループに注目した。文字列中の4文字であれば、文字、スペース、文法記号など、どれでも構わない。さて、文章の中で文字列について意識している作家を私は知らないが、ジュオラ氏によると、他の研究では、4グラムと呼ばれる4文字の文字列が著者の強力な指標であることが証明されているという。

ジュオラ氏の全体的な分析では著者を証明できないと彼は述べた。個別のテストでは、ローリング以外の著者が最も一致したという結果もいくつか出た​​。それでもなお、ローリングが最も一貫して一致した。ジュオラ氏は、自身の作品がローリングによる『カッコウの呼び声』の著者であることを「示唆的」あるいは「暗示的」だと評した。決定的な証拠はローリングの告白であり、ジュオラ氏の分析はローリングの告白を説得するのに間違いなく役立った。

この区別が重要なのは、言語学者がジュオラ氏らの手法のようなツールを用いて、はるか昔の著者による歴史文書から現代の裁判で争われている文書に至るまで、あらゆる文書の著者が実際に誰なのかを判断するためです。こうしたケースでは、確実で確実な自白を得るのは非常に困難です。

言語ログ