人工知能はあなたの下手な口笛をモーツァルトのように聞こえるようにすることができる 人工知能はあなたの下手な口笛をモーツァルトのように聞こえるようにすることができる

人工知能はあなたの下手な口笛をモーツァルトのように聞こえるようにすることができる

人工知能はあなたの下手な口笛をモーツァルトのように聞こえるようにすることができる

インディ・ジョーンズ映画のテーマ曲を人間が乱暴に口笛で吹いている音を考えてみてください。そして、コンピューターがその曲の口笛バージョンを聴いて、バッハ風にオルガンで真似をするところを想像してみてください。

Facebookの一部門の研究者グループが、まさにそれを可能にする人工知能システムを開発しました。ある楽曲のオーディオファイルを聴き、新しい楽器編成でそれを真似るのです。これは人工脳を持つカバーバンドのようなものです。彼らはこれを「ユニバーサル音楽翻訳ネットワーク」と呼んでおり、与えられた音楽ファイルから6つの異なるスタイルの音楽を吐き出すことができます。

インディ・ジョーンズやバッハだけではありません。このシステムは、「オールウェイズ・オン・マイ・マインド」のような心に響くクラシック曲を、モーツァルトによるその曲の演奏に変換することができます。「音楽を聴き、口笛や楽器を演奏することでそれを繰り返すという、人間の能力を模倣したいのです」と、この研究成果を解説した新たな論文の共著者の一人、リオール・ウルフ氏は述べています。このAIは音符を読むのではなく、与えられた音声ファイルをコードに変換し、それを新しいバージョンにデコードするだけです。

「このシステムは内部的に、音符の代わりになる独自の表現を学習します」とウルフ氏は付け加える。「最も分かりやすい説明は、異なる音楽領域、異なるスタイルのカバーバージョンを作成するということです。」これらのスタイルには、モーツァルト、バッハ、ベートーヴェンなどが含まれる。研究者たちはメタリカのリフをシステムに入力し、ピアノバージョンを出力させた。

この研究の共同研究者であるヤニフ・タイグマン氏は、ニューラルスタイルトランスファーと呼ばれるコンピュータービジョン技術の成功に着想を得たと述べています。これは、まるでゴッホが写真を描いたかのように、画像を新しいスタイルで再描画する技術です(Prismaというアプリが良い例です)。「私たちは基本的に、多くの人が普遍言語と考える音楽に、同じ効果をもたらしたいと考えました」とタイグマン氏は言います。

聴いていて楽しいです。下の動画では、ハイドンの弦楽四重奏曲をモーツァルト風にカバーしたり、アフリカの太鼓をベートーベンのピアノ曲として繰り返し演奏したりする様子を聴いてみてください。洗練されているようにも、荒削りなようにも感じられます。モーツァルトの交響曲をハイドンの曲でカバーする部分は、モーツァルトの口笛によるインディ・ジョーンズのテーマ曲よりもはるかに優れています。この研究を説明する論文では、率直にこう表現されています。「ある楽器を別の楽器に変換するように求められた場合、私たちのネットワークはプロのミュージシャンと同等か、わずかに劣る」。

この開発は、機械学習、アート、音楽に焦点を当てたプロジェクト「Magenta」に携わるGoogleのAI研究者、アダム・ロバーツ氏の目に留まりました。彼はツイートでこう投稿しました。「初めて聞いた、音楽スタイルのリアルな変換です。アフリカの太鼓や口笛がシンフォニーにどう繋がるか、ぜひ聞いてみてください!」

Facebookは既に、サイト上で他言語のコメントを見つけた際に表示される言語間翻訳サービスに人工知能を活用しているが、今回の研究を説明するブログ記事では、「特定の製品や機能」に活用する予定はないと述べています。研究者たちは、このプロジェクトのコードをGitHubで公開し、誰でも利用できるようにする予定です。

ブログ「aiweirdness.com」でニューラルネットワークと呼ばれる形式のAIを趣味で実験しているジャネル・シェーン氏は、AIを使ってバレンタインデーのキャンディハートの奇妙な言葉など、面白い新しい素材を生成することで知られているが、一般の人がこの機能を試すために使用できるツールがあれば、創造性を刺激するのに役立つだろうと述べている。

「他の人もこのツールを使えるようなデモプラットフォームのようなものが作られることを本当に願っています」と彼女は言う。「このツールを使って本当にクールなものを作れるアーティストがたくさんいるように思えます。今のところ、アートや音楽制作に人工知能ツールやニューラルネットワークツールを使うハードルは、ほとんどの人にとって少し高すぎると思います。」

ユニバーサルミュージック翻訳ネットワーク