コンピューターと音楽の現在と未来2

こんにちは、プログラマの三浦です。

今週は先週に引き続き、コンピュータと音楽の話題について触れたいと思います。今後も定期的にこの話題に触れていきたいと思います。

先週、このブログを公開した直後にMagentaの話題が出ました。

https://magenta.tensorflow.org/welcome-to-magenta

Magentaは、Googleが公開している機械学習を用いて「アート」を生み出すことを試すプロジェクトとして昨年スタートしたものです。

昨年、画像の作風を変更して、スタイル変換するアプリケーションが話題になりましたね。MagentaもGoogleが開発しているTensorFlowで同じことができます。

https://magenta.tensorflow.org/2016/11/01/multistyle-pastiche-generator/

今回話題のきっかけになったのはこちら。A.I. Duetのリリースですね。

http://jp.techcrunch.com/2017/02/17/20170216googles-a-i-duet-experiment-lets-you-jam-with-the-machine/

そろそろ雨季も終わりなのか、スコールの回数も減ってきました。

そろそろ雨季も終わりなのか、スコールの回数も減ってきました。

先週書いた人間とコンピュータのセッションは扱いやすいテーマ、と紹介しました。このA.I. Duetもデュエットと言葉を変えていますが、同じものを指します。内部的には、リカレントニューラルネットワーク(RNN)のモデルを用いた、シンプルなモデルを使用しているようです。LSTM(Long Short-Term Memory)を使っているそうなので、今後もっと複雑なモデルがリリースされることでしょう。私も実際に試してみましたが…私の修論のアウトプットの方がより商業音楽だったと思います。ただ、学習データがほぼ小室哲哉さんだったので、彼の作風ばかりでしたが。。。

音楽の場合、画像と比較して「楽典」がありますので、完全な自由な表現とは言い切れません。そういう意味で画像の場合、画像全体を乱暴に学習させ、マシンパワーに力を任せて、汎化能力から未知の入力データに対し、新たな画像を作り出し、それをクリエイティブと呼んでいます。それでも見る人間が歩み寄って、受け入れてくれます。が、音楽はもう少しロジカルであり、不協和音、明らかな不愉快なパターンなどがあります。それらを飲み込むだけのマシンリソースは、まだ現在においても簡単には利用できないと思われます(GoogleやMITなどはもう手を出していると思いますが)。そのため、モデルの方を音楽の特徴に歩み寄らせる必要があります。その流れから、Lookback RNN、Attention RNNなどが生み出されています。

ただ、あまりに「神の見えざる手」を入れすぎると本質的なルールを捉えきれず、知識ベースでの作曲システムと何ら変わらないものになってしまいます。きっと音楽も、ピッチを司るネットワーク、時系列(リズム)を司るネットワーク、構造を管理するネットワーク、アーティキュレーションを付与するネットワークなど、複数のネットワークをお互いに競い合わせて、それぞれが協調して学習したモデルを用意する必要があると思います。そのモデルが出力したものは、より音楽として音楽らしいものになると予想しますし、開発者の意図的な「思い」を排除することができると期待します。

たまに見かける横断歩道。いいアイデア!

たまに見かける横断歩道。いいアイデア!

機械学習を使った場合、そのバリエーションの無さが頻繁に問題となります。その場合、圧倒的に学習データが足りないか、意図的な知識ベースなどに制御されすぎていることがほとんどです。また過学習もその原因になります。汎化能力が有効に機能してくれていない状況ですね。クリエイティブ分野にA.I.を、とGoogleもそろそろ本腰を入れ始めてきていますが、一筋縄にはいかないのが、この分野です。

例えばある時期までは、将棋のソフトウェアを強くするためには、開発者もそれ相応の有段者でないと難しいと言われていました。が、あるレベルを突破したあたりから、開発者の能力を超えて一人歩きできるようになりました。

クリエイティブ領域でのA.I.は、それでいうとまだ開発者がその領域に理解がないといけない時期にいると考えます。この先2-3年はアーティステックなプログラマは、挑戦しがいのある期間で、一番活躍できる時期だと思います。あと2-3年するとA.I.が勝手にアートを作り出してしまうことになるかもしれませんからね。

私もがんばらねば。

Best Regards,

  Nozomu Miura

miura

秋田県生まれ。ベルギー、東京を経て現在シンガポール在住。 様々な業務アプリケーションの開発に関わり、主に低レイヤーの開発を得意とする。 ベルギーへ渡り、照明最大手のR&Dのリードエンジニアとして、メディアサーバや照明制御の開発に6年間従事。 2006年のユーロビジョンソングコンテストやアーティストのステージを支えるエンジニアとしてベルギーを拠点に欧州で活躍。 日本ではライブストリーミングサイトdommuneや、坂本龍一の映像配信などをサポート。 その一方で、vjとしてクラブシーンとも関わり、積極的にvjソフトウェアを開発。 小さくてもニーズのあるツールを提供するのが生き甲斐。次のプロダクト作成のため、メンバーを探している半ばの人生。 エンジニアとしてのメンタルを保つために、アジア大陸最南端でギラギラ葛藤中。 動物とあんことレッドブルが好き。最近お酒に弱くなりました。

0 comments