【特別連載:数理で読み解く科学の世界 #6】人工知能に絵を書かせる方法
アカデミストは4月18日、理化学研究所 数理創造プログラム(iTHEMS)と共同でオンラインイベント「数理で読み解く科学の世界」を開催いたします。 本連載では、同イベントの講演の内容について簡単にご紹介していきます。
#1 ブラックホールに入ったリンゴはどこへ行く?
#2 ゲーム理論で学ぶ男女比の進化:学級の男女比はなぜほぼ一対一なのか?
#3 量子コンピュータって何?どう使うの?
#4 暗黒物質の色は何色? 〜見えないモノを調べる方法〜
#5 世にもふしぎな素数の世界 ~まだこんなことがわからない~
#6 人工知能に絵を書かせる方法
※編集注:以下、オンラインイベントの内容を踏まえて、2020年4月29日に加筆・修正いたしました。
近年、人工知能(Artificial Intelligence, 略してAI)技術が著しい発展を遂げています。たとえば、Google翻訳などにみられるように機械翻訳の精度が飛躍的に良くなっています。ドイツのDeepLという会社の発表した機械翻訳サービスに至っては、翻訳後の文章を機械が翻訳したとは直ぐには判断できないほど自然な翻訳文が生成され、驚かされます。
また、テレビ番組ではしばしばAIを用いて偽の動画を作る技術が紹介されています。この手の技術に良くない印象を持たれている方も多いかと思いますが、たとえば、自分がお手本のダンスを踊ったらどのように見えるかを偽動画として作ると、お手本を練習する前に自分のダンスの完成形を「お試し」で見ることができたり、お手本のバックダンサーを増やせたりして案外便利かもしれません。
偽画像を作る技術における、2020年4月現在における、おそらく世界最先端の性能のAIはhttps://github.com/NVlabs/stylegan2 です。このURLにアクセスしてページの下の方を見ると、数枚の人間の顔が表示されていますが、なんと、これらはすべて「機械が描いた、この世に存在しない人物」なのです。
この他にも「超解像」と呼ばれる、粗い画像をより鮮明にする技術や、「スタイル変換」「自動着色」などの画像を別の似た画像に変換する技術など、数多くの偽動画や偽画像を作る技術が提案されてきています。
このような「自ら画像(データ)を作り出す」タイプのモデルを「生成モデル」と呼びます。生成モデルにもたくさんの種類があり、すべてを紹介することはできませんが、ここでは2例紹介してみます。
ボルツマン機械
最初の生成モデルは「ボルツマン機械」と呼ばれるモデルです。ボルツマン機械は、統計物理学の磁石の集団を記述するモデル、イジング模型に基づいていると考えることができます。イジング模型では、温度を設定すると、その温度に基づいた物理的なシミュレーションをマルコフ連鎖としてコンピュータ上で実現できます。
たとえば高温でシミュレーションをすると、水が沸騰するように、磁石もバラバラの状態が実現されます。一方で低温でシミュレーションすると、水が凍るように磁石も同じ方向に揃うようになります。低温での振る舞いは背後の物理モデルによって制御されるのですが、ボルツマン機械は与えられた画像データが何らかの物理モデルで記述できると仮定して、その物理モデルを機械学習します。学習後、新しい絵を描かせたい場合は、得られた物理モデルを用いてマルコフ連鎖によるシミュレーションを行い、安定な状態を探します。
敵対的生成ネットワーク
次に紹介するのは、近年注目を集めている深層学習を用いたモデルで、特に「敵対的生成ネットワーク」と呼ばれる方法です。ボルツマン機械と大きく異なるのは、学習のプロセスで2つのモデルを導入することです。ひとつは生成モデルで、絵を描くモデルです。もうひとつは識別モデルで、描かれた絵を批評する批評家の役割を果たします。この方法では生成モデルと識別モデルを別々に学習させます。
まず、識別モデル(批評家)が生成モデルの作った絵と実際のデータを区別できるように学習を進めます。次に生成モデルは識別モデルを「騙す」ように新しい絵を書きます。実際にはこの2段階を繰り返すことで、強くなる識別モデルを騙せるほど精巧な絵を描く生成モデルを得ることが可能となります。このように、敵対関係にある2つのモデルを使うことから「敵対的」という名前がついていますが、これは見方を変えれば、2つのモデルが「協力」して学習するともいえます。数学的に理想的な状況下では、この学習方法はある種のナッシュ均衡の探索に対応していると考えられます。
まとめ
このように、一口に「人工知能に絵を描かせる」と言っても、さまざまな方法があり、それぞれの方法の背後には数理的なアイデアがあることがわかります。また、ここまで述べてこなかったけれど重要な事実は、上で紹介したような生成モデルを学習させるのにも実は手間がかかるということです。
最良なのは、「学習させたいドメインの画像」だけ用意して、それを入力することで自動的に新しい絵が描けるようになることですが、現状そこまで自動化されてはいないのです。実際には「学習のためのさまざまなパラメータ」を設定する必要があり、うまくいくパラメータ設定はどのようなモデルを使うかやデータの品質に強く依存します。このような部分を解決していくのが、当面の研究課題であると思われます。
iTHEMS × academist オンラインイベント「数理で読み解く科学の世界」
iTHEMSでは「数学」を共通言語として、物理、生物、宇宙などさまざまな科学分野の横断的な研究をしています。オンラインイベント「数理で読み解く科学の世界」では、Web会議サービス「Zoom」を利用し、iTHEMS所属の若手研究者6名が最先端の研究に関する30分の講演をオンラインで行います。講演後も研究者たちと話せる時間がたっぷりありますので当日はぜひ、たくさんの疑問・質問を投げかけてみてください。
【イベント詳細】
日時:2020年4月18日(土)10:00〜17:00
場所:Web会議サービス「Zoom」(申込者に事前に招待URLをお伝えいたします)
参加費:無料
対象者:どなたでもご参加いただけます
お申し込み・特設サイトURL: https://www.ithems.academist-cf.com/【講演者および発表タイトル】
横倉祐貴 「ブラックホールに入ったリンゴはどこへ行く?」
入谷亮介 「ゲーム理論で学ぶ男女比の進化:学級の男女比はなぜほぼ一対一なのか?」
入江広隆 「量子コンピュータって何?どう使うの?」
廣島渚「暗黒物質の色は何色?ー見えないモノを調べる方法ー」
宮﨑弘安 「世にもふしぎな素数の世界 ~まだこんなことがわからない~」
田中章詞 「人工知能に絵を書かせる方法」
この記事を書いた人
-
理化学研究所 数理創造プログラム(iTHEMS) 上級研究員
理化学研究所 革新知能統合研究センター(AIP)数理科学チーム 研究員
慶應義塾大学 理工学部 数理科学科 訪問研究員
2015年大阪大学大学院理学研究科博士課程後期修了、博士(理学)。理化学研究所 iTHES、理化学研究所 AIP で特別研究員として数理物理・機械学習の研究に従事、2020年4月より現職。
この投稿者の最近の記事
- イベント2020.04.14【特別連載:数理で読み解く科学の世界 #6】人工知能に絵を書かせる方法