松尾豊特別講演(モデレーター:猪瀬直樹) 「人工知能は人間を超えるか!?」 日本文明研究所シンポジウム載録|書評専門紙「週刊読書人ウェブ」
マイページで記事のブックマーク!
ログイン
マイページ登録

トップページ

特集

書評

連載

コラム

ニュース

読書人とは マイページ

読書人紙面掲載 特集
更新日:2018年8月10日 / 新聞掲載日:2018年8月10日(第3251号)

松尾豊特別講演(モデレーター:猪瀬直樹)
「人工知能は人間を超えるか!?」
日本文明研究所シンポジウム載録

このエントリーをはてなブックマークに追加
五月二三日、日本文明研究所の第十二回シンポジウムとして、特別講演「人工知能は人間を超えるか!?」が行われた。登壇者は、人工知能研究の第一人者、東京大学准教授の松尾豊氏。モデレーターを作家で当研究所所長の猪瀬直樹氏が務めた。深層学習(ディープラーニング)の急激な進化により世界が劇的に変わろうとしているいま、知っておくべきこと、日本の人工知能研究の現状や、日本の産業がどう生き延びていけるのかなど熱く語られた。その模様を載録する。(編集部)
第1回
ディープラーニングの大きなイノベーション

松尾 豊氏
松尾 
 二年前、Google Deep Mindが開発した人工知能のアルファ碁が、韓国のプロ棋士・李世乭イセドル九段を破りました。また昨年は中国の柯潔かけつ九段に勝ち、太刀打ちできる人間は誰もいない状況です。アルファ碁はプロ棋士の棋譜データを学習し、それをベースに自己対局を繰り返すことで強くなっていたのですが、さらに、昨年十二月に開発されたアルファZeroは、学習用の棋譜データすらいりません。そして囲碁以外のチェスでも将棋でも、自己対局で強くなることができるのです。将棋では最強の人工知能ポナンザが、昨年名人に勝ちました。が、世界コンピュータ将棋選手権で、ポナンザにelmoエルモが勝利し、そのelmoのレベルにさえアルファZeroは、真っさらな状態から学習をスタートして、わずか二時間で到達してしまいます。名人が一生かかって身に着けるものを、わずか二時間です。こうした人工知能に中心的に使われている技術が、ディープラーニングなのです。

いま人工知能が大きなブームですが、実はこれは三度目のブームに当たります。人工知能の研究は一九五六年に始まり、六二年を経ていますが、第一次AIブームから「人工知能は人間を超える」といった妄想が語られてきました。ところが技術が追いつかず、妄想が失望に変わり、冬の時代がくる、ということを何度も繰り返しています。今回のブームでは、人工知能は何ができて何ができないのかを、きちんと知る必要があると思います。

実はいま騒がれている自動運転技術は、十数年前から研究されています。大まかに言えば、いまある技術は昔からのものが少しずつ良くなって今に至ります。そして、昔出来なかったことはほとんどの場合、いまもできないままなのです。でもその中で、ディープラーニングの技術だけは、大きなイノベーションが起こっています。

では、ディープラーニングでは何ができるのでしょうか。一つ目は「認識」です。次に「運動の習熟」。それから「言葉の理解」、この三段階です。

「認識」から話していきますと、猫、犬、狼、三枚の写真を、人はパッと見わけることができますね。ところがこれが、コンピュータには難しい。

まず「目が丸ければ猫」だと、分類の定義を与えることにします。次に「眼が細長い場合に、耳が垂れていれば犬、耳がピンと立っていれば狼」と判断基準を与えます。一見、このルールで認識できそうに思いますが、世の中にはいろいろな犬がいて、例えばシベリアンハスキーは、耳が尖っているけれど狼ではない。犬っぽさ、狼っぽさを定義するのは、なかなか難しいことなのです。

こうした「~っぽさ」を「特徴量」と言いますが、特徴量を人間が定義している限りは、画像認識の精度は上がりませんでした。人間は、「~っぽさ」を、無意識のうちに学習しています。コンピュータも、人間のように特徴量を学習できるシステムが必要だった、ということなのです。

それを可能にしたのがディープラーニングです。「Googleの猫」が有名ですが、YouTubeから取ってきた画像をコンピュータに大量に見せるだけで、猫らしさが学習できる、そういう仕組みが開発されたのです。

二〇一二年は、画像認識のエポックメイキングでした。世界中で同じデータセットを使い、数万枚の画像をコンピュータが当てて、その正答率を競います。が、なんと、二〇一二年の優勝チームは、従来の記録をいきなり十%も下回る、十六%のエラー率を叩き出したました。それは、それまで人力で定義していた「特徴量」を、ディープラーニングが自動的に学習するシステムが開発されたためでした。これ以降、画像認識のエラー率は、速度を上げて低下していきます。二〇一三年には十一%、一四年は六・七%、現在は二・三%です。同じタスクを人間が行うと、五・一%のエラー率だと言います。既に画像認識においては、コンピュータが人間を超えているということです。こうした変化が、わずか五年程の間に起こっているのです。

画像認識には、画像中の物体を取り出す物体検出や、対象物の領域を切り出すセグメンテーションなど、さまざまなタスクに細分化されます。

例えば、YOLOv2という、物体検出プログラムでは、一つの映像の中に映っている個々の物体それぞれを、一秒間に四七フレーム読み取ることができます。しかもこのプログラムは全世界に共有されており、ネット検索ですぐに手に入れることができます。
2 3 4 5 6
このエントリーをはてなブックマークに追加
猪瀬 直樹 氏の関連記事
読書人紙面掲載 特集のその他の記事
読書人紙面掲載 特集をもっと見る >
科学・技術 > 人工知能関連記事
人工知能の関連記事をもっと見る >