人工知能ってそういうことだったのか会議～Shannon Lab田中潤様～ - マーケティングメトリックス研究所/MARKETING METRICS Lab.

田中潤。Shannon Lab株式会社代表取締役。
アメリカの大学で数学の実数解析の一分野である測度論や経路積分を研究。アメリカの大学教授にも難易度が高いといわれているアメリカ数学会でも数学論文を発表している。カリフォルニア大学リバーサイド校博士課程に在籍中にShannonLabを立ち上げるため2011年帰国。開発する際は常にpythonを愛用。

[松本] 今回のゲストは数学者であり、データサイエンティストであり、経営者でもあるShannon Lab株式会社代表取締役の田中潤さんです。

今回は「正しく理解する人工知能」がテーマです。昨今、様々な切り口で語られている人工知能ですが、評論家より最前線の現場で活躍しておられる専門家の意見こそ重要だと私は思っています。そこで真っ先に思い浮かんだのが田中さんでした。

まず初めに、簡単に自己紹介をお願いします。

[田中] 今日はよろしくお願いします。簡単に、弊社の紹介をしますね。

「シンギュラリティに備えて人工知能をビジネスにしていこう」ということで、人工知能を身近に感じ、みんなに使ってもらう世界を実現するためにShannon Lab株式会社を創立しました。この先、ありとあらゆる分野で人工知能が人間を超えていくという予測が世界中で行われています。そこに向けて今から着実にビジネスをやっていこうとしています。

弊社は人工知能の「エンジン」を作っている会社と表現すればいいでしょうか。対話エンジン、音声認識エンジンを作って、それらを拡張して商売に繋げています。

私自身は数学科出身の人間で、もともと数学の研究をしていました。数学的な研究から、最近だと音声認識の研究まで行っています。日本音響学会には「音響レンズによる遅延和を利用した距離選択収音」という論文が掲載されました。

最近は、特殊なマイクと音声認識の組み合わせの論文を書いているところです。指導頂いている先生曰く「これはサイエンス誌に載りそうだね」と言って下さったほど、かなり先進的な研究を行っています。

[松本] すごいですね！もともと数学をずっと研究されていたのですか？

[田中] そうです。純粋数学出身の人間です。

[松本] どうして現在のように人工知能の研究や音声認識の研究に携わられるようになったのでしょうか？

[田中] 博士研究課題が「経路積分」という、金融で使われている量子力学の理論手法でした。そういう背景があって、リーマンショック前に金融系を手伝っていたことがあったんです。既にその頃にはディープラーニングの基礎が完成していて、米国で色々と見ていたので「ニューラルネットワークが来るなぁ」とは思っていました。

で、リーマンショックが起きたときに、アメリカ人の友達は「次は人工知能だ」って言っていたので「それはそうだな」と思ったんです。2009年、10年は日本とアメリカを行ったり来たりしていたんですが、2011年には日本に帰ってきて、人工知能で起業することにしました。

[松本] 日本では、2011年の段階で人工知能は世間的には認知されていなかったと思います。まさに開拓者ですよね。一方で本の出版もされていますよね。

[田中] そうですね。去年の12月にPythonの本を出版しています。

Pythonプログラミングのツボとコツがゼッタイにわかる本
Shannon Lab株式会社
秀和システム 2016-12-22

[松本] 難しいことを簡単に伝えることが一番難しいのに、田中さんはそれを易々と実践されていている印象です。だからこそ「人工知能に関するインタビューを、田中さんなら分かりやすく説明してくれるに違いない！」と思いました。

[田中] ありがとうございます。ちなみに、本に従って進めたら初心者でもウェブフレイムワークのdjangoからDQNというディープラーニングを実装できるような構成になっています。是非、読んで見てください。

音声認識から始めたビジネスとしての人工知能

[松本] ビジネスとしての人工知能を推進するために、対話アプリや音声認識を選ばれたのは何故でしょうか？

[田中] 「現代集合論と動詞論理」いう数学理論を作り、論文にしました。このロジックの拡張が、自然言語に応用ができるんじゃないかと考えたんですよ。つまり、音声認識があれば自然対話が可能になるんですが、それに加えて僕が作ったようなロジックが乗っかってくると、より人間らしい対話が可能になるのではないか？と考えたんです。

その世界観を完成させるには、高性能な音声認識が必要なんです。通常、音の跳ね返りがある環境では音声認識の精度が下がります。例えば、音大にあるような無音響の部屋は精度がでますが、今いるような普通の部屋では精度が落ちます。それではビジネスとしての拡張に欠けますよね。

そこで、無響室の環境で高い精度を誇る音声認識をある教授のところへ「もっと精度上げたいんだけどどうしたらいい？」と持って行ったところ、「マイクの研究から始めたらいいんじゃない？」と言われたのが2012年ぐらいです。その時はまだAmazon Echoも出ていません（笑）。かれこれ５年くらいマイクの研究をしています。

今は3Dプリンタで、こういう試作機を製作しています。

[松本] おぉー。なんですか、これは。

[田中] 周囲の騒音は拾わず、真正面の声だけを拾う機械です。これに自然対話も加わっているので、人を介さずに、まるで人と対話しているかのようなやり取りを可能とします。ちょっとデモをしてみましょう。

これからお見せするのは、ホテルのフロントでのやり取りを想定しています。大きいホテルだと、結構ガヤガヤしていますよね。XJAPANの紅を背景曲として流しますから、横で松本さん大声出してください。そんな中で私とマイクが対話を行います。

[松本] 分かりました。わー！

（XJAPANの紅の歌詞が大音量で流れます）

[田中] チェックインします。

[機械] いらっしゃいませ。ご予約のお客様のお名前と人数をお伺いしております。

[松本] わー！

（XJAPANの紅の歌詞が大音量で流れます）

[田中] 田中潤です。3名です。

[機械] 田中潤様ですね。本日から3泊で、3名様でよろしいですね？

[田中] はい。合っています。

[松本] くれないだー！

（XJAPANの紅の歌詞が大音量で流れます）

[機械] ただいま、お部屋の鍵を発行いたします…

[田中] こんな感じです。すごいでしょ？

[松本] すげぇぇぇ！僕の声もXJAPANの声も、全く認識しない。初めてチューリングテストを味わいました。これ、未来感半端ない！

[田中] 水の音を流して、掃除機かけて、XJAPANが響いても、大丈夫です。そもそも、この機械が声を拾う範囲が決まっていますから。これまでの音声認識は、跳ね返って後ろから来た音を拾っていました。これが厄介だと言われてきましたが、無事に解決しています。

[松本] なるほど。じゃあ、横にいる人間の声を拾うとかはないんですね。

[田中] そうです。あとは量産するだけです。もう2～3年後には、声による応答が当たり前になっていくでしょう。音声認識のためにマイクの研究をしていたんですが、マイクは一段落ついたんで、今は自然言語に注力しています。

毎週月曜日に中野オフィスにて音声認識のデモをやっているので、このインタビューをご覧の皆さんにも、是非遊びに来て欲しいですね。

「人工知能に仕事が奪われる」論への意見

[松本] この機械が完成すると、ますます「人工知能に仕事が奪われる」論が現実性を増しますね。

[田中] そうですね。少し先の世界ではこういう音声認識が完成していて、あとは機械が後ろに控えて、自動的に食事を提供するファストフード店舗が誕生するかもしれません。1店舗に人は1人いればいいって時代も来るかもしれません。

[松本] そう言えば、ハウステンボスに「変なホテル」ってありましたよね。

[田中] ありますね。でも、ちゃんと人はいるんですよ。次の5年の人工知能ビジネスは、せいぜい3人必要な作業を2人で行う、5人必要な作業を3人で行う、そうした自動化のようなビジネスになると思います。3人必要な作業を0人で完全自動化するって世界の実現はまだ難しいと思います。完全自動化には15年から20年はかかりますね。

なぜなら「決まった」作業は得意ですが、「決まっていない」作業は人間がやらないといけないからです。つまり、マニュアルが無い作業は不得意なんです。同じことの繰り返しは人工知能の出番ですね。マニュアル作業の自動化、しかも単なる自動化ではなく「知能」を兼ね備えた自動化が起きるでしょう。

[松本] 今、映画館に行くとタッチボタン式に変わっていますよね。以前はチケット券売の人がいて、その人にお願いしていましたけど、機械に置き換わっちゃいました。でも、券売機の前に2～3人立っています。鉄道の切符もそうですよね。私が小学生だった20年前は人が対応していましたが、自動改札になりました。でも、必ず駅員さんがおられます。よく出張で新幹線を利用するんですが、同じく2～3人の駅員さんが「切符の取り忘れに注意して下さい！」と連呼しています。確かに「0人化」はまだ先かもしれません。

[田中] 少し先の未来の話をしましょうか。タッチ式は、紹介したような音声式に変わると思います。タッチ式と音声認識の違いは明確で、タッチパネルはメニューが多いと、ドリルダウンしないといけませんから。回転寿司のタッチパネルメニューも、見にくいじゃないですか。エビ頼みたいのにエビどこ？みたいな（笑）。そういうとき、マイクに「エビ」って言えばいいんです。受付UXという点では、タッチパネルよりも音声認識のほうが断然優れています。

[松本] そこでお聞きしたいことがあります。「人工知能によって私たちの仕事が奪われてしまう」という意見に、田中さんならどう反論されますか？

[田中] うーん…とはいえ、取って代わっちゃいますからね。取って代わられちゃうのが嫌だ、ってことですか？

それだったら、人工知能を使いこなせる人間になればいいじゃないですか。そうすれば10年、15年は食えるでしょう。次の5年で、まず人工知能に置き換わるのは単純作業です。そこを取って代わられたくない、と言われると…。

[松本] 人間にしかできない仕事を考えないといけないですね。

[田中] でも、この先ますます自動化が進む中で、人間にしかできない仕事って何でしょうね？という疑問は湧きますね。30年先の2045年を考えたときに人が1人でも必要な仕事って意外と少ないと思います。

重要なのは、次の5年でどうなるか、次の10年でどうなるか、そのステップを見極めていくことではないでしょうか。30年先に起こるであろう世界を、明日起こるかのように議論するから話がややこしくなるんです。

例えば、自動運転技術自体はもう完成しています。では公道を走っても大丈夫？と問われれば、まだ危ないでしょう。だから、次の5年かけて安全性が高まっていき、10年かけて世の中に普及していくという流れだと思うんです。人工知能が騒がれていますけど、そんな急激に変わるわけじゃありませんから。あれっ？あれっ？とちょっとずつ浸透していくのではないでしょうか。

[松本] つい最近も、Googleから機械学習アルゴリズムがベースにある「AutoDraw」や「リアルタイムカメラ翻訳」がリリースされて騒然としました。そういうことなんでしょう。

2017年現在における人工知能の弱点を知る

[松本] 書店に行くと「AIで日本が復活する！」「AIが全ての産業を破壊する！」と訴えている本が並んでいて、しかも結構売れています。これから多くの人が、ラジオやテレビ、或いは携帯、スマホが登場したときのように、人工知能を学ぶ必要があります。

しかし、こうした情緒的な情報はあまり役立たないと私は思います。田中さんは、どういう情報に耳を傾けるべきだと思われていますか？

[田中] 現在の人工知能の弱点を理解してください、と思っています。エイブラハム・ウォルドの話ご存知ですか？あれって、人工知能の弱点を的確に表現しているんです。

[松本] 最近、その話をITメディアに掲載しました（アナタのその分析、「仮説」はありますか？）。機械学習の弱点を見事に表している話だと思います。

簡単に説明すると、エイブラハム・ウォルドというハンガリー出身の学者が第二次世界大戦当時、米軍のために、効率的な魚雷の発射法やミサイルの空力効率など、さまざまな問題の分析に従事していました。ある日、爆撃機を強化する装甲が必要な場所の優先順位を考える任務に就くことになります。

空軍が手間をかけて、無事に帰還した爆撃機の破損状況を調べていたので、データは揃っていました。爆撃機の損傷には明確なパターンがあり、その多くは翼も胴体も蜂の巣のように穴が開いていましたが、コックピットと尾翼にはその傾向がありませんでした。このデータを見た軍関係者は、多くの穴が開いていた機体部分に装甲を施すことを提案しましたが、ウォルドは反対します。

彼は、今手元にあるデータが「帰還した爆撃機のデータ」のみであり、「帰還しなかった爆撃機のデータ」が含まれていないことに気付いていました。帰還した爆撃機のコックピットと尾翼に穴が開いていないのは、そこを撃たれたら帰還できないからではないか？帰還した爆撃機の損傷場所は、撃たれても帰還できる部分なのではないか？というのがウォルドの洞察でした。

[田中] 弾痕を見てどこが弱いか？という洞察は機械でも出せるんですが、帰ってきていない飛行機に対する意味付けを今の人工知能はできないんです。結局、在るデータに対する解析はディープラーニングが取って代わろうとしていますが、無いデータに対する解析は人間にしかできないんです。だからこそ集合をもっと拡張したようなロジックは、今後の人工知能研究に大いに役立つと思っています。

[松本] AutoDrawも、見たことの無い奇抜な絵を置換することはできませんしね（笑）。

強いAIと弱いAIという議論があります。汎用型と特化型という表現でもいいかもしれません。「帰ってきていない飛行機ってどうなっているの？」という疑問を持てないAIは弱いAIという見方があると思います。いまあるデータのみを見る、いわば特化型と言われるようなAIですね。

[田中] そうです。無いデータに対して「帰ってきていないってことは、やばいんじゃない？」という意味付けができるようになり、かつ「じゃあ、帰ってきていない飛行機のデータってどういう弾痕だろう？」と仮説立てが行えるようになってくれば強いAIの誕生だと思います。

[松本] 今の段階では、それを人間が補っているし、しばらくは人間ができなければならないということですね。先ほど「人工知能を使いこなす側になる」と言いました。それはエイブラハム・ウォルドになれということですね？

[田中] 全体を描いた意思決定については、今のところは人間が必要でしょう。

[松本] とはいえ、エイブラハム・ウォルドの意見に反対した人は多かった（笑）。人工知能も、人間も、目に見えているデータや事実のみで判断してしまいがちです。

[田中] つまり、その考え方でいる限りは人工知能に取って代わられちゃうってことですよ（笑）。

決まった対応しかできない人間は人工知能が代替するようになって、人間がこれから注力すべきはイレギュラーな対応なんです。この先の面接の仕方も変わっていくと思いますよ。こういうときはロボットが対応しています、ではこういうイレギュラーが発生したらどう対応しますか？という話です。

[松本] 機転とか機知とか、要は人間由来の知恵ですよね。万分の１の確率でしか起きないハプニングに対応する引き出しを、どれだけ持っているかが勝負なんですよね？厄介な世界だなぁ（笑）。

[田中] それができれば次の20年は安泰です。でも、そんないっぱい引き出し持っている人いないですよね。もしかしたら人間にしかできないことではなく、機械にはできないことを考えるべきかもしれません。今後教育も変えて行く必要があるでしょうね。…人工知能を作るのが一番楽だと思いますよ。（笑）

「人工知能」とは何か？

[松本] そこで、田中さんの考える「人工知能」の定義をお聞きしたいと思いました。

[田中] それは年度ごとに依ります。うちの会社の人間にも言っているのですが、それはいつ起こるかを言いなさい、と求めています。世間では「シンギュラリティが起こって、こんな世界になる！」と言われていますが、僕は「それいつ来ると思ってんの？」と突っ込むことがあります。世間で言われているようなことは、僕は30年、40年かかると思っていますし、カーツ・ワイルの言っている年数とも同じだと思いますが…とにかく大事なのは「いつですか？」なんです。これを突っ込まない記事は意外と多いですよ。

で、人工知能を2017年に見たときは、やっぱりディープラーニングこそ人工知能です。2025年には対話によって間違いを修正して学べる機械が人工知能になっていると思います。

ただ、この質問って変に着飾る人もいますよね。「そもそも知能とは何か？」「その機械には感性や感情が無い」と言う人もいます。でも囲碁で人間を負かしてるんだからそこにあるのは知能でしょ？そもそも感情と知性って真逆じゃないですか？と思うわけです。

[松本] つまり多くの人が人工知能とは「造られた人間」であると錯覚しているわけです。キャシャーンだ（笑）。伊勢谷友介ですよ。だから「感情が無い！」と言った議論が起こるのではないでしょうか。知能は人間の存在も内包する、考える仕組みであって、それ自体は動物にも存在しています。

そもそも、そうした「機械と戦う仕組み」自体はゲームの世界では当たり前ですよね。対CPU戦と称して、野球ゲームで、バトルゲームで、私たちは機械と戦っているわけです。そこに「人工知能」というラベルが付いたことで「なんかすげぇ！」となっているだけかもしれません。

ところで、ほぼ年度ごとにアップデートされているということは、今までやれていなかったことができるようになっている、まさに毎年のように発見が更新されている領域なんですね。

[田中] 20年ぐらい寝ていた分、一気に開花しているのでしょう。

人工知能が浸透した世界、私たちは何をしているだろう？

[松本] 5年、10年と人工知能が浸透していった先、どんな世界になっているのでしょうか。田中さんなりの持論をお聞きしたいです。

[田中] 少しぶっ飛んだ議論ですが…イーロン・マスクも言っていますが、人工知能社会って進んでいくと天国と地獄のどちらかの世の中しかないと思うんです。基本的には人工知能が世の中のありとあらゆるものを支えていて、人間は遊んでいればいい世界。これが天国です。もう1つ、人工知能が人間を酷使して、人間は奴隷になるしかない世界。これが地獄です。

たぶん、地球上にこの天国と地獄の2パターンの国が生まれると思うんです。これは政治思想の違いによって別れてくると思うんですね。

私は、人工知能にはベーシックインカムが必須だと考えています。なぜなら、仕事からあぶれる人が出てくるんですよ。今の仕組み上、給料は仕事の対価として得られるので、仕事からあぶれるとどうやってお金を貰うのですか。でも、ベーシックインカムがあれば食うに困りませんので、人工知能のいうことを聞かなくても良い。しかしベーシックインカムがないと仕事にあぶれていて、人工知能の言うことを聞かないと食べれない。これが政治思想の違いというやつですね。

[松本] フィンランドではベーシックインカムの議論と試験導入が始まっていますね。

[田中] ついでに言っておくと、20年後の世界を考えると、優れた人工知能があれば、人は労働をせずとも、経済は回っていくのですよ。

[松本] あー…2500年ぐらい前のローマって、仕事って奴隷がするもので、奴隷じゃない人が普段何をしていたかといえば「議論」に花開かせていたらしいですね。塩野七生さんの「ローマ人の物語」で知りました。でも、田中さんのおっしゃられていることは、これから少しずつ時間をかけて、その時代に向かっていくよ、というわけですね。

[田中] ソクラテスとかの時代ですよね。そのたとえは分かりやすいな。

[松本] 「働く」ことの意味が大きく変わっていく、ということですね。

[田中] 働くって大半の人にとってはただの情報伝達になっていくと思いますね。それこそソクラテスの時代です（笑）。でも、ベーシックインカムが無い状態で人工知能が急速に広まっていくと、情報伝達をしている人にお金が入らなくなります。すると、20年後には人工知能の方が人より頭いいですから、人工知能の言うことを聞かなくてはいけない。ただの地獄ですよね。

[松本] 生活の糧としての仕事としてやってしまうと地獄に進んでしまうから、そこをいかに切り離すかを考えないといけないというわけですね。人工知能が「作業」を奪う世界から、汎用型になって「仕事」を奪う世界になった時になってベーシックインカムの議論をしても仕方がない、ということですね。

ところで、ベーシックインカムの議論でよくあるのが「働かなくなってしまう」「怠けてしまう」という反対論です。でも人工知能とセットで考えると「そもそも仕事が奪われるんだから働けなくなるし、仕事が無い世界を考えないといけない」というわけですね。

[田中] そうです。「働かなくなる」という文脈における労働の定義が20世紀の労働ではないでしょうか。

今だと、商品の紹介しているだけで年間億を稼いでいるYouTubreが日本にもいますよね。あれって情報伝達しかしていないんですよね。20世紀の労働の大部分はもう10年～20年で人工知能に取って代わられるのではないでしょうか。

そういう話じゃなくて、知的労働のレベルが格段に変わっていった過渡期を過ぎた後の世界を踏まえて話しませんか？と思うわけです。その意味では、確かにソクラテスの時代に戻るっていうのは合っているかもしれませんよね。

そういえば、エストニアではサイトにログインしてお金払えば国籍が買えるらしいです。仮想通貨は世界中で浸透してきていくでしょう。後には仮想国家が誕生します。この先世界では、もっと個々がどう共存するか、どう幸せになるか発信して議論し、それで生活ができる時代になるんじゃないかな。その文脈で哲学論は流行るんでしょうね。

[松本] 哲学論か…マメ研でもやろうかな。今日は貴重なお時間ありがとうございました！