5分でわかる『人工知能は人間を超えるかディープラーニングの先にあるもの』

東京大学の松尾豊准教授（当時、現教授）によって執筆された、2015年出版の本
人工知能とは何か、その歴史、今（執筆当時）起きていること、近未来に起こること、そこで我々がすべきこと、について書かれている。

あとがき等まで含めて260ページ、専門書ではなく、素人にもわかりやすく説明している本なので非常に読みやすかった。

人工知能とは
2度のAIブーム
1. 第1次AIブーム
2. 第2次AIブーム
切り開かれた新時代
ディープラーニングの先
シンギュラリティは起きるのか
私たちがすべきこと
日本が生き抜くために
まとめ

人工知能とは

巷には「人工知能を搭載した商品」や「人工知能を使ったシステム」が溢れている。
ところが、本当の意味での人工知能は「人間のように考えるコンピュータ」であり、それはまだできていない。

世間で言われるところの人工知能は、入力（人間の五感に相当する「センサー」により観測した周囲の環境や状況）に応じて、出力（運動器官に相当する「アクチュエーター」による動作）が変わるものを指している。
例えば、掃除ロボットの「ルンバ」は部屋の形とゴミの状況によって動きが変わる。
まるで知能を持っているかのようだ。

世の中で人工知能と呼ばれているものは、段階によってレベル1からレベル4までの分類をすることができる。

【レベル1】単純な制御プログラム

レベル1は、マーケティング的に「人工知能」「AI」を名乗っているだけで、実際はごく単純な制御プログラムを搭載しているだけの家電製品に「人工知能搭載」などとうたっているケースが該当する。
研究者の立場からすると、これらを人工知能と称するのは研究者や技術に若干失礼だが、便宜上、本書ではレベル1の人工知能と呼んでいる。

【レベル2】古典的な人工知能

レベル2は、将棋のプログラムや掃除ロボット、質問に答える人工知能などが対応する。
推論・探索を行っていたり、知識ベースを入れていたりすることにより、レベル1と比べてきわめて多彩な振る舞いのパターンを実現した。

【レベル3】機械学習の導入

レベル3は、検索エンジンに内蔵されていたり、ビッグデータをもとに自動的に判断したりするような人工知能である。
入力と出力を関係づける方法が、データをもとに学習されているもので、典型的には機械学習（サンプルとなるデータをもとに、ルールや知識を自ら学習）のアルゴリズムが利用される場合が多い。

【レベル4】ディープラーニングの導入

レベル4とはディープラーニングのことで、機械学習の入力に使う変数（特徴量）自体を学習するものである。
ディープラーニングが導入されたことにより、人工知能の研究は新たなステージに突入した。
本書の5章以降で詳細に解説されている。

2度のAIブーム

人工知能研究ではこれまでに2回、ブームと冬の時代を繰り返してきた。

第1次AIブーム

第1次AIブームは1950年代後半～1960年代に起こった。
コンピュータで推論・探索をすることで特定の問題を解く研究が進んだ。

しかし、この時代のAIでできることと言えば、迷路やパズルを解くだとか、チェスや将棋に朝鮮するとかいったような、非常に限定的な状況において問題解決をすることだった。
無論、現実の世界の問題ははるかに複雑で、この時代のAIには解くことができなかった。

いわゆるトイ・プロブレム（おもちゃの問題）しか解けないことが明らかになると、ブームは急速に冷め、1970年代には人工知能研究は冬の時代を迎える。

第2次AIブーム

1度下火になった人工知能研究だが、1980年代になると再び勢いを取り戻した。

膨大な専門知識を取り込むことにより、医療・生産・会計・人事・金融などの分野で専門的な問題に対応できるようになった（エキスパートシステム）。

ところが、現実問題に対応できたかのように見えたエキスパートシステムにも課題があった。

まず、知識をコンピュータに与えるために、専門家からヒアリングして知識を取り出さないといけないが、コストがかかる大変な処理だった。

コストがかかるというだけなら、大企業がお金をかければ突破できそうなものだが、さらに別の問題もあった。
知識の数が膨大になると、互いに矛盾していたり、一貫していなかったりする。
こうなると、ひたすら知識をインプットするだけではなく、インプットした知識を適切に維持管理する必要が出てきた。

さらに、他の問題もあった。
知識というのは必ずしも明確なものだけとは限らない。
例えば、「胃のあたりがムカムカする」といった症状に対してコンピュータが診断を下すためには、「胃のあたり」とはどのあたりか、「ムカムカする」というのはどういった状態なのか、きちんと定義しておく必要がある。

そういったことを定義しなければならないということは、コンピュータはさらに広大な範囲の知識、我々にとっては常識と言えるような知識までインプットしなければならないということである。
例えば、人間には通常、手と足が2本ずつあるとか、「お腹」と呼ばれる部位には「胃」「小腸」「大腸」などがあるとかいった、当たり前の知識がそれである。
常識まで含めると、コンピュータに教え込まなければならない知識はもはや無限であり、それを人の手でインプットしていくのが無理なことは明白であった。

こうして1995年頃、人工知能研究は再び冬の時代を迎えることとなる。

切り開かれた新時代

2度もの冬の時代を迎えた人工知能研究だが、機械学習によって3度目のチャンスを得ることになる。

機械学習とは、人工知能のプログラム自身が学習する仕組みである。
機械学習によって、分類の仕方、線引きをコンピュータが自ら見つけることで、未知のものに対して判断・識別、予測をすることができる。

ただ、機械学習にも弱点がある。
それが、フィーチャーエンジニアリング、つまり特徴量の設計である。
特徴量というのは、先述のとおり、機械学習の入力に使う変数のことで、この特徴量に何を選ぶかで、予測精度が大きく変化する。

例えば年収を予測する際、特徴量に「性別」「居住地域」を選択するのは妥当だが、「身長」はあまり関係がなさそうだし、「好きな色」なんてものはほぼ無関係だろう。
この機械学習の精度の肝となる「どんな特徴量を入れるか（特徴量設計）」は、人間が頭を使って考えるしかなく、これが機械学習の最大の関門だった。

そして、その関門を突破したのがディープラーニング（深層学習）である。

ディープラーニングは、データをもとに、コンピュータが自ら特徴量をつくり出す。
これは人工知能の黎明期以来の大発明だという。
仕組みについては割愛するので、気になる方は本書を読んでほしい。

ディープラーニングの先

ディープラーニングは人工知能研究における50年来のブレークスルーであるが、同時に、これから起こる人工知能技術全体の発展のほんの入口にすぎない。
筆者は次のような段階で研究が進展すると見ている。

入力データ	獲得する能力	関連領域
画像データ	①画像からの特徴表現と概念の獲得	画像認識精度の向上
観測データ（動画+音声+圧力など）	②マルチモーダルな特徴表現と概念の獲得	環境認識行動予測
自分の行動データ+観測データ	③「行動と結果」の特徴表現と概念の獲得	プランニングフレーム問題の解決
試行錯誤の連続的な行動データ	④一連の行動を通じた現実世界からの特徴量の取り出し	推論・オントロジー高度な状況の認識
言語データ	⑤言語と概念のグランディング	シンボルグラウンディング問題言語理解
人類が蓄積してきた大量の言語データ	⑥言語を通じての知識獲得（人間を超える？）	知識獲得のボトルネック解消高次社会予測

⑥の段階まで来ると、コンピュータが人間の言葉を理解できるようになる。
現在のように、人間から投げかけられた言葉に対して、データベースの中から最適な言葉を返すような段階ではなく、内部的に何らかのシミュレータが備えられていて、「人間の言葉を見聞きするとそこに何らかの情景が再現できるようになっている」段階である。

そうなると、コンピュータは本やウェブの膨大な情報を読めるので、途方も無いスピードで人間の知識を吸収していくだろう。

ただし、人工知能が知識を吸収する際に落とし込む概念は、人間の概念とは全く異なる可能性がある。
例えば、人間は目や耳の形、ひげ、全体の形状、鳴き声などからネコをネコだと認識するが、人工知能は、人間には見えない紫外線・赤外線や、小さすぎ・速すぎて見えない物体などをもとにネコをネコだと認識する可能性がある。

この差異は、人工知能が単体で動く分には問題とならないが、人間とコミュニケーションをする場合には別だ。
ドラえもんのような、人間の生活に深く入り込んでコミュニケーションを取るような人工知能は、人間が使っている概念も理解する必要があるので、⑥よりもさらに発展した段階にあると言える。

シンギュラリティは起きるのか

シンギュラリティというのは、人工知能が自分の能力を超える人工知能を自ら生み出せるようになる時点を指す。
その時点に達すると、人工知能が自分より賢い人工知能をつくり、その人工知能がさらに賢い人工知能をつくり・・・となるので、圧倒的な知能がいきなり誕生するという想定である。

では、そうなった場合に、ターミネーターの世界のように、人工知能が人類を支配したりするのだろうか。
この問いに対して、筆者は「現時点ではない」と結論づけている。

その理由は、人工知能に生命をつくる能力が備わっていないからである。
「征服したい」という意思は、自らの保存欲求、複製欲求が生まれて初めて生じる意思である。
だから、知能をつくることができたとしても、生命をつくることができるようにならない限り、人工知能が人類を征服しようとする日は来ないだろう。

私たちがすべきこと

人工知能の発展に伴い、様々な職業が失われるというのはよく聞く話だ。
実際にどの仕事が失われるかは、どのくらいのスパンかによる。
筆者の予測は次のとおり。

短期的（5年以内）には、会計・法律・広告・防犯・監視といった領域で人工知能の適用が進む。
本書が出版されたのは2015年なので、短期的スパンがそろそろ終わろうとしている段階だが、その間には実際、某外資系証券でほとんどのトレーダーが解雇され、AIに置き換わったなどというニュースもあったと記憶している。

中期的（5年から15年）には、生産管理やデザインといった部分で、人間の仕事がだいぶ変わる。
監視員のように、「何かがおかしい」ことを検知する仕事は、センサー+人工知能で代替できるので、人間は例外処理の部分だけ対応すればいい。

長期的（15年以上先）には、その例外処理すら人工知能がカバーできるようになりそうだ。

上記から考えると、短期・中期的には、データ分析や人工知能の知識・スキルを身につけることが大変重要だが、長期的には、人間にしかできない大局的な判断（経営や事業の責任者のような仕事）をできるようになるか、むしろ人間対人間の仕事（セラピストやレストラン店員など）に特化していく方が良い。
特に後者は、「人間が対応してくれた方が嬉しい」という人がいる限りは無くならない仕事である。

日本が生き抜くために

最後に、より視点を広げ、日本レベルで考える。
日本がこの先、人工知能分野で国際競争に勝ち残るための課題は次のとおり。

データ利用に対する社会的な受容性
過度な警戒・抑制は、領域をまたがってデータ活用をする段階では足かせとなる。
データ利用に関する競争ルール
海外有力プラットフォーマーによるデータの囲い込みを防ぐ。
モノづくり優先の思想
ロボットづくりは盛んだが、脳となる人工知能の研究はないがしろにされがち。
人レベルAIへの懐疑論
いまだに人工知能は夢物語だと思っている人が多い。
機械学習レイヤーのプレイヤーの少なさ
「機械学習の精度が上がると売上が莫大に伸びる」ビジネスモデルを築き上げている企業がほとんどないので、投資できる企業が少ない。

まとめ

60年以上の人工知能研究は、いくつもの壁にぶつかってきた。
それらは「特徴表現の獲得」という問題に集約できるが、その問題は今、ディープラーニングによって一部ではあるが、解かれつつある。
そして、今後、高い認識能力や予測能力、行動能力、概念獲得能力、言語能力を持つ知能が実現する可能性がある。

全体的に具体例が豊富で、平易な文章で解説されているので、人工知能のこれまでと今後について知りたい人にはおすすめの本だと思う。

[商品価格に関しましては、リンクが作成された時点と現時点で情報が変更されている場合がございます。]

人工知能は人間を超えるかディープラーニングの先にあるもの（角川EPUB選書） [ 松尾豊 ]
価格：1540円（税込、送料無料) (2019/12/1時点)

人工知能は人間を超えるか　ディープラーニングの先にあるもの