JAPAN SYSTEMS Driving for NEXT NEW with Comfort and Convenience

人工知能技術の誤解と現実(1)

吉田裕之
ジャパンシステム株式会社
チーフテクノロジーアドバイザー
南山大学 客員研究員
博士(情報科学)

image01.png

2010年代に入り、にわかに「人工知能/AI」という技術が注目され始め、「第三次AIブーム」とも言われています。IBM Watsonが、クイズ番組Jeopardy!に出場して優勝賞金百万ドルを獲得したのは2011年のことでした。Googleが、YouTubeのビデオから切り出した一千万枚の画像で学習させたところ、猫を認識できるAIが生まれたと発表したのは2012年です。2017年には、同じくGoogleのグループ会社であるDeepMind社が開発したAlpahGoが、囲碁の世界チャンピオンに3戦全勝しました。最近では、AIスピーカーや自動翻訳が実用化されて多くの人々が利用しています。

こうした様々な驚くべきできごとを、全部をひっくるめて「人工知能技術は凄い」と単純化して説明することが多いので、行き過ぎた期待や危機感もよく聞かれます。専門の立場でそれを聞いていると、「その説明だとそう思ってしまうのも無理もないな」と思える誤解もありますし、自分ではわかり易く説明したつもりでも「なるほどそう理解してしまうのか!」と意外に思える誤解もたくさんあります。

このコラムでは、筆者が実際に出会った誤解を披露し、現実のAI技術が本当はどんなものなのかを、できるだけわかり易く解説していきたいと思います。

誤解その1:人工知能は人間の脳の仕組みをモデルにした技術である

image02.png

人工知能とは文字通り「人間の知能を人工的に実現すること」ですが、その目的をサイエンスの立場から言えば、人間の知能の仕組みを解明することでしょう。一方でエンジニアリングの立場での目的は、「人間の知能による処理と同じ結果を(より早くより正確に)出せるようにする技術」を生み出すことなのです。

この立場からすれば、知能が模倣できればよく、脳がどんな仕組みなのかはさして重要ではありません。ですから、一口で「人工知能」と言っても、中には脳の仕組みをモデルにしたものもあることにはありますが、ほとんどはそうではありません。人工知能と言われている技術には多種多様なものがあるのです。

image03.jpg

人工知能技術に様々な種類がある理由は、そもそも模倣すべき「知能」に色々な種類があるからです。例えば、ペットの犬は人間の顔を見て、飼い主かどうか、怒っているかどうか、を認識していますよね。飼い主ならだれでも、うちのワンちゃんは「知能」が高いよな、とうぬぼれているものです。そもそも動物ならばどんなに下等なものでも、眼の前にあるものが食えるものか、あるいは自分の方が食われてしまう天敵なのかを、瞬時に識別できなければ、とっくの昔に自然淘汰されていることでしょう。視覚・聴覚・嗅覚・味覚・触覚に基づく「五感による知能」は、人間に限らずどんな動物にも備わっている能力です。

image04.png

それでは、人間にしか無い知能はなんでしょう。それは「言葉による知能」です。人間は言葉を生み出したことで、自分の体験を他人に伝えること、つまり、知識の共有が可能になったのです。さらに文字を発明したことで、世代を越えた知識共有ができるようになり、その積み上げが文明となったわけです。

image05.png

「言葉による知能」は人間誰しもが備えている能力ですが、人間の中には非常に優秀で、他の人にはちんぷんかんぷんな問題に取り組む人もいます。例えば、プログラマ。普通の人達からは、コンピュータに向かっておまじないを唱えている人に見えることでしょう。物理学者は物理現象を数式化して研究し、化学者は化学反応を分子式で研究し、数学者は現実には無いことさえも抽象化して考察します。これらの人々は曖昧な自然言語ではなく、精密に定義した記号を使って考えます。そこでこうした知能を「記号による知能」と呼びましょう。「記号による知能」は、人間の中でも一部の専門家だけが持つ最も高度な知能です。

このように、人間が持つ知能には大きく分けても3種類あります。人工知能研究者達は1950年代後半の第一次ブームの頃から、これら3種類の知能を人工的に模倣するための様々な技術を開発してきました。実はほとんどの原理はその頃に発明されたものなのですが、実用化されるまでには長い年月が必要でした。

面白いのは、これらの内で最初になんとか実用化できたと言えるのは、一番高度なはずの「記号による知能」だったことです。まず、数式を効率よく計算する数々のアルゴリズムが開発され、物理学者がそれまで筆算で解いていた問題を自動で計算できるようになりました。数学の定理を(人間が補助線を引くなど適宜助けてやれば)証明するアルゴリズムもできました。8クィーンやハノイの塔など簡単なパズルならば人間よりも高速に解けるようになり、さらにチェッカー、オセロ、チェスなどのゲームの世界で人間のチャンピオンに勝利しました。

なぜ、最も高度な「記号による知能」が最初に実用化できたのか。それは、記号で定義できる問題には曖昧性がなく、その中から解答をすばやく正確に見つけることは、人間よりもコンピュータの方がずっと得意だからです。ただし、解を探す範囲は膨大です。例えば、8クィーンパズルでは8の8乗= 16,777,216個の配置があり、囲碁の盤面は10の180乗個の配置があります。人工知能研究者達はこうした膨大な範囲を無駄なく効率よく探索するアルゴリズムを開発し、改良し続けて来たのです。そうした探索アルゴリズムは、もちろん人間の脳の仕組みとは無関係ですし、人間の専門家の思考過程とはぜんぜん違う方法を使うものも少なくありません。例えば、AlphaGoは持ち時間の間に(相手が考えている間も)現在の盤面の続きをランダムに何千局も打ってみて、その中で最も勝率が高かった手を選びます。

image06.png

では「言葉による知能」はどうでしょう。言葉は記号と違って曖昧性があるので、言葉で定義された問題の場合、コンピュータはどの範囲を探索すればいいかがわかりません。自動翻訳の分野には昔から有名な「鰻文」という例があります。「私は鰻だ」を英文に翻訳する問題ですが、もちろん正解は「I’m an eel.」ではありません。そもそも元の日本語が意味不明だと思いますよね。ですが、「ご注文は?」「私は鰻だ」「鰻丼ですね」なら通じますね。このように言葉は、状況によって意味が変わるので、いわゆるKYなコンピュータには扱いがとても難しいのです。コンピュータには空気が読めないことは、人工知能研究初期から認識されていて「フレーム問題」と呼ばれています。人間は日常的にフレーム問題を解決して暮らしているわけですが、その仕組みは解明されていません。

1980年代の第二次AIブームの頃、「言葉による知能」の実用化方法が考案されました。その秘訣は、適用する世界を限定することでした。限定した世界でよく使う言葉をリストアップしておいて、それぞれの言葉への対応を決めておきます。そして、使うときには与えられた言葉を検索して決められた対応を取る、これが当時もてはやされたエキスパートシステムです。最近流行っているチャットボットやAIスピーカーも基本的にはこの技術で、検索に失敗した時は「すみません、お役に立てません」と言うことにしてあります。Watsonは、Jeopardy!のすべての過去問と大量なWikipedia記事を、高速に検索できるような形式に変換してデータベースに持っていたのです。

image07.png

さて、三種類の知能の内、動物でさえ持っている「五感による知能」がコンピュータには一番難しかったのですが、それは例えば画像のどこをどう見て「猫」だと判断しているのかを、記号はもちろん言葉でさえも表現することが難しいからです。画像認識の研究者達は、画像の中からどうやって顔の輪郭を切り出し、耳はどこにあり、それが垂れているのか立っているのかをどうやって分析するか、という技術開発に地道な努力を続けてきましたが、人間並みの能力にはなかなか届きませんでした。そしてこの問題を、神経細胞の仕組みを使うディープラーニングが解決したことで、第三次AIブームが花開いたのです。ディープラーニングこそは、人間の脳の仕組みをモデル化した技術である、と言えるでしょう。

ディープラーニングでは対象とする世界を探索も検索もする必要がありません。典型的なサンプルデータとその解答を大量に与えて学習すれば、どんなデータに対してどう答えるのかを覚えてしまいます。なぜそんなことができるのか、なぜ最近になってそれができるようになったのか、については、この連載コラムの中で順次説明して行く予定です。

現実のまとめ

  • 知能には五感・言葉・記号による三種類がある
  • それらを模倣するためには、対象を定義する方法が異なる
  • それぞれに典型的な実現技術は探索アルゴリズム、言葉の検索、ディープラーニングである
  • 探索アルゴリズムと言葉の検索は、人間の知能による処理と同じ結果を出すべく開発された技術ではあるが、脳の仕組みを利用したものではない
  • 脳細胞の仕組みの単純なモデル化であるディープラーニング(ニューラルネットワーク)は、主に「五感による知能」の模倣に利用されている
知能の種類 保有者実用化技術対象の定義方法
記号による知能 専門家だけ 探索アルゴリズム 数式等で定式化した有限な範囲
言葉による知能 人間なら誰でも 言葉の検索 曖昧性のない範囲に事前に限定
五感による知能 動物にもある ディープラーニング サンプルデータを大量に与える

筆者プロフィール:吉田裕之

ジャパンシステム株式会社チーフテクノロジーアドバイザー。南山大学客員研究員。 某大手電機メーカーにて、長年にわたって人工知能/ソフトウェア工学/オブジェクト指向技術の研究開発に従事。オブジェクト指向、Java、モデリング技術関連の著作多数。UMLモデリング推進協議会(UMTP)経営委員。Modeling Forumプログラム委員会副委員長。電子情報技術産業協会(JEITA)ソフトウェアエンジニアリング技術専門委員会幹事。OASIS OSCL PROMCODE TC メンバー。博士(情報科学)。

Adobe® Reader®

PDFファイルの閲覧には、Adobe® Reader®が必要です。

Adobe® Reader®のダウンロード

お問い合わせ