JAPAN SYSTEMS Driving for NEXT NEW with Comfort and Convenience

人工知能技術の誤解と現実(2)

吉田裕之
ジャパンシステム株式会社
チーフテクノロジーアドバイザー
南山大学 客員研究員
博士(情報科学)

ここ数年、人工知能技術が話題になることがとても多いのですが、誤解に基づいた過剰な期待や危機感もよく聞かれます。このコラムでは、筆者が実際に出会った誤解を披露し、現実のAI技術が本当はどんなものなのかを、できるだけわかり易く解説していきたいと思います。

誤解その2:現時点ではまだ人工知能は本当の意味での「知能」ではないが、コンピューターの性能がもっと進歩すれば、近い将来に「知能」が生まれる可能性がある

2image01.png

現在Google社で人工知能関連の製品開発を担当しているレイ・カーツワイルは、10数年前に「シンギュラリティは近い」と主張しました。2020年代末には「コンピューターの知能が人間の知能と区別がつかなくなり」、さらに2045年には「これまでの人類の科学技術の歴史からはもはや推測不可能な社会(技術的特異点=シンギュラリティ)が訪れる」そうです。そのような社会では、私たちはどんな生活を送ることになるのでしょうか。

2image02.png

今年(2018年)は映画「2001年宇宙の旅」の公開50周年にあたり、10月には2週間限定でリバイバル上映がありました。あの映画の中では、コンピューターHAL 9000が「自分がミスを犯したかもしれない」という考えにどうしても納得できず、「ミスは人間が原因」という結論に至り、ミッション達成のための障害となる搭乗員達を排除しようとします。筆者よりもっと若い方が思い浮かべるのは「ターミネーター」(1984年公開)でしょうか。そこでは、1997年に自我に目覚めた軍事コンピューターSkynetが自己保存のために人類殲滅を企てます。欧米の方々が人工知能の未来を考えると、どうしてもそのような暗い話を思い浮かべてしまうようです。一方日本では、多くの人が「鉄腕アトム」「アラレちゃん」「ドラえもん」といった人間を助けるロボットを思い浮かべるためか、比較的楽観的な未来を描いているように思えます。ちなみに、鉄腕アトムの誕生日は2003年4月7日だそうです。いずれにしても、人工知能がさらに進化して「本当の意味での知能」になるのは、もうまもなくのことなのでしょうか?

2image03.png

そもそも「本当の意味での知能」とは何でしょう。前回のコラムでは、知能には色々な種類がある、主な分類として「五感による知能」「言葉による知能」「記号による知能」がある、と説明しました。それぞれ、動物にもある、人間にしかない、人間の中でも専門家だけが持つ知能です。チンパンジーの知能は人間の3歳児に相当するそうですが、チンパンジーに将棋を覚えさせるのはちょっと難しいでしょう。一方で、将棋プログラムはスマホで動作するものでさえ初心者ではかなわないほど強くなっています。とすると、スマホのプログラムはチンパンジーよりも知能が高いのでしょうか?普通、そうは思いませんね。チンパンジーは人間と比較できる程度の知能があるように思えるわけですが、将棋プログラム、つまり人工知能は、人間と比べられるような本当の知能ではない気がします。それはなぜでしょう。本当の知能とは何か、については様々な立場があります。今回はその中の三つをとりあげましょう。

一つは、人間の脳とは異なる仕組みによるものは本当の知能ではない、という立場です。前回のコラムでは、五感による知能の実現手段であるディープラーニングは神経細胞の仕組みをモデル化した技術である、と説明しました。今回はその仕組みを少し説明しましょう。図1を見てください。
2image08.png

図1 神経細胞の仕組み

神経細胞には、何本かの短い突起「樹状突起」と一本だけ長く伸びている「軸索」があり、樹状突起は電気信号を受ける役目、軸索は送る役目を果たします。軸索と樹状突起の接続部分は「シナプス」と言う化学的なスイッチになっていて、どの程度の電気信号が届いたら受け取るかは、シナプスによって感度が異なっています。複数のシナプスで受け取った電気信号の合計がある一定以上になると新たな電気信号が発生し、軸索を通してさらに隣に伝わっていきます。神経細胞の接続構造やシナプスの感度の違いによって、様々な異なる回路が形成できるのです。

この複雑な仕組みをかなり単純にモデル化したのが図2になります。樹状突起をダイヤル付の箱でモデル化していますが、このダイヤルが各シナプスの感度を表します。神経細胞本体は「σ」と書いてある箱ですが、σは入力が0より大きければ1、0以下ならば0を出力する関数を表します。
2image09.png

図2 神経細胞の仕組みの単純なモデル化

2image04.png

ディープラーニングではこのモデルを数式で表現し、大量の訓練データに対して最適なダイヤル設定を、GPUを使って計算します。これがシナプスの感度の学習に相当します。ここまで分かっていてGPUでバリバリ計算できるのであれば、あとはコンピューターの性能さえ上がれば本当の知能もできるかもしれない…そうでしょうか。実は、まだまだ解決しなければならない課題がたくさん残っています。図1・図2はたった一つの神経細胞の仕組みでしたが、人間には150兆個のシナプスがあります。あのAlphaGoはシナプスが2600万個のネットワークを2つ使っているのですが、人間はその300万倍のシナプスを持っているわけです。AlphaGoは合計5200万個のシナプスの感度を学習するのに50台のGPUを4週間以上使いました。人間の知能を実現するのに仮に単純にその300万倍の計算が必要としても、4週間で終えるにはGPUが1500万台必要で東京都一か月分くらいの電力を使いそうですし、もしGPUを1000台用意できたとしても計算に1万年以上かかります。いわゆるムーアの法則はもう限界まで来ていると言われていますので、これからコンピューターの性能が300万倍良くなることは期待できないでしょう。(そもそも、300万倍のシナプスを学習するのに300万倍の計算で済む、というのもありえないほど甘い見込みなのですが。)

2imege05.png

なぜそんなに計算量が必要なのかと言うと、実は生物がシナプスの感度をどうやって学習しているのかがまだ分かっていないからなのです。ディープラーニングでは、大量の訓練データを与えながらシナプスのダイヤルを少しずつ少しずつ調整して、正解の値が出るようになるまで計算を繰り返しています。これは、同じ処理を膨大な回数繰り返すのは得意というコンピューターのちから技を使った実現方法であって、人間の脳がそれと同じことをしているとはとても考えられません。人間が100歳まで生きるとして、もし1ミリ秒に一つずつ訓練データを与えたとしても、全人生では3兆回しか訓練できないわけで、それで150兆個のシナプスを精密に調整できるわけがないのです。人間は(動物も)何かまったく別の方法で学習しているに違いないのですが、それはまだ解明されていません。

2image06.png

それだけではありません。神経細胞は人間の体に1000億個あって、筋肉や内臓や脳のどこにあっても基本的には同じ仕組みですが、それらを組み合わせて実現できる機能は多種多様です。筋肉や内臓にある神経細胞は脳から送られた指示に従う役割なのに対し、脳の神経細胞はその指示を生み出すのが役割です。脳の中でも脳幹は自律神経を制御し、小脳は五感からのフィードバックを使って運動を制御します。だから、歩行や自転車乗りなど一度覚えた動作は考えなくても無意識にできるわけです。一方、大脳の旧・古皮質は本能(食欲や性欲など)と低レベルの感情(恐怖や怒りなど)を処理し、知的活動(思考や判断・言語など)と高レベルの感情(喜びや悲しみなど)は哺乳類にだけ存在する大脳新皮質が司っています。たった一種類の回路素子を使って、こんなに数々の異なる回路が実現されていることは、驚くべきことですね。これらの上位機能の実現方法は現在着々と解明が進んでいるところですが、まだまだ時間がかかりそうです。

そして、さらにこれらの上位に「意識」「自意識」「自我」「意志」などと呼ばれる特別な機能があります。Skynetは自我に目覚めたコンピューターとして描かれていますが、大規模な知的活動を行うコンピューターを作ってみたらなぜか目覚めた、という設定でした。HAL9000や鉄腕アトムにも明確に意識ないし意志があるように思えます。しかし現在のところ、意識や意志がどんな仕組みで実現されているかについては、ほとんど解明できていません。つまり当面の間、実現できるのはせいぜい「無意識の知能」になるわけで、欧米の方々が恐れるような、日本人が期待するような、本当の知能を持ったコンピューターの実現はまだまだ当分先の話と言えるでしょう。

さて、このコラムの最初の方で、本当の知能とは何かについて三つの立場をとりあげる、としましたが、すでに最初の立場の説明だけでずいぶんな文量になってしまいました。あとの二つは参考情報として簡単に説明しておきます。

2image07.png

第二の立場は、実現の仕組みは関係なく、知能があるように見えるならば知能はある、という主張です。チューリングマシンの生みの親として有名なアラン・チューリングが1950年に提唱した「チューリングテスト」が有名です。これは、コンピューターを人間の審査員と十分な時間会話させ、審査員がコンピューターか人間かを区別できなければそのコンピューターは知的と言える、というテスト方法です。実はすでに2014年に、英国王立協会が実施したチューリングテストにロシア製のコンピューターが史上初めて合格しています。つまりこの立場からはすでに本当の知能は誕生しているのです。皆さんが人間だと思って会話している相手の中には、そんな人工知能がすでにいるのかもしれませんね。いるとしても、それを「本当の知能」と言えるでしょうか。

第三の立場は、特定のことしかできない人工知能は本当の知能ではない、という主張です。自動運転のプログラムに囲碁はできませんし、AlphaGoは車を運転できません。人間のように柔軟に様々なことができる人工知能を「汎用人工知能(AGI: Artificial General Intelligence)」と言いますが、今のところ汎用人工知能はまだ開発できていません。「記号による知能」や「五感による知能」の汎用化はある程度は可能でしょう。これらが扱う対象は曖昧性が無いので、ある範囲で一般化ができます。例えば、DeepMind社が開発したDQNはブロック崩しやピンボールなど30近いゲームで人間と互角に勝負できますし、AlphaGoの後継のAlphaZeroは囲碁だけでなくチェスと将棋の三冠王になっています。汎用化が最も難しいのは「言葉による知能」でしょう。曖昧な言葉の意味をどう扱うか、という積年の技術課題に真っ向から立ち向かわざるを得ないからです。例えば、「本当の」という言葉の意味をどうやってコンピューターに理解させるのか。例えば「理解」の意味とは。例えば、「例えば」とは…。人間のように言葉をあやつるコンピューターの実現には、まだまだたくさんの課題が残っているのです。

現実のまとめ

  • 本当の意味での知能とは何かについては、これまでも色々な立場での議論があった
  • どの立場でも、コンピューター性能の向上だけでは解決できない課題がまだまだたくさんある
  • 本当の意味での知能を実現するにはそれらのたくさんの課題が解決されなければならないので、近い将来に実現するのはかなり難しい

筆者プロフィール:吉田裕之

ジャパンシステム株式会社チーフテクノロジーアドバイザー。南山大学客員研究員。 某大手電機メーカーにて、長年にわたって人工知能/ソフトウェア工学/オブジェクト指向技術の研究開発に従事。オブジェクト指向、Java、モデリング技術関連の著作多数。UMLモデリング推進協議会(UMTP)経営委員。Modeling Forumプログラム委員会副委員長。電子情報技術産業協会(JEITA)ソフトウェアエンジニアリング技術専門委員会幹事。OASIS OSCL PROMCODE TC メンバー。博士(情報科学)。

Adobe® Reader®

PDFファイルの閲覧には、Adobe® Reader®が必要です。

Adobe® Reader®のダウンロード

お問い合わせ