こんにちは。「株式会社わたしは」の竹之内です。
つい先日ですが、珍しいことがありました。高校生の秋山璃月(りつき)さんが「取材」ということで弊社を訪ねてきてくれたのです。
秋山さんは埼玉県の開智高校の1年生です。
開智高校では「フィールドワーク」と称し、さまざまな大学や会社に取材をする課題があり、秋山さんは先日の千原ジュニアさんとの共演で、弊社のことを知ったとのことです。
創業半年、社員2名の会社に行くと担任の先生に伝えたところ
「大丈夫?」
とかなり心配されたそうですが、ともあれ、今回は秋山さんから頂いた質問を中心に、私たちの人工知能に対する考え方を述べたいと思います。
さて、取材をお引き受けするにあたって、我々は秋山さんに1つ、事前に宿題を出させていただきました。
その宿題とは
「現在、巷にある人工知能と、弊社の大喜利人工知能とは、本質的に何がちがうと思いますか?」
という質問です。
これは、秋山さんに予習していただくと話がスムーズに進む、という狙いもありましたが、高校生がAIを見た時に抱く素朴な疑問はどのようなものか?に、我々も興味がありました。
そして取材当日、秋山さんから頂いた回答は
「文章解析の精度とそれに紐づく条件分岐の精度が違うのでしょうか?」でした。
面白いです。
この質問、実は同業者たち、つまりAIの技術者からもよく聞かれる疑問なのです。
そして、この質問は実は核心をついています。
最も有名なマイクロソフトの「りんな」も含め、現在一般的な「対話型のAI」や「チャットボット」のしくみは、概ね以下のようなものです。
1.ユーザーから話しかけられる
「今何しているの?」
↓
2.ユーザーの会話の内容を分析し、予め用意された幾つかの返事の中から、最適と思われる返事を探す
「おなかへったー」
「今起きたところ」⇒ ◉最適◉
「昨日は楽しかった」
「仕事いやだー」
↓
3.ユーザーに返事を返す
「今起きたところ」
秋山さんからも、同業者からも聞かれる質問
「文章解析と条件分岐の精度はどれくらい?」
は、この2番めの「会話の内容の分析」をどれくらい細かくやっていて、それに対する「返事の候補」がどの程度あるのか?という疑問でしょう。
しかし、結論から言うと我々のAIは「返事の候補」を用意していません。
ここが重要な点です。
要するに、我々の対話型のAIは、予めデータベースに登録された返事をユーザーに返すだけ、と言うものではなく、ユーザーから質問があった都度、文章をゼロから生成しているのです。ここが、他の対話型AIとの決定的な違いです。
実は、この話をしますと、同行の方々から「信じられない」という顔をされます。
なぜならば、AIが会話の意味を理解し、返事を返すのは極めて難しいとされているからです。
例えば先日、あるニュースが報じられました。「東大合格」を目指していた人工知能が、東大合格を諦めた、というのです。
そして、その原因は「読解力不足」にありました。
AI研究者が問う ロボットは文章を読めない では子どもたちは「読めて」いるのか?
東ロボは、問題を解き、正解も出すが、読んで理解しているわけではない。現段階のAIにとって、文章の意味を理解することは、不可能に近い。
そうすると、特に難しいのが国語と英語だ。
国語では、2016年のセンター試験模試(進研模試 総合学力マーク模試・6月)では、200点中96点しかとれなかった。偏差値は49.7。5科目8教科全体の偏差値が57.1だったことを踏まえると、かなり低く、これらの教科は苦手だということがはっきりした。
AIが文章の意味を理解する、という行為はこれほど難しいのです。ですから、現在の対話型AIやチャットボットが、大した会話ができないことにも納得がいくでしょう。
つまり、現在巷にあふれるAIは、言語をまだ扱えていません。言語ではなく、記号を扱っているだけなのです。
先程の記事の中でも、AIが言語ではなく、記号として言葉を扱っていることが紹介されています。
「徳川家康は( )年の関ヶ原の戦いで、石田三成らの西軍を破った」の( )に何が入るか。
答えは1600年。
コンピュータは、この答えを膨大な情報を瞬時に検索して答えを出す。
教科書、Wikipedia、百科事典など、デジタル化された情報すべてにアクセスし、検索をかけられる。
コンピュータは「戦う」とか「破る」という事態が、どのような事態なのかはわからない。
(中略)
問題文は、コンピュータにとって、意味不明の記号の羅列にすぎない。
人間にとっての「●△※×★÷◎◆▼□+」と同じだ。
でも、膨大な検索をかけると「●△※」と「◆▼□」がセットで出てくることの多いことがわかる。
「●△※」と「◆▼□」は強い結びつきがありそうだと推論する。
これが確率だ。
そこで、選択肢の中から「◆▼□」を選ぶ。
これが「1600」だ。
膨大な検索を通じて、確率的にありそうなことを選び出す。
これがAIのやっている作業だ。
しかし、我々の「大喜利人工知能」は、違います。当然ですが、意味を理解していなければ、大喜利などできません。笑いと言うものは、大きく文脈に依存するものだからです。
逆に言えば、まだその領域はGoogleも、Facebookも、IBMも、Microsoftもたどり着いていません。よって、対話型AI開発の未踏の領域とは、AIに記号ではなく言語を扱わせることなのです。
では「言語」を扱うことのできるAIを生み出すには何が必要なのでしょう?
「ディープラーニング」だけでは不足です。ディープラーニングは記号を扱うには適していますが、言語を扱うには力不足です。
言語を扱うことの難しさを指摘する、数学・論理学・記号論・哲学・現代思想・コンピュータサイエンスの領域のほとんど科学者は、ここで、フレーム問題や不完全性定理を持ち出し、「人工知能の不可能性」に言及するばかりです。
しかし、私たちは、現在の人工知能ブームが到来する以前から、こういった問題系を扱う数理モデルを研究してきました。
こういう武器を手に、世界のトップを走っていると思われるGoogleやFacebookの人工知能研究者とは違う戦い方で、でも彼らよりも圧倒的に早く、最高の対話AIを作るチャレンジを始めています。
最後になりましたが、秋山さん、探究レポート頑張ってください!
【お知らせ】Books&Appsでは、企業の広報活動を支援するサービスを行っています。ご興味のある方はこちらからご連絡ください