本稿は小生による記述である。
最近のタクシーには後部座席に広告を表示するためのディスプレイが設置されている。以前はハガキサイズの紙のチラシが設置されていたところだ。ディスプレイに付随しているカメラで小生の顔を読み取り、適切な動画広告を流しているのだという。顔認証技術のAIソリューションというらしい。動画広告を見ていると、AIを活用した社員のモチベーション管理だとか、クラウドを活用した顧客管理だとかの広告が流れる。女性が乗れば、おそらく化粧品の広告などが流れるのかもしれない。
AIについて直近で感嘆したのは、AlphaGo Zeroについてだろう。AlphaGo ZeroはAlphaGo Fan、AlphaGo Lee、AlphaGo Masterにつづく、Googleによる第四弾の囲碁ソフトウェアである。特筆するべきはAlphaGo Zeroは人工知能同士を何千万回と対戦させることで、自らを強く成長させている。要するに過去に人間によって積み上げられた線局データを読み込んで学習するのではなく、AlphaGo Zero自身が自身の分身と対戦することで強くなったのだ。
小生がAIという言葉を最初に知ったのは、30年近く前の小学生の時である。ファミコン版ドラゴンクエスト4にAIが搭載されているという話である。AlphaGoと比べると簡素なもので、通常4人の仲間それぞれに攻撃指示をするところを、「ガンガン行こうぜ!」や「命を大事に!」といった大まかな指示を与えることで、仲間がそれにしたがって攻撃したり、回復呪文を唱えたりするというものだった。当時としては画期的だったものの、何度戦いを繰り返しても、スライム相手に最強呪文を使うように、徐々に知能が高まるとは言えないものだった。
一方で最近我が家に導入したAlexaは日々賢くなっている実感をする。今日amazonが荷物を届けることを教えてくれるし、喋りかければ天気を教えてくれる。好きな音楽もかけてくれる。おそらくamazonの発注もできるだろう。それに私達の音声を認識する精度も日々成長している。先月はできなかった幼稚園児の曖昧な日本語も今では理解する。
これら4つの例だけでも分かる通り、AIという言葉は様々な技術レベルで使われている。AIは人工知能と訳されるが、社員のモチベーション管理のAIとAlphaGoのAIでは質的にまったく違う。何が違うかと聞かれると言葉に窮するが、ここでは発想力の有無としておこう。新しい発想力を必要としないもの、例えば、この場合はこういった命令を出す、と決まっていれば通常のプログラムの域を出ない。実際のプログラムはもう少し複雑だが、概ね以下のようなものだ。
仲間が死にそう → 「命を大事に!」という命令 → 回復呪文
仲間が死にそう → 「ガンガンいこうぜ!」という命令 → 最大火力攻撃
プログラムというものは基本的に、入力→処理→出力という流れをくむ。しかし、AlphaGo Zeroに関しては、過去データの入力はない。Alexaの音声認識は、おそらく膨大な我々の問いかけをどうにか計算し、認識精度を高めているのだろう。こういったことから昨今、頻出するAIという言葉が小生の中で曖昧なのである。何を以ってAIと言えるのか、それは計算機の進化によって変わってきたものなのか。では機械学習との違いはどうだろう。ディープラーニングと言われる深層学習とはなんだろう、といった疑問で溢れている。
本稿では読者にとって既知かもしれないが、本稿では改めてAI、人工知能、機械学習、ディープラーニングといった言葉について検討する。
1.AIの歴史
2.AIの定義
AIとはartificial intelligenceの略であり、直訳すれば(自然に対して)人工的な、知能、知性ということになる。知能とはなんだろうか。知能(ちのう)は、論理的に考える、計画を立てる、問題解決する、抽象的に考える、考えを把握する、言語機能、学習機能などさまざまな知的活動を含む心の特性のことである。(友注 wiki)
よって、人為的に作った機械がさまざまな知的活動を行うことのようだ。しかし知的活動そのものは人間の活動であるから、人工的な知的活動の模倣する仕組みということになる。
AI研究者によるAIの定義を表に示す。(人工知能は人間を超えるか 松尾豊 P45)
中島・武田・西田・溝口・山口・栗原を大まかに統合するのなら、「人工的な知能」ということになる。長尾も近似で人間の頭脳活動を模倣する「システム」とする。堀は「世界である」とし、定義を広範にしている。山化はは人間が作った計算機知能を指す。松尾は知能を「気づくことのできる」とし、データの中から特徴量を生成し現象をモデル化するものとしている。
ここでは、前述の事例を明快に把握するために、前掲書が世の中のAIを四段階に分類していることを参考にする。
(1) レベル1のAI
マーケティング的に「人工知能」「AI」と称しているが、実態としては単純な制御プログラムのもの。前掲書ではエアコンや掃除機、電動シェーバーなどで人工知能を名乗るものを指している。例えば自宅のルンバは人工知能搭載となっているが、高いところから落ちないものの、いつまでたっても壁にボコボコぶつかる始末だ。高いところから落ちないというだけで人工知能というのは横柄だろう。これがもし、一ヶ月後に小生の間取りや家具の配置を覚え壁にぶつかることなく、そしてフローリングと絨毯を区別し、それを巻き込むことなく清掃を終えることができるのなら、人工知能搭載と呼べるだろう。
(2)レベル2のAI
振る舞いのパターンがきわめて多彩なものを指し、将棋のプログラムや掃除ロボット(最近のルンバか?)、質問に答える人工知能などとしている。著者はレベル2のAIを古典的人工知能と呼び、入力と出力を関連付ける方法が洗練されており、その組み合わせが極端に多いものとしている。パターンが多彩とするとは、おそらく「この場合でこの場合のこの場合はこれ」のもっと重層的なものを指していると思われる。
たしかにアキネイターのような、いくつかの質問に答えるだけで、自身がどんな有名人を想像しているかを当てるようなものは、低レベルだが一種の人工知能と言えるのかもしれない。二択の質問も15回繰り返せば、65536通りとなる。後ろでは単純な分岐プログラムが組まれているのかもしれないが、分岐回数が多いため、我々には一種の知能を持ったもののように感じられる。
しかしこれではプログラムを人為的にチューニングを続けないと、その精度は高度化しない。いわゆるタダの複雑なだけのプログラムと言えるだろう。
(3)レベル3のAI
ここで機械学習が出てくる。著者は機械学習を取り入れた人工知能をレベル3としている。例えばグーグルの検索エンジンは使っているうちに、ユーザーの特性を学習し、検索結果を出力する。検索結果に出てくる広告も同様だろう。グーグルが小生を男性だと思えば、男性向けの広告を出すが、その性差、年齢、居住地域を小生はグーグルに問われたことはない。小生のウェブでの行動履歴をcookieなどを活用し学習している。
機械学習というのは、サンプルとなるデータ(ウェブでの行動履歴)をもとに、ルールや知識(性差、年齢、居住地域、趣味趣向などの想定)を学習するものである。
昨今の人工知能というと、このレベル3のものを指すものが多い。
友注 他の事例
(4)レベル4のAI
レベル4は機械学習をする際のデータを表すために使われる変数(特徴量とよばれる)自体を学習するものである。ディープラーニング、深層学習と呼ばれるものである。特徴量を学習するとは、例えば以下の飲食店の事例を考えてみよう。
その飲食店の伝票には当日の天気や気温、そして湿度、風速、または日経平均株価や為替レート、山手線の乗客数、店の前を通過した車の台数、はてまた他店の来客数など記録されているとし、これらを人工知能に入力する。
一般的に通常の店員なら、曜日や天気などまでが判断材料になるだろう。それを以って、今夜の来店数を予測する。計算機の演算速度は年々上がっているので、一見関係のないデータを入力しても十分に解析する。もしかしたら、山手線の乗客数が来店数と相関関係があるかもしれないし、気温ではなく湿度が重要な要因かもしれない。そういった判断材料自体をも演算によって導きだすレベルのものを指している。
ここでさらに機械学習は「教師あり学習」と「教師なし学習」に大別される。教師あり学習とは、例えば画像の学習データに、人間がこれは「花」、これは「犬」などとラベルをつけて正解を教え込ませるものだ。次に画像を読まされた人工知能は、事前に覚えた「花」というラベルに似ているから、これも「花」だと答える。しかし事前に教えられていないものを見てもわからない。「車」とは答えられないし、チューリップを見てもバラを見ても「花」としか答えられない。
前述の飲食店の事例では、湿度ではなく温度との相関関係があることが正しいと教え、結果を営業に活用する。人為的にラベルをつけて、以後の解析を行わせるわけだ。
一方、教師なし学習は人為的にラベルをつけない。2012年にGoogleが膨大な画像を読み込ませるだけで、その人工知能はこれが「猫」だと判別した。幼児が人生を通じて、いつのまにかこれは「犬」ではなく「猫」だと認識する過程に似ている。教師なし学習は、そのまま学習を続けていけば、猫の種類もいずれ判別するわけだ。
3.まとめ
聞き慣れない言葉がたくさん出てきたので、一度まとめる。
(レベル3以上の)AIとは機械学習であり、機械学習は教師あり学習と教師なし学習に分けられる。それは人為的に正解にラベルを付けるか、正解そのものを機械が示すかの違いである。教師あり学習のなかで、機械が特徴量を見つけるものを深層学習(ディープラーニング)と呼ぶ。(友注 教師なし学習は特徴量をどうしているのか?)
図
少なくともこの四分類で、人工知能とよばれる製品・サービスを分類、把握することが可能になった。特徴量や教師あり、なしに関しては、まだ実感のないフレーズであるが、概ね理解が整った。今後、この分野はさらに劇的な進歩を遂げ、仕組みは複雑化し、理解は難しくなるだろう。これまでのプログラムのようにボタンを押せばドアが開くといった単純なものや、少し高度なもので検索したら(一応ユーザーを考慮した)結果が返ってくるといった、小生の理解の及ぶところを遥かに超え、そういった高度化な人工知能が組み込まれた製品・サービスが登場することは想像に易い。
AIが我々の仕事を奪うだろう、という話はよく聞くものだ。しかしどうだろう。ラッダイト運動に示されるように、機械が導入され労働者が反対したが、別の職が生まれた。T型フォードによって馬から車へ移動手段が変わったものの、ガソリンスタンドや車のメンテナンスといった新しい職業が登場した。確かにAIによって代替される職業はあるだろう。それは工業機械や車よりも広範な範囲に及ぶだろう。なぜなら、自動化は様々な分野で進んだものの、知的生産活動については人間の専売特許だと考えられてきたからだ。
しかし当面の間はまだまだ人工知能の設計自体も人間が行っているわけだから、少なくともまだまだ人間の働き口は残されているだろう。
4.所感
AIについてみてきた。以下はちょっと下世話な話になる。たしかにタクシーはAIが最適なドライバーになるだろうし、マクドナルドのレジスタッフもAIを活用した音声認識、AIを活用した画像処理などによってロボットに代替されるだろう。裁判官などの高度な知的労働者であっても、過去の判例を超高速で解析して最適な判決を下せるようになるだろう。ピアニストによる曲の味付けの違いの楽しみも、そのうちAIと各種センサーが僕の好みの特徴量を見つけ出し、リヒテルとリシッツァをうまく混ぜ合わせたショパンを弾くだろう。
ふと近所のスナックで飲んでいたときに、ママがロボットだったら僕は飲みに来るのだろうかと考えた。ヒューマンタッチの必要とされる職業は、少なくとも生き残るとの指摘があったからだ。(友注 出典さがす)AIを活用すれば、僕の趣味趣向は数回来店すれば把握できるし、気の利いた話もできるようになるだろう。見た目だってオリエント工業の商品を更に発展させれば、現状より満足の行くものになるだろう。
なぜだかわからないが、今の所、ロボットが立つスナックに通うイメージがわかない。それはペッパーくんのようなロボットをどこかで想像しているのかもしれないし、Alexaに何度も同じことを伝えているときの苛立ちを想像しているのかもしれない。
しかし本当に好みの芸能人に似たママが、僕との会話を一言残らず覚えていて、それで楽しく飲めるとしたとき、ヒューマンタッチの必要とされるスナックのママといった職業すら代替されてしまうのだろうか。まだ実感のわかないところである。