話題
AIが救う?「コミュ障キャラ」 警戒心ほどいてくれる最新技術
提供:NTT
人間の心というものは、実に複雑です。急に機嫌が良くなったり悪くなったり、しゃべっているのと全然違うことを考えていたり。家族や親友でさえ理解できない、ということもたまにあります。はたしてAI(人工知能)にヒトの気持ちが理解できるのか、判断が難しいところです。
機械学習の進歩、ディープラーニング(深層学習)の登場によって、AIは飛躍的な進歩を遂げました。これからも、数々の問題をクリアしていくことでしょう。しかし、人間の活動を支援していくうえで、解決することが求められるのが、ヒトの心の理解です。
この気まぐれな生き物に、AIはどこまで優しくなれるのでしょうか?
最終回も、前回の「AI×○○で、何が生まれる?」に引き続き、NTTグループのAI技術ブランド「corevo(コレボ)」の研究開発に携わっているNTTメディアインテリジェンス研究所の八木貴史さんに疑問をぶつけてみました。
「AIはヒトを真に理解できる?」というのが、八木さんへの最後の質問です。
「corevo」が提供するのは、「人の活動の一部を代替、支援し、あるいは人の能力を補完し、引き出すためのAI技術」。AIの使命が人間に寄り添うことであるのなら、AIはヒトの気持ちを理解することで、その能力を大きく発揮できるはずです。
ヒトの要望に的確に応えるためには、そのヒトの発言した内容や口調、表情はもちろん、その場の状況やこれまでの経緯、そのヒトの性格なども判断材料になります。人間同士だと、判断を読み違えた場合には、コミュニケーションがうまく取れないという結果に結び付きます。AIがそれらの膨大なデータを処理して学習を重ねたとして、人間の本音にどこまで迫れるでしょうか?
八木さんはまず、自身の所属するメディアインテリジェンス研究所で進められている、音声認識を中心とした研究について解説してくれました。NTTグループが長い研究開発の蓄積を持ち、世界でも進んでいるとされる分野です。
「最近では、音声認識をテキスト化するだけではなく、感情を音声から抽出する技術の開発も進められています。コールセンターなどでお客様とオペレーターの会話から、お客様が怒っているとか満足しているとかを自動的に抽出することで、怒りの原因を分析し、オペレーターの応対品質を上げていくことにつながります」
怒りの感情を認識する技術は、怒っている人や怒られている人の声の特徴やよく使う言葉、相づちの打ち方、会話の間の取り方などの情報から、怒りの状態について推定。怒鳴り声を伴う「ホットアンガー」だけでなく、静かに怒っている「コールドアンガー」の感情も認識することができるそうです。
人間の聴覚に相当する部分だけでも、発話した内容以外にさまざまな情報が潜んでいます。将来的には、さらに多くのことを判断することが可能になるでしょう。
次に八木さんがヒントをくれたのは、ヒトが意識していない心身の状態を読み解く「ハートタッチングAI」の分野です。先ほどの音声認識に映像が加われば、ヒトの表情やしぐさなどからも、さまざまな情報が得られます。
「得られる情報が多ければ多いほど、分解能も向上してきますから。いろんな感情の細かな違いのようなものも、分類できる可能性は上がると思います」
コールセンター等の業務でも、テレビ電話などを使えば、さらにコミュニケーションの精度は高まりそうです。
「お客様の表情などを映すことができれば、AIがリアルタイムに担当者を支援することも可能だと思います。ただこれは、お客様に許可していただけることが必須です。応対の質が良くなるなどのメリットを映される側に訴求できるようになれば、実現する時も来るのではないでしょうか」
顔の表情に現れる感情については、経験によって人間も判断することが可能です。ヒトの能力では検知することが難しいのが、「目は口ほどに物を言う」とされる眼球の動きです。
「マイクロサッカードと呼ばれる眼球の微細な運動を観測すると、好きな音楽を聴いている時とそうでない音楽を聴いているときでは、眼の動きが異なるそうです。眼の動きから、そのヒトの快不快や注意の状態などを判別できる可能性があることがわかってきています」
それでは、AIはヒトの感情までも理解することができるのでしょうか? 八木さんは慎重に言葉を選んで、「ヒトの感情の理解について言うと、正しく理解できているのか、実はわかっていないところもあります」と答えました。
「今のAI研究では、AIが正しく認識しているかを判断するのに、『この場合はこういう感情だ』という正解のラベルを作って、それが当てはまっているかの評価をするわけです。実際にそのヒトがその時点で感じたことが、後からラベルを付けると違っているかもしれません。本人でなく第三者がラベルを付けたとしても、実は怒っているという感情ではない可能性もあります。ほとんどの人が正解だと思うレベルには達しているとは思いますが」
正解を決める人間の感情が不安定であるからこそ、全ての人に100%の正解を出すことは、現状では難しいようです。
「ただ、データがよりたくさん集まれば、ディープラーニングなどをうまく使うことにより、いろんな細かい感情の違いも識別できることにつながっていくと思います」
最後に八木さんは、現在携わっているエージェントAI(ヒトの発する情報から意図などを読み解くAI)の分野での、自身の研究開発に対するスタンスを話してくれました。
「やはり、ヒトとAIがうまく付き合っていくということが大切。AIがヒトに寄り添えるように、気軽にAIとのコミュニケーションが取れるインターフェースを持たせたいと考えて、研究開発を進めています」
人間同士の場合、警戒心のある相手とは、うまくコミュニケーションを取るのは非常に難しいものです。ヒトがAIと自然な形で接し、心を開くことができた時、AIとの真の理解が実現するのかもしれません。