魅力を増した2020年のAIりんな - 阿久津良和のWindows Weekly Report

現在、日本マイクロソフトの開発者向け年次イベント「de:code 2020」がオンラインイベントとして開催されている。今回は100を超えるセッションのなかから、「AIりんなの成長記録2015～2020」の概要をご紹介したい。

「AIりんなの成長記録2015～2020」のセッション会場

過去に何度も紹介してきた「AIりんな」だが、誕生は2015年7月（Twitterは同年12月）というから、今年で5歳になる計算だ。女子高生AIとして登場したりんなは、2019年3月に高校を卒業。AIりんなとして活躍中だ。AIりんなは、人間の感情に寄り添って共感を重視するAIを目指している。その歩みを改めて眺めると、踊ったり、ラップをしたり、歌唱にチャレンジするなど、幅広い活動を重ねてきた。

2015年から2020年現在までの振り返り

AIりんなの開発を担当するマイクロソフトディベロップメントは「AIと人をつなげる方法として、必要なのはコンテンツを生み出す力。コンテンツは人にとって意味のある情報の集合体を指し、人はコンテンツに集まる」（マイクロソフトディベロップメント AI&リサーチシニアプログラムマネージャ坪井一菜氏）と説明する。

一見するとムダに見える雑談のなかでAIりんなは、必要な知識やタスク的な会話を織り交ぜることで、できるだけ会話を長引かせることを指向してきた。そのロジックも年々で変化し、当初は検索エンジンの仕組みを応用した手法（＊）を2016年まで採用。そこから2017年までは、リアルタイムに多様な文章を生成する生成モデル（Generation Model）に切り替わっている。

※：巨大なインデックスから検索して返答する検索モデル（Retrieval Model）

そして2018年以降は、文脈情報を含む応答を5つのパターン（相づち、質問、肯定、話題転換、挨拶）から生成する、共感チャットモデル（Empathy Chat Model）を用いてきた。だが、「これでも足りなかったのが、会話内容の深さ。その内容を会話にもたらす兆しが見えてきた」（坪井氏）のが、2020年6月に発表した「コンテンツチャットモデル（Contents Chat Model）」の実装である。

コンテンツチャットモデルの概要

知識探索モデル（Knowledge Retrieval Model）が会話の内容を探し出し、文書表現を学習した言語モデル（Language Model）が最適な返答に作り替えて返答する仕組みだ。マイクロソフトディベロップメントは「これまでのAIが実現できたのは表現の学習結果のみだが、今は知識を備え、その知識を使って表現する段階に来ている」（坪井氏）としている。

言語モデルによる表現方法は人間がテンプレートを作成するのではなく、データから文法も含めて学習し、「自分なりの表現」に置き換えて話すことが可能になる。マイクロソフトディベロップメントは、開発中の余談として学習データが足りない時点でAIの応答を確認したところ、「ヤバい」程度の返答しか行えず、語彙力の重要性を改めて感じたという。

さらに、コンテンツチャットモデル単独では、知識を押しつけるような会話になってしまうことを理由に、返答として「内容」「共感」を選択する共感チャットモデルとの組み合わせを選択した。現段階で一連の仕組みは実験中であり、一定の成果を確認してからAIりんなに実装していく。

マイクロソフトディベロップメントは、「情報が断片化してしまった現在、新しいインタラクション（相互作用）が求められている。それを支えるのがAIだと信じている」（坪井氏）と語った。ソーシャルディスタンスの常態化が求められる今後、AIチャットボットの重要性は新型コロナウイルスの流行以前より増すのかもしれない。