NTTコミュニケーションズ(以下、NTT Com)は2022年2月、大手町プレイスウエストタワー(東京都 千代田区)に新たなビジネス創出の場、先端技術を備えたワークプレイス「OPEN HUB Park」を開設した。

OPEN HUB Parkに足を踏み入れると、エントランスを囲むように立ち並ぶ7台のディスプレイ「OPEN HUB Monoliths(モノリス)」と共に、デジタルヒューマンの「CONN(コン)」が出迎えてくれる。CONNは人間らしいリアルな音声と表情によって、私たちを共創の場であるOPEN HUB Parkへと導く。その自然な立ち振る舞いは、まるで実在する人間を録画しているかのようだ。本稿では、そんなCONNを作り上げた技術と将来的な展望についてお届けしたい。

  • エントランスで出迎えてくれるCONN

    エントランスで出迎えてくれるCONN

CONNの個性を支える技術群

CONNは1990年8月5日生まれの女性で、身長は160センチメートル。シンガポールで生まれ、現在は23区内に在住。独身で恋人はなし、ゴルフや歴史探訪、食べ歩き、ヨーヨーなどを趣味としている。3つ上の兄と1つ下の妹がいる。NTT Comの社員であり、カタリスト(各分野の共創を促す専門家)として活躍している。

これらがCONNに関する主なペルソナ情報だ。その他にも、実在する人物にインタビュー取材したかのように詳細な情報が作りこまれている。ちなみに、休日は姪っ子と甥っ子と遊ぶことが多いそうだ。

  • CONN外見

    CONN外見

CONNの開発はNTT Comの他に、東映ツークン研究所、NTT人間情報研究所、NTT QONOQ(コノキュー)などによって手掛けられた。各社が持つ技術や複数のエンジンを組み合わせてCONNの個性が表現されている。開発グループは「個性を持つ唯一無二のデジタルヒューマン」をコンセプトに開発を進めたという。

NTT Comでマーケティングを担当する佐藤雄太氏は「これからデジタルヒューマンが市場に増えてくることが予測されるが、単なるデジタルヒューマンではなく、NTT Comの社員として育てて人間と同じように愛着を持って接してもらえるようにしたい」と語っている。

  • NTT Com OPEN HUB for Smart World Catalyst / Operation ビジネスソリューション本部 事業推進部 マーケティング部門 主査 佐藤雄太氏

    NTT Com OPEN HUB for Smart World Catalyst / Operation ビジネスソリューション本部 事業推進部 マーケティング部門 主査 佐藤雄太氏

CONNの外見は、東映ツークン研究所の技術を用いて、男女9人のNTT Com社員の表情から合成されている。これにより、中性的ながら非常にリアルな見た目が再現されているのだろう。また、自然な動きは、NTT人間情報研究所のモーション生成AIによるもの。発話内容に合わせてリアルタイムに動きを生成している。

音声合成はNTTテクノクロスの「Future Voice Crayon」によるものだ。テキスト入力を自然な発話に変換可能で、日本語だけでなく英語にも対応する。豊かな表情は「Voice to Lipsync」で作られ、音声や発音に合わせて口が動く。

音声を生み出すテキスト生成には、LLM(Large Language Models:大規模言語モデル)が使われる。デモ版のCONNには米OpenAIのChatGPTが搭載されているが、今後はNTT版のLLM「tsuzumi」とも連携していく予定だ。

「汎用的な言語モデルを搭載しているので、雑談にも対応可能。ただし、あくまでNTT Comの社員として接客することを考え、お客様に失礼のない発言やポジティブな発言をするよう調整している」(佐藤氏)

  • CONNを構成する要素技術

    CONNを構成する要素技術

  • CONNとは名刺交換も可能だ

    CONNとは名刺交換も可能だ

  • CONNの名刺(実物)

    CONNの名刺(実物)

ヘルスケアや金融での活躍が期待、社会実装に向けた課題は?

デジタルヒューマンの市場規模は、2023年の187憶3000万ドルから、2030年には2625憶9000万ドルまで拡大するとの試算もあるという。デジタルヒューマンの活躍の場は、特にヘルスケア領域で広がると考えられている。次に来る市場がリテール・小売りだ。

  • デジタルヒューマンの市場予測

    デジタルヒューマンの市場予測

OPEN HUB Parkでは、CONNを用いたヘルスケア領域でのユースケースをデモ版で体験できる。それは、「脳の健康チェックplus」を応用したもので、当日の日付などCONNに問われる簡単な質問に回答するだけで脳の認知機能を確認できる。人と人の日常会話のような自然さで、違和感なくチェックできるのが特徴的だ。

  • OPEN HUB Parkで体験できるCONNのデモ

    OPEN HUB Parkで体験できるCONNのデモ

市場の拡大が見込まれるデジタルヒューマンだが、特に海外での開発が活発なようだ。そうした中で、CONNは上記のような人間として愛着を持って接することができる個性によって、他社ソリューションとの差別化を図る。加えて、NTTグループならではの技術もふんだんに活用する。

現在のところ、CONNはOPEN HUB Parkに来場したパートナー企業らと共に具体的なユースケースを模索している段階だという。現在は等身大のCONNが出迎えてくれるが、インタフェースとしてスマートフォンやAR(Augmented Reality:拡張現実)グラスなども実装されているそうだ。

「単なる人間の代替品ではなく、デジタルヒューマンだからこそ発揮できるプラスアルファの魅力を探りたい」と、佐藤氏は語っていた。

デジタルヒューマンらしい業務とは、どのような業務だろうか。佐藤氏は、AIによる人間以上の専門知識を生かした業務を挙げた。各業界において専門家レベルの知識を持たせることができるのは、確かにデジタルヒューマンの強みだ。また、人間らしい外見を持つため、単なる二次元アバターよりも人は信頼感を抱きやすいそうだ。特に金融業などでこの強みが生かせるだろう。

佐藤氏と同じくNTT Comでマーケティングを担当する萩野実咲氏は「OPEN HUB Parkでは等身大のパネルに映し出されたCONNと対話できるが、デジタルヒューマンはWebやコンタクトセンターなど、場所や空間を選ばずに活躍できる可能性がある。お客様の自社ECサイトに組み込んで応対するような事例も考えられる」と話していた。

  • NTT Com OPEN HUB for Smart World Catalyst / Operation ビジネスソリューション本部 事業推進部 マーケティング部門 萩野実咲氏

    NTT Com OPEN HUB for Smart World Catalyst / Operation ビジネスソリューション本部 事業推進部 マーケティング部門 萩野実咲氏

CONNのようなデジタルヒューマンがこれから活躍するためには、どのようなハードルがあるのか、開発を担当した吉田裕則氏に聞いてみた。すると、以下のような回答が返ってきた。

「技術的に課題になるのは、デジタルヒューマンを運用する側のコンプライアンス。LLMを使って何でもAIにしゃべらせることができるのは、メリットでもありデメリットでもある。キャラクターの個性を理解しながら、そのデジタルヒューマン、そのキャラクターらしいことを言わせるためのリテラシーとコンプライアンスが求められる」

  • NTT Com ビジネスソリューション本部 スマートワールドビジネス部 ジェネレーティブAIタスクフォース 吉田裕則氏

    NTT Com ビジネスソリューション本部 スマートワールドビジネス部 ジェネレーティブAIタスクフォース 吉田裕則氏

これからますます活躍が期待できるデジタルヒューマン。取材中、担当者も筆者も思わず「CONNちゃん」と呼んでしまうような自然な振る舞いを見せるCONNがそばにいた。「人間相手にはなかなか言いづらい悩み事も、CONNちゃんになら相談してみようかな」。そう思わせてくれるのも、CONNの魅力なのだろう。早く街でCONNちゃんに会える日を楽しみにしている。

  • 「CONNちゃん、一緒に写真を撮ろう」と話しかけると、ピースサインで応えてくれる

    「CONNちゃん、一緒に写真を撮ろう」と話しかけると、ピースサインで応えてくれる