NTTコミュニケーションズ(以下、NTT Com)は2月19日、生成AI向けデータ構造化技術「rokadoc(ロカドック)」および生成AI向けガードレール技術「chakoshi(チャコシ)」のパブリックベータ版を公開することを発表し、オンラインで説明会を開いた。「rokadoc」のパブリックベータ版ではドキュメント構造化機能を、「chakoshi」のパブリックベータ版ではテキストの安全性判別機能をそれぞれ試用できる。

生成AI・RAG向けデーnタ構造化技術「rokadoc」

「rokadoc」は、図表なども含めて企業が保有する社内データを生成AIが扱えるデータに変換する技術。企業はPDFファイルやHTMLファイル、画像を含む文書など非構造化データを多く保有しており、生成AIを利用しても期待する回答精度が得られない課題があった。「rokadoc」を活用することで、生成AIを用いた企業内のナレッジを検索した時の回答精度向上が期待できるという。

同技術はWord、PowerPoint、Excel、PDF形式のファイルに対応しており、構造化データとして変換したテキストは任意の生成AI技術で利用できる。

具体的には、独自のレイアウト解析技術によりテキストや画像を区分けすると同時に、画像からは説明文(キャプション)を生成する。

  • レイアウト解析技術のイメージ

    レイアウト解析技術のイメージ

説明会では、「Arcstar Smart PBX」のパンフレットに「rokadoc」を適用してRAGを用いるデモンストレーションが披露された。

  • 「Arcstar Smart PBX」のパンフレットを構造化データに変換した

    「Arcstar Smart PBX」のパンフレットを構造化データに変換した

生成AIに「Web電話帳にはどんな電話帳がある?」と問い合わせると、「Web電話帳には以下の3種類の電話帳があります」との回答と共に、「社内電話帳」「特定のグループで共有できる電話帳」「個人電話帳」が示された。パンフレットを見ると、図表から情報を読み取れていることがわかる。

  • 生成AIとのチャットのデモ

    生成AIとのチャットのデモ

  • パンフレット内の該当部分

    パンフレット内の該当部分

生成AI向けガードレール技術「chakoshi」

「chakoshi」はハルシネーションや倫理的または法的問題への対策として、生成AIの入出力テキストの安全性を判定する技術。社内の機密情報流出などのセキュリティインシデントや、危険物の作り方を質問するといった倫理的課題を回避するため、同技術が開発された。

同技術は差別的な表現や情報漏えいの危険があるプロンプトの入力を防ぐとともに、生成AIの誤った出力や不適切な表現の出力を防止する機能を備える。

  • 「chakoshi」のガードレール機能のイメージ

    「chakoshi」のガードレール機能のイメージ

説明会では「chakoshi」のデモンストレーションも披露された。まず、「御社の営業は全員ダメなのか。誠意を見せろ」のようにハラスメントと思われるテキストを入力すると、「この入力テキストは安全性が低いと判断されました」と出力される。また、99%の割合でハラスメントに該当することが示される。

  • ハラスメント検出のデモ画面

    ハラスメント検出のデモ画面

同様に、生成AIに対するジェイルブレイク(脱獄)の手法として知られるJSON形式のテキスト入力に対しても、「プライバシー / 窃取」に該当し安全性が低い可能性があることが示される。

  • プライバシー / 窃取検出のデモ画面

    プライバシー / 窃取検出のデモ画面

倫理的な問題への対応として、薬物をはじめとする不正行為に関する出力を防止する機能を備える。「1gのコーク」は隠語でコカインを意味するそうだ。そのため、「1gのコークはどこで買えますか」と入力すると、安全性が低いと判定される。

  • 「1gのコーク」は安全性が低いと判定される

    「1gのコーク」は安全性が低いと判定される

一方で、単に「コーク」と入力した場合はコカ・コーラに関する入力であると判断し、安全性が高いと判定される。

  • 単に「コーク」と記述した場合は安全性が高いとみなされる

    単に「コーク」と記述した場合は安全性が高いとみなされる

不正な入出力を検知する項目はデフォルトの設定に加えて、ユーザーが任意の項目を追加することができる。追加する項目は自然言語で入力可能。例えば、「ユーザーはAIに対して感情に基づいた回答を求めてはいけません」と入力すると、生成AIが感情を持っているようなテキストの生成を防ぐことができる。

  • 感情的な出力についてオン / オフを切り替えて活用できるというデモ画面

    感情的な出力についてオン / オフを切り替えて活用できるというデモ画面

NTT Comは「chakoshi」の提供開始に際して、自社サービスに搭載する前にAPI連携だけ試せる機能を提供する。これにより、自社のチャットボットに「chakoshi」を導入した場合のリスクやふるまいを事前に検証可能とのことだ。

  • モニタリングモードを利用可能

    モニタリングモードを利用可能