日立製作所は19日、要約文書の根拠や情報背景を高精度に特定する技術を開発したことを発表した。事実を前提とした文書では、それが信頼できる情報に基づくものなのか否かが重要になる。いわゆるフェイクニュースのように虚偽の情報が広がることは誤認の弊害が起こる。同社が開発した技術は、文書のなかの表現から話者を分類し、要約元や根拠となる背景情報を特定するもの。これを活用し、対象となる文書が事実に基づくかどうかの判断支援を行えるようになるという。

  • 発言者の特徴から質問者と回答者の関係を認識し、話者を特定する技術

    発言者の特徴から質問者と回答者の関係を認識し、話者を特定する技術

  • 要約された対象文書から引用元の根拠や背景を特定する

    要約された対象文書から要約元の根拠や背景を特定する

発言者の特徴から質問者と回答者の関係を認識し、話者を特定する技術

「NTCIR-14」QA Lab-Poliinfo Task概要(英文/NIIのPDF資料)

国立情報学研究所(NII/National Institute of Information)が行う情報アクセス技術コンペティション「NTCIR」(NII Testbeds and community for Information access Research)では目的に応じたタスクとデータセットで国内外の研究機関や企業がスコアを競い技術向上を図っている。

「NTCIR-14」では都道府県の議会における議員の質問と首長の回答の議事録から、ポジションの分類を行うSegmentation、要約の精度を行うSummarization、ファクトチェック可能なセンテンスの分類を行うClassificationとそれぞれ数式に基づいたスコアを競っているが、日立が開発した技術はSegmentationタスクで93%の精度を実現している。

同社は、パートナーとの共創を通じて今回の技術精度を高め、インターネット上の文書データ信頼性判断を可能とするサービスの開発を目指す。