Linked Idealは1月11日、ナレッジベース構築プラットフォーム「Toposoid」が英語文への対応を開始したことを発表した。「Toposoid」はオープンソース・ソースソフトウェア(以下、OSS)として公開しており、誰でも利用可能だ。

ナレッジベースは知識ベースとも呼ばれ、知識や経験をコンピュータが解読できる形式でデータベース化したものだ。「Toposoid」は、文章をそのまま入力するだけで述語項構造解析エンジンが解析し、ナレッジグラフ構造として蓄積可能である。ナレッジベースはグラフデータベース「Neo4j」で管理され、ナレッジグラフとして探索が可能となる。

  • 「Neo4j」によるグラフデータベースの画面イメージ

今回のアップデートによって英語文にも対応したことで、日本語と同様に英語の文章を入力するだけでナレッジベースが構築可能となった。ナレッジベースは日本語と英語の知識を分けて構築することも、 混ぜて構築することも可能だという。

また、英語文から自然言語処理で有用な固有表現や類義語、数量表現も自動抽出してナレッジベースを構築できる。

  • 英語文からナレッジベースを構築するイメージ

「Toposoid」では非構造化データである文章データをそのままナレッジグラフ化してナレッジベースを構築している。英語でのナレッジベース検索にも対応しており、英語文章を入力することでナレッジベースに問い合わせ可能とのことだ。

  • 英語文でのナレッジベース検索イメージ

「Toposoid」はOSSとしてライセンス提供されているため、デベロッパーによる拡張も可能だ。また、推論エンジンのプログラムはデベロッパーの任意のプログラミング言語で拡張・差し替えができるように設計されている。