日立システムアンドサービス(日立システム)と日立アイ・エヌ・エス・ソフトウェア(日立INS)は、テキスト/音声/画像による検索を可能にするハイブリッド検索ソリューションを発表、7月1日から販売を開始する。日立INSの音声検索ソリューション「Voice Searcher」、日立システムの画像検索技術と同社の全文検索ソリューション「InWeave Search」を連携させ、動画ファイルからも数秒で検索が可能になる。同ソリューションで使われている技術は日立製作所中央研究所で進められた研究がベースになっており、「日立グループによるシナジー効果が生んだソリューション」(日立システム)としている。

ハイブリッド検索は、テキストまたは画像をキーとして、音声、画像、動画、文書といったコンテンツから検索を行うソリューション。音声の場合は、音素がどのタイミングで出現するかをインデックスを利用して検索を行う。音素や音節で照合するため、キーワードを事前に付与する必要がない。画像の場合は、「タネ画像」と呼ぶ検索のキーとなる画像と類似した画像を検索する。数千万件の画像データからも1秒ほどで検索できる高速性が特徴だ。また、全文検索では「1,000万件のデータを約0.1秒」で検索できるn-gram方式を採用、エンタープライズサーチ機能により、社内外の大量のコンテンツから横断的な検索が可能になっている。

個々のソリューションはすでに各社から提供されていたが、今後は日立グループのシナジー効果を謳い、共同で幅広い業種に向けて提供するとしている。情報のデジタル化が進み、大量のコンテンツが蓄積すると見られる医療/教育/福祉、または旅行会社やコンテンツプロバイダなどでの導入が期待されるという。販売目標は3年間で20億円。

ハイブリッド検索ソリューションの例。クエリテキストに「つうてんかく」を入力すると、動画像データから「つうてんかく」という音声を含むコンテンツを瞬時に検索し、その音声の数秒前から再生する