コンピュータがメール文章などを自分で読み分析処理 - 言語学研究より誕生

      [2004/02/27]

    米Xeroxは、電子ドキュメントの内容を自動分析してインデックス作成、類別処理を行い、適切な担当者の手に届けてくれる新技術の開発に成功したことを発表した。

    Eric Gaussier氏

    すでに市場では類似のソフトウェアが出回っているものの、分類過程に限界があるというのが現状である。例えば、フランスにあるXeroxの欧州研究機関「Xerox Research Centre Europe(XRCE)」で新技術の研究開発に携わったEric Gaussier氏は、ドキュメントを「生物化学」や「生物物理学」に類別することができても、そのカテゴリーに特定されてしまった後は、各カテゴリーを上位階層で関連付けることは難しいという。生物化学カテゴリーに存在する生物物理学にも関連する資料を類別したり、生物化学および生物物理学を統合する「生命科学」カテゴリーで再分類したりするといったことが、なかなかコンピュータには苦手な分野となっていた。

    しかしながら、新開発技術を搭載したソフトウェアでは、より柔軟に人間的な思考を働かせた類別処理が行えるようになっているという。階層構造によって各カテゴリーの関連度を考慮に入れ、ユーザーがどのドキュメントをどのフォルダに保存していくのかを数回の作業で判別して、その後は自己学習したユーザーの思考過程に沿って分類が進められるという。もしも既存の類別フォルダとは関連性の薄い新たなトピックに遭遇したなら、どんなカテゴリーを新設し、他のカテゴリーとの関連度はどのように設定するとよいかを提案して、ユーザーの判断を仰ぐことになる。

    別の特徴としては、分析処理後のドキュメントを、適切な人物のもとへ自動転送できる点が挙げられるだろう。例えば、総務課に送られてきた顧客からの製品サービスに関する苦情メールが分類されるなら、その担当部署まで自動的に回されるほか、参考までに営業課や製品開発部門にもCCで送信されるといったイメージで、スパム対策はもちろんのこと、膨大な数で届く日々の大切なメールを、より迅速かつ効率的に処理することが可能になる。

    これまでXRCEでは、言語学の分析およびコンピュータの自己学習技術に関する研究が専門的に進められてきており、今回の新技術の誕生にもつながっている。Javaで記述された搭載ソフトウェアは最大20の言語に対応し、Windows/Linux/UNIX環境をサポートする。親しみやすいインタフェースが採用されているとのことで、間もなく各メーカーや企業に向けたライセンス提供が開始される。

    すでに同ソフトウェアを用いたモニターテストが実施されており、利用者からは高い評価が寄せられているという。スイスでバイオインフォマティクスの研究に携わるAnne-Lise Veuthey氏は、実際の試用感について「正に調査中の情報を極めて的確に発見するのに役立った」とのコメントを発表した。

    関連記事

    関連サイト

    新着記事

    特設サイトの情報

      人気記事

      一覧

        イチオシ記事

        新着記事

        特別企画

        マイナビニュースマガジン