富士通研究所は4月4日、人が校正した文章の履歴を使って、文章校正を自動的に行う技術を開発したと発表した。実際に、中国語ネイティブが作成する日本語文章に対し、1万件の校正履歴を用いた自動校正を実行し、約80%の誤りを修正できることを確認したという。

オフショア開発の現場では、開発受注先の外国人によるプログラム仕様書の執筆など、日本語文章の執筆機会が増えており、納品を行う前に日本人による校正作業を行う必要が生じており、同研究所は同技術がオフショア開発の現場に役立つとしている。

オフショア開発における文章作成の流れ

同技術では、「対象文と似た文を修正前の文に持つ校正履歴データを検索」「対象文と修正前の文の共通部分と修正後の相違部分を特定」「対応する語句が持っている品詞など文の構造としての共通性から文の距離を求め校正の可否を判断」「校正可能であれば、対象文の表現を修正」という手順で校正履歴のみを用いて校正を行う。

同技術により、人間の構成した文をそのまま利用できるようになり、これまで自動修正が困難な誤りも検出し、正しい表現に直すことが可能になった。「梅雨は雨を降ります」といった複合的な誤りも、対象文と校正履歴の修正前文章で対応する語句が持っている品詞などを用いて文章間の共通性と意味の近さを評価することで、校正できる。

自動校正の処理の仕組み

同研究所は2012年度より、自社のオフショア開発を担っている中国の関係会社に本同技術を用いて開発した校正支援ツールの適用を開始し、2013年度を目途にクラウドサービスとしての実用化を目指す。