オープンソースのOCRシステム「OCRopus」がGoogle Codeで公開

 

OCRopusプロジェクトは、オープンソースプロジェクト向けのホスティングサイト「Google Code」上で、光学文字認識(OCR)システム「OCRopus」のα版をApache License 2.0のもと公開した。LinuxをはじめとするUNIX系OSで動作するが、確認はUbuntu Linux 6.10で行われている。

OCRopusは、文字認識エンジンと文書解析機能を含むOCRシステム。ドイツ人工知能研究センター(DFKI)の研究グループの1つ「Image Understanding and Pattern Recognition」(IUPR)が中心となり、DFKIのThomas Breuel教授指揮のもとに開発が進められている。Google Code上でのソースコードの公開は、Googleがスポンサーについたことを契機とするもの。

プラグラムには、アメリカ国勢調査局によって90年代半ばに採用された手書き文字認識システムと、新開発の高性能なレイアウト分析機能が搭載されている。文字認識プラグインとして同じくGoogle Codeで公開されている「Tesseract」を使用しているため、現時点における文書解析の精度はTessetactと同レベルとのこと。

ソースコードのビルドには、ビルド支援ツール「jam」のほか、画像ライブラリのlibpng/libjpeg/libtiff、そしてスペルチェッカーのaspellが必要。



転職ノウハウ

あなたが本領発揮できる仕事を診断
あなたの仕事適性診断

シゴト性格・弱点が20の質問でサクッと分かる!

「仕事辞めたい……」その理由は?
「仕事辞めたい……」その理由は?

71%の人が仕事を辞めたいと思った経験あり。その理由と対処法は?

3年後の年収どうなる? 年収予報
3年後の年収どうなる? 年収予報

今の年収は適正? 3年後は? あなたの年収をデータに基づき予報します。

激務な職場を辞めたいが、美女が邪魔して辞められない
激務な職場を辞めたいが、美女が邪魔して辞められない

美人上司と可愛い過ぎる後輩に挟まれるエンジニアの悩み

人気記事

一覧

イチオシ記事

新着記事

沢村一樹主演『レンタル救世主』ポスターに明記された電話番号にかけると…
[12:33 9/26] エンタメ
住信SBIネット銀行、ディープラーニングを活用したデジタルマーケティング
[12:20 9/26] 企業IT
ビジネスインパクトを拡大するビックデータ活用とは - TERADATA PARTNERS 2016 基調講演
[12:10 9/26] 企業IT
IBM、クレジットカード関連の「FinTechカードAPI」提供 - 6社と仕様合意
[12:05 9/26] 企業IT
【特別企画】『キングオブコント2016』優勝予想1位は? 2位しずる、3位タイムマシーン3号
[12:04 9/26] エンタメ

求人情報