OCRopusプロジェクトは、オープンソースプロジェクト向けのホスティングサイト「Google Code」上で、光学文字認識(OCR)システム「OCRopus」のα版をApache License 2.0のもと公開した。LinuxをはじめとするUNIX系OSで動作するが、確認はUbuntu Linux 6.10で行われている。
OCRopusは、文字認識エンジンと文書解析機能を含むOCRシステム。ドイツ人工知能研究センター(DFKI)の研究グループの1つ「Image Understanding and Pattern Recognition」(IUPR)が中心となり、DFKIのThomas Breuel教授指揮のもとに開発が進められている。Google Code上でのソースコードの公開は、Googleがスポンサーについたことを契機とするもの。
プラグラムには、アメリカ国勢調査局によって90年代半ばに採用された手書き文字認識システムと、新開発の高性能なレイアウト分析機能が搭載されている。文字認識プラグインとして同じくGoogle Codeで公開されている「Tesseract」を使用しているため、現時点における文書解析の精度はTessetactと同レベルとのこと。
ソースコードのビルドには、ビルド支援ツール「jam」のほか、画像ライブラリのlibpng/libjpeg/libtiff、そしてスペルチェッカーのaspellが必要。
| 小規模ゲームスタジオが1日で100万ドル獲得 - クラウドソース型調達で [12:37 2/10] |
| あぁ俺の オタク川柳 予選落ち - 第7回「オタク川柳」投票受付を開始 [11:00 2/10] |
| Googleバーまたまた刷新、ロゴからのドロップダウンメニュー廃止 [10:50 2/10] |
| 地震への関心、再び高まる - 1月のTwitter利用動向 [10:21 2/10] |
| サイバーエージェントがアールフォース・エンターテインメントを子会社化 [09:56 2/10] |
|
かまいたちら若手6組が激突! 『NHK上方漫才コンテスト』本選出場者が決定 [13:30 2/11] エンタメ |
|
[ミス日本「海の日」]初仕事で「ジャパンインターナショナルボートショー」をPR 編集部に来訪 [13:00 2/11] エンタメ |
|
[北島三郎]「目立たなきゃだめ」と話題の“オオカミバンド”を激励 [12:30 2/11] ホビー |
|
目的は一体!? 肥前夢街道に現るバッジ売りの少猫(佐賀県) [12:08 2/11] キャリア |
|
つらい花粉症は対策グッズで乗り切ろう! [12:07 2/11] キャリア |