生成AI向けPDF抽出サービス「1extract」の提供開始、ファイマテクノロジー

ファイマテクノロジーは7月26日、生成AI向けPDF抽出サービス「1extract(ワンエクストラクト)」の提供を開始したことを発表した。

「1extract」の概要

同サービスはAIや機会学習の分野においてPDF活用の需要は高まっているものの、「PDFから正確にテキストデータが読み込まれない」「画像が入っているPDFデータだと、本文と画像のテキストが混在して読み込まれてしまう」といった顧客の声をもとに開発。

2021年にリリースした論文翻訳AI「1paper」の論文PDF抽出エンジンを、1extractとしてサービス化したものとなっている。

同サービスを活用したテキストデータを用いることで、生成AI活用型のチャットボットなどが社内にあるPDF文書や論文PDFなどに基づいて質問応答することが可能になる。

1paperで培ったPDFデータ抽出エンジンにより、文書構造を踏まえて正確に情報抽出ができるため、書かれた事実のみに基づいて正確に回答する生成AI活用システムを構築できる。

「1extract」活用事例

1extractでは「PDFファイルからテキスト情報の正確な抽出や、文字情報が埋め込まれていないスキャンデータでも事前のOCR処理なく情報の抽出が可能。

また、文字データをコピー&ペーストできない特殊なPDFファイルの対応に加え、認識した文字データの改行・改ページ部分も自動で文章を連結してコンテクストを崩さずに抽出結果の出力、原文通り残したい図や式はそのままに画像として出力することなどができるという。

サービスのイメージ

活用事例としては、正確なテキストデータを用いた生成AI活用のチャットシステムにおける回答精度の改善、特許。論文などの技術文書を用いた生成AIによる新しい業務プロセスの構築、医学、生命科学、物理学、化学などの研究分野における新しい知の探索方法の確立といったものがある。

システムの概要

同社は、今後、国産LLM(大規模言語モデル)開発を行う多くの研究者や開発者の力になり、日本企業の研究力向上に貢献したい考え。

生成AI向けPDF抽出サービス「1extract」の提供開始、ファイマテクノロジー

「1extract」の概要

「1extract」活用事例

AIが勧める、あなたのための会員限定記事

軍事とIT 第656回マン・マシン・インタフェース(8)M1E3戦車の操縦席がF1化? なぜ“ボタンだらけ”になるのか

NEC BioとTransgene、個別化がんワクチン「TG4050」でライセンス契約　臨床開発を加速

島根県出雲市にて出雲村田製作所の新生産棟が竣工、積層セラミックコンデンサの需要増に対応

京大、高性能だが壊れやすい有機半導体ルブレンの耐久性を劇的に向上

群大など、水酸副産物カニ殻で海洋生分解性プラの寿命調節技術を開発

ダイフク、滋賀事業所にて半導体生産ライン向け搬送・保管システム新工場棟を竣工

編集部が選ぶ関連記事

LLMにより論文の情報収集と研究DXを支援する「1spire」のβ版提供開始

NRI×ELYZA×KDDI、法人顧客向けの生成AIソリューション提供に向けて協業

富士通、SNS上などのフェイクニュースに対し偽情報対策システムの開発を強化

ソラコム、IoTカンファレンス「SORACOM Discovery 2024」で4つの新サービス発表

関連リンク

軍事とIT 第656回マン・マシン・インタフェース(8)M1E3戦車の操縦席がF1化? なぜ“ボタンだらけ”になるのか

NetAppが示す2026年テクノロジー予測、AI実装とデータ基盤の現在地

レバレジーズ、AI人事プラットフォーム「NALYSYS」でAI面接機能を本格提供

三菱電機、RAGを「2日で98%満足度」に　Serendieで進めるデータ活用戦略

IIJ、SoftSIMのマルチキャリア対応を開始 - IoT機器の可用性向上へ

NTT、6G電波を屋内に導く制御技術「透過型液晶メタサーフェス」を開発

このカテゴリーについて

生成AI向けPDF抽出サービス「1extract」の提供開始、ファイマテクノロジー

「1extract」の概要

「1extract」活用事例

AIが勧める、あなたのための会員限定記事

軍事とIT 第656回 マン・マシン・インタフェース(8)M1E3戦車の操縦席がF1化? なぜ“ボタンだらけ”になるのか

NEC BioとTransgene、個別化がんワクチン「TG4050」でライセンス契約 臨床開発を加速

島根県出雲市にて出雲村田製作所の新生産棟が竣工、積層セラミックコンデンサの需要増に対応

京大、高性能だが壊れやすい有機半導体ルブレンの耐久性を劇的に向上

群大など、水酸副産物カニ殻で海洋生分解性プラの寿命調節技術を開発

ダイフク、滋賀事業所にて半導体生産ライン向け搬送・保管システム新工場棟を竣工

編集部が選ぶ関連記事

LLMにより論文の情報収集と研究DXを支援する「1spire」のβ版提供開始

NRI×ELYZA×KDDI、法人顧客向けの生成AIソリューション提供に向けて協業

富士通、SNS上などのフェイクニュースに対し偽情報対策システムの開発を強化

ソラコム、IoTカンファレンス「SORACOM Discovery 2024」で4つの新サービス発表

関連リンク

軍事とIT 第656回 マン・マシン・インタフェース(8)M1E3戦車の操縦席がF1化? なぜ“ボタンだらけ”になるのか

NetAppが示す2026年テクノロジー予測、AI実装とデータ基盤の現在地

レバレジーズ、AI人事プラットフォーム「NALYSYS」でAI面接機能を本格提供

三菱電機、RAGを「2日で98%満足度」に Serendieで進めるデータ活用戦略

IIJ、SoftSIMのマルチキャリア対応を開始 - IoT機器の可用性向上へ

NTT、6G電波を屋内に導く制御技術「透過型液晶メタサーフェス」を開発

このカテゴリーについて

軍事とIT 第656回マン・マシン・インタフェース(8)M1E3戦車の操縦席がF1化? なぜ“ボタンだらけ”になるのか

NEC BioとTransgene、個別化がんワクチン「TG4050」でライセンス契約　臨床開発を加速

軍事とIT 第656回マン・マシン・インタフェース(8)M1E3戦車の操縦席がF1化? なぜ“ボタンだらけ”になるのか

三菱電機、RAGを「2日で98%満足度」に　Serendieで進めるデータ活用戦略