国立国会図書館のNDLラボは2月24日、一般的なノートPCや家庭用PCで、図書や雑誌といった資料のデジタル化画像からテキストデータが作成できるOCRソフト「NDLOCR-Lite」を無償で公開した。公式GitHubからダウンロード可能となっており、CC BY 4.0ライセンスで公開されている。
AIを用いて写真からテキストデータを抽出できる軽量ツール「NDLOCR-Lite」が2月24日、国会図書館の実験的なサービスを提供する「NDLラボ」の公式「GitHub」サイトで公開された。ライセンスは「CC BY 4.0」で、ソースコードも公開済み。適切なクレジット表示さえあれば商用を含め自由に利用できる。
Smarter document extraction starts here.
株式会社ハンモック(本社:東京都新宿区、代表取締役社長:若山 大典、以下 ハンモック)の提供する、AI OCR+人の ...
ドキュメント理解に特化したマルチモーダルOCRモデル「GLM-OCR」を中国のAI企業であるZ.aiが公開しました。GLM-OCRは0.9B(9億)という極めて軽量なパラメータ数でありながら、複雑なドキュメントレイアウトを高精度に解析・抽出することを目指して開発されてい ...