HOME

CHARACTER RECOGNITION文字識別技術(OCR)

印刷體字符識別 
 PRINTED CHARACTER RECOGNITION

A、基礎功能模塊
1.輸入圖像格式 可識別彩色(24BITS)、灰度(256階)和黑白二值圖像。支持TIFF、BMP、JPG、PDF等格式的圖像文件。
2.輸入版面格式 能自動分析出橫排文本、豎排文本、表格和圖像等區域,并對文本和表格區域的文字進行識別。
3.輸入字體格式 可識別中文簡體、臺灣繁體、香港繁體、英文及中英混排、簡繁混排等印刷文本。
4.輸入字體 可識別宋、仿宋、楷、黑、魏碑、隸書、行楷、幼圓等一百多種中文字體,識別字號介于“小六號”和“初號”。
5.輸出文本字符集 可輸出GB、GBK、BIG5、unicode碼結果文本。
6.標準印刷體漢字識別率:可達到99.7%。
7.印刷體數字識別 具有4個獨立的識別引擎,識別率可達到99.9%。
8.輸出識別結果 可輸出TXT、XLS、RTF、PDF、HTML等格式文本文件,RTF、PDF、Html格式支持版面還原。
9.開發環境 提供VC開發的DLL動態庫,支持C++、VC、VB、JAVA、.Net、Delphi等語言。
10.支持系統平臺 支持Windows平臺、Linux平臺。
11.表格識別: 自動判斷、識別各種通用型印刷體表格。電子表格還原準確精美,輸出的電子表格可隨意編輯。
12.可以準確識別公文的題頭、正文、印章等區域,并將識別結果按原版面精確還原。
13.識別速度:印刷文稿識別速度達1000字/秒。
B、增強功能模塊
1.多國文字識別:支持日、韓、法、意、德、西班牙、瑞典、葡萄牙、丹麥、荷蘭、挪威等國文字的識別,標準印刷體字符識別率達到96%以上。
2.手寫體數字識別: 具有3個獨立的識別引擎,識別率達99%以上。
3.支持有規律的復雜表單、票據的識別。
 
午夜快成播人免费网站