[C#]解決OCR : Bad language

[C#]解決OCR : Bad language

這幾天也在尋找免費OCR SDK,後來還是覺得MODI比較好上手(不懂MS在OFFICE2010後移除MODI支援意義何在?),

預設MODI語言只有繁中(本地語系)和英文,如果要辨識其他語言需要相關 office語言包,

如果要在office2010使用MODI的話,我目前是透過安裝office2007方式,

自己紀錄一下如何解決MODI辨識其他語系問題。

 

安裝了office2007 簡體語言包後,記得變更索引設定裡面的語系,否則無法執行MODI辨識簡體語系

image

 

選擇中文(簡體)

image

這時候執行MODI就可以正常辨識簡體語系,但是client applications執行依然出現OCR : Bad language。

 

參考用MODI OCR 21种语言一文決定安裝Office 2007簡中版本

image

自訂只安裝OCR核心和簡體中文相關工具。

 

確認以下檔案是否存在(C:\Program Files (x86)\Common Files\microsoft shared\MODI\12.0)

image

 

 

再次執行client applications

image

搞定簡中。

 

補充:日文語系我也是用一樣方法來處理

image

 

確認以下檔案是否存在(C:\Program Files (x86)\Common Files\microsoft shared\MODI\12.0)

image

 

 

 

 

參考

安裝 MODI 以便於和 Microsoft Office 2010 搭配使用

[Office 2010]Microsoft Office Document Imaging (MODI) 替代方案

用MODI OCR 21种语言

Non-English OCR in Microsoft Office Document Imaging (MODI)