辨識
校對
協作
開放
中研院文字辨識與校對平台提供使用者上傳文本的數位圖像檔案,平台會自動將圖像中的文字內容辨識為文字格式,同時也提供協同校對功能,讓使用者個人或開放其他人透過直覺式的工具,比對原始圖像與辨識結果,以利進行文字校正,使用者亦可將自動辨識或人工校對的結果下載到自己的電腦。
此平台是由中研院數位文化中心運用影像處理與深度學習技術所研發。其中包含了圖像處理、文本版式偵測、文字位置偵測、文字辨識、文本語意預測及依使用者反饋自動修正等核心技術,並透過網頁與資料庫技術來整合這些核心技術,以提供線上服務。
高準確率的自動辨識
本平台核心技術於香港中文大學舉辦的「中國古籍文字自動識別挑戰2021」競賽中,以近 91% 的高準確率榮獲冠軍。
直覺式的圖文對照操作介面
簡易直覺的操作介面與流程,可彈性調整個人偏好,工作效率加倍。
中文缺字輸入與呈現
採用「漢字構形資料庫」之核心技術,古籍上常有的缺字及罕見字皆能無痛輸入與呈現。
多人協同校正
可快速組織專屬的校正團隊,讓多人一同參與書籍校正,透過多人協作,大幅縮短校正時程。
彈性的權限設定
可建立所有會員皆可協作的公開型校正,或指定人員參與的限制型校正;下載校正結果亦有不可下載、下載目前頁面及下載全書等權限設定。
批量移除區域功能
可快速移除書頁版心、魚尾、書耳及書眉 ... 等區域,降低校正工作的繁瑣程度。
錯別字詞修正功能
可使用自建常用詞、智慧生成詞頻或特定領域的權威詞,自動進行錯誤字詞的批量取代。
依使用者反饋自動學習
平台透過蒐集使用者手動校正資料自動學習,後續處理狀況相近任務即可自動修正辨識錯誤的部份。
文本校訂版本控制
允許使用者選擇某一次校訂文本的結果進行編輯或儲存;亦可讓使用者暫存,後續繼續編輯。