智慧檔案管理與大數(shù)據(jù)解決方案的領航者,讓信息價值超越期待
電 話:18937133779
網(wǎng) 址:http://www.gycxdjzzl.com
郵 箱:zboao@qq.com
紙質(zhì)文件雖然翻閱方便,但歸檔保存不方便,也不利于后續(xù)的查找使用。因此,一些有歷史價值、研究意義的紙質(zhì)文件,通常要進行數(shù)字化處理,將其保存為電子文檔。
那么,該如何對紙質(zhì)文檔進行數(shù)字化處理?本文會結合使用專業(yè)的文本識別軟件ABBYY FineReader PDF 15來詳細講解文檔數(shù)字化處理的技巧。
一、將紙質(zhì)文件轉換為文檔
ABBYY FineReader PDF 15為我們提供了兩種紙質(zhì)文檔數(shù)字化處理的方法,第一種是運用掃描儀,將紙質(zhì)文檔掃描為所需的文件類型。
第二種是運用拍攝的方法,將紙質(zhì)文件拍攝為圖像,然后再通過ABBYY FineReader PDF 15的智能OCR文本識別功能,識別圖像中的文本。
接下來,我們會重點介紹第二種方法。
二、通過OCR識別圖像
我們將拍攝的紙質(zhì)文檔圖像導入到ABBYY FineReader PDF 15的OCR編輯器后,可先使用其“編輯圖像”功能,對文件的版式進行處理。
如圖4所示,編輯圖像功能是應用ABBYY FineReader PDF 15的圖像編輯器對圖像進行處理的功能。
建議先使用其中的“建議預處理”功能,對圖像進行預處理。
然后,再結合圖像的實際情況使用其他的處理功能。比如,當前圖像的左邊出現(xiàn)一些書邊,可使用“修剪”功能,將書邊裁剪掉。
然后,由于拍攝的失誤,圖像的左下角出現(xiàn)了相機的影子,在這種情況下,可使用“漂白背景”功能,讓書本的背景呈現(xiàn)為白色。同時,結合使用“消除運動模糊”功能,糾正拍攝時的抖動模糊。
最后,書脊部分文本有一點歪曲,可使用“矯直文本行”功能,糾正歪曲。
如圖8所示,我們已經(jīng)完成了圖像的處理。
三、另存為文檔
完成圖像的處理后,我們就可以使用ABBYY FineReader PDF 15的另存為功能,將圖像保存為所需的電子文檔保存。
四、小結
綜上所述,我們既可以應用ABBYY FineReader PDF 15的掃描功能,將紙質(zhì)文件掃描為電子文件,也可以應用ABBYY FineReader PDF 15的高級OCR文本識別功能,對拍攝的紙質(zhì)文件圖像進行文本識別,然后再保存為電子文件格式。
什么叫檔案數(shù)字化,檔案數(shù)字化的好處
檔案數(shù)字化是一種新型的檔案信息管理模式,它把各種載體的檔案資源轉化為數(shù)字化的檔案信息,以數(shù)字化的形式存儲,網(wǎng)絡化的形式互相連接,利用計算機系統(tǒng)進行管理,形成一個有序結構的檔案信息庫,及時提供利用,實現(xiàn)資源共享。
1.代替原件使用,有效延長原件的保存時間。
2.數(shù)字化副本分地保存。要長期或永久保存的重要檔案,用數(shù)據(jù)備份的方法制成多份數(shù)字化副本的備份分地保存。
3.恢復檔案材料模糊褪變的字跡。對字跡出現(xiàn)模糊擴散或褪變的檔案,可經(jīng)過計算機掃描等處理技術恢復模糊褪變字跡。
4.提高辦公效率,數(shù)字化檔案管理使資料能及時歸檔,并盡快提供利用,從而提高辦公效率。
5.提高經(jīng)濟效益,數(shù)字化管理檔案使傳統(tǒng)的以紙質(zhì)為載體的檔案信息對象轉為機讀檔案,不僅節(jié)約了保管費用,節(jié)省了占地空間,而且查閱方便迅速,避免了反復印制資料而造成的紙張和人員的浪費。
用掃描儀,數(shù)碼相機。拍攝儀都可以,要根據(jù)檔案的種類,選取合適的設備。另外,還要配備相關的軟件;譬如:掃描病案資料,建議采用《智慧數(shù)字化病案綜合管理系統(tǒng)》軟件。其他行業(yè)要求不同,軟件也不同。
掃描,通過掃描儀或者其他掃描工具將紙質(zhì)文檔掃描到電腦,再通過ocr文字識別軟件識別后,就可以變成能用Word進行文字處理的文檔保存的電腦。這樣就把你的紙質(zhì)文檔數(shù)字化了。
檔案數(shù)字化是隨著計算機技術、掃描技術、掃描矩陣CCD技術、OCR技術、數(shù)字攝影技術(錄音、錄像)、數(shù)據(jù)庫技術、多媒體技術、存儲技術的發(fā)展而產(chǎn)生的一種新型檔案信息形態(tài)。
它把各種載體的檔案資源轉化為數(shù)字化的檔案信息,以數(shù)字化的形式存儲,網(wǎng)絡化的形式互相連接,利用計算機系統(tǒng)進行管理,形成一個有序結構的檔案信息庫,及時提供利用,實現(xiàn)資源共享。
擴展資料:
檔案數(shù)字化的主要內(nèi)容
1、檔案目錄信息的數(shù)字化,建立檔案目錄數(shù)據(jù)庫;
2、載體檔案的數(shù)字化,如紙質(zhì)檔案、檔案縮微品、照片檔案及錄音錄像檔案等的數(shù)字化,建立檔案影像數(shù)據(jù)庫或多媒體數(shù)據(jù)庫;
3、檔案專題信息的采集與建庫。
參考資料來源:百度百科-檔案數(shù)字化
檔案信息化建設——檔案掃描
檔案掃描工作量是非常大的,因此,如果用戶文檔資料量很大,沒有足夠的人力
和時間對檔案進行掃描,那可以采用外包掃描服務的形式。
外包掃描服務就是用我們的人力、我們的機器設備,到用戶現(xiàn)場為您進行文檔掃描加工
、檔案索引建立、檔案目錄打印等全套工作,作業(yè)結束后將資料刻成光盤,并把機器中數(shù)據(jù)
刪除,保證資料安全性。
外包掃描服務,可以使用戶在盡量短的時間內(nèi),享受到數(shù)字化檔案管理帶來的方便快捷
,而您又不必擔心數(shù)據(jù)的準確性和作業(yè)質(zhì)量,因為專業(yè)的掃描加工隊伍有著嚴格的流程管理
和豐富的文檔掃描經(jīng)驗。
文檔資料數(shù)字化加工服務管理流程:
1.提卷:與用戶完成點交點收手續(xù)
2.案卷整理:按照加工服務操作規(guī)范將文檔整理成元寶樣式并填寫流程單。
3.檔案批量掃描:接受上一流程整理好的資料,按文件整理順序進行批量掃描。保證掃描影像的清晰完整,方向正確,沒有歪斜、黑邊。
4.影像處理:對以上環(huán)節(jié)沒有糾正的一些黑邊/歪斜/順序錯誤現(xiàn)象在系統(tǒng)中做人工處理或調(diào)整,保證文件順序正確以及影像品質(zhì)。記錄不清楚的文件待補掃 。
5.建立索引:按照要求在索引系統(tǒng)中對影像建立對應的索引信息。
6.圖像補掃:按照補掃記錄單記錄的頁號,對問題頁采用相應色度一一補掃。
7.數(shù)據(jù)校對:對加工完成的索引數(shù)據(jù)及影像信息進行校對,對錯誤及時修正。
8.光盤刻錄/數(shù)據(jù)備份:將加工完成的電子數(shù)據(jù)資料(數(shù)據(jù)庫/電子影像)刻錄到光盤中,刻錄完成后再作一個光盤備份。
9.文檔還原:按照用戶要求將文檔恢復成原狀。
10.成品驗收/還卷:質(zhì)檢通過的光盤及原件,移交用戶。
掃描結束后,得到的數(shù)據(jù)光盤上就已經(jīng)包含有單盤檢索調(diào)閱軟件,您可以方便地在任何
一臺微機上檢索光盤內(nèi)容;如果用戶有網(wǎng)絡調(diào)閱需求,我們可以為您提供基于IE瀏覽器的文
檔檢索調(diào)閱系統(tǒng),當然系統(tǒng)已經(jīng)為您考慮到了權限設定、密級控制等各種安全措施;
如果用戶有自己的OA系統(tǒng)、電子政務系統(tǒng)、或檔案管理系統(tǒng),本公司掃描生成的光盤數(shù)
據(jù),具有很強的開放性,我們?nèi)匀荒軌驅(qū)⒓庸?shù)據(jù)方便地與您的系統(tǒng)實現(xiàn)無縫連接。