電 話:18937133779
網(wǎng) 址:http://www.gycxdjzzl.com
郵 箱:zboao@qq.com
檔案掃描是檔案數(shù)字化加工重要的一部分,檔案掃描應(yīng)根據(jù)紙質(zhì)檔案原件實際情況、數(shù)字化目的、數(shù)字化規(guī)模、計算機網(wǎng)絡(luò)和存儲條件等選擇相應(yīng)的掃描設(shè)備,進行相關(guān)參數(shù)的設(shè)置和調(diào)整。
參數(shù)的設(shè)置和調(diào)整應(yīng)保證掃描后數(shù)字圖像清晰、完整、不失真,圖像效果最接近檔案原貌。掃描的工作人員需要掌握一定的操作技術(shù)和方法,充分掌握合格圖像的標準要求。
1.掃描設(shè)備
1.1掃描設(shè)備的選擇應(yīng)特別注意對檔案實體的保護,盡量采用對檔案實體破壞性小的掃描設(shè)備進行數(shù)字化。
1.2超出所使用掃描儀掃描尺寸的檔案可采用更大幅面掃描儀進行掃描,也可以采用小幅面掃描儀分幅掃描后進行圖像拼接的方式處理。分幅掃描時,相鄰圖像之間應(yīng)留有足夠的重疊,并且采用標板等方式明確說明分幅方法;若后期采用軟件自動拼接的方式,重疊尺寸建議不小于單幅圖像對應(yīng)原件尺寸的三分之一。
1.3對于極其珍貴且尺寸不規(guī)則的檔案,為方便直觀顯示原件大小,可采用標板、標尺等方式標識原件大小等信息。
1.4應(yīng)遵循相關(guān)設(shè)備的使用規(guī)律進行定期維護、保養(yǎng)。
2.掃描色彩模式
2.1為最大限度保留檔案原件信息,便于多種方式的利用,宜全部采用彩色模式進行掃描。
2.2頁面中有紅頭、印章或插有照片、彩色插圖、多色彩文字等的檔案,應(yīng)采用彩色模式進行掃描。
2.3頁面為黑白兩色,并且字跡清晰、不帶插圖的檔案,也可采用黑白二值模式進行掃描。
2.4頁面為黑白兩色,但字跡清晰度差或帶有插圖的檔案,也可采用灰度模式掃描。
3.掃描分辨率
3.1掃描分辨率的選擇,應(yīng)保證掃描后圖像清晰、完整,并綜合考慮數(shù)字圖像后期利用方式等因素。
3.2掃描分辨率應(yīng)不小于200 dpi。如文字偏小,密集、清晰度較差時,建議掃描分辨案不小于300 dpi。
3.3如有計算機輸出縮微攝影、仿真復制、印刷出版等其他用途時,可根據(jù)需要調(diào)整掃描分辨率。需要進行輸出的檔案,掃描分辨率建議不小于300 dpi:需要進行高精度仿真復制的檔案掃描分辨率建議不小于600 dpi;需要進行印刷出版的檔案,可結(jié)合檔案幅面、印刷出版幅面、印刷精度要求等選擇合適的分辨離。
4.存儲格式
4.1紙質(zhì)檔案數(shù)字圖像長期保存格式為TIFF、JPEG或JPEG2000等通用格式,圖像壓縮率的選擇可根據(jù)實際應(yīng)用的需求而定。
4.2紙質(zhì)檔案數(shù)字圖像利用時,也可從網(wǎng)絡(luò)瀏覽速度、易操作性、存儲空間占用等方面進行綜合考慮,將圖像轉(zhuǎn)換為OFD、PIDF等其他格式。
4.3同一批檔案應(yīng)采用相同的存儲格式。
5.圖像命名
5.1應(yīng)以檔號為基礎(chǔ)對數(shù)字圖像命名。圖像命名方式的選擇應(yīng)確保圖像命名的唯一性。
5.2建議將數(shù)字圖像存儲為單頁文件,并按檔號與圖像流水號的組合對圖像命名。
數(shù)字圖像確需存儲為多頁文件時,可采用該檔案的檔號對圖像命名。
5.3應(yīng)科學建立紙質(zhì)檔案數(shù)字圖像的存儲路徑,確保數(shù)據(jù)掛接的準確性。
6.裁邊
如需對數(shù)字圖像進行裁邊處理,應(yīng)在距頁邊最外延至少2 mm~3 mm處裁剪圖像
7.去污
如需對數(shù)字圖像進行去污處理,以去除在掃描過程中產(chǎn)生的污點、污線、黑邊等影響圖像質(zhì)量的雜質(zhì),應(yīng)遵循展現(xiàn)檔案原貌的原則,處理過程中不得去除檔案頁面原有的紙張褪變斑點、水遺、污點、裝訂孔等痕跡。
8.圖像質(zhì)量檢查
8.1數(shù)字圖像不完整、無法清晰識別或圖像失真度較大時,應(yīng)重新掃描
8.2對于漏掃、重掃、多掃等情況,應(yīng)及時改正。
8.3數(shù)字圖像的排列順序與檔案原件不一致時,應(yīng)及時進行調(diào)整。
8.4對數(shù)字圖像拼接、旋轉(zhuǎn)及糾偏、裁邊、去污等處理情況進行檢查,發(fā)現(xiàn)不符合圖像質(zhì)量要求時應(yīng)重新進行圖像處理。
9.數(shù)據(jù)掛接
9.1應(yīng)借助相關(guān)軟件對數(shù)據(jù)庫中的目錄數(shù)據(jù)和與其對應(yīng)的紙質(zhì)檔案數(shù)字圖像進行掛接,以實現(xiàn)目錄數(shù)據(jù)與數(shù)字圖像的關(guān)聯(lián)。
9.2逐條對掛接結(jié)果進行檢查,包括目錄數(shù)據(jù)與紙質(zhì)檔案數(shù)字圖像對應(yīng)的準確性、已掛接數(shù)字圖像與實際掃描數(shù)量的一致性、數(shù)字圖像是否能正常打開等,發(fā)現(xiàn)錯誤及時進行糾正。
檔案掃描的流程
檔案掃描是將紙質(zhì)檔案轉(zhuǎn)換為數(shù)字圖像的過程,以便于存儲、管理和檢索。以下是一般的檔案掃描流程:
一、準備工作
1.評估檔案:對需要掃描的檔案進行評估,確定其數(shù)量、大小、紙張質(zhì)量等。
2.設(shè)備準備:選擇適合的掃描儀設(shè)備,并確保其正常運行。
3.人員培訓:對參與掃描工作的人員進行培訓,包括操作掃描儀、處理圖像等。
二、掃描設(shè)置
1.選擇掃描參數(shù):根據(jù)檔案的特點,設(shè)置合適的掃描分辨率、顏色模式、文件格式等參數(shù)。
2.放置檔案:將檔案逐頁放置在掃描儀的玻璃板上,確保頁面平整、對齊。
3.開始掃描:啟動掃描儀進行掃描,按照設(shè)定的參數(shù)生成數(shù)字圖像。
三、圖像處理
1.質(zhì)量檢查:檢查掃描得到的圖像,確保其清晰、完整,如有必要,進行圖像的旋轉(zhuǎn)、裁剪等處理。
2.命名規(guī)則:為掃描后的圖像文件命名,遵循一定的規(guī)則,便于管理和檢索。
3.保存圖像:將處理后的圖像保存到指定的文件夾或數(shù)據(jù)庫中。
四、索引和元數(shù)據(jù)
1.建立索引:為掃描的檔案建立索引信息,包括檔案編號、題名、作者、日期等。
2.關(guān)聯(lián)元數(shù)據(jù):將索引信息與掃描后的圖像文件進行關(guān)聯(lián),便于檢索和查詢。
五、質(zhì)量控制
1.抽樣檢查:定期抽取一定比例的掃描圖像進行質(zhì)量檢查,確保掃描質(zhì)量符合要求。
2.記錄問題:對發(fā)現(xiàn)的問題進行記錄,并及時采取糾正措施。
六、成果輸出
1.數(shù)字檔案:將掃描后的圖像和相關(guān)元數(shù)據(jù)整合為數(shù)字檔案,可進行電子存儲和備份。
2.檢索和訪問:提供檢索功能,用戶可以通過關(guān)鍵詞、檔案編號等方式查找和訪問掃描的檔案。
總之,檔案掃描的流程包括準備工作、掃描設(shè)置、圖像處理、索引和元數(shù)據(jù)、質(zhì)量控制以及成果輸出等環(huán)節(jié)。通過掃描檔案,可以實現(xiàn)數(shù)字化管理,提高檔案的利用效率和保護水平。
檔案數(shù)字化掃描怎樣保持原貌
什么是檔案數(shù)字化?
所謂的檔案數(shù)字化是利用計算機技術(shù)及那個模擬信號轉(zhuǎn)換為數(shù)字信號的處理過程。
紙質(zhì)檔案數(shù)字化是采用掃描儀等設(shè)備對紙質(zhì)檔案進行數(shù)字化加工,使其轉(zhuǎn)化為存儲在磁盤、磁帶、光盤等載體上的數(shù)字圖像,并按照紙質(zhì)檔案的內(nèi)在聯(lián)系,建立起目錄數(shù)據(jù)與數(shù)字圖像關(guān)聯(lián)關(guān)系的材料的過程。
紙質(zhì)檔案數(shù)字化包含數(shù)字化前處理、目錄數(shù)據(jù)庫建立、檔案掃描、圖像處理、數(shù)據(jù)共接、數(shù)字化成果驗收與移交等環(huán)節(jié)。紙質(zhì)檔案數(shù)字化工作的重點在于最大程度地保持和展現(xiàn)檔案的原貌,使掃描圖像的效果最接近紙質(zhì)檔案的原貌,以真實地反映檔案的內(nèi)容,其中,檔案掃描和圖像處理環(huán)節(jié)是保證紙質(zhì)檔案數(shù)字化成果質(zhì)量的關(guān)鍵,接下來讓小編帶你一起了解下吧。
1檔案掃描
檔案掃描要根據(jù)紙質(zhì)檔案原件的實際情況、數(shù)字化目的、數(shù)字化規(guī)模、計算機網(wǎng)絡(luò)和存儲條件等選擇相應(yīng)的掃描設(shè)備,進行相關(guān)參數(shù)的設(shè)置和調(diào)整。
①色彩模式
掃描色彩模式分為彩色、灰度、黑白。
色彩模式會對圖像大小產(chǎn)生影響。在不考慮壓縮等其他影響因素的情況下,三種色彩模式掃描的圖像大小的關(guān)系可簡單表述為:24位彩色圖像大小是8位灰色圖像的3倍,黑白圖像的24倍。
色彩模式還會對圖像清晰度產(chǎn)生影響。對于影像清晰、檔案原件色彩簡單、對比強烈的原件,如白紙黑字的普通打印文件,在其他條件均調(diào)到最佳的情況下,采取三種色彩模式掃描的圖像清晰程度差異不明顯。而對于影像不夠清晰,或檔案原件色彩豐富,以及對比不夠強烈的原件,采取彩色模式掃描的圖像,在展現(xiàn)檔案原件細節(jié)、清晰程度等方面要明顯優(yōu)于灰度模式或黑白模式掃描的圖像。
因此,一般要求全部采用彩色模式進行掃描。在實際的數(shù)字化過程中,各單位要根據(jù)數(shù)字化成果應(yīng)用要求、實際可承受的存儲容量以及原件情況等因素,來確定色彩模式參數(shù)。頁面中有紅頭、印章或插有照片、彩色插圖、多色彩文字等的檔案,應(yīng)采用彩色模式進行掃描。頁面為黑白兩色,并且字跡清晰、不帶插圖的檔案,也可采用黑白二值模式進行掃描。頁面為黑白兩色,但字跡清晰度差或帶有插圖的檔案,也可采用灰度模式掃描。
?、诜直媛?/p>
分辨率是指單位長度內(nèi)圖像包含的點數(shù)或像素數(shù),一般用每英寸點數(shù)(dpi)表示。分辨率對掃描圖像大小和清晰程度以及掃描時長都有直接影響。掃描圖像分辨率越高,所占用的掃描時間越長,文件也會越大,圖像清晰程度越好。但是,分辨率在調(diào)高到一定程度時,分辨率的增加并不會明顯改善清晰程度,而其所需的存儲空間則會明顯增加。因此,實際工作中,應(yīng)根據(jù)可接受的圖像大小和清晰程度的具體情況來選擇合適的分辨率。
在現(xiàn)有技術(shù)條件下,綜合考慮不同檔案部門基礎(chǔ)條件的差異,一般要求掃描分辨率個小于200dpi.如文字偏小密集,清晰度較差時,建議掃描分辨率不小于300dpi.如有計算機輸出縮微攝影(COM)仿具復制、印刷出版等其他用途時,可根據(jù)需要調(diào)整掃描分辨率,需要進行COM輸出的檔案,掃描分辨率建議不小于300dpi;需要進行高精度仿真復制的檔案,掃描分辨率建議不小于600dp;需要進行印刷出版的檔案,可結(jié)合檔案幅面、印刷出版幅面、印刷精度要求等選擇合適的分辨率。
?、鄞鎯Ω袷?/p>
紙質(zhì)檔案數(shù)字化圖像應(yīng)存為TIFF、JPEG、JPEG2000等通用格式,壓縮率的選擇可根據(jù)實際應(yīng)用的需求而定。
TIFF可以實現(xiàn)對圖像的無壓縮存儲,能保持原有圖像的顏色和層次,但占用存儲空間很大。JPEG是一種有損壓縮格式,在采用較高壓縮率的同時能獲得較好的圖像質(zhì)量;JPEG具有調(diào)節(jié)圖像的功能,允許用不同的壓縮比例對文件壓縮,方便在圖像質(zhì)量和文件大小之間找到平衡點,其應(yīng)用也非常廣泛。目前各類瀏覽器均支持JPEG這種圖像格式。JPEG2000既支持無損壓縮,也支持有損壓縮。JPEG2000在相同圖像質(zhì)量條件下可以獲得比JPEG更高的壓縮比,而且能夠?qū)崿F(xiàn)圖像的漸進傳輸。
2圖像處理
圖像處理包含圖像拼接、旋轉(zhuǎn)與糾偏、裁邊、去污、圖像質(zhì)量檢查等工作。
“裝潢者,書之司命也”(明·周嘉胄《裝潢志》)正如裝裱之于書畫,好的圖像處理甚至可以彌補掃描的缺陷。需要的是耐心細致的工匠精神。
國家檔案局還頒布了《錄音錄像檔案數(shù)字化規(guī)范》(DA/T62-2017),與《紙質(zhì)檔案數(shù)字化規(guī)范》一樣在2018年1月1日開始實施。從這里我們可以看到“消滅存量”的工作正在全面加快速度。在存量檔案數(shù)字化工作中,我們應(yīng)當積極采用人工處理與自動化處理相結(jié)合的方式,提高數(shù)字化工作的效率,加快檔案數(shù)字化工作的步伐,盡快實現(xiàn)“消滅存量”的目標。