你知道檔案數(shù)字化如何加工?
來源:www.trustodo.com 發(fā)布時間:2023年08月04日>
您知道如何加工檔案數(shù)字化嗎?
一、定義
隨著計算機(jī)技術(shù)、掃描技術(shù)、OCR技術(shù)、數(shù)字?jǐn)z影技術(shù)(錄音、錄像),檔案數(shù)字化、隨著數(shù)據(jù)庫技術(shù)、多媒體技術(shù)和存儲技術(shù)的發(fā)展,一種新的文件信息形式將其轉(zhuǎn)化為存儲在磁盤、光盤等載體上的數(shù)字圖像或數(shù)字文本的處理過程,可以通過計算機(jī)識別。
文件數(shù)字化是一種新型的文件信息管理模式,它將各種載體的文件資源轉(zhuǎn)換為數(shù)字文件信息,以數(shù)字形式存儲,以網(wǎng)絡(luò)形式相互連接,利用計算機(jī)系統(tǒng)進(jìn)行管理,形成有序結(jié)構(gòu)的文件信息庫,及時提供利用,實(shí)現(xiàn)資源共享。
數(shù)字化步驟二
前期檔案整理
檔案借出
從檔案室接收,填寫檔案并移交清單,一式兩份。拿到檔案后,開始檢查檔案數(shù)量,檢查數(shù)量后簽字確認(rèn),將檔案帶回加工現(xiàn)場。
準(zhǔn)備目錄數(shù)據(jù)
根據(jù)各種檔案整理規(guī)定的要求,在檔案管理系統(tǒng)中記錄目錄數(shù)據(jù)。如有錯誤或不規(guī)范的文件標(biāo)題、文件標(biāo)題、責(zé)任人、日期、起止頁號等。,應(yīng)進(jìn)行修改。
拆除裝訂
如果沒有拆除裝訂物,會影響掃描工作的檔案,裝訂物應(yīng)該被拆除。拆除裝訂物時要注意保護(hù)檔案不受損壞。
頁面修整
對于損壞嚴(yán)重、無法直接掃描的檔案,應(yīng)先進(jìn)行技術(shù)修復(fù),掃描前應(yīng)對影響掃描質(zhì)量的原件進(jìn)行相應(yīng)處理(壓平或熨平等)。).
檔案掃描
掃描方式
根據(jù)檔案幅度的大小(A4)、A3、A0等。)選擇相應(yīng)規(guī)格的掃描儀或?qū)I(yè)掃描儀進(jìn)行掃描(例如,0號圖紙掃描儀可以用于工程圖紙)。大型文件可以用大型數(shù)字平臺掃描,也可以用縮小拍攝后的電影數(shù)字轉(zhuǎn)換設(shè)備掃描。
(2)紙張狀況不佳,檔案太薄、太軟或太厚,應(yīng)采用平板掃描;對于紙張狀況良好的檔案,可以采用高速掃描來提高工作效率。
顏色模式的掃描
(1)掃描色彩模式一般包括黑白二值、灰度、色彩等。一般采用彩色。
頁面為黑白兩色,且字跡清晰,無插圖文件,可采用黑白二值模式掃描。
(3)頁面為黑色和白色,但字跡清晰度差或帶插圖的文件,以及頁面為多色文本的文件,可以用灰度模式掃描。
頁面上有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的文件,可以通過彩色模式進(jìn)行掃描。
掃描分辨率
原則上,掃描后的圖像清晰、完整、不影響圖像的使用效果,是掃描分辨率參數(shù)大小的選擇。
(2)掃描文件時,采用黑白二值、灰度、彩色等模式,其分辨率一般應(yīng)設(shè)置為200-300dpi。特殊情況下,如文字小、密度大、清晰度差等。,可以適當(dāng)提高分辨率。
圖像處理
圖像數(shù)據(jù)質(zhì)量檢驗(yàn)
(1)檢查圖像的偏差、清晰度、失真等。當(dāng)發(fā)現(xiàn)圖像質(zhì)量不符合要求時,應(yīng)重新處理圖像。
如果由于操作不當(dāng),導(dǎo)致掃描的圖像文件不完整或無法清晰識別,則應(yīng)重新掃描。
發(fā)現(xiàn)文件漏掃時,應(yīng)及時補(bǔ)齊并正確插入圖像。
當(dāng)發(fā)現(xiàn)掃描圖像的排列順序與檔案原件不一致時,應(yīng)及時調(diào)整。
糾偏、去污、圖像拼接、切邊處理
(1)對有偏差的圖像進(jìn)行偏差處理,以達(dá)到視覺上基本不感覺偏差為準(zhǔn)。旋轉(zhuǎn)還原方向不正確的圖像,以滿足閱讀習(xí)慣。
(2)對影響圖像質(zhì)量的雜質(zhì),如黑點(diǎn)、黑線、黑框、黑邊等。,應(yīng)進(jìn)行去污處理。在處理過程中,應(yīng)遵循在不影響可理解性的情況下展示文件原貌的原則。
(3)分區(qū)掃描大型文件形成的多幅圖像,應(yīng)拼接合并成一個完整的圖像,以保證文件數(shù)字圖像的整體性。
采用彩色模式掃描的圖像應(yīng)進(jìn)行裁邊處理,去除多余的白色邊緣,以有效地減少圖像文件的容量,節(jié)省存儲空間。
圖像存儲
存儲格式
圖像文件采用黑白二值模式掃描,一般采用PDF格式存儲。
采用灰度模式和彩色模式掃描的文件,一般采用PDF格式存儲。
圖像文件命名
(1)紙質(zhì)檔案目錄數(shù)據(jù)庫中的每個文件都有相應(yīng)的檔號,掃描后的圖像文件被該檔號命名為該檔號。如果圖像文件較大,不方便網(wǎng)絡(luò)瀏覽,可以拆分成多個圖像文件,文件名稱后增加A、B、C等區(qū)別。
分別設(shè)置文件夾,以文件檔號命名,并存儲相應(yīng)的圖像文件。
數(shù)據(jù)掛接
在將每個紙質(zhì)文件掃描獲得的圖像存儲在相應(yīng)文件號的文件夾中后,仔細(xì)檢查每個圖像文件的名稱是否與文件目錄數(shù)據(jù)庫中文件的文件號相同,圖像文件的頁數(shù)是否與文件目錄數(shù)據(jù)庫中文件的總頁數(shù)相同。通過每個圖像文件所在文件夾的名稱與文件目錄數(shù)據(jù)庫中文件號的一致性,建立相應(yīng)的關(guān)聯(lián)關(guān)系,為實(shí)現(xiàn)文件目錄數(shù)據(jù)庫與圖像文件的批量掛接提供條件。
一、定義
隨著計算機(jī)技術(shù)、掃描技術(shù)、OCR技術(shù)、數(shù)字?jǐn)z影技術(shù)(錄音、錄像),檔案數(shù)字化、隨著數(shù)據(jù)庫技術(shù)、多媒體技術(shù)和存儲技術(shù)的發(fā)展,一種新的文件信息形式將其轉(zhuǎn)化為存儲在磁盤、光盤等載體上的數(shù)字圖像或數(shù)字文本的處理過程,可以通過計算機(jī)識別。
文件數(shù)字化是一種新型的文件信息管理模式,它將各種載體的文件資源轉(zhuǎn)換為數(shù)字文件信息,以數(shù)字形式存儲,以網(wǎng)絡(luò)形式相互連接,利用計算機(jī)系統(tǒng)進(jìn)行管理,形成有序結(jié)構(gòu)的文件信息庫,及時提供利用,實(shí)現(xiàn)資源共享。
數(shù)字化步驟二
前期檔案整理
檔案借出
從檔案室接收,填寫檔案并移交清單,一式兩份。拿到檔案后,開始檢查檔案數(shù)量,檢查數(shù)量后簽字確認(rèn),將檔案帶回加工現(xiàn)場。
準(zhǔn)備目錄數(shù)據(jù)
根據(jù)各種檔案整理規(guī)定的要求,在檔案管理系統(tǒng)中記錄目錄數(shù)據(jù)。如有錯誤或不規(guī)范的文件標(biāo)題、文件標(biāo)題、責(zé)任人、日期、起止頁號等。,應(yīng)進(jìn)行修改。
拆除裝訂
如果沒有拆除裝訂物,會影響掃描工作的檔案,裝訂物應(yīng)該被拆除。拆除裝訂物時要注意保護(hù)檔案不受損壞。
頁面修整
對于損壞嚴(yán)重、無法直接掃描的檔案,應(yīng)先進(jìn)行技術(shù)修復(fù),掃描前應(yīng)對影響掃描質(zhì)量的原件進(jìn)行相應(yīng)處理(壓平或熨平等)。).
檔案掃描
掃描方式
根據(jù)檔案幅度的大小(A4)、A3、A0等。)選擇相應(yīng)規(guī)格的掃描儀或?qū)I(yè)掃描儀進(jìn)行掃描(例如,0號圖紙掃描儀可以用于工程圖紙)。大型文件可以用大型數(shù)字平臺掃描,也可以用縮小拍攝后的電影數(shù)字轉(zhuǎn)換設(shè)備掃描。
(2)紙張狀況不佳,檔案太薄、太軟或太厚,應(yīng)采用平板掃描;對于紙張狀況良好的檔案,可以采用高速掃描來提高工作效率。
顏色模式的掃描
(1)掃描色彩模式一般包括黑白二值、灰度、色彩等。一般采用彩色。
頁面為黑白兩色,且字跡清晰,無插圖文件,可采用黑白二值模式掃描。
(3)頁面為黑色和白色,但字跡清晰度差或帶插圖的文件,以及頁面為多色文本的文件,可以用灰度模式掃描。
頁面上有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的文件,可以通過彩色模式進(jìn)行掃描。
掃描分辨率
原則上,掃描后的圖像清晰、完整、不影響圖像的使用效果,是掃描分辨率參數(shù)大小的選擇。
(2)掃描文件時,采用黑白二值、灰度、彩色等模式,其分辨率一般應(yīng)設(shè)置為200-300dpi。特殊情況下,如文字小、密度大、清晰度差等。,可以適當(dāng)提高分辨率。
圖像處理
圖像數(shù)據(jù)質(zhì)量檢驗(yàn)
(1)檢查圖像的偏差、清晰度、失真等。當(dāng)發(fā)現(xiàn)圖像質(zhì)量不符合要求時,應(yīng)重新處理圖像。
如果由于操作不當(dāng),導(dǎo)致掃描的圖像文件不完整或無法清晰識別,則應(yīng)重新掃描。
發(fā)現(xiàn)文件漏掃時,應(yīng)及時補(bǔ)齊并正確插入圖像。
當(dāng)發(fā)現(xiàn)掃描圖像的排列順序與檔案原件不一致時,應(yīng)及時調(diào)整。
糾偏、去污、圖像拼接、切邊處理
(1)對有偏差的圖像進(jìn)行偏差處理,以達(dá)到視覺上基本不感覺偏差為準(zhǔn)。旋轉(zhuǎn)還原方向不正確的圖像,以滿足閱讀習(xí)慣。
(2)對影響圖像質(zhì)量的雜質(zhì),如黑點(diǎn)、黑線、黑框、黑邊等。,應(yīng)進(jìn)行去污處理。在處理過程中,應(yīng)遵循在不影響可理解性的情況下展示文件原貌的原則。
(3)分區(qū)掃描大型文件形成的多幅圖像,應(yīng)拼接合并成一個完整的圖像,以保證文件數(shù)字圖像的整體性。
采用彩色模式掃描的圖像應(yīng)進(jìn)行裁邊處理,去除多余的白色邊緣,以有效地減少圖像文件的容量,節(jié)省存儲空間。
圖像存儲
存儲格式
圖像文件采用黑白二值模式掃描,一般采用PDF格式存儲。
采用灰度模式和彩色模式掃描的文件,一般采用PDF格式存儲。
圖像文件命名
(1)紙質(zhì)檔案目錄數(shù)據(jù)庫中的每個文件都有相應(yīng)的檔號,掃描后的圖像文件被該檔號命名為該檔號。如果圖像文件較大,不方便網(wǎng)絡(luò)瀏覽,可以拆分成多個圖像文件,文件名稱后增加A、B、C等區(qū)別。
分別設(shè)置文件夾,以文件檔號命名,并存儲相應(yīng)的圖像文件。
數(shù)據(jù)掛接
在將每個紙質(zhì)文件掃描獲得的圖像存儲在相應(yīng)文件號的文件夾中后,仔細(xì)檢查每個圖像文件的名稱是否與文件目錄數(shù)據(jù)庫中文件的文件號相同,圖像文件的頁數(shù)是否與文件目錄數(shù)據(jù)庫中文件的總頁數(shù)相同。通過每個圖像文件所在文件夾的名稱與文件目錄數(shù)據(jù)庫中文件號的一致性,建立相應(yīng)的關(guān)聯(lián)關(guān)系,為實(shí)現(xiàn)文件目錄數(shù)據(jù)庫與圖像文件的批量掛接提供條件。
相關(guān)文章
- 你知道重慶檔案整理是什么嗎?2018年09月20日
- 重慶檔案數(shù)字化的思考講解2020年03月06日
- 如何做好紙質(zhì)檔案數(shù)字化掃描工作2023年07月07日
- 檔案數(shù)字化加工過程中應(yīng)注意的幾點(diǎn)問題!2023年07月14日
- 檔案數(shù)字化加工告訴你檔案整理有怎樣的重要性?2023年07月28日