一、術(shù)語(yǔ)和定義
1、數(shù)字化
用計(jì)算機(jī)技能將模擬信號(hào)轉(zhuǎn)化為數(shù)字信號(hào)的處理進(jìn)程。
2、紙質(zhì)檔案數(shù)字化
選用掃描儀或數(shù)碼相機(jī)等數(shù)碼設(shè)備對(duì)紙質(zhì)檔案進(jìn)行數(shù)字加工,將其轉(zhuǎn)化為存儲(chǔ)在磁帶、磁盤(pán)、光盤(pán)等載體上并能被計(jì)算機(jī)辨認(rèn)的數(shù)字圖畫(huà)或數(shù)字文本的處理進(jìn)程。
3、數(shù)字圖畫(huà)
表示什物圖畫(huà)的整數(shù)陣列。一個(gè)二維或更高維的采樣并量化的函數(shù),由相同維數(shù)的接連圖畫(huà)發(fā)生。在矩陣(或其他)網(wǎng)絡(luò)上采樣——接連函數(shù),并在采樣點(diǎn)上將值最小化后的陣列。
4、是非二值圖畫(huà)
只要是非兩級(jí)灰度的數(shù)字圖畫(huà)。它對(duì)應(yīng)于是非兩種狀態(tài)的文字稿、線條圖等。
5、接連色調(diào)靜態(tài)圖畫(huà)
以多于兩級(jí)灰度的不同濃淡層次或以不同顏色通道組合成的靜態(tài)數(shù)字圖畫(huà)。在紙質(zhì)檔案數(shù)字化進(jìn)程中,一般表現(xiàn)為灰度掃描和五顏六色掃描兩種方法。
6、分辨率
單位長(zhǎng)度內(nèi)圖畫(huà)包含的點(diǎn)數(shù)或像素?cái)?shù),一般用每英時(shí)點(diǎn)數(shù)(dpi)表示。
7、失真度
對(duì)檔案進(jìn)行數(shù)字化轉(zhuǎn)化后,數(shù)字圖畫(huà)與檔案原件在顏色、幾何等方面的違背程度。
8、可懂度
數(shù)字圖畫(huà)向人或機(jī)器供給信息的才干。
9、圖畫(huà)壓縮
鏟除圖畫(huà)冗余或圖畫(huà)近似的任一種進(jìn)程,其目的是對(duì)圖畫(huà)以更緊湊的方法表示。
二、紙質(zhì)檔案數(shù)字化根本要求
1、根本原則
紙質(zhì)檔案數(shù)字化的根本原則是使檔案信息資源精確方便快捷地供給使用,使能夠公開(kāi)的檔案信息資源得到共享,以滿足社會(huì)對(duì)檔案使用的需求。
2、數(shù)字化對(duì)像的確定原則
應(yīng)當(dāng)對(duì)所要進(jìn)行數(shù)字化的對(duì)象依照一定的原則和辦法進(jìn)行承認(rèn),只要契合一定要求的紙質(zhì)檔案文獻(xiàn)才干進(jìn)行數(shù)字化。
1)契合國(guó)家法律法規(guī)的原則
紙質(zhì)檔案的數(shù)字化,有必要契合國(guó)家檔案開(kāi)放規(guī)定以及有關(guān)規(guī)定。
2)價(jià)值性原則
歸于歸檔規(guī)模且應(yīng)永久或長(zhǎng)時(shí)間保存的、社會(huì)使用價(jià)值高的檔案可列入數(shù)字化加工的規(guī)模。
3、根本環(huán)節(jié)
紙質(zhì)檔案數(shù)字化的根本環(huán)節(jié)首要包含:檔案收拾、目錄建庫(kù)、檔案掃描、圖畫(huà)處理、圖畫(huà)存儲(chǔ)、數(shù)據(jù)質(zhì)檢、數(shù)據(jù)掛接、數(shù)據(jù)查驗(yàn)、數(shù)據(jù)備份、作用辦理等。
4、 進(jìn)程辦理
1)應(yīng)加強(qiáng)紙質(zhì)檔案數(shù)字化各環(huán)節(jié)的安全保密辦理機(jī)制,保證檔案原件和數(shù)字化檔案信息的安全。
2 )紙質(zhì)檔案數(shù)字化的各個(gè)環(huán)節(jié)均應(yīng)進(jìn)行詳細(xì)的掛號(hào),并及時(shí)收拾、匯總,裝訂成冊(cè),在數(shù)字化作業(yè)完成的同時(shí)樹(shù)立起完好、標(biāo)準(zhǔn)的記載。
三、檔案收拾
在掃描之前,依據(jù)檔案辦理情況,按下述步驟對(duì)檔案進(jìn)行恰當(dāng)收拾,并視需求作出標(biāo)識(shí),保證檔案數(shù)字化質(zhì)量。
1 目錄數(shù)據(jù)準(zhǔn)備
2 拆除裝訂
3 區(qū)分掃描件和非掃描件
4 頁(yè)面修整
5 檔案收拾掛號(hào)
6 裝訂
四、檔案掃描
1、掃描方法
1)依據(jù)檔案幅面的巨細(xì)(A4、A3、A0等)挑選相應(yīng)規(guī)格的掃描儀或?qū)I(yè)掃描儀(如工程圖紙可選用0號(hào)圖紙掃描儀)進(jìn)行掃描。大幅面檔案可選用大幅面數(shù)碼平臺(tái),或許縮微拍攝后的膠片數(shù)字化轉(zhuǎn)化設(shè)備等進(jìn)行掃描,也能夠選用小幅面掃描后的圖畫(huà)拼接方法處理。
2)紙張情況較差,以及過(guò)薄、過(guò)軟或超厚的檔案,應(yīng)選用平板掃描方法;紙張情況好的檔案可選用高速掃描方法以提高作業(yè)效率。
2、掃描顏色方法
1)掃描顏色方法一般有是非二值、灰度、五顏六色等。一般選用是非二值。
2)頁(yè)面為是非兩色,并且字跡明晰、不帶插圖的檔案,可選用是非二值方法進(jìn)行掃描。
3)頁(yè)面為是非兩色,但字跡明晰度差或帶有插圖的檔案,以及頁(yè)面為多色文字的檔案,可選用灰度方法掃描。
4)頁(yè)面中有紅頭、印章或插有是非照片、五顏六色照片、五顏六色插圖的檔案,可視需求選用五顏六色方法進(jìn)行掃描。
3 、掃描分辨率
1)掃描分辨率參數(shù)巨細(xì)的挑選,原則上以掃描后的圖畫(huà)明晰、完好、不影響圖畫(huà)的使用作用為準(zhǔn)。
2)選用是非二值、灰度、五顏六色幾種方法對(duì)檔案進(jìn)行掃描時(shí),其分辨率一般均建議挑選≥100dpi.特別情況下,如文字偏小、密布、明晰度較差等,可恰當(dāng)提高分辨率。
3)需求進(jìn)行OCR漢字辨認(rèn)的檔案,掃描分辨率建議挑選≥200dpi.
4、掃描登掛號(hào)
仔細(xì)填寫(xiě)紙質(zhì)檔案數(shù)字化轉(zhuǎn)化進(jìn)程交代掛號(hào)表單,掛號(hào)掃描的頁(yè)數(shù),核對(duì)每份文件的實(shí)踐掃描頁(yè)數(shù)與檔案收拾量填寫(xiě)的文件頁(yè)數(shù)是否共同,不共同時(shí)應(yīng)注明具體原因和處理辦法。
五、圖畫(huà)處理
1 、圖畫(huà)數(shù)據(jù)質(zhì)量查看
1)對(duì)圖畫(huà)偏斜度、明晰度、失真度進(jìn)行查看。發(fā)現(xiàn)不契合圖畫(huà)質(zhì)量要求時(shí),應(yīng)從頭進(jìn)行圖畫(huà)的處理。
2)由于操作不妥,造成掃描的圖畫(huà)文件不完好或無(wú)法明晰辨認(rèn)時(shí),應(yīng)從頭掃描。
3)發(fā)現(xiàn)文件漏掃時(shí),應(yīng)及時(shí)補(bǔ)掃并正確刺進(jìn)圖畫(huà)。
4)發(fā)現(xiàn)掃描圖畫(huà)的擺放順序與檔案原件不共同時(shí),應(yīng)及時(shí)進(jìn)行調(diào)整。
5)仔細(xì)填寫(xiě)相關(guān)表單,記載質(zhì)檢結(jié)果和處理意見(jiàn)。
2、糾偏
對(duì)呈現(xiàn)偏斜的圖畫(huà)應(yīng)進(jìn)行糾偏處理,以到達(dá)視覺(jué)上根本不感覺(jué)偏斜為準(zhǔn)。對(duì)方向不正確的圖畫(huà)應(yīng)進(jìn)行旋轉(zhuǎn)還原,以契合閱覽習(xí)慣。
3、去污
對(duì)圖畫(huà)頁(yè)面中呈現(xiàn)的影響圖畫(huà)質(zhì)量的雜質(zhì)如黑點(diǎn)、黑線、黑框、黑邊等應(yīng)進(jìn)行去污處理。處理進(jìn)程中應(yīng)遵從在不影響可懂度的前提下展現(xiàn)檔案原貌的原則。
4、圖畫(huà)拼接
對(duì)大幅面檔案進(jìn)行分區(qū)掃描構(gòu)成的多幅圖畫(huà),應(yīng)進(jìn)行拼接處理,合并為一個(gè)完好的圖畫(huà),以保證檔案數(shù)字化圖畫(huà)的整體性。
5、裁邊處理
選用五顏六色方法掃描的圖畫(huà)應(yīng)進(jìn)行裁邊處理,去除多余的白邊,以有用縮小圖畫(huà)文件的容量,節(jié)省存儲(chǔ)空間。
六、圖畫(huà)存儲(chǔ)
1、存儲(chǔ)格局
1)選用是非二值方法掃描的圖畫(huà)文件,一般選用TIFF(G4)格局存儲(chǔ)。選用灰度方法和五顏六色方法掃描的文件,一般選用JPEG格局存儲(chǔ)。存儲(chǔ)時(shí)的壓縮率的挑選,應(yīng)以保證掃描的圖畫(huà)明晰可讀的前提下,盡量減小存儲(chǔ)容量為原則。
2)供給網(wǎng)絡(luò)查詢的掃描圖畫(huà),也可存儲(chǔ)為CEB、PDF或其他格局。
2、圖畫(huà)文件的命名
1)紙質(zhì)檔案目錄數(shù)據(jù)庫(kù)中的每一份文件,都有一個(gè)與之相對(duì)應(yīng)的唯一檔號(hào),以該檔號(hào)為這份文件掃描后的圖畫(huà)文件命名。
2)多頁(yè)文件可選用該檔號(hào)樹(shù)立相應(yīng)文件夾,按頁(yè)碼順序?qū)D畫(huà)文件命名。
七、目錄建庫(kù)
1、數(shù)據(jù)格局挑選
目錄建庫(kù)應(yīng)挑選通用的數(shù)據(jù)格局。所選定的數(shù)據(jù)格局應(yīng)能直接或直接經(jīng)過(guò)XML文檔進(jìn)行數(shù)據(jù)交換。
2、檔案著錄
依照《檔案著錄規(guī)則》(DA/T18)的要求進(jìn)行著錄,樹(shù)立檔案目錄數(shù)據(jù)庫(kù)。
3、目錄數(shù)據(jù)質(zhì)量查看
選用人工校正或軟件主動(dòng)校正的方法,對(duì)目錄數(shù)據(jù)庫(kù)的建庫(kù)質(zhì)量進(jìn)行查看。核對(duì)著錄項(xiàng)目是否完好、著錄內(nèi)容是否標(biāo)準(zhǔn)、精確,發(fā)現(xiàn)不合格的數(shù)據(jù)應(yīng)要求進(jìn)行修正或重錄。
八、數(shù)據(jù)掛接
1、匯總掛接
檔案數(shù)字化轉(zhuǎn)化進(jìn)程中構(gòu)成的目錄數(shù)據(jù)庫(kù)與圖畫(huà)數(shù)據(jù)庫(kù),經(jīng)過(guò)質(zhì)檢環(huán)節(jié)承以為“合格”后,經(jīng)過(guò)網(wǎng)絡(luò)及時(shí)加載到數(shù)據(jù)服務(wù)器端匯總。經(jīng)過(guò)編制程序或借助相應(yīng)軟件,可完成目錄數(shù)據(jù)對(duì)相相關(guān)的數(shù)字圖象的主動(dòng)查找、參加對(duì)應(yīng)的電子地址信息等,完成批量、快速掛接。
2、數(shù)據(jù)相關(guān)
以紙質(zhì)檔案目錄數(shù)據(jù)庫(kù)為依據(jù),將每一份紙質(zhì)檔案文件掃描所得的一個(gè)或多個(gè)圖畫(huà)存儲(chǔ)為一份圖畫(huà)文件。將圖畫(huà)文件存儲(chǔ)到相應(yīng)文件夾時(shí),要仔細(xì)核對(duì)每一份圖象文件的名稱與檔案目錄數(shù)據(jù)庫(kù)中該份文件的檔號(hào)是否相同,圖畫(huà)文件的頁(yè)數(shù)與檔案目錄數(shù)據(jù)庫(kù)中該份文件的頁(yè)數(shù)是否共同,圖畫(huà)文件的總數(shù)與目錄數(shù)據(jù)庫(kù)中文件的總數(shù)是否相同等。經(jīng)過(guò)每一份圖畫(huà)文件的文件名與檔案目錄數(shù)據(jù)庫(kù)中該份文件的檔號(hào)的共同性和唯一性,樹(shù)立起一一對(duì)應(yīng)的相相關(guān)系,為完成檔案目錄數(shù)據(jù)庫(kù)與圖畫(huà)文件的批量掛接供給條件。
3、仔細(xì)填寫(xiě)紙質(zhì)檔案數(shù)字化轉(zhuǎn)化進(jìn)程交代掛號(hào)表單,記載數(shù)據(jù)相關(guān)后的頁(yè)數(shù),核對(duì)每一份文件相關(guān)后的頁(yè)數(shù)與檔案收拾、掃描時(shí)填寫(xiě)的頁(yè)數(shù)是否共同,不共同時(shí)應(yīng)注明具體原因和處理辦法。
九、數(shù)據(jù)查驗(yàn)
1、數(shù)據(jù)抽檢
1)以抽檢的方法查看已完成數(shù)字化轉(zhuǎn)化的所有數(shù)據(jù),包含目錄數(shù)據(jù)庫(kù)、圖畫(huà)文件及數(shù)據(jù)掛接的整體質(zhì)量。
2)一個(gè)全宗的檔案,數(shù)據(jù)查驗(yàn)時(shí)抽檢的比率不得低于5%.
2、查驗(yàn)?zāi)繕?biāo)
1)目錄數(shù)據(jù)庫(kù)與圖畫(huà)文件掛接錯(cuò)誤碼,或目錄數(shù)據(jù)庫(kù)、圖畫(huà)文件之一呈現(xiàn)不完好、不明晰、有錯(cuò)誤等質(zhì)量問(wèn)題時(shí),抽檢標(biāo)記為“不合格”。
2)一個(gè)全宗的檔案,數(shù)字化轉(zhuǎn)化質(zhì)量抽檢的合格率到達(dá)95%以上(含95%)時(shí),給予以查驗(yàn)“經(jīng)過(guò)”。
合格率:抽檢合格的文件數(shù)/抽檢文件總數(shù)×100%
3、查驗(yàn)審閱
查驗(yàn)“經(jīng)過(guò)”的結(jié)論,有必要經(jīng)分管領(lǐng)導(dǎo)審閱、簽字后方有用。
4、查驗(yàn)掛號(hào)
仔細(xì)填寫(xiě)紙質(zhì)檔案數(shù)字化查驗(yàn)掛號(hào)表單。
十、數(shù)據(jù)備份
1、備份規(guī)模
經(jīng)查驗(yàn)合格的完好數(shù)據(jù)應(yīng)及時(shí)進(jìn)行備份。
2、備份方法
為保證數(shù)據(jù)安全,備份載體的挑選應(yīng)多樣化,可選用在線、離線相結(jié)合的方法完成多套備份,并注意異地保存。
3、數(shù)據(jù)查驗(yàn)
備份數(shù)據(jù)也應(yīng)進(jìn)行查驗(yàn)。備份數(shù)據(jù)的查驗(yàn)的內(nèi)容首要包含備份數(shù)據(jù)能否打開(kāi)、數(shù)據(jù)信息是否完好、文件數(shù)量是否精確等。
4、備份標(biāo)簽
數(shù)據(jù)備份后應(yīng)相應(yīng)的備份介質(zhì)上做好標(biāo)簽,以便查找和辦理。
5、備份掛號(hào)
填寫(xiě)紙質(zhì)檔案數(shù)字化備份辦理掛號(hào)表單。
十一、數(shù)字化作用辦理
1、應(yīng)加強(qiáng)對(duì)紙質(zhì)檔案數(shù)字化作用的辦理,保證其安全、完好和長(zhǎng)時(shí)間可用。
2、紙質(zhì)檔案數(shù)字化作用供給網(wǎng)上檢索使用時(shí),應(yīng)有制作單位的電子標(biāo)識(shí),并依據(jù)具體情況分別選用可下載或不行下載的數(shù)據(jù)格局。
相關(guān)文章
- 重慶檔案管理咨詢服務(wù)的特點(diǎn)2018年08月10日
- 重慶檔案管理的性質(zhì)作用是什么?2018年08月10日
- 重慶檔案管理的組成部分及劃分環(huán)節(jié)是什么?2018年08月10日