電 話:18937133779
網 址:http://www.sanvkeji.com
郵 箱:zboao@qq.com
檔案數字化掃描的命名
檔案數字化掃描的命名可以根據以下幾個方面來確定:
1.根據檔案名稱:如果檔案有一個明確的名稱,可以直接將其命名為該名稱,例如“2019年度財務報表”。
2.根據檔案編號:如果檔案有一個獨特的編號,可以將其作為命名的一部分,例如“F202001-001”。
3.根據檔案類別和日期:如果檔案沒有具體的名稱或編號,可以根據檔案類別和日期來命名,例如“合同-2020年6月份”。
4.根據檔案內容關鍵字:如果檔案涉及多個內容,可以根據其中最主要的關鍵字來命名,例如“客戶信息表”。
5.根據機構部門:如果檔案是某個機構或部門的文件,可以在命名中加入機構或部門名稱,例如“財務部-2020年度工資表”。
檔案掃描的介紹
檔案掃描(也稱為檔案數字化加工或數字化掃描加工服務等)是近幾年才興起的一項服務形式,隨著信息化建設的加速和無紙化辦公的要求,要把紙質的檔案轉化成電子化的檔案以方便查詢和利用,檔案掃描順應了這一潮流,并在這幾年內快速興起。檔案掃描融合了檔案掃描、OCR識別和文檔管理等技術,可以將數以萬計的紙介質的文檔、檔案、書本雜志等快速、自動地轉換成電子化(數字化)文本、影像,并實現信息高速檢索。
什么是檔案數字化?
檔案數字化掃描的命名
檔案數字化是隨著計算機技術、掃描技術、掃描線性CCD技術、OCR技術、數字攝影技術(錄音、錄像)、數據庫技術、多媒體技術、存儲技術的發展而產生的一種新型檔案信息形態,它把各種載體的檔案資源轉化為數字化的檔案信息,以數字化的形式存儲,網絡化的形式互相連接,利用計算機系統進行管理,形成一個有序結構的檔案信息庫,及時提供利用,實現資源共享。
檔案數字化是數字檔案建設最基礎的工作,傳統載體的檔案經高科技技術加工成數字檔案形式,通過局域網、政務網、互聯網進行計算機檢索、閱讀電子檔案,為迎接檔案信息服務新環境的挑戰,提高管理水平、提高效率,增強檔案業務部門的服務水平,為檔案內部管理及面向客戶服務提供高效率的全面服務。
檔案工作的數字化建設是順應潮流、適應時代發展的新舉措、新要求。檔案作為一種原生信息資源,其重要性正日益凸顯出來,逐步掌握信息技術為檔案工作服務,為社會主義經濟建設服務,為社會主義精神文明建設服務。
數字化檔案管理相較于傳統檔案而言,在提升經濟效益、提高辦公效率、增強對檔案原件的保護上具有重要的作用。
檔案數字化加工具體怎么做?
檔案數字化掃描的命名
一、拆卷
1、檢查案卷的完整性,是否有缺頁、漏頁、錯編現象,正、副卷標注是否正確;
2、拆開案卷,將案卷背面的封條小心撕干凈,剪開裝訂線;
3、將案卷內頁一頁頁分開,對特殊頁做出標識提醒掃描人員注意;
4、取掉案卷中金屬物;
5、注明每卷案卷(包括正、副卷)的頁數及其他的特殊情況。對不能確定的案卷,拆卷人員應該及時向檔案員進行咨詢,不得擅自對問題進行處理。
二、掃描
1、嚴格按照規定命名方式對影像文件進行命名。并根據數據交換規則設置掃描影像的輸出存放位置;
2、對于封面、內頁、手寫體或是發票等各類不同資料,需用不同的比例或是掃描方法進行掃描;
3、掃描影像與檔案原件的內容要吻合、順序正確,影像清晰效果達到檔案實體一樣。并將掃描頁數和拆卷人所注明的頁數核對,確保不能重掃、漏掃、多掃、順序顛倒掃。
4、采用規定的格式掃描,確保案卷的清晰度。同時影像歪斜不超過正負2度、黑邊不大于
2毫米。
三、影像處理
1、采用軟件及人工結合方法,對影像優化處理,使影像效果達到或超過實體效果;
2、對因掃描原因造成的黑邊、歪斜等特殊影像進行處理;
3、對非正常格式、容量文件進行檢查處理;
4、對案卷中漏編的頁面進行科學處理,確保掃描好的影像頁數與原案卷頁數一致。
四、還原卷
1、經過掃描和影像處理后,嚴格質檢沒有問題的檔案進行裝訂還原;
2、注意還原檔案歸類和歸還,保持檔案加工室的整潔。
檔案數字化工作流程是怎樣的?
檔案數字化加工流程
前期檔案整理
檔案借出
從檔案室接件,填寫檔案移交清冊,一式兩份。拿到檔案后,開始核對檔案數量,數量核對無誤后簽字確認,將檔案拿回加工現場。
目錄數據準備
按照各類檔案整理規定的要求,在檔案管理系統著錄目錄數據。如有錯誤或不規范的案卷題名、文件名、責任者、日期、起止頁號等,應進行修改。
拆除裝訂
在不去除裝訂物情況下,會影響掃描工作進行的檔案,應拆除裝訂物。拆除裝訂物時應注意保護檔案不受損害。
頁面修整
破損嚴重、無法直接進行掃描的檔案,應先進行技術修復,褶皺不平影響掃描質量的原件應先進行相應處理(壓平或熨平等)后再進行掃描。
檔案掃描
掃描方式
(1)根據檔案幅面的大小(A4、A3、A0等)選擇相應規格的掃描儀或專業掃描儀(如工程圖紙可采用0號圖紙掃描儀)進行掃描。大幅面檔案可采用大幅面數碼平臺,或者縮微拍攝后的膠片數字化轉換設備等進行掃描。
(2)紙張狀況較差,以及過薄、過軟或超厚的檔案,應采用平板掃描方式;紙張狀況好的檔案,可采用高速掃描方式以提高工作效率。
掃描色彩模式
(1)掃描色彩模式一般有黑白二值、灰度、彩色等。通常采用彩色。
(2)頁面為黑白兩色,并且字跡清晰、不帶插圖的檔案,可采用黑白二值模式進行掃描。
(3)頁面為黑白兩色,但字跡清晰度差或帶有插圖的檔案,以及頁面為多色文字的檔案,可采用灰度模式掃描。
(4)頁面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,可采用彩色模式進行掃描。
掃描分辨率
(1)掃描分辨率參數大小的選擇,原則上以掃描后的圖像清晰、完整、不影響圖像的利用效果為準。
(2)采用黑白二值、灰度、彩色幾種模式對檔案進行掃描時,其分辨率一般應設為200-300dpi。特殊情況下,如文字偏小、密集、清晰度較差等,可適當提高分辨率。
圖像處理
圖像數據質量檢查
(1)對圖像偏斜度、清晰度、失真度等進行檢查。發現不符合圖像質量要求時,應重新進行圖像的處理。
(2)由于操作不當,造成掃描的圖像文件不完整或無法清晰識別時,應重新掃描。
(3)發現文件漏掃時,應及時補掃并正確插入圖像。
(4)發現掃描圖像的排列順序與檔案原件不一致時,應及時進行調整。
糾偏、去污、圖像拼接、裁邊處理
(1)對出現偏斜的圖像應進行糾偏處理,以達到視覺上基本不感覺偏斜為準。對方向不正確的圖像應進行旋轉還原,以符合閱讀習慣。
(2)對圖像頁面中出現的影響圖像質量的雜質,如黑點、黑線、黑框、黑邊等應進行去污處理。處理過程中應遵循在不影響可懂度的前提下展現檔案原貌的原則。
(3)對大幅面檔案進行分區掃描形成的多幅圖像,應進行拼接處理,合并為一個完整的圖像,以保證檔案數字化圖像的整體性。
(4)采用彩色模式掃描的圖像應進行裁邊處理,去除多余的白邊,以有效縮小圖像文件的容量,節省存儲空間。
圖像存儲
存儲格式
(1)采用黑白二值模式掃描的圖像文件,一般采用PDF格式存儲。
(2)采用灰度模式和彩色模式掃描的文件,一般采用PDF格式存儲。
圖像文件命名
(1)紙質檔案目錄數據庫中的每一份文件,都有一個與之相對應的檔號,以該檔號為這份文件掃描后的圖像文件命名。如圖像文件較大,不便于網絡瀏覽,可拆分為多個圖像文件,文件名后增加A、B、C等區別。
(2)分別建立文件夾,以文件檔號命名,并存儲對應圖像文件。
數據掛接
將每一份紙質檔案掃描所得的圖像存儲到相應檔號的文件夾后,認真核查每一份圖像文件的名稱與檔案目錄數據庫中該份文件的檔號是否相同,圖像文件的頁數與檔案目錄數據庫中文件的總頁數是否相同等。通過每一份圖像文件所在文件夾的名稱與檔案目錄數據庫中該份文件的檔號的一致性,建立起一一對應的關聯關系,為實現檔案目錄數據庫與圖像文件的批量掛接提供條件。
檔案數字化流程大概是怎樣的?
一、術語和定義1、數字化用計算機技術將模擬信號轉換為數字信號的處理過程。
2、紙質檔案數字化采用掃描儀或數碼相機等數碼設備對紙質檔案進行數字加工,將其轉化為存儲在磁帶、磁盤、光盤等載體上并能被計算機識別的數字圖像或數字文本的處理過程。
3、數字圖像表示實物圖像的整數陣列。一個二維或更高維的采樣并量化的函數,由相同維數的連續圖像產生。在矩陣(或其他)網絡上采樣——連續函數,并在采樣點上將值最小化后的陣列。
4、黑白二值圖像只有黑白兩級灰度的數字圖像。它對應于黑白兩種狀態的文字稿、線條圖等。
5、連續色調靜態圖像以多于兩級灰度的不同濃淡層次或以不同顏色通道組合成的靜態數字圖像。在紙質檔案數字化過程中,通常表現為灰度掃描和彩色掃描兩種模式。
6、分辨率單位長度內圖像包含的點數或像素數,一般用每英時點數(dpi)表示。
7、失真度對檔案進行數字化轉換后,數字圖像與檔案原件在色彩、幾何等方面的偏離程度。
8、可懂度數字圖像向人或機器提供信息的能力。
9、圖像壓縮清除圖像冗余或圖像近似的任一種過程,其目的是對圖像以更緊湊的形式表示。
二、紙質檔案數字化基本要求1、基本原則紙質檔案數字化的基本原則是使檔案信息資源準確方便快捷地提供利用,使可以公開的檔案信息資源得到共享,以滿足社會對檔案利用的需求。
2、數字化對像的確定原則應當對所要進行數字化的對象按照一定的原則和方法進行確認,只有符合一定要求的紙質檔案文獻才能進行數字化。1)符合國家法律法規的原則紙質檔案的數字化,必須符合國家檔案開放規定以及有關規定。
2)價值性原則屬于歸檔范圍且應永久或長期保存的、社會利用價值高的檔案可列入數字化加工的范圍。
3、基本環節紙質檔案數字化的基本環節主要包括:檔案整理、目錄建庫、檔案掃描、圖像處理、圖像存儲、數據質檢、數據掛接、數據驗收、數據備份、成果管理等。
4、過程管理1)應加強紙質檔案數字化各環節的安全保密管理機制,確保檔案原件和數字化檔案信息的安全.2)紙質檔案數字化的各個環節均應進行詳細的登記,并及時整理、匯總,裝訂成冊,在數字化工作完成的同時建立起完整、規范的記錄。
三、檔案整理在掃描之前,根據檔案管理情況,按下述步驟對檔案進行適當整理,并視需要作出標識,確保檔案數字化質量。1目錄數據準備2拆除裝訂3區分掃描件和非掃描件4頁面修整5檔案整理登記6裝訂
四、檔案掃描1、掃描方式1)根據檔案幅面的大小(A4、A3、A0等)選擇相應規格的掃描儀或專業掃描儀(如工程圖紙可采用0號圖紙掃描儀)進行掃描。大幅面檔案可采用大幅面數碼平臺,或者縮微拍攝后的膠片數字化轉換設備等進行掃描,也可以采用小幅面掃描后的圖像拼接方式處理。2)紙張狀況較差,以及過薄、過軟或超厚的檔案,應采用平板掃描方式;紙張狀況好的檔案可采用高速掃描方式以提高工作效率。
2、掃描色彩模式1)掃描色彩模式一般有黑白二值、灰度、彩色等。通常采用黑白二值。2)頁面為黑白兩色,并且字跡清晰、不帶插圖的檔案,可采用黑白二值模式進行掃描。3)頁面為黑白兩色,但字跡清晰度差或帶有插圖的檔案,以及頁面為多色文字的檔案,可采用灰度模式掃描。4)頁面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,可視需要采用彩色模式進行掃描。
3、掃描分辨率1)掃描分辨率參數大小的選擇,原則上以掃描后的圖像清晰、完整、不影響圖像的利用效果為準。2)采用黑白二值、灰度、彩色幾種模式對檔案進行掃描時,其分辨率一般均建議選擇≥100dpi。特殊情況下,如文字偏小、密集、清晰度較差等,可適當提高分辨率。3)需要進行OCR漢字識別的檔案,掃描分辨率建議選擇≥200dpi。
4、掃描登登記認真填寫紙質檔案數字化轉換過程交接登記表單,登記掃描的頁數,核對每份文件的實際掃描頁數與檔案整理量填寫的文件頁數是否一致,不一致時應注明具體原因和處理方法。
五、圖像處理1、圖像數據質量檢查1)對圖像偏斜度、清晰度、失真度進行檢查。發現不符合圖像質量要求時,應重新進行圖像的處理。2)由于操作不當,造成掃描的圖像文件不完整或無法清晰識別時,應重新掃描。3)發現文件漏掃時,應及時補掃并正確插入圖像。4)發現掃描圖像的排列順序與檔案原件不一致時,應及時進行調整。5)認真填寫相關表單,記錄質檢結果和處理意見。
2、糾偏對出現偏斜的圖像應進行糾偏處理,以達到視覺上基本不感覺偏斜為準。對方向不正確的圖像應進行旋轉還原,以符合閱讀習慣。
3、去污對圖像頁面中出現的影響圖像質量的雜質如黑點、黑線、黑框、黑邊等應進行去污處理。處理過程中應遵循在不影響可懂度的前提下展現檔案原貌的原則。
4、圖像拼接對大幅面檔案進行分區掃描形成的多幅圖像,應進行拼接處理,合并為一個完整的圖像,以保證檔案數字化圖像的整體性。
5、裁邊處理采用彩色模式掃描的圖像應進行裁邊處理,去除多余的白邊,以有效縮小圖像文件的容量,節省存儲空間。
六、圖像存儲1、存儲格式1)采用黑白二值模式掃描的圖像文件,一般采用TIFF(G4)格式存儲。采用灰度模式和彩色模式掃描的文件,一般采用JPEG格式存儲。存儲時的壓縮率的選擇,應以保證掃描的圖像清晰可讀的前提下,盡量減小存儲容量為準則。2)提供網絡查詢的掃描圖像,也可存儲為CEB、PDF或其他格式。
2、圖像文件的命名1)紙質檔案目錄數據庫中的每一份文件,都有一個與之相對應的唯一檔號,以該檔號為這份文件掃描后的圖像文件命名。2)多頁文件可采用該檔號建立相應文件夾,按頁碼順序對圖像文件命名。
七、目錄建庫1、數據格式選擇目錄建庫應選擇通用的數據格式。所選定的數據格式應能直接或間接通過XML文檔進行數據交換。
2、檔案著錄按照《檔案著錄規則》(DA/T18)的要求進行著錄,建立檔案目錄數據庫。
3、目錄數據質量檢查采用人工校對或軟件自動校對的方式,對目錄數據庫的建庫質量進行檢查。核對著錄項目是否完整、著錄內容是否規范、準確,發現不合格的數據應要求進行修改或重錄。
八、數據掛接1、匯總掛接檔案數字化轉換過程中形成的目錄數據庫與圖像數據庫,通過質檢環節確認為“合格”后,通過網絡及時加載到數據服務器端匯總。通過編制程序或借助相應軟件,可實現目錄數據對相關聯的數字圖象的自動搜索、加入對應的電子地址信息等,實現批量、快速掛接。
2、數據關聯以紙質檔案目錄數據庫為依據,將每一份紙質檔案文件掃描所得的一個或多個圖像存儲為一份圖像文件。將圖像文件存儲到相應文件夾時,要認真核查每一份圖象文件的名稱與檔案目錄數據庫中該份文件的檔號是否相同,圖像文件的頁數與檔案目錄數據庫中該份文件的頁數是否一致,圖像文件的總數與目錄數據庫中文件的總數是否相同等。通過每一份圖像文件的文件名與檔案目錄數據庫中該份文件的檔號的一致性和唯一性,建立起一一對應的關聯關系,為實現檔案目錄數據庫與圖像文件的批量掛接提供條件。
3、認真填寫紙質檔案數字化轉換過程交接登記表單,記錄數據關聯后的頁數,核對每一份文件關聯后的頁數與檔案整理、掃描時填寫的頁數是否一致,不一致時應注明具體原因和處理辦法。
九、數據驗收1、數據抽檢1)以抽檢的方式檢查已完成數字化轉換的所有數據,包括目錄數據庫、圖像文件及數據掛接的總體質量。2)一個全宗的檔案,數據驗收時抽檢的比率不得低于5%。2、驗收指標1)目錄數據庫與圖像文件掛接錯誤碼,或目錄數據庫、圖像文件之一出現不完整、不清晰、有錯誤等質量問題時,抽檢標記為“不合格”。2)一個全宗的檔案,數字化轉換質量抽檢的合格率達到95%以上(含95%)時,給予以驗收“通過”。合格率:抽檢合格的文件數/抽檢文件總數×100%3、驗收審核驗收“通過”的結論,必須經分管領導審核、簽字后方有效。4、驗收登記認真填寫紙質檔案數字化驗收登記表單。
十、數據備份1、備份范圍經驗收合格的完整數據應及時進行備份。
2、備份方式為保證數據安全,備份載體的選擇應多樣化,可采用在線、離線相結合的方式實現多套備份,并注意異地保存。
3、數據檢驗備份數據也應進行檢驗。備份數據的檢驗的內容主要包括備份數據能否打開、數據信息是否完整、文件數量是否準確等。
4、備份標簽數據備份后應相應的備份介質上做好標簽,以便查找和管理。
5、備份登記填寫紙質檔案數字化備份管理登記表單。
十一、數字化成果管理1、應加強對紙質檔案數字化成果的管理,確保其安全、完整和長期可用。
2、紙質檔案數字化成果提供網上檢索利用時,應有制作單位的電子標識,并根據具體情況分別采用可下載或不可下載的數據格式。
紙質檔案數字化處理的基本程序與方法
任何一個有一定存在歷史的機構,都有一定數量的紙質檔案,將這些紙質檔案數字化,有利于管理與利用。
下面,將以檢察院的紙質檔案數字化為例,對檔案數字化處理的基本程序與方法予以介紹。
創建檔案管理分類架構
檢察院的綜合檔案管理,分類架構一般為:
文書檔案、財務檔案、聲像檔案、實物檔案、基建檔案、設備檔案、司法鑒定檔案、訴訟檔案和電子檔案等九大類,訴訟檔案是檢察院最為專業、也最為重要的檔案類型。
各級檢察院可根據自身管理需要,進行更詳細的檔案分類管理。
取卷
從庫房拿取需要數字化的紙質實體案卷,取卷時注意:
準確記錄所取案卷的物理存放位置。
依次拿取,不要丟卷,確保案卷的完整。
檔案定義
檔案定義,是3Hmis的專用術語,實際上就是確定檔案的最底層分類的相關屬性,或稱案卷的相關屬性。3Hmis可同時管理紙質檔案和數字化檔案,如果3Hmis已存在相關案卷信息,此步驟可省略。
關于檔案定義的具體操作,前面已詳細介紹,這里不再重復。
拆卷
拆卷的含義是手工拆除案卷裝訂,如果紙質實體案卷信息已保存在3Hmis系統中,還應執行取消注冊功能,相當于在3Hmis中執行拆卷操作。
拆卷的注意事項:
保證案卷的完整,檢查是否有缺頁、漏頁及其它錯誤,正、副卷標注是否正確。
保持案卷的清潔。
拆開案卷,將案卷背面的封條小心撕干凈,剪開裝訂線。
取掉案卷中的金屬物。
將卷內文件一頁頁分開,對單面、雙面等情況進行標注,以提醒掃描人員注意。
為了方便掃描及時與掃描人員溝通。
注明每卷(包括正、副卷)的頁數及其他的特殊情況。
如有疑問,應及時向檔案管理員進行咨詢和溝通,不得擅自違規處理。
錄入卷內文件信息
一份案卷,一般都由多份性質相同或相似的文件組成,即所謂卷內文件。
如果系統中已存在卷內文件目錄,不必在錄入,若無,則采用新建文件的方法,錄入卷內文件屬性信息。
掃描
對已錄入相關屬性的卷內文件進行掃描,并將掃描結果文件引入(上傳)檔案系統。
3Hmis的圖片管理器內嵌掃描處理程序,可在錄入卷內文件信息的同時直接調用掃描模塊進行掃描(支持高速掃描儀),用戶亦可使用其它掃描程序掃描文件(但使用3Hmis提供的圖片管理器更為簡單方便),然后,再通過引入功能將掃描文件引入檔案系統,3Hmis還提供了專門的批量引入工具。
如果檢察院有更嚴格的數字化檔案安全管理要求,并有專門用于歸檔的電子印章,可在掃描文件上加蓋歸檔專用的電子印章。
掃描時的注意事項如下:
根據需要設置掃描文件的格式和分辨率,3Hmis可對各種常用格式的數字化文件進行管理。
對于封面、內頁、手寫訴狀或是發票等各類不同證據材料,需用不同的比例或掃描方法進行掃描。
根據規則設置掃描文件的存放位置和掃描結果文件的文件名(采用3Hmis圖片管理器掃描時,將自動上傳,股不需要存放在客戶端)。
將掃描頁數和拆卷人所注明的頁數核對,確保不重掃、漏掃、多掃,同時保證案卷的清晰度,對掃描結果不佳的頁面進行專門處理。