電 話:18937133779
網 址:http://www.sanvkeji.com
郵 箱:zboao@qq.com
檔案數字化掃描參數的選擇
檔案數字化掃描參數的選擇涉及到多個因素,包括文件類型、分辨率、壓縮格式、色彩模式等。下面是一些常用的參數選擇建議:
1.文件類型:根據實際需求選擇合適的文件類型,如JPEG、PDF、TIFF等。
2.分辨率:分辨率越高,圖像清晰度越高,但文件大小也會相應增大。建議根據實際需求選擇合適的分辨率,一般來說300dpi就可以滿足大部分需求。
3.壓縮格式:對于需要傳輸或存儲的文檔,可以考慮使用壓縮格式,如JPEG2000、PNG等,以減小文件大小。
4.色彩模式:黑白模式可以節省空間,但可能會丟失一些細節;灰度模式可以保留更多細節,但文件大小也會相應增大;彩色模式適用于需要保留顏色信息的文檔。
5.其他參數:還有一些其他參數需要考慮,比如文件格式的設置、頁面尺寸選擇、頁碼順序等。
總之,在選擇數字化掃描參數時,要根據具體需求和實際情況做出合理的選擇。
檔案數字化加工具體怎么做?
檔案數字化加工具體過程
前期檔案整理檔案借出
從檔案室接件,填寫檔案移交清冊,一式兩份。拿到檔案后,開始核對檔案數量,數量核對無誤后簽字確認,將檔案拿回加工現場。
目錄數據準備
按照各類檔案整理規定的要求,在檔案管理系統著錄目錄數據。如有錯誤或不規范的案卷題名、文件名、責任者、日期、起止頁號等,應進行修改。
拆除裝訂
在不去除裝訂物情況下,會影響掃描工作進行的檔案,應拆除裝訂物。拆除裝訂物時應注意保護檔案不受損害。
頁面修整
破損嚴重、無法直接進行掃描的檔案,應先進行技術修復,折皺不平影響掃描質量的原件應先進行相應處理(壓平或熨平等)后再進行掃描。
檔案掃描
掃描方式
(1)根據檔案幅面的大小(A4、A3、A0等)選擇相應規格的掃描儀或專業掃描儀(如工程圖紙可采用0號圖紙掃描儀)進行掃描。大幅面檔案可采用大幅面數碼平臺,或者縮微拍攝后的膠片數字化轉換設備等進行掃描。
(2)紙張狀況較差,以及過薄、過軟或超厚的檔案,應采用平板掃描方式;紙張狀況好的檔案,可采用高速掃描方式以提高工作效率。
掃描色彩模式
(1)掃描色彩模式一般有黑白二值、灰度、彩色等。通常采用彩色。
(2)頁面為黑白兩色,并且字跡清晰、不帶插圖的檔案,可采用黑白二值模式進行掃描。
(3)頁面為黑白兩色,但字跡清晰度差或帶有插圖的檔案,以及頁面為多色文字的檔案,可采用灰度模式掃描。
(4)頁面中有紅頭、印章或插有黑白照片、彩色照片、彩色插圖的檔案,可采用彩色模式進行掃描。
掃描分辨率
(1)掃描分辨率參數大小的選擇,原則上以掃描后的圖像清晰、完整、不影響圖像的利用效果為準。
(2)采用黑白二值、灰度、彩色幾種模式對檔案進行掃描時,其分辨率一般應設為200-300dpi。特殊情況下,如文字偏小、密集、清晰度較差等,可適當提高分辨率。
圖像處理
圖像數據質量檢查
(1)對圖像偏斜度、清晰度、失真度等進行檢查。發現不符合圖像質量要求時,應重新進行圖像的處理。
(2)由于操作不當,造成掃描的圖像文件不完整或無法清晰識別時,應重新掃描。
(3)發現文件漏掃時,應及時補掃并正確插入圖像。
(4)發現掃描圖像的排列順序與檔案原件不一致時,應及時進行調整。
糾偏、去污、圖像拼接、裁邊處理
(1)對出現偏斜的圖像應進行糾偏處理,以達到視覺上基本不感覺偏斜為準。對方向不正確的圖像應進行旋轉還原,以符合閱讀習慣。
(2)對圖像頁面中出現的影響圖像質量的雜質,如黑點、黑線、黑框、黑邊等應進行去污處理。處理過程中應遵循在不影響可懂度的前提下展現檔案原貌的原則。
(3)對大幅面檔案進行分區掃描形成的多幅圖像,應進行拼接處理,合并為一個完整的圖像,以保證檔案數字化圖像的整體性。
(4)采用彩色模式掃描的圖像應進行裁邊處理,去除多余的白邊,以有效縮小圖像文件的容量,節省存儲空間。
圖像存儲
存儲格式
(1)采用黑白二值模式掃描的圖像文件,一般采用PDF格式存儲。
(2)采用灰度模式和彩色模式掃描的文件,一般采用PDF格式存儲。
圖像文件命名
(1)紙質檔案目錄數據庫中的每一份文件,都有一個與之相對應的檔號,以該檔號為這份文件掃描后的圖像文件命名。如圖像文件較大,不便于網絡瀏覽,可拆分為多個圖像文件,文件名后增加A、B、C等區別。
(2)分別建立文件夾,以文件檔號命名,并存儲對應圖像文件。
數據掛接
將每一份紙質檔案掃描所得的圖像存儲到相應檔號的文件夾后,認真核查每一份圖像文件的名稱與檔案目錄數據庫中該份文件的檔號是否相同,圖像文件的頁數與檔案目錄數據庫中文件的總頁數是否相同等。
通過每一份圖像文件所在文件夾的名稱與檔案目錄數據庫中該份文件的檔號的一致性,建立起一一對應的關聯關系,為實現檔案目錄數據庫與圖像文件的批量掛接提供條件。
紙質檔案數字化處理的基本程序與方法
任何一個有一定存在歷史的機構,都有一定數量的紙質檔案,將這些紙質檔案數字化,有利于管理與利用。
下面,將以檢察院的紙質檔案數字化為例,對檔案數字化處理的基本程序與方法予以介紹。
創建檔案管理分類架構
檢察院的綜合檔案管理,分類架構一般為:
文書檔案、財務檔案、聲像檔案、實物檔案、基建檔案、設備檔案、司法鑒定檔案、訴訟檔案和電子檔案等九大類,訴訟檔案是檢察院最為專業、也最為重要的檔案類型。
各級檢察院可根據自身管理需要,進行更詳細的檔案分類管理。
取卷
從庫房拿取需要數字化的紙質實體案卷,取卷時注意:
準確記錄所取案卷的物理存放位置。
依次拿取,不要丟卷,確保案卷的完整。
檔案定義
檔案定義,是3Hmis的專用術語,實際上就是確定檔案的最底層分類的相關屬性,或稱案卷的相關屬性。3Hmis可同時管理紙質檔案和數字化檔案,如果3Hmis已存在相關案卷信息,此步驟可省略。
關于檔案定義的具體操作,前面已詳細介紹,這里不再重復。
拆卷
拆卷的含義是手工拆除案卷裝訂,如果紙質實體案卷信息已保存在3Hmis系統中,還應執行取消注冊功能,相當于在3Hmis中執行拆卷操作。
拆卷的注意事項:
保證案卷的完整,檢查是否有缺頁、漏頁及其它錯誤,正、副卷標注是否正確。
保持案卷的清潔。
拆開案卷,將案卷背面的封條小心撕干凈,剪開裝訂線。
取掉案卷中的金屬物。
將卷內文件一頁頁分開,對單面、雙面等情況進行標注,以提醒掃描人員注意。
為了方便掃描及時與掃描人員溝通。
注明每卷(包括正、副卷)的頁數及其他的特殊情況。
如有疑問,應及時向檔案管理員進行咨詢和溝通,不得擅自違規處理。
錄入卷內文件信息
一份案卷,一般都由多份性質相同或相似的文件組成,即所謂卷內文件。
如果系統中已存在卷內文件目錄,不必在錄入,若無,則采用新建文件的方法,錄入卷內文件屬性信息。
掃描
對已錄入相關屬性的卷內文件進行掃描,并將掃描結果文件引入(上傳)檔案系統。
3Hmis的圖片管理器內嵌掃描處理程序,可在錄入卷內文件信息的同時直接調用掃描模塊進行掃描(支持高速掃描儀),用戶亦可使用其它掃描程序掃描文件(但使用3Hmis提供的圖片管理器更為簡單方便),然后,再通過引入功能將掃描文件引入檔案系統,3Hmis還提供了專門的批量引入工具。
如果檢察院有更嚴格的數字化檔案安全管理要求,并有專門用于歸檔的電子印章,可在掃描文件上加蓋歸檔專用的電子印章。
掃描時的注意事項如下:
根據需要設置掃描文件的格式和分辨率,3Hmis可對各種常用格式的數字化文件進行管理。
對于封面、內頁、手寫訴狀或是發票等各類不同證據材料,需用不同的比例或掃描方法進行掃描。
根據規則設置掃描文件的存放位置和掃描結果文件的文件名(采用3Hmis圖片管理器掃描時,將自動上傳,股不需要存放在客戶端)。
將掃描頁數和拆卷人所注明的頁數核對,確保不重掃、漏掃、多掃,同時保證案卷的清晰度,對掃描結果不佳的頁面進行專門處理。
干貨:檔案數字化加工,核心7大步驟,檔案管理人必備!
檔案數字化具體流程:從檔案的收集、掃描錄入、整理、歸檔入庫、利用、統計、編研、鑒定等過程實現全生命周期的自動化管理。
1、檔案收集:按照檔案形成的規律,把各企業單位分散的材料進行接收、征集、集中起來。
2、檔案整理:根據不同需求,對收集起來的檔案分類組成有序體系,規范化處理。
3、掃描錄入:將有價值的檔案進行分類掃描錄入系統歸檔,采用會博通檔案管理系統,分類保管檔案。
4、歸檔入庫:根據國家檔案分類要求標準,建立標準檔案分類,進行歸檔。
5、檔案利用:通過會博通檔案管理系統的借閱手續,是檔案資料直接可以為各企業單位提供檔案利用服務工作。
6、檔案統計:運用會博通統計技術和方法,通過表冊和數字的形式描述和分析檔案工作的各種現象、狀態和趨勢情況,可以了解和掌握檔案工作總體情況。
7、檔案鑒定:利用系統甄別檔案文件的現實價值和歷史價值以及年限,進行存毀的判斷條件。
8、檔案銷毀:根據不同年限檔案、不具有保存價值的檔案,在系統上導出目錄,將相對應的檔案消除或銷毀。
利用會博通檔案管理系統,一款專業的檔案管理軟件,會博通功能涵蓋檔案收集、檔案著錄、檔案查詢、檔案借閱、檔案利用、檔案統計、檔案鑒定、檔案銷毀的全生命周期管理,適用于科技檔案管理、人力資源信息管理、證照管理、客戶資料管理、文件資料管理等等,同時還適用于自動化辦公應用。基本上一個軟件就能夠滿足一個企業當中,不同人員的辦公需求。
紙質檔案進行數字化轉換后原件可以銷毀嗎
能(A)紙質文件的數字化處理紙質文件的數字化處理方法主要有兩種:直接掃描法和縮微法。1.直接掃描方法所謂直接掃描法,就是用掃描儀對原始紙質文件進行光學掃描,將圖像信息傳輸到光電轉換器中變成模擬電信號,再將模擬電信號轉換成數字電信號,再通過計算機接口傳輸到計算機存儲器中。
直接掃描可以分為兩種方式:(1)對紙質文件進行掃描后,使用字符識別(OCR)軟件進行識別,最終生成文本文件。這種數字文件的優點是:占用空間小,便于計算機全文檢索,文件使用時易于提取和編輯。
其缺點是:不能保留原文件的排版格式,以及簽名、印章等原始信息;有時候OCR字符識別的準確率低,檢查修改困難,數字化效率很低,實際上已經破壞了原始文件的真實性。(2)掃描紙質文件,形成數字圖像文件。這種圖像文件的優點是:能保持文件內容和排版的原貌,數字化速度快。
缺點是:無法進行全文檢索,無法編輯文本內容,占用存儲空間大。以上兩種方法的優缺點正好互補。現在有一種方法可以把兩種方法的優點結合到一個文件里,就是做一個雙層PDF。制作方法是:將原來的紙質文件掃描成數字圖像文件再轉換成文本文件,然后將兩個內容相同的文件放在同一個PDF文件中,圖像文件放在文本文件的上層,文本文件隱藏在圖像文件的下層。在查詢這個文件時,我們不僅可以看到上層的原始圖像文件,還可以全文搜索隱藏的文本文件。
2.縮微方法所謂縮微膠片轉換方法,就是對已經縮微的文件,使用專用的掃描設備(即縮微膠片掃描儀),將縮微膠片上的模擬圖像轉換成數字圖像的方法。與直接掃描法相比,顯微掃描法更經濟、簡單、高效。但是,這種方法必須建立在紙質文件的微細加工基礎上。
值得注意的是,掃描微縮膠片后,原微縮膠片應與紙質檔案一起保存,不得擅自銷毀。這樣,文件就形成了“三集”的存儲狀態。盡管縮微膠片不如數字文件易于保存、復制、查詢和傳播,但作為模擬信息,縮微膠片文件具有數字文件所不具備的優點,如人類可讀、穩定性好、體積小等,是紙質文件所不具備的,應成為檔案信息資源的重要補充形式。
(B)紙質文件的數字化工作流程紙質檔案數字化是一個復雜的過程,其基本環節主要包括:檔案整理、檔案掃描、圖像處理、圖像存儲、編目建庫、數據掛鉤、數據驗收、數據備份、成果管理。文件整理紙質檔案掃描前,根據檔案管理情況,按照以下步驟對檔案進行適當整理,并根據需要進行標記,以保證檔案的數字化質量。
(1)文件出庫一般來說,對大量紙質檔案進行數字化處理,首先要將待數字化的檔案從檔案倉庫搬到臨時周轉倉庫;然后,數字處理人員從周轉倉庫接收文件進行數字化。無論前者或后者,數字化處理人員都必須按預定計劃提出申請,經審批后,向雙方移交檔案,登記并完成交接手續。
(2)目錄數據準備根據《檔案著錄規則》(DA/T18-1999)的要求,規范檔案的內容,包括確定檔案的著錄項目、字段長度和內容要求。然后,建立一個用于數字文件檢索的目錄數據庫。數據庫建設可以利用原有紙質檔案的編目基礎。如果原始紙質文件目錄存在錯誤或不規范,如標題、文件名、負責人、起止頁碼和頁數等。,應該修改。紙質檔案未建立機讀目錄數據庫的,應按檔案著錄規則重新錄入。
(3)解除捆綁文件可以在去除綁定前逐一貼上條形碼,以便在后續流程中通過識別條形碼對掃描的文件進行準確高效的控制。條形碼還可以為今后檔案借閱和利用的管理提供方便。然后,工作人員一卷一卷、一頁一頁地檢查檔案。對缺失內容、遺漏內容、顛倒頁碼、珍貴破損檔案進行登記,交檔案保管機構妥善處理。對于不解除綁定會影響掃描工作的文件,應解除綁定。
拆除裝訂時,應注意保護文件不受損壞。拆除裝訂后,應將原文件按順序排列,并用夾子夾住,以防散落。對于歷史悠久,紙質條件差,不方便拆封的,可以使用零頁邊距掃描儀進行掃描。
(4)區分掃描件和非掃描件。根據要求,將同一案卷中的掃描件和非掃描件分開,剔除無關和重復件。
(5)頁面修剪紙張的質量與掃描儀的選擇和掃描效果有關。因此,對于破損嚴重、褶皺不平、字跡模糊的檔案,必須分別登記處理。比如折疊的文件可以熨燙;對于被污染的紙張,可以在通風的環境下用軟刷輕輕刷掉漂浮的灰塵、污垢或霉菌;必須修復損壞和不完整的文檔。
(六)備案登記將整理后的原始文件移交給掃描人員,制作并填寫紙質文件數字化處理交接登記表,詳細記錄整理后每個文件的起始頁碼和頁碼。
(七)裝訂、修復和歸還掃描工作完成后,已拆除的檔案應按檔案保管要求重新裝訂。恢復裝訂時,要注意保持文件的排列順序不變,做到安全、準確、不遺漏。更換嚴重損壞的輥和箱。裝訂人員會在裝訂好的文件上加蓋專用印章和專用數碼印章。文件的數字處理和重新裝訂完成后,應進行清點。清點無誤后,交回檔案管理部門,辦理檔案歸還手續。
2.文件掃描(1)掃描設備的選擇根據文件格式的大小(A4、A3、A0等。),選擇相應規格的掃描儀。大幅面文件可以用寬幅掃描儀掃描,縮微后用膠片數字轉換設備掃描,小幅面掃描后用圖像拼接。紙張狀況不好、太薄、太軟或太厚的文件,以及多色頁面的文件,都可以用普通平板掃描儀掃描。紙張條件好的A4、A3文件可以用高速掃描儀掃描,提高工作效率。
不適合拆包的文件可以用零頁邊距掃描儀掃描。(2)掃描顏色模式的選擇通常,有兩種掃描顏色模式:一種是掃描形成黑白二值圖像。這種圖像只有黑白兩級,沒有過渡灰度。其特點是黑白分明,字跡清晰,文件容量小。它適用于掃描筆跡清晰、線條清晰的文本或圖形文件。
二是掃描形成連續色調的靜態圖像。這類圖像分為灰度圖像和彩色圖像。灰度圖像由從最暗的黑色到最亮的白色的不同灰度組成。灰度表示一幅圖像從亮部到暗部的層次,也叫色階。灰度越高,層次越豐富,文件容量越大。灰色模式適合掃描黑白照片和圖像文件,色階的選擇要適中,只要不影響畫質即可。顏色模式中的顏色數量表示顏色的范圍。顏色越多,圖像越生動真實,文件容量越大。同樣,色號的選擇也要適度,不是越多越好。彩色模式適用于掃描文件或頁面上帶有紅色抬頭和印章的彩色照片文件。需要永久保存或長期保存,或移交國家檔案館的檔案,一般應采用彩色模式掃描。
(3)掃描分辨率掃描分辨率參數的選擇原則上是基于掃描圖像的清晰度和完整性,不會影響圖像的利用效果。黑白二進制、灰度、彩色模式掃描文件時,分辨率一般建議大于等于200dpi。特殊情況下,如文字小、文字密、清晰度差等。,分辨率可以適當提高。對于需要OCR漢字識別的文件,掃描分辨率建議選擇300dpi。
(4)光學字符識別處理目前OCR技術已經相當成熟,一般掃描儀都有自己的OCR軟件,使用起來也非常方便。但是OCR的識別準確率往往不盡如人意,影響檢索效果。手動修改稿件中的錯別字很麻煩。因此,提高OCR識別率是檔案數字化中的一個重要問題。
其實只要注意以下幾點,就可以明顯提高OCR識別率:一是選擇合適的掃描分辨率。過低的掃描分辨率往往會導致OCR識別率下降,過高的分辨率則會使圖像文件過大,降低識別速度。在實際操作中,操作者可以通過查看OCR識別后生成的文本中紅色錯別字的數量(如小于3%)來判斷可接受性,決定是否以此分辨率掃描,進行OCR識別。
二是盡量黑白二進制模式掃描。用掃描儀掃描文檔時,OCR通常接受灰色或黑白二進制模式,不接受彩色模式。如果稿件的印刷質量好,可以采用灰色模式,否則應采用黑白二進制模式。掃描時,您可以手動調整黑白閾值的大小。如果黑白二值圖像上的文字輪廓不完整,適當增加閾值。
如果文本的輪廓太粗,說明信息冗余較多,可以適當降低閾值。這樣調整后形成的黑白二值掃描圖像可以達到更好的OCR識別效果。第三,在進行OCR識別時注意字符的傾斜校正。OCR識別允許文檔輕微傾斜,但過度傾斜會影響識別率。校正方法是在掃描軟件上點擊傾斜校正按鈕,識別軟件會在OCR識別前自動校正圖像。
四是稿件識別前的預處理。去除稿件中的雜物和圖片,因為雜物會干擾文字識別,圖片無法識別,會影響OCR的文字分割。針對稿件中的欄目,建議手動設置欄目區域,即用多個方框選擇要識別的文字,然后進行OCR識別。
五是采取適當的識別方法。簡體和繁體稿件混雜,中英文稿件識別率往往較低。如果簡體和繁體中英文分塊分布,可以用圖像處理軟件將不同的文本塊編輯成文本塊相似的文件,然后分別用OCR識別不同的字符。
(5)掃描注冊認真填寫紙質文件數字化轉換流程交接登記表,登記掃描頁數,核對每份文件實際掃描頁數與歸檔時填寫的文件頁數是否一致。如不一致,應注明具體原因和處理方法。3.圖像處理掃描完成后,獲得的圖像必須按要求進行技術處理,以糾正掃描文件與原始文件之間的偏差,使掃描文件更清晰、更規范。
圖像處理一般包括以下內容:(1)影像數據質量檢查檢查圖像的偏斜、清晰度和失真。如果發現不符合質量要求,應對圖像進行重新處理。當掃描的圖像文件不完整或因操作不當無法清晰識別時,應重新掃描;如有漏掃描文件,及時補掃描,正確插入圖像;當發現掃描圖像的排列順序與原始文件不一致時,應及時調整。認真填寫相關表格,記錄質量檢查結果和處理意見。
(2)整改應該校正偏轉圖像,以便在視覺上感覺不到偏轉。方向不正確的圖片要旋轉還原,符合閱讀習慣。
(3)去污影響圖像質量的雜質,如黑點、黑線、黑框和黑邊,應該去除。在處理過程中,應注意不要破壞文件的原始信息。
(4)圖像拼接掃描不同區域的大幅面文件形成的多幅圖像應拼接合并成一幅完整的圖像,以保證文件數字圖像的完整性。
(5)修剪彩色模式下掃描的圖像應進行修剪,去除多余的白邊,以有效減少圖像文件的容量,節省存儲空間。以上的整改、去污、修整等處理都可以根據肉眼手動完成。也可以使用專門設計的軟件,預先進行一定的設置,然后由計算機自動處理。計算機處理當然效率高,但不如手工處理靈活。比如,一旦污漬的大小被設計得太小,電腦會自動把一些標點符號作為污漬去掉。因此,掃描圖像的處理也需要采用手動和自動相結合的處理方式。
4.圖像存儲(1)存儲格式以黑白二進制模式掃描的圖像文件通常以TIFF(G4)格式存儲。以灰色模式和彩色模式掃描的圖像文件通常以JPEG格式存儲。存儲時壓縮比的選擇應以保證掃描圖像易讀性的前提下最小化存儲容量為基礎。提供網絡查詢的掃描圖像,也可以存儲為CEB,PDF或其他格式的文件。
(2)圖像文件的命名數字檔案資源應以檔案號或唯一標識符命名。用檔案號命名數字檔案資源的,按卷排序的,應按《檔案號編制規則》(DA/T 13-1994)編制檔案號,建議增加檔案類別碼作為類別號的子項;若按件排序,案卷號可采用“全宗號-案卷類別碼年份-保管期限-機構(問題)碼-件號-分件號”的結構。
5.目錄數據庫建設(1)數據格式選擇目錄數據庫建設應選擇通用數據格式,所選數據格式應能通過XML文檔直接或間接交換數據。這個數據庫的建立可以通過專門的檔案管理系統或者掃描處理管理軟件錄入,也可以通過EXCEL專門設計的檔案目錄表錄入,然后將數據導入檔案管理系統。
(2)檔案描述根據《檔案著錄規則》(DA/T18-1999)的要求,建立檔案目錄數據庫,錄入檔案目錄數據。
(3)目錄數據的質量檢查為保證數據的準確性,可采用“單機錄入-人工校對”或“雙機錄入-計算機自動校對”的方法。無論是人工校對還是計算機校對,都要檢查描述項目是否齊全,描述內容是否規范準確,如發現不合格數據,應進行修改或重新記錄。
6.數據掛鉤(1)匯總掛鉤檔案數字化轉換過程中形成的編目數據庫和影像文件,經質量檢查合格后,通過網絡及時加載到數據服務器進行匯總。目錄數據庫和鏡像文件要避免慢且容易出錯的手動掛接,盡量批量使用電腦自動掛接。只要將掃描的數字文件按照紙質文件的文件號進行命名,就可以通過編制掛鉤程序或借助相應的軟件,實現相關數字圖像的自動搜索和相應電子地址信息的添加,從而實現批量、快速掛鉤。
(2)數據關聯基于紙質文件目錄數據庫,從每個紙質文件掃描的一個或多個圖像被存儲為圖像文件。將圖像文件存儲在相應的文件夾中時,需要仔細檢查每個圖像文件的名稱是否與歸檔目錄數據庫中的文件號相同,圖像文件的頁數是否與歸檔目錄數據庫中的文件頁數相同,圖像文件的總數是否與歸檔目錄數據庫中的文件數相同。利用每個圖像文件的文件名與該文件在歸檔目錄數據庫中的文件號建立一一對應的關系,為歸檔目錄數據庫與圖像文件的自動批量連接提供了條件。
(3)交接登記認真填寫紙質文件數字化轉換過程交接登記表,記錄數據關聯后的頁數,檢查每次文件關聯后的頁數與文件整理掃描時填寫的頁數是否一致。如不一致,應注明具體原因和處理方法。
7.數據接受檢查所有已經采樣數字化的數據,包括目錄數據庫、圖像文件和數據掛鉤的整體質量。當目錄數據庫和圖像文件鏈接出現錯誤,或者目錄數據庫和圖像文件中有一個不完整、不清晰、有錯誤時,抽檢將標記為“不合格”。一個全宗文件,當數字轉換質量抽檢合格率達到95%以上(含95%)時,將被驗收為“通過”。
合格率=通過抽樣檢查的文件數/通過抽樣檢查的文件總數×100%。認真填寫紙質檔案數字化驗收登記表。驗收“通過”的結論必須經過審核簽字才能生效。8.數據備份完整、合格的數據應及時備份。為保證數據安全,備份載體的選擇應多樣化,可采用線上線下相結合的方式實現多套備份,并注意遠程存儲。
還應該檢查備份數據。備份數據的檢查內容主要包括備份數據是否可以打開,數據信息是否完整,文件數量是否準確。數據備份后,應在相應的備份介質上做好標記,以便于查找和管理。填寫紙質文件數字備份管理登記表。
9.數字結果管理應加強紙質檔案數字化成果的管理,確保其安全性、完整性和長期可用性。提供紙質檔案數字化成果在線檢索利用時,應當有制作單位的電子標識,并根據具體情況采用可下載或不可下載的數據格式。
如何做好紙質檔案數字化工作
如何做好紙質檔案數字化工作
檔案數字化掃描參數的選擇
隨著社會信息化的迅速發展,很多信息都以數字化的形式呈現、保存和傳輸。接下來由我為大家整理出如何做好紙質檔案數字化工作,希望大家喜歡!
一、掃描加工前階段
這一階段是數字化工作開展前的準備階段,是該項工作的起步階段也是關鍵階段,本階段的工作做好了就為后期工作打下良好基礎。準備的內容包括紙質檔案的準備、基礎設施的準備、人員的準備及相應管理制度完善等。
1、紙質檔案的準備。
許多檔案工作人員有著強烈的工作積極性和責任感,希望盡早把工作完成,這是好事,但不能盲目推進,在紙質檔案沒有準備好之前最好不要進入下一階段,必須在紙質檔案已按檔案整理規則完成規范的歸檔整理后進行。
若紙質檔案整理不合格就開展數字化掃描,那么一旦紙質檔案需要重新調整必然牽動相應的數字化檔案的調整。檔案整理人員要能夠熟練掌握各階段檔案整理規則,整理工作包括歸檔與不歸檔鑒定、保管期限鑒定、文件頁正確排序、頁碼正確編寫在正確位置、按檔案整理方案歸檔排序、每一件蓋好歸檔章并準確填寫、全年檔案完成編目并準確無誤等工作,確保即將進行數字化加工的檔案齊全、完整、真實、準確、規范,同時要注意有些檔案需要進行拆除裝訂物,修整頁面,修補褪變、破損檔案等工作,才能進行數字化加工。
2、基礎設施的準備。
紙質檔案數字化工作需要相應的設備和場所,數字化加工場所應空間充足,布局合理,有條件的可配備消防系統和門禁、防盜、視頻監控等安全系統。數字化加工設備需要計算機、檔案掃描儀、刻錄機及存儲介質(如磁帶、磁盤、光盤等),有條件的單位可以配置服務器、備份設備、數碼相機等,數字化加工工作同樣需要相應的軟件系統支撐,如操作系統、檔案管理軟件、掃描程序、刻錄軟件、備份軟件、病毒查殺軟件等,來保障數字化加工工作安全有保障。
3、人員的準備。
檔案數字化加工人員需要具備一定的計算機知識和檔案管理知識。檔案工作人員要積極向單位領導匯報反映此項工作的程序和需求,做好工作計劃,確定工作形式(自主加工或業務外包),制定實施方案,成立檔案數字化工作領導小組,工作人員要求責任心強,細心細致,能夠嚴格把好質量關,實行數字化加工過程的全流程管理。
4、管理制度的完善。
檔案數字化掃描參數的選擇
科學、規范、可行的工作制度能夠保障此項工作的順利有序開展,紙質檔案數字化加工工作涉及崗位、場地、設備、數據、檔案實體等,要做好這項工作,應從這幾個方面制定相應的制度,如《檔案數字化工作管理辦法》《數字化工作流程》《檔案信息保密管理制度》《檔案數字化驗收工作細則》《數字化工作制度》《設備管理制度》等,并在紙質檔案數字化工作過程嚴格執行,確保檔案的安全和工作的有機銜接。
二、掃描加工中階段
這一階段是紙質檔案數字化加工流程進入實質性操作階段,是實現紙質檔案數字化高質量的關鍵階段。掃描人員需要掌握一定的操作技術和方法,充分掌握合格圖像的標準要求。
1、掌握標準要求。
做好工作標準先行,紙質檔案數字化加工工作同樣要在標準規范的指導下進行。既不要為了節省存儲空間降低標準,也不要不顧實際需要一味地提高標準。具體標準應該包括但不限于全年度歸檔紙質檔案全部掃描,圖像按檔案排列順序依次掃描,每一件每一頁紙質檔案與掃描后形成的數字圖像一一對應,每一件檔案圖像首頁應含有歸檔章,各頁有正確的頁碼標識,每一頁圖像要字跡清楚、圖像完整、方向正確符合閱讀習慣,圖像明暗度要適中、圖像盡可能反映檔案原貌等。
2、掌握操作方法。
在未實現完全電子化辦公情況下,紙質檔案的數字化掃描任務是相當繁重的,要做好此項工作,操作人員需掌握一定的掃描操作和圖像處理的技術方法。
掃描操作:檔案掃描儀與計算機連接,安裝驅動和掃描軟件后即可使用。工作人員要能夠對檔案掃描儀操作方法及掃描儀參數的設置熟練掌握和使用。掃描操作說起來并不復雜,就是將紙質檔案放入掃描儀、掃描、將檔案拿出掃描儀。
但是這里還是強調不要急于掃描,在掃描前一定要對掃描方式、掃描色彩模式、掃描分辨率、圖像存儲格式進行判斷和設置,其依據為《紙質檔案數字化規范》及《紙質檔案數字化工作指南》中的相關要求。目前市場上有平板式掃描儀、滾筒式掃描儀、頂置式掃描儀等,應根據需要和檔案的紙張質量進行選擇,有條件的話最好選用專業的非接觸式檔案掃描儀。
掃描色彩模式在《紙質檔案數字化規范》中推薦全部采用彩色模式掃描,而色彩往往又與圖像存儲格式關聯,彩色圖像通常存儲的格式為JPG,若存儲為TIFF格式占用空間相對會大。掃描分辨率是影響檔案直觀效果的`重要參數,規范中規定最低為200dpi,要實現OCR識別的則需要300dpi以上。在確定好以上參數的基礎上再進行亮度和對比度的微調。
圖像處理:規范中要求掃描圖像盡可能反映檔案原貌,但在掃描過程中受檔案紙張幅面、紙質粗糙程度、字跡洇散、顏色不均等因素影響,可能出現圖像一次掃描不全、燥點過多過大、字跡深淺不一、發白偏暗、圖像倒置等質量問題,出現這些情況就需要進行圖像處理操作,一般需要采用專門的圖像處理軟件來實現,一般可以采用PS軟件,也有一些專業的檔案掃描儀自帶非常實用的圖像處理軟件,能夠完成圖像拼接、圖像去污、裁邊、旋轉及糾偏等圖像處理工作,使圖像完整、整潔、端正。
三、掃描加工后階段
一批檔案掃描完,在移交檔案管理部門前,還有一些工作要做,包括圖像檢查、數據對接檢查、數據存儲、數據移交等工作,每項工作依次銜接完成。
1、圖像檢查。
數字化加工的成果好不好,在數字檔案利用過程中會得到檢驗,但是作為加工工作來說,不能等到利用時發現問題再回過頭來修改,就像工廠產品生產一樣不能等著別人去發現問題,這樣就會造成不良的影響。檢查人員首先要掌握紙質檔案數字化加工的標準要求,然后才能參與檢查。
其次檢查人員要認真負責,在可能的情況下實現100%的檢查,最低不能低于10%,對抽檢到的內容要達到100%的合格率,一旦發現問題,必須進行修改,該處理的處理,該重掃的重掃,該補掃的補掃,并要進一步擴大檢查范圍,再檢查完善。
2、數據對接檢查。
目前,利用數字檔案的方式基本都是通過目錄來檢索數據,因此目錄與圖像及數字化副本能否一一對應,也是檢查的重要內容,檢查率應為100%,如果發現問題,必須重新修改完善。
3、數據存儲。
在前兩步驟沒有問題的前提下,就可以將數據進行脫機存儲,目前提倡采用一次性寫光盤作為存儲介質,存儲的內容包括檔案圖像、目錄數據、相關說明文件等,其存儲結構包括圖像文件的命名方式等應按照數字檔案管理系統的設計模板來建立,而相關文件說明要盡可能地齊全,包括但不限于工作流程過程中的規劃方案、人員登記表、數字化加工檔案登記表、數量統計表、質量檢查表、編碼說明文件、數據描述等,建立起完整的項目檔案元數據。
4、數據移交。
這是掃描加工工作完成前的最后一項內容,將前期工作成果向檔案管理部門移交,移交的內容由檔案管理部門規定,移交過程包括移交前的驗收和辦理交接手續,此驗收由檔案管理部門來驗收,驗收合格則進行下一步——辦理交接手續,如果驗收不合格,那么說明前期的工作還存在問題,需要重新改正后再進行數據移交。交接手續在雙方蓋章確認后,標明此次工作即圓滿完成。
檔案數字化工作是當前及今后一段時間檔案工作的重要內容之一,這一工作說起來容易做起來則需要很大的細心和耐心,但只要掌握具體規范,并在工作中積極總結經驗,都能夠把這項工作很好地完成。
檔案館要弄信息數字化,需要對紙質檔案進行掃描,我想問下各種幅面大小的單價是多少,比如A1的多少一張
樓主,你是要買掃描儀嗎?
還是將文檔進行掃描儲存在電腦里面的單價?
掃描文檔的成本就是機器磨損和人員工資。你這A1一張是多少錢。。。意思不是太清楚。
如果是買掃描儀你可以將你要掃描的最大幅面是多少就可以了,掃描最低參數都是:彩色(灰度、黑白),分辨率:300dpi的。
你要A4掃描儀我可以推薦:
明基5560
基本參數
產品用途:商業應用/個人家用糾錯產品類型:平板式糾錯最大幅面:A4糾錯掃描元件:CCD糾錯光學分辨率:1200x2400dpi糾錯最大分辨率:19200×19200dpi糾錯掃描范圍:214×294mm糾錯掃描介質:文件,圖片,照片,名片糾錯接口類型:USB2.0/1.1糾錯
性能參數色彩位數:彩色:48bit,灰階:16bit糾錯灰度參數:灰階16bit(輸入/輸出)糾錯雙面掃描:手動糾錯網絡掃描:不支持糾錯
其它參數
產品尺寸:412×258×73mm糾錯產品重量:2.2kg糾錯操作系統:Windows XP/2000糾錯電源類型:16V,0.9A糾錯工作噪音:低于50dB糾錯環境參數:工作溫度:0-40℃,工作濕度:10-85%糾錯
掃描儀附件包裝清單:主機x1
電源適配器x1
USB電纜線x1
使用手冊x1
隨機光盤x1
保修卡x1糾錯隨機軟件:MiraScan掃描儀驅動程序
電子檔用戶手冊
Acrobat Reader(PDF閱讀軟件)
ABBYY FineReader Sprint(多國文字識別軟件)
漢王OCR(中英文文字識別軟件)
拼接精靈MergeMagic(享受大幅面掃描)
Ulead PhotoExplorer SE Basic(多媒體管理軟件)
Ulead PhotoExpress SE(我行我速軟件)糾錯
我想你問的也不是打印。。。