纸质档案数字化规程
一、 了解的内容
l 纸质档案数字化相关参数定义
l 扫描仪的基本调整
l 根据对象不同情况如何选择扫描参数
l 扫描图像的处理
l 扫描图像的合并及存储
l 最终文件的上传挂接
二、 纸质档案数字化相关参数定义
黑白二值图像:只有黑白两级灰度的数字图像。它对应于黑和白两种状态的文字稿、线条图等。
连续色调静态图像:以多于两级灰度的不同浓淡层次或以不同颜色通道组合成的静态数字图像。在纸质档案数字化过程中,通常表现为灰度扫描和彩色扫描两种模式。
图像压缩:清除图像冗余或对图像近似的任一种过程,其目的是对图象以更紧凑的形式表示。纸质档案数字化过程中,较常见的有CCITT(G4)、JPEG等压缩格式。
分辨率:单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示
三、 纸质档案数字化的流程
主要包括档案整理、档案扫描、图像处理、图像存储、目录建库、数据挂接、数据验收、数据备份、成果验收等。
1. 数字化流程图
2. 档案扫描方式
根据档案幅面的大小(A4、A3、A0等)选择相应规格的扫描仪或专业扫描仪(如工程图纸可采用0号图纸扫描仪)进行扫描,也可采用小幅面扫描后进行图像拼接。
3. 扫描仪的基本调整
l 扫描仪的安装
l 利用高级模式实现更多的功能
l 扫描过程中对对比度等参数的调整
4. 根据对象不同情况如何选择扫描参数
l 页面为黑白两色,并且字迹清晰、不带插图的档案.可采用黑白二值模式进行扫描。
l 页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,可以采用灰度模式扫描。
l 页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可视需要采用彩色模式进行扫描。(建议)
l 扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。
l 采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率一般均建议选择大于或等于200dpi。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率。
5. 扫描图像的处理
图像命名:以档案实体中的档号命名 ,如全宗号-目录号-案卷号-文件顺序号-页号(立卷方式)全宗号-归档年度-机构(问题)-保管期限-件号-页号(件盒),位数符合机读目录实际位数。
纠偏:对出现偏斜的图像进行纠偏处理,保证数字图像的偏斜角度小于1度(图像偏斜不超过页面内三分之一个文字)
去污:档案数字化图像的去污遵循不影响可读度的前提下展现原貌的原则,去除数
字图像中影响可读度的杂质,包括局部去污,如去除黑点、黑线、黑框;整体去污,去除页面上的污渍