1、总 则
1.1范围
本规范规定了纸质文书档案数字化工作的基本环节和技术要求。
本规范适用于甘肃省各级档案部门对纸质档案的数字化加工处理及数字化成果的管理。
1.2规范引用文件
本规范依据以下国家标准制定:
DA / T 31 一2005 纸质档案数字化技术规范。
GB/T 18894-2002电子文件归档与管理规范
DA/T 18—1999 档案著录规则
2、基本要求
2.1基本原则
纸质档案数字化的基本原则是使档案信息资源准确、方便、快捷地提供利用,使可以公开的档案信息资源得到共享,以满足社会对档案利用的需求。
2.2数字化对象的确定原则
应当对所要进行数字化的对象按照一定的原则和方法进行确认,只有符合一定要求的纸质档案文献才能进行数字化。
2.3符合国家法律法规的原则
纸质档案的数字化,必须符合国家档案开放规定以及有关规定。
2.4 价值性原则
属于归档范围且应永久或长期保存的档案可列入数字化加工的范围。
3、基本环节及过程管理
3.1纸质档案数字化的基本环节主要包括:档案整理、目录建库、档案扫描、图像处理、图像存储、数据质检、数据挂接、数据验收、数据备份、成果管理等。(具体流程见附录图1)。
3.2应加强纸质档案数字化各环节的安全保密管理机制,确保档案原件和数
字化档案信息的安全。
3.3纸质档案数字化的各个环节均应进行详细的登记,并及时整理、汇总,装订成册,在数字化工作完成的同时建立起完整、规范的记录。
4、前处理工作规范
4.1 档案调卷及质检
对调得的档案进行前期质量检查工作,对有以下情况的案卷视为质量不合格案卷,需要填写调用扫描案卷检查登记表,并交整理人员重新整理。
4.1.1案卷题名不清或无题名。
4.1.2案卷无档号、档号错误或者档号重复。
4.1.3案卷无卷内目录或者卷内目录不正确。
4.1.4卷内文件页码不正确,例如重编或者漏编页码。
4.1.5未进行解密划控鉴定的案卷。
(参考表格见附录表一)
4.2 档案整理
在扫描之前,根据档案管理情况,按下述步骤对档案进行适当整理,并视需要做出标识,确保档案数字化质量。
4.2.1编页
应在扫描之前对没有编页或编页不规范的档案重新进行编页。
4.2.2编页位置
应在档案页面的底端用铅笔(建议用2B铅笔)编写页号,编页不应压盖档案内容,页面底端已有页号时,应将原页号用铅笔划去以示区分。
4.2.3编页方法
使用阿拉伯数字从"1”开始依次编写页号,属于同一案卷或文件下的档案,应保证页号编写的连续性。
4.2.4拆除装订物
在不去除装订物情况下,影响扫描工作进行的档案,应拆除装订物。拆除装订物时应注意保护档案不受损害。
4.2.5页面修整
破损严重、无法直接进行扫描的档案,应先进行技术修复,折皱不平影响扫描质量的原件应先进行相应处理(压平或烫平等)后再进行扫描。
4.2.6档案整理登记
制作并填写纸质档案扫描检查核对登记表(参考表格见附录表二),详细记录档案整理后每份文件的起始页号和页数。
4.2.7区分扫描件和非扫描件
按要求把同一案卷中的扫描件和非扫描件区分开。普发性文件区分的原则是:无关和重份的文件要剔除,有正式件的文件可以不扫描底稿。
4.2.8装订
扫描工作完成后,拆除过装订物的档案应按档案保管的要求重新装订。恢复装订时,应注意保持卷内文件的顺序不变,做到安全、准确、无遗漏。对加工好并装订的档案实体进行质量检查,登记,出现以下情况的应退回加工单位重新整理。
4.2.8.1 卷内文件前后顺序不正确。
4.2.8.2 卷内文件不完整,或者出现因对案卷加工引起的纸张残缺。
4.2.8.3 装订方式不符合档案装订规范
5、目录建库
5.1目录数据准备
按照《 档案著录规则》 (DA / T18 一1999 )的要求,规范档案中的目录内容。包括确定档案目录的著录项、字段长度和内容要求。如有错误或不规范的案卷题名、文件题名、责任者、起止页号和页数等,应进行修改。
5.2数据格式选择
目录建库应选择通用的数据格式。所选定的数据格式应能直接或间接通过XML或者TXT 文档进行数据交换。
5.3目录数据质量检查
采用人工校对或软件自动校对的方式,对目录数据库的建库质量进行检查。核对著录项目是否完整、著录内容是否规范、准确,发现不合格的数据应要求进行修改或重录。
6、档案扫描
6.1扫描方式
6.1.1根据档案幅面的大小(A4 、A3 、AO 等)选择相应规格的扫描仪或专业扫描仪(如工程图纸可采用O 号图纸扫描仪)进行扫描。大幅面档案可采用大幅面数码平台,或者缩微拍摄后的胶片数字化转换设备等进行扫描,也可以采用小幅面扫描后的图像拼接方式处理。
6.1.2纸张状况较差,以及过薄、过软或超厚的档案,应采用平板扫描方式;纸张状况好的档案可采用高速扫描方式以提高工作效率;不适合拆卷的档案可采用零边距扫描仪或照相机拍摄方式。
6.2扫描色彩模式
6.2.1扫描色彩模式一般有黑白二值、灰度、彩色等。
6.2.2页面为黑白两色,并且字迹清晰、不带插图的档案,采用黑白二值模式进行扫描。
6.2.3页面为黑白两色,但字迹清晰度差或带有插图的档案,以及页面为多色文字的档案,采用灰度模式扫描,档案中的蓝图等特殊档案也采用灰度模式扫描。
6.2.4页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,宜采用彩色模式进行扫描。
6.2.5同一文件对应的档案页面,宜采用同一种色彩模式。
6.3扫描分辨率
6.3.1扫描分辨率参数大小的选择,原则上以扫描后的图像清晰、完整、不影响图像的利用效果为准。
6.3.2采用黑白二值、灰度、彩色几种模式对档案进行扫描时,其分辨率应选择 ≥150dpi 。特殊情况下,如文字偏小、密集、清晰度较差等,可适当提高分辨率;需要进行OCR汉字识别的档案,扫描分辨率建议选择≥300dpi 。
6.4扫描登记
认真填写纸质档案扫描检查核对登记表单,核对每份文件的实际扫描页数与档案整理时填写的文件页数是否一致,不一致时应注明具体原因和处理方法(参考表格见附录表二)。
7、图像处理
7.1纠偏
对出现偏斜的图像应进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应进行旋转还原,以符合阅读习惯。
7.2去污
对图像中出现的影响图像质量的杂质如黑点、黑线、黑框、黑边等应进行去污处理。处理过程中应遵循在不影响可懂度的前提下展现档案原貌的原则。
7.3图像拼接
对大幅面档案进行分区扫描形成的多幅图像,应进行拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。
7.4裁边处理
采用彩色模式扫描的图像应进行裁边处理,去除多余的白边,以有效缩小图像文件的容量,节省存储空间。
7.5图像数据质量检验
7.5.1对图像偏斜度、清晰度、失真度等进行检查。发现不符合图像质量要
求时,应重新进行图像的处理。
7.5.2由于操作不当,造成扫描的图像文件不完整或无法清晰识别时,应重
新扫描。
7.5.3发现文件漏扫时,应及时补扫并正确插入图像。
7.5.4发现扫描图像的排列顺序与档案原件不一致时,应及时进行调整。
7.5.5认真填写纸质档案扫描检查核对登记表,记录质检结果和处理意见(参考表格见附录表二)。
8、图像存储
8.1存储格式
扫描的图像应保存为TIFF 、JPEG或PDF 格式,一般黑白二值图像保存为TIFF ( G4 ) 格式,灰度或彩色图像保存为JPEG 格式,以单份文件为单位存储为PDF 格式;数码相机拍摄的图像应保存为JPEG 格式。
8.2图像文件的命名
8.2.1卷内文件级档案图像文件的命名:宜采用文件夹树的命名方式,各文件夹名字长度为:全宗号3位;目录号3位;案卷号4位;份文件夹名4位(或由扫描仪自动产生的8位也可以);扫描的每页档案文件名4位(或由扫描仪自动产生的8位也可以);不足以上位数的以"0"左补齐。命名标准其组成格式简单表述如下:
全宗号 目录号 案卷号 份文件夹号 文件号
3位 3位 4位 4位(或8位) 4位(或8位)
001 001 0001 0001(00000001) 0001(00000001)
8.2.2 归档文件级档案图像文件的命名:宜采用文件夹树的命名方式,各文件夹名字长度为:全宗号3位;归档年度4位;机构(问题)4位(或由扫描仪自动产生的8位也可以);件文件夹名4位(或由扫描仪自动产生的8位也可以);扫描的每页档案文件名4位(或由扫描仪自动产生的8位也可以);不足以上位数的以"0"左补齐。命名标准其组成格式简单表述如下:
全宗号 归档年度 机构(问题) 件文件夹号 文件号
3位 4位 4位(或8位) 4位(或8位) 4位 (或8位)
001 2010 0001(00000001) 0001(00000001) 0001(00000001)
9、数据汇总挂接
9.1 汇总挂接
档案数字化转换过程中形成的目录数据库与图像数据库,通过质检环节确认"合格”后,通过相应的软件与档案文件目录数据库进行批量挂接,通过网络及时加载到数据服务器端汇总。
9.2 检查挂接
数据挂接后,以文件级目录数据库为依据,对挂接的图像文件进行检查,核对图像文件的命名格式是否符合要求,发现错误及时修正。
9.3 挂接登记
对汇总挂接及检查挂接的情况进行登记,对挂接错误的注明错误原因、处理
办法及修正结果(参考表格见附录表三)。
10、数据验收
10.1数据抽检
以抽检的方式检查已完成数字化转换的所有数据,包括目录数据库、图像文件及数据挂接的总体质量。一个全宗的档案数据验收时抽检的比率不得低于5 %。
10.2验收指标
10.2.1目录数据库与图像文件挂接错误,或目录数据库、图像文件之一出现不完整、不清晰、有错误等质量问题时,抽检标记为"不合格”。
10.2.2一个全宗的档案,数字化转换质量抽检的合格率≥98 %时,认定验收"通过”。
合格率=抽检合格的文件数/抽检文件总数X 100 %
10.3验收登记
认真填写纸质档案挂接验收登记表单(参考表格见附录表三)。
11、数据备份
11.1数据备份
经验收合格的完整数据应及时进行备份,同时为保证数据安全,备份载体的选择应采用在线、离线相结合的方式实现多套备份,并异地保存。备份介质若为一次性写入光盘,则至少备份3套。
11.2数据检验
备份的数据应进行检验,检查备份数据是否能被计算机正确读取、数据信息是否完整、文件数量是否准确等。
11.3备份标签
数据备份后应在相应的备份介质上做好标签,并简略说明备份内容和备份时间,以便查找和管理。
11.4备份登记
对每次备份的内容、数据大小、备份时间、备份套数及数据存放位置等进行记录(参考表格见附录表四)。
12、数据管理
12.1 管理要求
加强对纸质档案数字化成果的管理,制定相应的管理制度,对备份数据定期检查,确保数据的安全、完整和长期可用。
12.2 保管环境
12.2.1 数据光盘不得擦洗、划痕、触摸其裸露处,不得弯曲、挤压、摔打盘片。
12.2.2 数据光盘保管环境温度为14℃—24℃,相对湿度为45%—60%。防止数据光盘沾染灰尘和污垢,避免阳光直接照射,远离热源、酸碱等有害气体和强磁场。
12.3 检测与维护
12.3.1 备份数据光盘每年进行一次有效性、安全性检查,每5年重新刻录、备份数据一次。
12.3.2 如原数据运行的软、硬件平台发生改变,应及时对数据进行转换,并做好备份。
12.3.3 做好数据检测与维护过程的登记,数据转换时应说明数据转换的原因及采取的转换措施、转换数据数量等。