1 适用范围
本规程规定了纸质档案(含文书档案、科技档案、会计档案等)数字化加工的主要技术指标。
本规程适用于湖北省各级综合档案馆。机关、团体、企业事业单位、社会组织参照执行。
2 引用文件
DA/T18-1999 档案著录规则;
DA/T22-2000 归档文件整理规则;
DA/T31-2005 纸质档案数字化技术规范;
湖北省文书档案目录数据库结构与著录细则(鄂档[2004]46号);
湖北省国家综合档案馆电子档案数据容灾管理试行办法(鄂档〔2010〕41号);
关于进一步加强档案信息安全保密工作的通知(鄂档办〔2014〕19号)。
3 实施主体
3.1纸质档案数字化加工的责任主体为实施档案数字化的各级国家综合档案馆及机关、团体、企业事业单位、社会组织(以下简称“数字化实施单位”)。
3.2纸质档案数字化加工可由数字化实施单位自行组织人员开展,也可以由数字化实施单位采取业务外包的方式委托给具有相关资质和能力的档案数字化服务机构(以下简称“数字化服务机构”)完成。
4 基本原则
4.1 统筹规划,分步实施
根据纸质档案重要程度、破损状况、利用需求等,进行统筹规划,分步实施。国家重点档案、重要全宗档案和涉及民生的专业档案应优先列入数字化加工对象。
数字化应保持原有档案全宗或目录的完整性。
4.2 加强管理,保障安全
遵守保密安全要求,对数字化对象进行划控、鉴定。涉及国家秘密的档案,不得以外包方式委托进行数字化加工。加强档案数字化各个环节的管理工作,确保档案原件和数字化成果的安全。
4.3 完善细节,规范流程
对因涉密不宜以外包方式委托进行数字化加工的对象,应用文字做出说明,并由数字化实施单位组织工作人员集中进行数字化加工。应加强数字化加工流程管理,界定各个环节的职责任务,堵塞漏洞和缺憾。
4.4 分工协作,夯实基础
加强内设机构的分工协作,把夯实档案基础业务工作与档案数字化相结合,开展传统载体档案清理、整理、鉴定、修裱等基础处理工作,为加快推进档案数字化创造有利条件。
5 基本环节
纸质档案数字化的基本环节为数字化前期准备、数字化前处理、数字化扫描、数字化后处理、数字化成果验收移交。内容主要包括:制定数字化工作方案、案卷整理与交接登记、目录建库、档案扫描、图像处理、图像存储、数据挂接、数据验收、数据备份、数字化成果移交及管理等。数字化操作流程及任务要点见附录1。
档案数字化从整理分件到案卷还原的各个环节,应以卷(盒)或批次为单位建立档案数字化加工流程单(见附录2),记录每卷(盒)或每批档案数字化过程,确保档案扫描加工质量和效率。
6 制定方案
对档案实体的基本情况进行摸底排查,根据排查结果,制定总体规划和分年计划,并按照本规范编制数字化工作方案。包括档案数字化的内容和范围、数量以及先后顺序、数字化的形式、技术参数、时间安排以及经费预算等内容。
7 案卷整理
开展数字化扫描工作之前,应根据纸质档案实际情况,按步骤对档案实体进行整理鉴别,对需要说明、修裱、扫描等内容进行标识,以确保扫描加工质量和效率。
7.1 分件
按传统方法整理的档案,应将案卷拆分为件进行扫描。件的划分应遵照DA/T22的规定进行,注意保持文件的齐全、完整,尽量避免以组合件的方式进行扫描。按新方法整理的档案,件的划分遵循档案形成规律和DA/T22的要求。
分件过程中,应注意理顺文件的排列顺序。对文件形成过程中产生的,除正本以外的一般性修改稿、底稿、重复件及没有保存意义的制表说明等不予扫描的页面,应加以标注。
为便于数字档案(正文)的利用,应将文件处理签或领导(职能部门)签署的意见、有本级党政领导亲自批示和审改内容的文件底稿等不便提供利用的文件,在档案目录数据库中进行标识。
7.2 编页
没有编页或编页不规范的档案,原则上应重新进行编页。文书档案正面页号应编在右下角、背面页号应编在左下角,科技档案页号应统一编在右下角,没有信息的档案页面不编号。
页号不应压盖档案内容;重新编写页号时,应将原页号用铅笔划去,以示区分。
装订物处理
对已装订成册,不去除装订物会影响扫描工作进行的档案,应拆除装订物。拆除装订物时,应注意保护档案不受损害。
对已装订成册,不去除装订物不影响扫描工作进行的档案,应维持原样。
7.4 页面修整
对破损严重无法扫描或折皱不平影响图像质量的纸质档案,应先进行技术修复或压平等相应处理后再进行扫描。
7.5 装订还原
纸质档案扫描加工完成后,对拆除过装订物的档案实体进行装订还原。装订还原应符合国家档案装订规范,要保持案卷整齐、卷内文件排列顺序正确、不掉页、不压字等。
对装订还原的档案实体进行质量检查、登记,出现卷内文件不完整、前后顺序排列不正确及装订不符合国家规范等情况,应退回重新整理。
7.6 交接登记
档案数字化过程需要交接的环节,应当填写档案调还卷登记表,确保交接清楚,手续完备,有据可查。
8 建立目录数据库
按照国家档案局《档案著录规则》(DA/T18-1999),湖北省档案局《湖北省文书档案目录数据库结构与著录细则》(鄂档[2004]46号)等要求,确定目录数据库中的著录项,建立档案目录数据库。
应采用计算机自动校对与人工校对相结合的方式,对目录数据库的质量进行检查,包括目录与内容的一致性、准确性等。
档案数字化之前已经建立了案卷级、文件级目录数据库的,应充分尊重原有基础,并对其进行核对,发现不合格的目录数据,应进行修改或重录。
9 元数据管理与捕获
9.1 元数据管理
9.1.1档案数字化过程及后期数字化成果管理工作中,应捕获必要的元数据,用以记录数字化项目信息、数字图像生成背景及各类技术参数等,并整合到与档案目录数据库对应的目录条目中。
9.1.2元数据应采用数字化系统自动捕获和人工录入等方式获取。建议以系统自动捕获为主。捕获过程中应进行元数据的校验,包括对元数据完整性和赋值规范性的检查等。
9.2 元数据捕获
9.2.1描述数字化全过程各环节操作完成情况和操作人员等情况的元数据;
9.2.2描述数字化技术环境、过程及各项技术参数的元数据,如数字化时间、数字化设备、数字化软件、色彩模式、分辨率、存储格式等;
9.2.3描述数字化成果存储位置、读取利用所需技术环境等的元数据,如存储路径、阅读所需软硬件等;
9.2.4用以维护数字化成果法律认可性的元数据,如数字化项目的授权信息、数字化成果的更新维护管理活动相关信息等。
10 档案扫描
10.1 基本原则
10.1.1应根据纸质档案原件实际情况、数字化目的、设备情况等选择相应扫描方式、设置和调整相关扫描参数。扫描参数的设置和调整,应以保证数字图像不失真、扫描效果最接近档案原件,并能够满足数字化成果利用的要求为原则;
10.1.2纸质档案数字化后需进行COM输出、OCR识别、出版、仿真复制等的,扫描参数的选择应考虑后期处理的要求。
10.2 扫描方式
按纸质档案幅面的大小选择相应规格的扫描仪进行扫描。大幅面纸质档案,可采用专用数码平台进行扫描或者采用图像拼接方式处理。
纸张状况较差,以及过薄、过软或超厚不宜拆卷的档案,应采用平板或零边距扫描方式;纸张状况好的档案可采用高速扫描方式,以提高工作效率。
10.3 扫描参数
10.3.1典藏级
纸质档案数字化主要用于精确反映档案原件并长期保存,应采用不低于24位彩色模式进行扫描,扫描分辨率应不小于300dpi,扫描形成的数字图像应采用无损压缩TIFF格式存储。
10.3.2出版级
纸质档案数字化主要用于备份并提供利用(如出版、仿真复制、COM输出、OCR识别等),应采用不低于24位彩色模式进行扫描,扫描分辨率应不小于200dpi。有放大需求、文字偏小或密集时,可提高分辨率。扫描形成的数字图像可存为TIFT、JPEG或JPEG2000格式,压缩比率的选择应兼顾图像质量与存储空间的要求。
10.3.3网络浏览级
纸质档案数字化主要用于提供网络浏览利用,应通过软件工具将典藏级或出版级数字图像的分辨率进行转换。分辨率的选择应综合考虑档案原件情况、计算机网络条件等多种因素,建议不小于72dpi。
图像文件命名
以纸质档案目录数据库为依据,将每一份图像文件命名为档案目录数据库中该份文件的档号。通过档号的唯一性和一致性,建立起一一对应的关联关系,为实现档案目录数据库与图像文件的批量挂接提供条件。
若扫描对象为一个或多个稿本,应根据具体情况确定图像文件命名方式。
例1:扫描对象为一个稿本、档号为“LS015-001-0016-0001”的文件有3页,如扫描格式为JPG,经扫描生成的3个数字图像应分别命名为:
LS015-001-0016-0001.001.JPG
LS015-001-0016-0001.002.JPG
LS015-001-0016-0001.003.JPG
例2:扫描对象为多个稿本,数字图像名称由文件级档号、稿本代码、稿本内页面流水号3个部分构成。稿本代码为:A-正本,B-定稿,C-草稿。以一份档号为“SZ101-2001-W01-Y-001”的文件正本为2页、定稿为2页、草稿为4页的档案为例,经扫描生成的8个数字图像,应分别命名为:
SZ101-2001-W01-Y-001.A.001.JPG
SZ101-2001-W01-Y-001.A.002.JPG
SZ101-2001-W01-Y-001.B.001.JPG
SZ101-2001-W01-Y-001.B.002.JPG
SZ101-2001-W01-Y-001.C.001.JPG
SZ101-2001-W01-Y-001.C.002.JPG
SZ101-2001-W01-Y-001.C.003.JPG
SZ101-2001-W01-Y-001.C.004.JPG
11 图像处理
对纸质档案扫描形成的图像应作质量检查、纠偏、去污、去黑边、拼接等处理。
11.1 质量检查
11.1.1对图像偏斜度、清晰度、失真度等进行检查。发现不符合质量要求的图像,应重新进行扫描;
11.1.2发现文件漏扫时,应及时补扫并正确插入;
11.1.3发现图像的排列顺序与档案原件不一致时,应及时进行调整;
11.1.4发现图像重复时,应及时删除重复部分。
11.2 纠偏
对扫描过程中出现的偏斜图像应进行整体纠正,保证图像的偏斜角度小于1度(图像偏斜不超过页面内半个文字);对方向不正确的图像应进行旋转处理,以符合阅读习惯。
11.3 去污
对扫描过程中产生的污点、污线、黑边等影响图像质量杂质的,应进行去污处理。处理过程应严格遵循展现档案原貌的原则,不得去除档案页面原有的纸张褪变斑点、水渍、污点、装订孔等。
11.4 拼接
对大幅面档案进行分区扫描而形成的多幅图像,应进行拼接处理,合并为一个完整的图像。
数据挂接
应借助相关软件对汇总后的目录数据与图像数据进行批量、快速挂接,以实现目录数据与图像数据的关联和一一对应。
对挂接后的数据逐条进行检查,包括目录信息与图像文件对应的准确性、已挂接图像文件与实际扫描数量的一致性、图像文件能否正常打开等,发现错误应及时纠正。
检查验收
数字化实施单位应指定专人或通过业务外包方式聘请具有相关资质的专业监理公司,对纸质档案数字化形成的数据及档案实体还原情况进行检查验收,并填写档案数据及档案实体还原质量报告单(见附录3)。
检查验收内容包括目录数据、图像数据、数据挂接(见附录2、3),以及档案实体。
检查方式应按加工批次随机抽检,抽检率不低于10%,合格率不低于98%。档案实体还原情况抽检率为100%,合格率要求100%。抽检合格率不符合要求的,应退回返工。
13.1 目录数据及元数据检查
以完成纸质档案扫描的某一全宗或多个目录为单元,对条目数量、目录数据库及元数据著录项目的完整性、一致性、规范性等进行随机逐条的检查。其中,纸质档案档号的合格率要求达到100%,其它项目合格率要求达到98%以上。检查不合格的数据,应进行修改或重新著录。
13.2 图像数据检查
对批量扫描形成的图像数据,按比率进行随机抽查。
13.2.1图像数据应符合本规程中所规定的分辨率、文件格式及色彩模式;
13.2.2扫描图像的完整性要达到100%,不能出现缺页、错页、重复等现象;
13.2.3图像的偏斜度、清晰度、整洁度等技术指标,抽检合格率应达到98%以上。
13.3 数据挂接检查
将挂接图像文件的名称、页数和总数,对照档案实体、档案目录数据库中的档号、页数和文件总数,采用人工的方式进行抽检。要求二者的一致性和正确性为100%。
13.4 档案实体还原检查
对已完成数字化的档案实体,应对照档案原目录进行清点。检查内容包括所有档案是否都已还原,文件排列顺序是否正确,文件数量有无缺漏,文件装订是否符合国家规范等。要求准确率为100%。
13.5 验收结论
对检查通过的数据进行验收,并给出“合格”或“不合格”结论。
验收合格结论由验收责任人签字,报数字化实施单位负责人审批后方为有效。
14 数据存储
14.1 存储范围
对验收合格的成果数据及时进行存储。包括档案目录数据及元数据、数字图像、数字化过程中产生的各种文档等。
14.2 存储方式、载体与备份
对验收合格的成果数据,采用在线、近线、离线相结合的方式进行存储。存储载体的选择应多样化,并考虑载体的存储容量、数字化成果存储的目的、保管期限、经费情况、载体市场环境、载体生产厂商提供服务的能力等方面的因素,选择最适宜的存储载体。
相同内容的数据成果应使用不同的介质进行离线备份。套数应为三套,一套封存保管、一套提供利用、一套异地保存,分别标识为A、B、C。
14.3 存储校验
对存储数据应用计算机进行自动校验,内容包括图像文件能否打开、数字化成果数量、信息数据是否完整等。
14.4 载体标签
数据存储后,应在相应存储载体的封套(盒)上编制成果数据标签(见附录4),以便管理。
15 成果数据移交
15.1 移交内容
包括档案目录数据及元数据、档案数字化全文数据元数据、系统数据、载体和数量。
15.2 移交验收
成果数据移交时,接收方应进行验收。验收内容为:移交的载体、数量及其是否完好、清洁,是否无划痕、无损伤、无病毒;移交的数据内容及其是否完整、规范、准确等。
15.3 移交方式
成果数据移交方式根据实际情况确定。以业务外包形成成果数据的移交方式,由数字化实施单位与数字化服务机构通过合同约定。
15.4 移交手续
成果数据移交时,需填写《档案数字化成果移交接收登记表》(见附录5),一式两份,由交接双方共同签署,完善手续,分别保管。
16 成果数据管理
16.1应加强数字化成果数据的管理工作,记载数字化成果的管理和使用情况,并及时获取和补充数据管理过程中的元数据。
应采取有效的技术手段,确保成果数据不被非法篡改,保证其安全、完整和长期可用。
16.2 建立有效、可操作性的存储载体与存储设备维护规范,对存储载体、存储设备的状态检测、预防性检查、常规性作业等提出具体要求。
16.3 数字化成果数据在提供出版、印刷、发布和网上传输时,应履行审批手续,并采用数字水印、电子标识、产品标志、数字加密及转换分辨率等措施,以起到保护版权、鉴别真伪和安全通信等作用。
17 安全保密
17.1 管理制度
档案数字化过程中应建立可靠的安全保密责任制,制定与信息涉密等级相应的管理制度,定期对制度实施情况进行监督检查。
17.2 外包管理
17.1.1凡采取业务外包方式实施数字化加工的,数字化实施单位应按照安全保密的相关规定,选择具有一定规模、管理制度健全、社会信誉好、经验丰富、具备相关资质要求的数字化服务机构承担档案数字化加工;
17.1.2数字化服务机构应接受档案行政管理部门、保密工作部门的保密审查和指导监督,并与数字化实施单位签订保密协议。
17.3 人员管理
档案数字化加工人员上岗前应接受保密安全培训,签订保密承诺书,并保持相对稳定。数字化服务机构对参加数字化工作的人员,应进行身份登记和安全保密审查。
17.4 场所管理
17.4.1数字化加工场所一般设在数字化实施单位内部,并配备临时存放档案的柜架,按保密要害部门进行管理。加工场所应安装监控摄像头和录像设备,全程摄录加工现场情况备查;
17.4.2数字化加工场所应配备专门的储物柜,用于工作人员存放私人物品。禁止数字化加工人员将个人手机、数码拍摄设备、移动存储介质,以及与工作无关的生活用品等带入数字化加工场所;
17.4.3数字化加工场所禁止存放易燃、易爆物品。应制定消防预案,配备一定数量的手携消防器材,定期、专人检查。设置兼职消防安全员,实施消防安全员值日制度,发现安全隐患立即报告并采取适当措施。
17.5 设备管理
17.5.1数字化加工过程中所使用的扫描仪、照相机、计算机及存储等设备,应符合有关保密技术标准和保密要求;
17.5.2应根据所加工档案的最高密级,确定计算机及其存储介质的密级,并采取相应的保密技术防护措施,加强设备监管;
17.5.3数字化加工使用的计算机应与相关设备组成专用网络,并封闭外联接口。禁止接入互联网或其它公共网络,禁止安装具有无线互联功能的硬件模块和无线鼠标、键盘等外围设备;
17.5.4档案数字化任务完成后,加工使用过的计算机及设备应继续按涉密设备使用和管理。采用外包方式加工的计算机,应拆除硬盘,与其它使用过的存储介质一并向数字化实施单位移交。
17.6 档案实体管理
档案实体在数字化加工过程中未经批准,不得查阅和借出。档案调卷、还卷及数字化加工过程作业中各道手续应详细登记备查,确保安全。数字化作业完毕的档案应及时归还库房,暂存数字化加工场所的档案应专人管理,妥善保存。
17.7 介质管理
应建立档案数字化存储介质台账并实行专人管理。对数据存储光盘、硬盘等介质进行防护,防止造成弯曲、划伤、破损等。
数据备份和存储介质保管及安全管理参照国家及湖北省有关规范进行。
18 附则
本规程由湖北省档案局负责解释。