档案之窗

扫一扫关注

当前位置: 首页 » 技术 » 档案知识 » 正文

大连市档案资料数字化标准(试行)

放大字体  缩小字体 发布日期:2018-11-23 22:37:11    来源:大连档案信息网    浏览次数:639    评论:0
导读

1、范围本标准根据国家档案局《电子文件归档与管理规范》、《纸质档案数字化技术规范》制定,适用于大连市各级档案馆(室)的数字化工作,其它单位可参照执行。2、基本术语解释2.1数字化:指用计算机等设备和技术将

        1、范围
        本标准根据国家档案局《电子文件归档与管理规范》、《纸质档案数字化技术规范》制定,适用于大连市各级档案馆(室)的数字化工作,其它单位可参照执行。
        2、基本术语解释
        2.1 数字化:指用计算机等设备和技术将档案资料内的信息转换为数字信息的处理过程。
        2.2 数字图像:表示实物图像的整数阵列。一个二维或更高维的采样并量化的函数,由相同维数的连续图像产生。在矩阵(或其他)网络上采样――连续函数,并在采样点上将值最小化后的阵列。
        2.3 图像压缩:清除图像冗余或对图像近似的任一种过程,其目的是对图像以更紧凑的形式表示。
        2.4 分辨率:指单位长度内图像包含的点数或像素数,一般用每英寸点数(dpi)表示。
        2.5 TIFF:标记图像文件格式。一种基于标记的无损(不丢失信息)压缩格式,用于在应用程序之间和计算机平台之间交换文件。
        2.6 JPEG:联合照片专家组。一种丢失少量信息的压缩格式,尤其适用于屏幕和打印显示,支持所有主要的计算机平台和Web浏览器。JPEG格式文件小,影像质量多数情况下均可接受。
        2.7 灰度值:指进行灰度扫描时把图像由纯黑到纯白整个色彩区域进行划分的级数,编辑图像时一般都使用到8位,即256级灰度。
        2.8 黑白二值图像:是与彩色及灰度相对应的一种模式,黑白图在表示图像时只区分黑白二值,它把其它色彩根据其特性转换为黑白两种,因此形成只有两种颜色的图像。
        2.9 光学分辨率:指扫描仪光电转换器件的物理精度。
        3、基本原则
        3.1 数字化对象的确定原则
        应当对所要进行数字化的对象按照一定的原则和方法进行确认,只有符合一定要求的档案资料才能进行数字化。
        1.1 档案资料的数字化,必须符合国家档案开放规定以及有关规定。
        1.2 属于归档范围且应当永久和长期保存的、社会利用价值高的档案可列入数字化加工范围。
        3.2 安全原则
        数字化过程中,采取有效措施,确保档案安全;录音、影像档案数字化时必须远离强磁场等外部干扰。
        3.3 真实性、完整性原则
        数字化过程中应检查档案原载体质量,确保数字信息的真实、完整。
        4、纸质档案数字化基本要求
        4.1 基本流程
        纸质档案数字化的基本流程主要包括档案整理、目录建库、档案扫描、数据处理、数据存储、数据检验、数据挂接、数据备份等环节。
        4.1.1 档案整理
        对需要扫描的档案进行适当整理,做出标识。
        4.1.2 目录建库
        为数字化的档案检索而建立必要的目录数据库。
        4.1.3 档案扫描
        按照档案数字化具体任务的整体安排按计划分批次进行扫描。
        4.1.4 数据处理
        4.1.4.1 对扫描图像进行校对,确保图像完整无误,并视需要对有问题的扫描图像进行纠偏、去污、拼接等技术处理。
        4.1.4.2 对裸数据进行验收前的相应处理,包括文件的格式转换、逻辑分盘处理、添加说明性文件,以及数据的挂接、检验、上载、质量检查和备份。
        4.1.5 数据存储
        根据不同的扫描图像选择适当数据格式、编码方式和存储介质对信息进行保存。
        4.2 档案整理
        在批量扫描之前,按下述步骤对档案进行整理,视需要作出标识,确保档案数字化质量。
        4.2.1 分件
        4.2.1.1 把同一案卷中的扫描件和非扫描件分开,有正式文件的可以不扫描底稿,页面破损严重的档案,应先进行技术修复。
        4.2.1.2 在扫描件中将大图插入指示页,便于扫描工序批量扫描,进行图像扫描时,替换指示页。
        4.2.1.3 对需要特殊处理的页,标识清楚。
        4.2.2 编号
        对扫描前的档案进行页号、件号的标注。如在标注中与原档案中的件数、页号不一致,应以此为准。
        4.2.3 拆卷
        去除档案中原来的装订物,以便后续扫描工作的进行。
        4.2.4 装卷
        按档案保管要求恢复原装订,做到安全、准确、无遗漏。
        4.2.5 档案整理登记
        制作并填写数字化加工过程交接登记表。
        4.3 建目录库
        4.3.1 档案著录
        根据《大连市文书档案目录数据库交流标准》确定档案著录项,进行著录,建立档案目录数据库。
        4.3.2 数据格式选择
        所选定的数据格式应通用,能直接或间接通过XML文档进行数据交换。
        4.3.3 目录输入
        将著录好的目录输入计算机内,建立机读目录数据库。
        4.4 档案扫描
        4.4.1 扫描方式
        纸质档案扫描可采用黑白二值图像、灰度和彩色三种方式。
        4.4.1.1 字迹清晰、不带插图的档案,采用黑白模式扫描。
        4.4.1.2 页面为黑白两色,但字迹清晰度较差或带有插图的档案,以及页面为多色文字的档案,采用灰度模式扫描。
        4.4.1.3 页面中有红头、印章或插有黑白照片、彩色照片、彩色插图的档案,可视需要采用彩色模式扫描。
        4.4.2 分辨率选择
        4.4.2.1 单色页面档案文件,扫描分辨率建议不低于200dpi。
        4.4.2.2 彩色页面档案文件,扫描分辨率可选择200dpi以上参数值进行。
        4.4.2.3 大幅面档案文件,如工程图纸、报纸等尺寸超过A3的,可选用大幅面图像扫描仪(如AO)、大幅面数码平台、缩微照相后胶片数字转换,也可以采用小幅面扫描后的图像拼接。扫描分辨率应选择200dpi以上。
        4.4.2.4 需要时可根据原件的清晰度适当调整扫描分辨率。增减的多少以扫描后图像按原尺寸显示后是否清晰为准。
        4.4.3 文件夹命名方式
        文件夹命名方法,以档案实体的档号分级命名。
        4.5 数据处理
        4.5.1 图像处理
        4.5.1.1 纠偏
        对扫描过程中出现的偏斜图像进行纠偏处理,以达到视觉上基本不感觉偏斜为准。对方向不正确的图像应旋转还原,以符合阅读习惯。
        4.5.1.2 去污
        对影响图像质量的杂质,如黑点、黑线、黑框、黑边等进行去污处理,处理过程应遵循保证文件内容完整的原则。
        4.5.1.3 拼接
        对大幅面档案文件进行分区扫描后,应进行图像拼接处理,合并为一个完整的图像,以保证档案数字化图像的整体性。
        4.5.1.4 校对
        4.5.1.4.1 一次校对,检查扫描完的图像质量情况,对不合格的图像进行标记,退回重新扫描。
        4.5.1.4.2、纠错处理,根据一次校对中提出的消除污渍、黑边、偏斜等图像质量问题,对每份图像进行相应的处理。
        4.5.1.4.3 二次校对,对一次校对及数据处理后的数字图像再次进行检查,并标记图像处理过程中不清晰的页面。不合格的退回重新处理。
        4.6 数据存储
        数字信号的存储管理应保持原纸制档案的保管模式对应存储。
        4.6.1 压缩存储格式
黑白、灰度及彩色三种扫描方式的档案数字图像存储统一采用TIFF文件格式。
        4.7 数据检验
        4.7.1 对数据进行检验,给出合格或不合格结论。
        4.7.2 将数字加工后的数据转换为裸数据光盘格式,拷贝到活动硬盘上。
        4.7.3 系统应自动记录检验进度。
        4.7.4 数据质量检查
        4.7.4.1 文字录入质量
        对录入清单上所标明的各著录项的文字录入进行正确率控制;保证错误率低于3‰。
        4.7.4.2 图像质量
        对纸质文件扫描后形成的图像文件进行清晰度、污渍、黑边、偏斜等问题的控制,以达到要求的图像质量。
        保证扫描后的数字图像清晰,便于清楚阅读,适应各种纸张和手写、印刷字的情况。
        4.7.5 认真填写纸质档案数字化验收登记表。
        4.8 数据挂接
        4.8.1 档案条目数据与图像文件的对应准确程度的控制。
        4.8.2 档案数字化各工序的数据通过网络及时上载到数据服务器端汇总,其中数字信号自动搜索对应的目录数据,加入对应的电子地址数字图像文件名,建立起一一对应的关系。
        4.9 数据备份
        4.9.1 定期对服务器的各类数据进行备份,防止数据丢失。
        4.9.2 数据备份后应在相应的存储载体上做好标签,以便查找和管理。
        4.9.3 填写纸质档案数字化备份管理登记表。
        5、照片档案数字化基本要求
        5.1 技术要求
        5.1.1 前提条件:所有要进行数字化的档案必须先按《大连市照片档案目录数据格式与著录细则》进行著录,编制好页号。
        5.1.2 扫描方式:照片按彩色和灰度两种方式扫描。
        5.1.3 分辨率:所使用扫描仪的光学分辨率必须大于或等于300dpi。
        5.1.4 扫描办法:对于所扫的照片,以常见5寸照片大小(12.5cmX8.5cm)为参照,统一采用300dpi;对于其它太大或太小的照片,扫描线数可作相应的调整;对于一些涉及重要历史事件和人物的照片,其扫描精度可在以上基础上适当增加。
        5.1.5 文件存储类型:扫描后的照片以TIF格式存储,采用LZW压缩,存入一个统一的照片数据库。
        5.1.6 文件存储方式:档案照片存储时按全宗、保管期限、相册分级建文件夹保存,照片名字以照片号命名。
        5.1.7 文件夹命名办法:以照片档案的档号命名,全宗号5位,保管期限4位,册号3位,照片张号3位。资料照片名字由资料号、照片所在的页号、照片在该页的幅号组成。资料号7位,页号4位,幅号2位。
        5.2 扫描要求
        5.2.1 彩色照片采用彩色方式扫描,黑白照片采用灰度方式扫描。
        5.2.2 扫描仪有光学分辨率和差值分辨率两个常用技术参数,其中光学分辨率反映的是硬件系统确实可以达到的清晰程度,是扫描仪自身性能的反映,因此我们在本标准中以它来要求。
        5.2.3 扫描线数调整的具体方法为:比较要扫描照片与5寸照片大小的比例,假设待扫照片大小为5寸照片的N分之一,则扫描线数变为5寸照片的N倍,即Nx300dpi;相应的,假设待扫照片为5寸照片的N倍大小,则我们的扫描线数可相应变为5寸照片的N分之一,即300/N dpi。这样,我们可达到最佳的精度/容量比,便于保存和利用。
        6、录音档案数字化基本要求
        录音档案数字化必须保证录音档案的真实性、完整性、有效性。在使用时必须保证数字化数据能从存储载体中正确读取,并能还原成声音信号输出。要进行数字化的档案必须先按《大连市音像档案目录数据格式与著录细则》进行著录。
        6.1 硬件要求
        6.1.1 放音设备:放音设备必须能正确地将声音源输出。放音设备应根据原载体型号进行选择,如盒式录放机、开盘式放音机等等。
        6.1.2 计算机配置:应选用性能稳定配置较高的计算机作为数字化设备。
        6.1.3 存储设备:声音信号可存储在硬盘、磁带或光盘上,如有必要,应异地保存。
        6.1.4 声音卡:声音卡(声卡)是声音数字化和数字化声音转换为可听到的模拟信号的部件。声音卡必须符合录音档案数字化要求的技术指标和功能。
        6.1.4.1声音卡的采样频率至少应支持11.025kHz、22.05kHz、44.1kHz,最好支持48kHz。
        6.1.4.2 声音卡应能够支持多种声源输入,如CD Audio、MIDI、话筒、线性输入等。
        6.2 技术要求
        6.2.1 存储标准:声音档案数字化时要选用标准和通用的格式。本标准规定使用的声音文件存储标准为:WAV或MP3。
        6.2.2 采样频率:声音档案数字化选用44.1kHz作为声音采样标准。对于DVD中的声音选用48kHz。
        7、影像档案数字化基本要求
影像档案数字化必须保证其真实性、有效性、完整性。在使用时必须保证数字化数据能从存储介质中正确读取,并还原成影像信号输出。要进行数字化的档案必须先按《大连市音像档案目录数据格式与著录细则》进行著录。 
        7.1 硬件要求
        7.1.1 放像设备:放像设备必须能正确地将影像信息源输出。放像设备应根据原载体型号进行选择。
        7.1.2 计算机配置:应选用性能稳定配置较高的计算机作为数字化设备。
        7.1.3 存储设备:影像信号除存储在硬盘中随机使用外,应备份至磁带或光盘上脱机保存,如有必要,应异地保存。
        7.1.4 视频采集卡:视频采集卡分为广播级视频采集卡,专业级视频采集卡,民用级视频采集卡。
        7.1.5 压缩卡:压缩卡是影像档案数字化的关键部件。压缩卡必须符合影像档案数字化要求的技术指标和功能。压缩卡应支持采集MPEG1和MPEG2。压缩卡的码流最高值至少应为10MB。压缩卡应能够支持多种影像源输入。
        7.1.6 编辑机:本标准推荐使用非线性编辑机。
        7.2 技术要求
        7.2.1 存储标准:影像档案数字化选用MPEG2格式作为影像存储标准。
        7.2.2 数据传输率:影像档案数字化的数据传输率应不低于4Mb/S。

 
(文/小编)
免责声明
• 
本文为小编原创作品,作者: 小编。欢迎转载,转载请注明原文出处:http://www.dawindow.com/tech/201811/2117.html 。本文仅代表作者个人观点,本站未对其内容进行核实,请读者仅做参考,如若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,作者需自行承担相应责任。涉及到版权或其他问题,请及时联系我们kf@dawindow.com。
 

Copyright © 2018 档案之窗(dawindow.com)     深圳司捷科技有限公司    版权所有       粤ICP备18047471号-1