民国档案整理工作信息采集与处理
在中国第二历史档案馆(以下简称“二史馆” ) 5 年数字化工程的整理工作中,目录体系、组织模式、管理方法与工作信息共同构成与档案实体相对应的宏观的信息体系。在学术研究范围,整理工作使民国档案在实体上达到整齐划一,建立完整的“全宗—案卷” 目录体系,二者从工作对象的角度代表了民国档案整理工作已取得的成果;成熟的业务外包组织模式与高效的管理方法从工作本身对整理工作进行了分析;工作信息是记录整理工作本身的重要材料,对其的研究尚显薄弱。二史馆在实际的整理过程中,不断探索并形成了一套完整的工作信息之采集与处理方法。本文通过对整理工作中各项环节之信息采集与处理的过程阐述与分析效果,试对工作本身信息的加工处理进行探究,将其提取与归档的价值加以阐释。
一、信息采集与处理工作的概念及意义
民国档案的信息采集与处理是针对案卷实体整理加工过程及生成的各种数据进行筛选、记录,随后对记录的数据进行统计与分析,最终反馈于整理过程的一项综合性工作。高效的信息采集工作如实地记录了整理环节各处细节,通过查阅该信息可以了解整理工作的基本状态,对各种数据进行的分析处理为民国档案案卷级整理工作起到促进作用,为各类数据统计与工作总结提供便利。
二、工作信息与数据的采集
民国档案整理工作每一处细节都会形成相应的信息及数据,如调卷过程中产生的点卷记录、分卷过程的新旧档号对照、整理过程的特殊状况标注、编目过程的新旧标题对照、质检过程的差错率等,对其的采集不仅是对工作过程的详细记录,更为数据统计后反馈指导业务工作提供可靠参考,因此,有选择的、细致的数据采集利于数据统计的准确与全面。
(一) 点卷记录
二史馆馆藏丰富,档号存在各种特殊情况,一卷多宗、空缺跳号、改重要号、移交特藏、断头号等诸多因素往往导致档号范围与实体案卷数量并不相同,因此而开展的点卷工作是项目组在提调案卷之前必须进行的。点卷环节由全宗负责人牵头,外包公司工作人员逐卷清点,将有差别有疑问的情况在«点卷记录表» (见表1) 上标注明确,之后与库房保管员进行信息核对,双方对实体数量及对应情况确认无误后才可将档案调出。点卷记录不仅是调卷过程中必不可少的环节,生成的«点卷记录表» 更标注了案卷的走向及档号的历史变动,是实体档案保管与档号管理必不可少的信息。
(二) 新旧档号对照
二史馆馆藏档案档号来源众多、变更复杂,最原始的档号是由民国时期各立档单位编制,第二层是由新中国各档案接收单位编制,第三层是由二史馆接收后编制,第四层是在历次整理过程中因拆并卷、移交特藏、抽调重要号等工作不断变化而成。档号变动情况的记录,不仅明确地标识着每本档案的来源,而且通过对其的研究更可以了解民国档案整理工作甚至民国档案的工作历史。数字化前整理过程中大量的厚卷、杂卷得到精细拆分,多宗重新编制档号,空缺号码进行销除,整理工序完成后最终的编排流水档号使得大多数全宗案卷总数与调出时不同。因此,在拆并卷及顺号过程中对新旧档号的记录必不可少,其形成的记录将与保管处留存的历史档号变迁记录组成全新的民国档案案卷走向指南。新旧档号的对照情况反映在电子目录中(见表2)。
(三) 珍贵档案与特殊载体记录
民国档案在一定意义上具有文物性质,其本身已是重要保护对象,而其内有较多珍贵档案,诸如字画、手迹、钞票、邮票、勋章、照片等物件弥足珍贵,但在历次整理过程中并未全部发现并及时予以保护。案卷当中的非纸质载体、实物、影像资料等不同于普通文书的档案,以丰富多彩的形式向世人展示民国档案的内涵与魅力,对其的鉴别与标注是数字化整理工作的一大特色。对珍贵档案的处理关键在鉴定,相对于民国档案庞大的数量,仅具有极高文物特性与历史研究价值的档案才应被鉴定为珍贵档案,以手迹鉴定举例: 其一应注意档案内隐藏的领袖人物的手迹,其二为民国时期书法大家手迹,其三为国际著名人物手迹,其四择出各界著名人物手迹,由馆员按照鉴定标准来确定挑选出的物件是否应标注为珍贵档案。珍贵档案的详细记录为保护提供便利信息,其中有利于随卷保管的或无法拆分的珍贵档案,仍然跟随原卷进行保存,可拆分的或全卷为珍贵的档案,直接提交特藏库房进行保管。案卷内特殊载体的鉴别与标注相对简单,只要是档案内出现的非纸质载体,一一予以内容与载体形式的记录。珍贵档案与特殊载体记录落实在电子目录的备注栏内(见表3)。
(四) 质检环节错误情况记录
二史馆民国档案数字化整理工作的质检在内容上分为整理质检、编目质检、编页质检与数据质检,在形式上分为公司自检(一检)、项目组抽检(二检)、馆方终检(三检)。把对各环节内错误的记录反馈给工作人员,这是一种有效提高整理质量的手段,基本上每段质检在每个环节内都会找到错误,对出错点的记录与归纳为后期错情分析提供基础材料。错情记录点包括案卷标题、卷内文件排序、页码编制、重份档案处理、档案保护性处理、案卷备考表填写、案卷包装、档号变化、珍贵与特殊档案记录以及目录数据等方面出现的错误(见表4)。一检中记录的错误点会即时反馈给整理人员,二检与三检的错误记录会反馈给整理人员及上一级质检人员,使各人在其记忆期内将错点纠正,加深印象,有效地防止同类问题再次出现。
(五) 整理各环节时间点记录
整理各环节时间点记录是对整理过程大工序的起或止时间节点进行记录,通过其了解整体进度并据此安排后续工作。记录的时间点为每个全宗的调卷、整理、二检、三检开始时间,档案实体移交结束时间,时间精确到日,所有项目填齐后即视为该全宗整理工作的结束。对每个全宗的加工时间点的记录,主要作为参考数据来制订各层次的工作计划、统计数据、查询环节之用,亦可以间接地反映整理各环节耗时、难易度与相互间的衔接情况(见表5)。
三、工作信息与数据的分析
民国档案整理工作的信息分析是对在整理环节中记录的各种数据与材料进行统计与归纳,寻找出工作中的普遍规律及易出现的问题,反馈指导整理工作的一个项目。信息分析是信息采集工作的目的,其完成的各项信息反馈对整理工作具有一定的促进作用。
(一) 库房存储分析
二史馆馆藏档案主体保存在保管处库房内,拟加工档案存区在工作现场有临时档案柜与暂存库房,在保管库区配有周转库房。临时档案柜与暂存库房主要存储正在整理的档案与已调出的待整档案,周转库房主要存储已整理待扫描的档案。整理现场与周转库房库存有限,必须结合调卷、移交与具体整理进度对库存进行科学规划,使其达到“充而不实” “流而不塞” 的状态。在进口端,库管员通过对工作现场空柜的统计,结合扫描环节预调卷计划,计算出可调卷量,由此确定调卷计划;在出口端,结合空柜数量与实际整理进度,在柜容预满前首先联系扫描环节调卷,如其暂时无法调卷,则将一定数量案卷转移到周转库房,由此来保证整理工作的正常进行。
(二) 进度分析
进度分析主要是对整理环节每周的编页量、整卷量、一检量进行统计,通过计算各分类的已完成总量,进行相应的换算,以此来对整理工作各进度进行调控,保证整体进度正常开展。进度分析成果主要包含总体进度、整检差与日均编页量:
1 总体进度
是用每周更新的编页总量除以各项总量得出的百分比来代表。在二史馆的数字化整理工作中,有两项工作量标准,第一个是合同总量,按照与外包公司签订的合同规定,期限一般为1 年,基本是从本年中至次年中,其进度计算公式为:
合同进度=编页总量÷合同总编页量
第二个是年度绩效考核总量,因二史馆数字化工程是全额财政拨款,每个自然年要对工程的绩效进行考核,因此产生的年度总量以自然年为准,其进度计算公式为:
考核年度进度=编页总量÷考核年度总编页量
两套标准需要两套数据进行跟踪,在进度分析中,设有年度完成率与合同完成率两项,通过每周的产量统计,分别计算出年度与合同的完成率。然而,年度与合同在具体月份上是存在冲突的,因二者总量固定但合同期先行半年,导致下半年为完成年度总量工作偏紧,上半年因合同量所剩不多致使工作偏松,此时对工作人员、强度、协调等管理手段都要进行相应的调整,以适应不同阶段的工作(见表6)。
2 整检差
整检差是整卷总量与一检案卷总量的差,共计算分公式为:
整检差=整理总卷量-一检总卷量
其主要是对第一道质检的进度进行跟踪,由于一检率为100%,总量,大原始错误率高,所以特别对一检进行进度跟踪,通过对数值的分析来调整工作人员。在整理人员一定的条件下,整检差数值正增长时减少整卷人员、增加质检人员,负增长时反向调整,以保证质检与整理衔接有度,不使其出现较大空挡(见表7)。
3 日均编页量
即未来日均编页最低数量,其为两项总量的完成提供参考。考核年度日均量自合同期开始至自然年年底,公式为:
日均编页量=考核年度剩余编页量÷有效工作日
合同日均量自年初至合同截止日期,公式为:
日均编页量=合同剩余编页量÷有效工作日
两项日均编页量的计算并不冲突,是相互衔接的,其过渡阶段的计算尤为重要,需将两项标准之间的量清算明确。日均编页量的计算是整体工作进度分析最细致的材料,通过其与实际工作量的比对,可以以日为单位随时对编页量进行调整,而编页量的保证是整个整理工作总进度的保证(见表8)。
(三) 错情分析
错情分析是对整理环节中出现的各种错误的分析,其包含分卷错误、档号错误、编页错误、卷内文件次序错误、时间项错误与标题错误,前几者均是就事论事,及时解决,其中最重要的是标题的出错情况(见表9)。案卷标题是整理成果的重要结晶,其质量好坏在一定程度上代表着全部整理工作的质量。在实际工作中,标题出现的错误可以归结为“硬伤” 与“软伤”,“硬伤” 包括历史点、行文关系、政治性用语等基本概念性的错误以及录入错误,“软伤” 一般是表述、点题、概括等不够明确到位。每一道质检,工作人员都会对检出的错误进行及时的记录,通过对其分析,找出错误原因并归纳出易错范围,直接反馈给整理人及前道质检人,在其记忆有效期内对错误进行更正,从而加深印象,在较大程度上避免了同类问题的再次出现。对标题的错情分析,在“物” 上可以归纳出整全宗的特点与难点,在“人” 上可以了解整理人员当时的业务水平与工作状态,通过对二者的分析,可以在“法” 上看到现有整理规则存在的盲区及死角,通过“整理规则审定制度” 对相应规则进行补充及修改,使之更好地适应现有及未来的整理工作。
(四) 各种数据统计
在二史馆民国档案数字化过程中,许多环节需要整理环节的数据进行参考,馆方各种统计亦需整理方面的基础数据。
三检环节质检验收需要提供抽检的卷数与页数,档案馆对制成的三检目录进行统计,得出结果后交予质检验收组,每次提交三检的数字最终汇成年度绩效考核时的年度验收总量。
扫描环节提调已整案卷前,需要了解案卷的卷数、页数、排架长度以及破损程度,档案馆在电子目录上对卷量、页数、破损率进行计算,并在周转库房对待移交案卷排架长度进行估测,将数据报给扫描环节后,其空出相应的架位以供接收案卷。
二史馆新馆筹建时需要一项新旧案卷对比数据,档案馆将开展数字化以来近百个全宗的新卷数求和,旧卷数求和,计算出差及百分比提交筹建小组,其通过对此数据的分析,估算出未来整理后的案卷涨库量。
此类型的统计工作有许多,基本是为某个总结或计划进行特定数据的统计,其最基础的数据来源是全宗明细表(见表10),其内记录了每一全宗的代号、名称、总卷数、总页数、责任者等,在每个全宗结束之后由数据管理员对全宗数据进行采集与记录,随着工作的进展,数据不断丰富与全面,为各类统计工作提供有力的数据支持。
四、结语
二史馆整理环节运用工作信息的采集与处理方法,对馆藏百余个全宗的案卷级加工进行了辅助,其中经过摸索有过错误,在不断地否定与再否定之中前进,形成了整套适用于民国档案案卷级整理的信息处理方法,其经验与模式,或可应用于未来民国档案文件级整理工作当中,并在其中经受实践的考验,锤炼为适应更大量、更复杂的工作的科学方法。