馆藏广州地方民国档案文件级著录工作的体会和设想
近年来我馆开展了馆藏民国档案文件级著录工作,笔者有幸参与了文件级著录操作规范制定、著录实际工作的监督、指导和培训,就民国档案文件级著录谈一些体会和设想。
作为初涉民国档案编目的新兵,总体感觉就是一个字——难。
一是由于缺乏民国时期广州市政治、经济、教育、军事、地方社会文化等方面的历史背景知识,在加上民国时期广州市地方政权不够稳定,政府机构设置及其变化纷繁复杂,造成对馆藏民国档案各全宗立档单位的机构名称、设置、职能及其演变、对广州地方发生的重大事件、重要人物都不够熟悉;二是因为民国档案字体上均为繁体字,且异体字、行书、草书较多,且多为竖排文字,识读较为困难;三是民国时期时间跨度大,广州地方政府文书制度、办文程序不断变革,对整理编目中出现的新情况如何保证处理标准统一规范没有把握;四是馆藏民国档案中语言文白交迭、除了近代白话、文言,还有不少英文、德文、日语、俄文等语言文字,需要有多语言识读能力;五是公文体式种类繁多、非正式文种文件大量存在,与现代公文文种差别较大,很多用词用语还具有鲜明的广州地方特点,对题名、文种、主题的准确理解和著录提出了挑战。
一、民国档案文件级著录工作中的难点
(一) “件” 的划分问题
进行民国档案文件级著录中如何科学、合理准确的划分民国档案文件,成为著录碰到的第一个重大难点。在缺乏通用的民国档案分件具体标准的情况下,我们产生了两种对“件” 的划分的思路,第一种: 具有或根据文件页面的内容能判断出文件责任者、事由或主题、文件编号、发(收) 文者、正文、收文者、发文的时间、印章等全部或大部分文件结构特征的页面或页面的集合构成1 件文件,我们称之为“自然件”;第二种: 1 个或数个内容紧密关联的文书(包括其附属物) 在完成公文流转在立档时被立档人作为1 个基础保管单位而存档的档案,即为1 “件” 档案,我们暂称之为“逻辑件”。我们借鉴兄弟省市档案馆民国档案整理分件的部分操作原则,参考«归档文件整理规则» 中对“件” 的定义,确定了以“逻辑件” 作为广州市档案馆文件级著录分件的标准: 即以事由结合责任者为划分档案文件的主要标准。
在分件的具体操作中,由公务文书的正式文种转化形成的馆藏民国档案文件因为具有相对固定和完整的构成要素,分件相对容易;但对于大量成套出现的专用表册,如户籍卡、担保书、合同、学籍册、各类统计表、登记表、履历表等,在逻辑上定为一件的划分方法实际是文件的组合,存在“件” 的划分上往往会因为分件过粗而产生著录深度不够、检索查全率和查准率降低的问题。如“广州市黄沙区民国二十五年人口迁入/ 迁出申请表”,其中该文件就有60 页,但按照逻辑件的分件标准只算为一件,但实际上每页为独立的一张申请表,上面记载了申请迁入或迁出的人员姓名、担保人姓名、家庭住址、申请内容等信息,每一页的文件信息实际上构成一个自然件,但逻辑件的分件使得著录无法揭示这些档案内容信息。
(二) 著录项的确定问题
依据«档案著录规则» (DA/ T 18—1999),档案文件级著录项为层级式著录,一般通用的文件级目录著录项共分7 大项,21 个小项,«民国档案目录中心数据采集标准民国档案著录细则» (DA/ T 20 1—1999) 则规定,民国档案文件级著录项必录项共分5 大项,9 小项,加上全宗号、目录号、案卷号、件号、起至页号、档号等通用必录项,合计应录5 大项,15 小项,完全著录则为7 大项,19 小项。
广州市档案馆开展民国档案文件级著录是依据«档案著录规则» (DA/ T18—1999) 和«民国档案目录中心数据采集标准民国档案著录细则» (DA/ T20 1—1999) 的基础上,使用平行著录项,以“最小必要性” 为原则,选择了全宗号、目录号、案卷号、件号、起至页号、档号、题名、附件题名、责任者、文件形成时间、保管期限、密级、控制标识、政权标识、关键词、附注16 个著录项,作为我馆民国档案的必录项。舍弃了文件编号、稿本、文种、语种、载体类型、载体形态、提要、分类号、缩微号、档案馆代码等著录项。这16 个著录项能够基本反映对应档案文件的内容和形式特征,基本满足当前方式下的档案查阅利用需要。对分类号、提要、主题词等内容特征检索项的舍弃,减少了分类和主题标引工作,大大降低了著录工作难度和工作量,有助于提高文件级目录著录工作进度,但削弱了目录的内容检索深度,在未来实际工作中,这样的选择,利用效果有待检验。
著录项的舍弃、增加、完善是一项极其关键和复杂的工作,是目录建库的首要问题,要综合考虑档案类型、档案内容和形式特征、元数据、整理基础、著录软件功能配置、著录项规范性、可操作性、数据互联和共享要求等,需要在不断的实践中完善和扩展,以提高对档案描述的全面性、准确性。
(三) 著录项的规范性问题
在确定著录项的基础上,在编目外包项目实施过程中,外包公司员工面对具体和纷繁复杂的具体民国档案文件,在理解和执行分件、编目著录规则的过程中,各著录项存在诸多不够规范的问题,有些问题反复出现,困难较多,对一些复杂情况的不规范著录处理仍留有不少遗憾。特别是题名、文件形成时间、关键词、责任者、政权标识等项是著录的核心内容,在著录过程中发现存在不少问题,归纳概括起来为:
1 题名项
题名照录事由;题名有语病;题名冗长;题名不能确切反映档案内容;文种、责任者错漏;抽象代指词语未替换和明确;未使用标准规范简化字;对干支代月,韵目代日没有进行换算的照录。
2 文件形成时间项
文件形成时间判断错误;录入错误;农历、伪满、日本等年号未转换;考证时间未加“ [ ] ”;等等。
3 责任者项
机构责任者全称或简称混用著录,不统一;个人责任者未著录职务,著名人物责任者使用别名、笔名、字、号署名时为标注其真实姓名或常用名;考证责任者未加“ [ ] ”;等等。
4 关键词项
关键词无检索意义;关键词过长;关键词错漏;关键词的非叙词问题。
5 政权标识项
文件的日伪属性判断依据不足;文件的日伪属性判断错误;文件的日伪属性判断遗漏。
针对上述问题,广州市档案馆制定了著录项操作规范,对每一项的著录进行了具体的规定,结合著录实例,编写了操作手册和案例集,对外包公司员工进行了持续的培训和指导,并通过例行质检,发现和及时解决了一些著录项规范性的问题,尽最大可能提高各著录项的著录质量。
二、对民国档案著录工作的设想
(一) 制定民国档案整理规则的行业标准
通过参与馆藏民国档案著录工作,笔者深刻感受到,文件级档案著录,“件” 的划分是著录工作难易和工作量高低的关键决定因素。而“件” 的划分和排列实质是档案整理问题,即保持文件的完整性和文件之间的历史联系,历史研究界对民国档案内容有深入系统的研究,但从档案学角度对民国档案整理技术和方法的研究却比较少见,有关民国档案整理的论文大多也只是论述民国档案整理的某一方面问题,系统、全面规定民国档案整理方法、步骤、操作规则的标准迟迟未能出台。对民国档案整理规则的制定和研究,各档案馆基本上处于封闭和各自为战的状态,水平参差不齐。因为缺少统一和通用的民国档案整理标准,各档案馆制定的整理规则差别非常大,对同一情况的处理方法各不相同,编目成果兼容性较差,交换和共享数据困难;规则起草和制定代价大,试错成本高,在开展民国档案整理工作时往往事倍功半,整理质量也无法得到切实保障。如果能够制定用于指导和规范全国各级档案馆民国档案整理的行业标准,则能大大推动民国档案整理工作标准化。
(二) 修订民国档案著录相关配套规则
笔者通过学习«档号编制规则» «档案著录规则» 和«民国档案目录中心数据采集标准民国档案著录细则» (以下简称“ «两个著录规则» ” ) 等,对比实际著录工作,发现这些标准均存在严重滞后于工作实际需要的问题,主要是:
1 著录成果都是段落式条目和表格式条目,输出的条目卡片连续排列形成卡片式目录,在著录用标识符、著录项组合的表现形式等诸多规定大多无法直接使用于当今的计算机软硬件环境下开展的民国档案著录工作;而现在计算机著录工作方式和环境与过去相比发生了巨大变化,著录结果是条式条目,输出的条式条目按序排列组成簿式目录,电子形态则为数据库,新的著录成果形态没有统一规定。
2 只有对条目著录的规定,没有对目录组织方法的规定;而现在档案编目软件一般自带目录组织功能,而且功能并不一致,迫切需要统一规定。
3 对全宗号、目录号、案卷号、宗号、件号、档号等著录项的著录只能依据«档号编制规则» 的一般性规定,缺乏适用于民国档案文件级著录的详细规定。
4 都是本馆条件下利用,未考虑目录数据的共建共享和互联互通;而现在对数据格式兼容性、数据项标准化、数据跨时空共建共享和互联互通等方面有了强烈要求。
5 在部分款目的具体规定上,«两个著录规则» 对文件形成时间项的著录要求有明显的不一致,如«档案著录规则» “9 4 5 文件时间不完整或部分时间字迹不清时,仍著录原时间,原时间中缺少或字迹不清部分以‘□’ 补之,……” “9 4 7 文件形成时间考证不出时著录为‘□□□□□□□’……”;而«民国档案目录中心数据采集标准民国档案著录细则» “9 3 2 时间项用8 位阿拉伯数字表示……,原文无法确定的时间补‘0’ ”。给统一著录造成困惑。
«档号编制规则» «民国档案著录细则» «民国档案分类标引细则» «民国档案主题标引细则» 等配套组成民国档案著录工作的必备标准,如果能够在修订时统筹考虑,系统修订完善,方能适应当下和未来网络化环境下的民国档案编目著录工作,服务新时期各档案馆馆藏民国档案深度编研开发和查阅利用的需要。
(三) 推进民国档案分类标引和主题标引自动化工作
分类标引和主题标引是著录的关键工作,直接决定了内容揭示类核心著录项的著录质量,在过去传统人工著录方式下是最耗费时间和考验著录工作人员水平的工作,往往因为要求较高而效率较低,质量也无法有效控制,不少档案馆甚至被迫舍弃分类标引和主题标引工作。在现代计算机软硬件环境下,如果对分类号、主题词的标引依据«民国档案主题标引细则» 和«民国档案分类标引细则» 的内容进行修订完善和软件化改造,使两个细则的内容分类和主题标引工作能够在著录软件中根据题名、事由、责任者、全文内容自动提取主题词和分类号,辅以人工选择和审核。图书编目著录中以人机结合开展自动化的图书分类号和主题词标引工作,经验成熟,值得借鉴。
(四) 成立民国档案目录编制机构,建设全国档案馆民国档案联机编目检索系统,建立档案编目员培训和评价机制
参考国家统计局对企业一套表全国联网直报信息采集和图书联机编目的思路,笔者设想,建立全国性民国档案联机编目中心和各省级区域分中心,建设全国性档案馆馆藏民国档案目录数据库和检索系统。目录数据库按照统一规划、统一标准,配发统一的网络化编目软件或建设网上编目统一平台;各类型档案馆加入成为联机编目中心的成员馆,共享技术、平台、标准和目录资源,成员馆联机原始编目可以得到联机编目机构的标准、规则等方面的技术、业务支持;成员馆的编目数据实时上传到数据库平台,质量接受联机编目机构的评估,编目质量评价结果作为档案馆业务评价的核心指标之一,影响档案馆民国档案整理编目经费划拨、人员配置等。档案编目是一项极为专业的工作,必须接受专业的培训教育。民国档案联机编目各中心可依托编目机构的专业人员力量强大、标准规则研发能力突出等优势,持续开展档案编目员培训和成员馆编目水平评价工作,促进编目员自身业务水平不断提高和成员馆档案编目工作质量稳步改进,最终建成全国民国开放档案目录信息网及其检索系统,为社会提供便捷、统一的档案目录查阅服务。