探索档案著录新理念 推动档案工作新发展——有感国务院印发«促进大数据发展行动纲要»
党中央国务院高度重视大数据发展与应用,于2015 年9 月印发了«促进大数据发展行动纲要» (以下简称«纲要» ),这是指导未来我国大数据发展的纲领性文件。大数据时代,“数据驱动” “数据创新” 已成为全球发展的新态势,大数据正日益对全球经济运行机制、社会生活方式和国家治理能力产生重要的影响,数据已成为国家重要的战略基础性资源。«纲要» 明确提出,加快政府信息平台整合,建立标准体系规范,推动数据共享应用,消除数据信息孤岛,助力社会治理创新,提升政府治理能力。这是推进我国大数据发展的指导战略性文件,是对我国大数据发展的国家顶层设计和统筹布局。
«纲要» 的颁布,体现了我国信息化发展的重点已从前期分散化的网络和应用系统建设,回归和聚焦到充分发挥数据资源的核心价值。档案作为人类社会实践活动的原生性数据资源,对于促进经济文化建设和提高国家软实力具有不可替代的重要作用。«纲要» 的颁布,为深化与提升档案信息化建设水平提供了行动指南。目前,档案信息化建设进入攻坚期,馆藏数字化档案已经初具规模,由于著录标准体系的滞后发展,造成著录缺乏规范性和一致性,使得各地档案馆的网上档案资源无法进行有效融合与开发共享,导致“数据鸿沟” 和“数据孤岛” 的产生。
面对档案信息化建设新问题和新挑战,档案工作者应切实贯彻«纲要»的精神,紧紧抓住战略机遇期,认真学习习总书记的重要讲话,按照“借鉴国外,面向未来,立足特色” 的要求,以新发展理念为引领,凝心聚力,破难题,补短板,开展新环境下档案著录标准体系的研究与制定,解决数字化档案著录标准滞后的问题,打造档案数据发展的创新体系,着力推进档案信息共享与融合,发挥档案数据在国家核心竞争力中基础性、战略性、先导性的突出作用,开创“用数据说话、用数据决策、用数据管理” 的新局面,为推动大数据时代档案工作新发展做出应有的贡献。
一、借鉴国外 研究国际档案著录标准体系
国际档案著录标准体系是国际档案领域最前沿研究成果的概括和反映,是档案学家和学者长期理论探索和深入实践的经验总结。国际档案著录标准体系对档案著录的理解具有时代气息,紧密融合技术发展,从整个标准体系到各项子标准,都体现着科学性、理论性、前瞻性和应用性等特点。
从著录内容控制来看,国际著录标准主要有4 个标准: «国际标准———档案著录规则(总则) » [ISAD (G) ],用于规范档案全宗、类别、案卷和文件等的著录;«国际标准———团体、个人和家族档案规范记录著录规则» [ISAAR(CPF) ],用于规范档案形成者的著录;«国际标准———职能著录规则» (ISDF),用于规范档案保管机构的著录;«国际标准———档案保管机构著录规则» (ISDIAH),用于规范档案形成者职能的著录。其中,«国际标准———档案著录规则(总则) » 是为编制档案条目而提供的总则性指南,可与现有的各国档案著录规则结合使用,并可引领其他国际档案著录标准的制定,从而形成国际档案著录标准体系的核心与基础。因此,该国际标准的著录原则已成为当今国际上被应用最广的国际标准,其采标率达92%。
从著录数据的规范化形式描述来看,现有3 个档案置标的标准已成为实践中的国际著录标准: «档案置标著录» (EAD),用于解决档案著录信息«国际标准———档案著录规则(总则) » [ISAD (G) ] 著录条目的机读格式问题;«档案背景置标著录» (EAC),用于解决档案形成者著录信息[ISAAR(CPF) ] 著录条目的机读格式问题;«档案保管机构指南置标著录»(EAG),用于解决档案保管机构著录信息(ISDIAH) 著录条目的机读格式问题。此外,还有两个是各类信息资源通用的标准: «机读目录» (MARC),用于解决档案信息与其他信息资源交换格式问题;«元数据置标和交换标准»(METS),用于解决跨语言数据交换格式等问题。
其中,«档案置标著录» (EAD) 是基于«国际标准———档案著录规则(总则) » 之上建立的档案著录交流标准,具有著录档案资源、提供背景信息、提高检索效率、维护信息安全、促进资源共享的功能。它是通过统一结构和语义来描述档案特征信息,使这些信息能以与平台无关的方式被查询、检索、显示和交换,从而为数字档案信息资源的无障碍交流与共享提供了基础性保障。EAD 很好实现了«国际标准———档案著录规则(总则) » 中提出的来源原则、尊重全宗和分级著录的要求。同时,在保持档案来源联系的前提下,深入地揭示档案信息资源,实现电子档案著录的目的。因此,EAD 受到了国际档案界的广泛重视与认可,对中文电子档案著录工作标准化也有借鉴指导意义,具有在世界范围的档案保管机构普及应用的趋势。
总之,国际档案著录标准体系是一个逻辑结构合理、层次清晰和功能齐全的规范系统。它不但充分考虑了时代发展和技术进步等因素,而且前瞻性地将档案信息共享和知识服务充分体现于标准中。因此,深入研究和借鉴国际档案著录标准体系,不仅是我国档案著录工作实践的迫切要求,也是推进我国档案著录标准体系建设的理论保证。
二、面向未来 构建我国档案著录标准体系
在网络发展越来越快的今天,文字数码化、档案图像化、网络利用化,使得档案著录观念在新环境下发生了根本性变化。数字环境下不仅要满足数字信息的检索需求,而且要满足其凭证价值的证明需求;不仅要满足其表层形式特征描述的需求,而且要满足其深层内容信息智能控制的需求。但我国于1999 年颁布的«档案著录规则»,无论从著录概念、著录项目的设置以及著录内容的规范,都难以满足档案著录的新要求。
一是档案著录概念落后狭隘。1999 年颁布的中国档案著录标准中,“著录” 仅指“在编制著录档案目录时,对档案的内容和形式进行分析、选择和记录的过程”,其范围只限于传统纸质文件。在国际档案著录标准对著录的定义是: 通过捕获、核对、分析、组织有助于确认档案以及说明其上下文和产生该档案的文件系统的各种信息。两者比较,现代档案著录概念突破了传统档案著录囿于“档案编目” 的范围,已经扩大成为对各种档案信息资源的一种全方位、立体化的智力控制。
二是著录条目设置不科学。我国档案著录标准分为7 大项、22 小项。22个小项都是仅从档案本身的内容和形式特征出发。而国际档案著录标准分为7大项、26 小项。不仅包括了档案本身内容和形式特征,还涵盖了档案来源、保管情况、利用条件、关联档案信息和著录控制等信息。两者相比,国际档案著录标准比我国档案著录标准更具有前瞻性,著录项目设置更科学,适应了包括电子档案在内的档案著录,满足了网络环境下档案的真实性、完整性和凭证性的要求。
三是多级著录的体现不够。我国的档案著录规则不能很好地体现尊重全宗原则,缺少全宗著录级别,只包含案卷与文件级别的著录,用户难以判断著录对象与其潜在信息的关联性。这种著录几乎相当于图书馆界所采用的书目著录方式。而在国际档案著录标准规定中,很好地体现了尊重全宗原则,著录首先从全宗开始,由全宗逐级向下著录到类别,然后再由类别著录至案卷、文件。这种多级著录原则,很好地解决了通过一次检索就能获得从文件到全宗的相关档案信息,满足了利用者多角度的需求。
四是配套标准不健全不完善。现代档案著录标准体系建设是一个多维的系统工程,需要不断完善,不可能一蹴而就。我国档案著录标准虽然颁布了一个通用性档案著录标准,但随后并没有形成全面、科学的档案著录体系。而«国际标准———档案著录规则(总则) » 制定完成之后,国际档案理事会档案著录委员会又随后制定颁布了«国际标准———团体、个人与家族档案规范记录著录规则» «职能著录国际标准» «档案保管机构著录国际标准» 等与其相配套,使著录档案的内容更为详尽规范,更为系统科学,便于档案检索和信息共享。
五是与电子文件著录兼容困难。在我国现行«档案著录规则» 中表达电子档案结构的著录项目太少,只有载体类型标识、数量及单位、规格3 个著录单元,缺少对产生电子档案信息系统著录的要求,不能保证电子档案真实性、可靠性和凭证性的要求。而«国际档案著录规则»,既能满足档案馆内部传统文件著录,又能满足新环境下电子文件著录的要求。因而,«国际档案著录规则» 已成为国际上各个国家制定本国档案著录标准的基石。
鉴于我国档案著录标准的滞后性,我们有必要借鉴和采纳国际档案著录标准,在档案信息共享大环境和长远发展目标下,思考档案著录标准体系框架,加快修订和完善我国«档案著录规则»,吸纳国际公认的档案多级著录理念。同时,将档案著录标准作为一个系统来对待,以«档案著录规则» 新版本为基础,完善相应的明细规则和相关配套标准,系统化建构我国新环境下档案著录标准体系,实现大数据时代档案著录工作的科学化、标准化和规范化,为档案信息的共建共享提供重要的保证。
三、立足特色 做好民国档案文件级著录工作
档案著录工作是档案信息化建设的一项重要内容,是目录数据库建设的重要基础。文件级目录数据库是较案卷级目录数据库更全面、客观、直接地映射馆藏档案内容的一种信息组织形式。档案具有承载历史,知古鉴今,昭示未来的作用。随着馆藏数字化进程的不断加快,适时开展数字档案的文件级著录工作无疑具有重要意义。
(一) 正确认识文件级著录工作
1 推动档案信息的共建共享
民国档案是一种不可再生的原生性信息资源,形成于民国时期各个中央政权及其直属机构,涉及政治、军事、经济、文化及社会各方面,具有正听、纠误、存真和资政的作用,是连接过去、现在和未来的使者和桥梁。开展民国档案文件级著录,对于深入挖掘民国档案信息资源,贯彻«纲要» 的核心内涵,推动档案信息资源共建共享具有重要意义。
2 应以坚持客观著录为原则
长期以来,民国档案经过几代档案工作者的辛勤劳动,划分了全宗,组成了案卷,基本做到了“有矩可循,有目可查”。由于案卷级目录缺乏专指性和直接性,而文件级目录具有直接揭示和客观描述,两者之间形成了鲜明的反差。随着档案数字化不断加快,开展民国档案文件级著录已提到重要议事日程。对于民国档案文件级著录规则的制定,我们应以遵循客观著录为原则,以简便实用为主,易于掌握为宜,达到一线著录人员正确领会和方便使用的目的。
3 实施档案智力控制的过程
档案著录的目标是为了确认和说明档案的背景、内容和结构信息,以便促进档案的检索和理解。同时保障档案的真实性、可靠性、完整性和可用性。因此,我们要从维护档案历史面貌出发,立足特色,做好民国档案文件级的著录工作。通过科学设置著录项目和规范著录内容,实现利用者在未阅读档案原文的情况下,就可快速筛选与快速识别,从而做出“需要” 或“不需要” 的判断,提高档案信息快速查找、检索和利用的效果。
(二) 题名是著录工作中的核心
1 题名是档案著录工作的重要内容
文件题名是数据检索的关键,也是著录工作的重点和难点,其著录质量关系着数据检索能力的高低。因此,档案工作者应本着科学性、规范性和一致性原则,客观著录档案内容,不加褒贬,直述其事。
2 题名是建立档案检索系统的前提
检索系统要有效地发挥存储和检索功能,必须依赖于题名著录的完备性以及揭示档案内容的深度和确切程度。因此,题名著录准确对于提高档案信息的检索能力至关重要。
3 题名是提供文件查找途径的依据
题名是档案内容的概括和客观反映,是揭示档案信息的重要手段。计算机通过题名关键词检索,可以找到包含这个词语的所有档案。题名著录中的任何纰漏、不当都会影响检索系统的质量,影响检索效率。
(三) 文件题名著录的规范控制
题名著录离不开责任者、受文者、事由、地名、时间和文种六要素。为了避免或减少误检和漏检的情况,在题名中每个要素不仅须准确、唯一地表征所反映的事物或事件,而且在很大程度上取决于题名要素著录的规范控制。因此,题名数据采集著录应遵循客观、精准、一致的原则,最大限度地体现档案内容的历史性、人文性和地域性。
1 对责任者著录的规范要求
责任者是文件的作者,是指对文件内容进行创造、负有责任的团体或个人。机关团体责任者必须用全称或规范的简称。在同一个全宗,责任者不可以简称与全称同时混用。
个人责任者,对于档案内容中,个人姓名前的背景信息,如地区、机构、官职等,应如实抄录,以便使题名最大限度地反映文件内容的特征,提升文件的历史价值。
如果原文中只有个人责任者的姓名,应尽可能在姓名后著录对文件负有责任的职务,并加“ () ”。例如: 陈仪(福建省政府主席)。
原文只有个人责任者的姓和职务,除抄录原文外,如能考证出来,应著录考证出的姓名,并加“ 〔〕”。例如: 国防部何部长,考证得出: 〔何应钦〕,即“国防部何〔何应钦〕部长”。
原文只有个人责任者的字、号、别名、笔名时,除照录原文外,如能确定其真实姓名或常用名,可附后并加“ () ”。例如: 胡展堂(胡汉民);周树人(鲁迅)。
外国责任者应依次著录民国时期外国国家的简称、统一的中国译名、外文原文及所担任的职务。国家名简称、姓名原文、所担任的职务均加“ () ”。例如: (美) 陈纳德(Claire Lee Chennault)。
2 受文者著录的规范要求
目前,全要素著录已经成为国内外档案界的普遍共识。任何公文的来往,都有责任者和受文者,受文者不能刻意省略,应如实著录。责任者与受文者的著录能够表明文件的运行轨迹,是对新环境下档案的真实性、可靠性、完整性的直接反映。受文者与责任者著录规范要求相同,必须准确,须用全称或规范的通用简称,不能用“本市” “该局” “本人” 等替代。
例如: 临时大总统孙文为各部局明确事权致外交部总长王宠惠电
对于没有正文的法令、报表、计划、统计表等,直接抄录原文标题。
例如: 国民政府组织法
3 对文种要求
民国时期公文种类有“训令” “指令” “咨” “呈” “函” “代电” 等。文种名称反映了文件作者与受文者的关系,它能够准确反映文件的行文关系、重要程度和发文范围,体现了文件的性质和价值。在文件题名著录时,文种不能省略,应该保留它的原貌。
4 对时间著录的规范要求
在时间项的著录中,文件年代一律采用公元纪年。但是,在题名中应保留民国纪年的时代特征,体现民国特色。档案原件中民国纪年应如实抄录。如“民国五年公债”,又如“民国二十九年财政部工作报告”。
题名中的旧历如实抄录,这也在清代档案中得到印证,如«光绪二十八年宙字密码电报册»。
当然这样的写法也非常流行,即将题名中的民国纪年改成公元纪年,如财政部一九四〇年工作报告(1940 年);
又如: 原文中“中华民国三十三年一月份各战(省) 区军粮检讨报告书”,写成“一九四四年一月份各战(省) 区军粮检讨报告书”。
由此,引出一个问题: 标题中的时间是否一定要把民国纪年改成公元纪年,值得商榷。目前的“民国档案著录细则” 只是规定时间项中用公元纪年,但并没有对题名中时间要素进行规定。
5 对事由著录的规范要求
文件题名中的“事由” 部分,是对档案内容的提炼与归纳,是文件题名的主体部分。
“事由” 部分的揭示要确切、恰当、清楚,使人一目了然,有助用户弄清文件的内容是否是自己要找的文件。
民国时期公文有上行文、平行文和下行文,公文类档案没有标题,但公文类文件有案由和摘由,我们虽不能将其直接作为题名,但可以作为拟写题名事由部分的参考。
责任者与事由常用的连词,经归纳起来,有“关于” “为” “因” “就”“对(对于) ” “据” “奉” “准予” “核准” 等。
例如1: 军政部第二纺织厂上尉特务队长王怀祺对于蒋介石所著«中国之命运» 研读的意见
例如2: 军政部第二纺织厂为请购眷属实物给军需署的呈文
例如3: 军政部军需署奉令取缔国军官兵穿着日军服装给第二纺织厂的代电
例如4: 军政部准予按照编制官佐配发夏服给第二纺织厂的代电
例如5: 军政部军需署关于报缴废品服装以资利用给第二纺织厂的代电
6 对地名著录的规范要求
对地名的著录应照录文件中原地名,民国时期的地名不应与现今地名相换,如“直隶” 不能写成“河北”,“奉天” 不能写成“辽宁”。市、县、区前应加省名,以便完整地揭示文件所反映的地域性。
例如1: 山东省临清、平原、朝城、金乡、文登、鱼台县煤商调查表
例如2: 原文“军事委员会外事局大溪别墅三号”,应写为“军事委员会外事局重庆大溪别墅三号” (增加“重庆” 地名,意义更完整)
7 对附件著录的规范要求
随同文件正文发出的附加文件称为“附件”。一般来说,正文与附件为一件。其中,转发文与被转发文,被转发文是附件;来电与复电,来电是附件;请示与批复,请示是附件。附件如果在题名中未能反映出来的,有必要说明并标注其文件名称。其标注方法,目前在行业内有三种标注形式:
(1) 附件题名紧接文件题名之后,其前加“+” 号。
例如1: 军事委员会关于修正重庆防毒办法给重庆防空司令部的训令+办法
(这种方法是著录细则规定的,但在现行文书档案已经不太使用,原因是不利于目录的组织,编排打印不美观,附件名称有时简写,无法检索。)
(2) 如果附件主题与正文不同。可在正式标题之后,直接抄录附件标题并加“ () ” 表示。
例如: 军政部第五被服厂关于加拨军粮军盐给军政部的呈文(附军政部第五被服厂现有人数统计表)
(3) 如果附件主题与正文相同,可将附件作为题名的主体部分写,正文作为题名的次要部分写(即变通法)。
例如: 军事委员会关于修正重庆防毒办法给重庆防空司令部的训令(附重庆防毒办法)
也可写成: 军事委员修正重庆防毒办法及训令
(4) 一份主件对应附件在二个以上,应视为多件对待,应另行分别著录条目,使之成为具有独立检索意义的著录条目,但应在附注中加以说明,以突出主件与附件的对应关系。这样既有利于附件的内容能够全部被检索,又体现了文件之间的相互关系,维护档案内容的真实性。
例如: 军政部汽油厂为建造第二动力室追加预算给军政部的呈文(正文部分),其中附件有4 份,可另行分别著录条目。即:
军政部汽油厂建筑工程施工细则
军政部汽油厂建造第二动力室工程支付预算书
军政部汽油厂第二动力室建筑图纸
军政部汽油厂第二动力室工程合同
8 题名中不能用“等” 字的规范要求
(1) 如果档案记述了有多个(3 个以上) 机构名、多个(3 个以上) 人名、多个(3 个以上) 地名,应如实客观著录,不可以用“等” 加以省略,在字数允许围绕内按主次顺序尽量书写。
例如1: 实业部地质调查所职员王日伦、熊永先、吴希曾、王晓青、徐瑞麟的保证书
不能写成: 实业部地质调查所王日伦、熊永先、吴希曾等职员的保证书;
也不能写成: 实业部地质调查所职员王日伦、熊永先、吴希曾等五人的保证书。
例如2: 察哈尔特别区商都、凉城、丰镇、多伦、兴和、沽源县警界出力人员履历表
(2) 如果案卷内有上百人的人事履历表,可将其平均分配,以5~8 人为一组,将人名一一列举抄录。
9 附注项著录的要求
对著录档案中需要解释和补充的事项。
10 提要项著录的要求
主要针对会议记录、工作报告、工作计划、统计表、书刊等中内容的深度揭示以及其他相关重要数据(包括技术参数等) 的说明。
综上所述,文件题名规范控制是档案著录工作的重要内容,是实现档案信息检索与档案信息开发的重要保证。它对于著录系统的检索质量有着重要的影响。为此,我们要站在“对历史负责,为现实服务,替未来着想” 的高度,增强做好档案著录工作的责任感和使命感,不忘初心,精耕细作。目前,二史馆正在起草民国档案文件级著录规则,借此,我诚恳希望与会专家和同人,畅所欲言,相互交流,为做好民国档案文件级著录标准化工作而共同努力!