数字档案馆关键技术
数字档案馆建设是一项综合性强、技术应用复杂、建设周期长的系统工程,其中需要运用许多先进的计算机编程技术、网络技术、安全技术等。这里简要介绍几种关键技术。
1 XML技术
XML(Extensible Markup Language)叫做可扩展置标语言,在数字档案馆的数据管理中占有重要位置,用这种语言来组织管理数据,能够实现通用、开放、生命周期长等目标。
1. XML的基本概念
XML本身不是一个单纯的置标语言,它是一种元语言(meta-language),可以被用来定义任何一种新的置标语言。XML可以用来创造新类别文件的格式定义,也就是在XML之中能够创造出很多不同的置标语言,用来定义各种不同的文件类别。
2. XML的特点
简单易懂:XML 对人而言是非常清晰易懂的;计算机可以轻易对它进行处理。
开放对可延伸:XML 于目前几乎所有的软件、硬件都是开放的,并且是一种可扩展和延伸的语言,根据需要,可以建立新的置标。
内容与显示分离:XML 是用来描述内容而非描述外观。用XML语言来表示一个文件或一个网站,可以在不改变文件或网站内容的情况下来改变其外观。
可以内嵌多种类型信息:XML 文件可以包含从多媒体信息到各种数据库、程序文件等多种信息类型,这种特点对于接收多种类型归档电子文件至关重要。
3. XML技术在档案管理系统中的应用
可以解决数字档案浏览、阅读和存储对原有软件、硬件的依赖性,可以简化档案管理系统与其它应用系统接口的复杂性,可以保持归档电子文件保存格式的多样性,可以基本解决数字档案的真实、完整和长期可读等等。
2 数据仓库技术
数字档案管理系统本质上是一个数据库管理系统,数据仓库技术是数据库技术的发展,是一种智能化的数据库。
1.数据仓库的基本概念
数据仓库概念起源于20 世纪 80年代中期,是在系统管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。数据仓库没有成熟的基本模式,实际上是一种应用解决方案。
2.数据仓库的关键技术
数据的抽取:数据的抽取是数据进入仓库的入口,由于数据仓库是一个独立的数据环境,它需要通过抽取过程将数据从联机事物处理系统、外部数据源、脱机的数据存储介质中导入到数据仓库。数据抽取在技术上主要涉及互联、复制、增量、转换、调度和监控等方面。
数据的存储和管理:这是数据仓库的关键。数据仓库的组织管理方式决定了它有别于传统数据库,同时也决定了其对外部数据的表现形式。要决定采用什么产品和技术来建立数据仓库的核心,则需要从据仓库的技术特点着手分析。
数据的表现:数据表现实际上相当于数据仓库的门面,其性能主要集中在多维分析、数理统计和数据挖掘方面。
3.数据仓库的体系结构
为了能够将已有的数据源提取出来,并组织成可用于决策分析所需的综合数据的形式,一个数据仓库的基本体系结构有以下几个基本组成部分。
数据源:指为数据仓库提供最底层数据的运作数据库系统及外部数据。
监视器:负责感知数据源发生的变化,并按数据仓库的需求提取数据。
集成器:将从运作数据库中提取的数据经过转换、计算、综合等操作,集成到数据仓库中。
数据仓库:存储已经按档案管理要求转换的数据,供分析处理用。根据不同的分析要求,数据按不同的综合程度存储。数据仓库中还应存储元数据,其中记录了数据的结构和数据仓库的任何变化,以支持数据仓库的开发和使用。
应用:供用户对数据仓库中的数据进行访问查询,并以直观的方式表示分析结果的工具。
4.数据仓库在档案管理系统中的应用
数据仓库是一个设计思路、一个解决方案,而不是一个可以买到的产品。不同的档案管理系统会有不同的数据仓库。在许多情况下,档案管理人员往往不懂如何利用数据仓库,不能发挥其决策支持的作用,而计算机编程人员又对档案管理业务不是很熟悉,不知道建立哪些决策主题,从数据源中抽取哪些数据,因此,在具体应用数据仓库技术时需要计算机人员和档案管理专家互相沟通,共同协商开发数据仓库。
3 VPN技术
数字档案馆的投入和建设是由一个个独立的档案馆完成的,为了适应社会信息化对档案事业发展的要求,为了使数字档案资源能够社会共享,数字档案馆之间的互相联通是数字档案馆建设的一个发展方向。从安全角度来考虑,似乎应该为数字档案馆建设一个专用网,但是从现实出发,数字档案馆建专网既不可能,也没有必要。VPN技术可以解决数字档案馆的馆际互联问题。
1. VPN技术的基本概念
VPN又叫虚拟专用网,是一个被加密或封装通讯过程,该过程把数据安全地由一端传到另一端,数据的安全由可靠的加密技术来保障,而数据是在一个开放的、没有安全保障的、经过路由传送的网络上传输的。VPN是利用公众网来构建专用网络,其核心是被称为“隧道”的技术,它是通过特殊设计的硬件和软件直接通过共享的IP网所建立的隧道来完成的。
2. VPN技术的特点
费用低:和建设或者租用专用网相比,使用公众网的费用非常低,可以节省购买和维护通讯设备的费用。
安全性有保证: VPN通过使用点到点协议( PPP)用户身份验证的方法进行验证,并且采用微软点对点加密算法( MPPE)和网际协议安全(IPSec )机制对数据进行加密。对于敏感数据,还可以使用VPN 将服务器中的高度敏感数据进行物理隔离,只有内网上拥有相应权限的用户才能通过远程访问建立连接关系,而获取该敏感数据。
使用方便:使用时间、传输速度完全可以由使用者自己决定。