档案之窗

扫一扫关注

当前位置: 首页 » 技术 » 档案管理 » 综合管理 » 正文

信息的分类与度量

放大字体  缩小字体 发布日期:2018-08-03 09:43:09    浏览次数:81    评论:0
导读

信息的分类与度量1 信息的分类信息普遍存在并作用于自然界、人类社会和思维领域, 其表现形式是多种多样的, 我们可以根据不同的标准对信息作出不同的分类。(1 ) 社会信息与非社会信息根据信息的实质内容和产生基础, 信息可以分为社会信息和非社会信息。社会信息是指人类传递和交流的信息, 包括一切由人创造的具有广义社会价

 信息的分类与度量

1 信息的分类

信息普遍存在并作用于自然界、人类社会和思维领域, 其表现形式是多种多样的, 我们可以根据不同的标准对信息作出不同的分类。

(1 ) 社会信息与非社会信息

根据信息的实质内容和产生基础, 信息可以分为社会信息和非社会信息。社会信息是指人类传递和交流的信息, 包括一切由人创造的具有广义社会价值的文化形态和观念。非社会信息是指生物信息( 如遗传信息) 和自然信息(如天体信息)。其中, 生物信息是指生物遗传密码的传递、复制、转录、转译过程以及生物之间的通讯联系。而自然信息则是指以自然界中的事物相互作用为信源发放出来的信息。例如, 地震是地球内部巨大能量的释放, 这种能量在地震到来之前会发出多种信息。

(2 ) 客观信息、人工信息与主观信息

根据信息的地位和作用, 信息可分为客观信息、人工信息与主观信息。所谓客观信息即是指表现物质特征的信息; 而主观信息则指的是表现精神属性的信息。客观信息是主观信息的对象和内容,主观信息是客观信息功能的反映和抽象。而介于两者之间的则是经过电脑加工的人工信息。其特征是: 有人工痕迹, 但主观色彩极少, 它来源于客观信息, 而又高于客观信息, 是在客观信息的基础上, 经过数度抽象而成的, 因而也称之为低级的主观信息、高级的客观信息。

(3 ) 实在信息、先验信息与实得信息

根据对事物的观察过程, 信息可以被分为实在信息、先验信息与实得信息。所谓某事物的实在信息, 指的是该事物实际的运动状态和方式, 也就是在理想观察条件下观察者所获得的关于该事物的全部信息; 观察者关于某事物的先验信息是指他在观察之前通过某种途径所感知的该事物运动的状态和方式; 而在观察过程中, 观察者关于某事物的实得信息, 则是指他通过观察所新感知到的该事物运动的状态和方式。

(4 ) 直接信息与间接信息

根据人的感知方式, 信息可分为直接信息与间接信息。直接信息是指从人的直接经验中获得的信息, 如人通过观察某一现象所获得的信息。直接信息在多数情况下常常是指事实或现象, 即事物运动的存在形式。而间接信息则指的是人对客观事物的反映, 是事物运动的表达形式, 它包括书籍、文献、资料、数据、演讲等。

(5 ) 言语信息与非言语信息

根据载荷信息的符号种类, 信息可分为言语信息与非言语信息。言语信息是由言语交际符号所载荷的信息, 其重要性就在于它能够表达和传递最抽象的思想、最复杂的感情和最丰富的内容。而非言语交际符号也是人类符号系统中重要的组成部分, 寄载于非言语交际符号中的信息即是非言语信息。非言语信息是言语信息的孪生兄弟, 二者互为补充, 组成了绚丽多彩的信息世界。

(6 ) 内储信息与外化信息

根据信息的存在形式, 信息可分为内储信息与外化信息。内储信息指的是经过人脑加工存储在人脑信息库中的那一部分信息。而外化信息则是指以符号形式存在的一切精神产物。

(7 ) 动态信息与静态信息

根据信息的运动状态, 信息可分为动态信息与静态信息。在此, “ 动态” 与“ 静态” 并非严格意义上的科学概念。由于信息是事物运动的存在形式或表达形式, 在本质上总是运动的, 在形式上也总是动中有静, 静中有动。因此, 动态信息与静态信息只是一种比喻说法。所谓动态信息, 常常指的是诸如新闻、情报这样时间性极强的信息。而静态信息则主要是指像历史文献、资料和知识这样一些处于相对稳定状态的信息。

(8 ) 有用信息与无用信息

根据信息的作用、结果, 信息可分为有用信息与无用信息。从本质上说, 有用性是信息的基本特性之一。我们所说的有用信息和无用信息是就信息对用户的作用结果而言的。如果某一信息对于用户没有带来有益的结果, 无助于用户从事某种活动, 这种信息当然是无用信息; 反之, 则是有用信息。信息的有用与否既与人们的活动目的有关, 又与人们活动的对象有关, 还与时间有一定的关系。

(9 ) 空壳信息、黑洞信息、饱和信息与含熵信息

根据信息的结构, 从思维科学的角度可将信息分为空壳信息、黑洞信息、饱和信息与含熵信息。要了解这四类信息的含义, 我们有必要先弄清楚熵、信息量、信息结构这些基本概念的含义。所谓“熵”, 它是一个介于信息内容和信息量之间的概念。简单地说, 它就是不确定的信息内容。而信息量则是信源所包含的信息内容的定量表示。我们知道, 信源要向外发送消息, 信源所含的全部信息量就可以部分或全部地为其所发出的消息所携带, 被消息所携带的信息量称之为“ 携载信息量”, 而那部分没有为消息所携载, 仍然潜在信源之中的信息量则叫做“ 熵量”。所以, 信源所含的全部信息量等于熵量加携载信息量。假定熵量为零, 信源信息量就等于携载信息量; 反之, 假如携载信息量为零, 则信源信息量就等于熵量。

据此, 我们就可以对空壳信息、黑洞信息、饱和信息与含熵信息做出界定。当信源中不再有熵, 发出的消息中携载了信源含有的全部信息量, 这时, 信源发出的消息所携载的信息量就达到了饱和———它可能携载的信息量已经全部携载了, 这种信息便称之为“ 饱和信息”; 而含熵信息则是不饱和信息; 空壳信息和黑洞信息则是信息量为零的信息。空壳信息是没有熵, 也没有信息量的信息; 而黑洞信息则全是熵, 但没有信息量。

(10) 文献信息与非文献信息

根据信息所依附的载体差异可将信息分为文献信息与非文献信息。所谓文献信息是指以文献为形式的信息, 它以文字、图像、公式、声、视频、代码等为手段将信息知识记录或描述在一定的物质载体上, 并能起到贮存和传递信息知识的作用。文献信息是一种固化了的信息, 包括文献的内容信息和文献的形式信息。文献信息最常见的有档案信息、图书信息和情报信息。

2 信息的层次

(1 ) 本体论层次与认识论层次

我们已经指出, 信息是事物运动的状态和方式以及关于这种状态和方式的广义知识, 这个基本定义本身描述的是两个层次的信息, 即本体论层次的信息和认识论层次的信息。所谓本体论层次的信息, 指的是事物运动的状态和方式, 也就是事物内部结构和外部联系的状态和方式。本体论层次是最普遍的层次, 也是无条件约束的层次, 在这个层次上的信息是广义的信息, 它适用的范围最广。

上述定义中所说的“ 事物” 泛指一切可能的研究对象, 既包括外部世界的物质客体, 也包括主观世界的精神现象; “运动” 泛指一切意义上的变化, 包括机械运动、物理运动、化学运动、生物运动、思维运动和社会运动等; “ 运动状态” 是指事物运动在空间上所展示的性状和态势; “ 运动方式” 则是指事物运动在时间上所呈现的过程和规律。

认识论层次的信息是指认识主体所感知或所表达的事物运动的状态和方式。认识论层次的信息必须有认识主体的约束条件, 这个认识主体可能是人、生物或机器系统。认识主体所感知的事物运动状态和方式, 是外部世界向主体输入的信息, 认识主体所表达的事物运动状态和方式, 是主体向外部世界( 包括向其他主体) 输出的信息。信息是普遍存在的, 在没有认识主体时, 它就普遍存在于世界之中, 只有有了认识主体( 特别是人) 去获得信息, 信息才会有意义。

如果把信息与用户或观察者联系起来, 信息就有了新的性质,进而呈现出三个既相互联系又相互区别的层次。

(2 ) 语法信息、语义信息与语用信息

语法信息是关于事物运动状态和方式的形式化关系方面的表述, 是最基本的层次, 是最抽象的。从形式化方面来看, 事物运动的状态可划分为连续的和离散的、无限的和有限的、模糊的和精确的; 而运动方式则可划分为随机的( 或概率性的)、偶发的(或半随机的) 和确定性的。所谓形式化关系, 它类似于语言学中的语法, 正像语法只考虑词与词之间的关系那样, 语法信息只涉及事物运动状态和方式的形式化关系。从信息交流的角度来看, 这一层次的信息主要是关于“技术问题”, 即“交流符号怎样才能被精确地传输”。因此, 它也被称为技术信息, 其相关理论是“ 技术信息论”。

语义信息是关于事物运动状态和方式的逻辑含义方面的表述,是认识论信息的第二层次。这一层次将事物运动状态和方式与它们所代表的实际事物联系起来, 表明这种状态和方式究竟是什么意思。它相当于语言学中的语义。从信息交流的角度来看, 这一层次的信息主要是关于“语义问题”, 即“被传输的符号怎样准确地运载欲表达的意义” 的。其相关理论是“语义信息论”。与技术信息论相比, 语义信息论更强调信息的语义性问题。

语用信息是关于事物运动状态和方式对于信息接受者效用性方面的表述, 是认识论信息的第三层次。这一层次显然要以前两个层次为基础: 首先要知道是什么样的运动状态和方式, 然后还必须知道这个运动状态和方式具有什么样的意义, 这样才有可能考虑这个运动状态或方式对于信宿具有什么样的效用或价值。从信息交流的角度来看, 语用信息是关于信息对于接受者的“ 效用问题”, 即“被接收的意义怎样有效地影响产生所欲得到的行为”。其相关的理论是“ 效用信息论”。语用信息是最具体、最实际的信息层次。从利用信息的角度来看, 语义信息, 特别是语用信息是最有意义的。

(3 ) 三个信息层次之间的关系

语法信息、语义信息和语用信息是三个既相互区别又相互联系的信息层次, 下面我们以爱因斯坦的著名公式E = mc2 为例来简要地说明一下这三个层次信息的关系。如果从语法信息的角度来说,公式E = mc2 规定了这些英文字母和数字的一种特定的排列方式。这就是我们在观察之前所存在的不确定性———关于这些字母和数字的运动状态和方式的不确定性。当我们观察到了这个公式时, 我们就获得了它们的运动状态和方式, 也就是获得了语法信息, 于是就消除了我们事先所存在的关于这些字母和数字的运动状态和方式的不确定性。这就是公式E = mc2 提供的语法信息。对于通讯来说,也许认识到这一步就足够了。但是从交流与研究的角度来说, 仅仅看到了这个公式, 如果不知道这些字母和数字的含义, 也不知道它们这样一种排列顺序或位置有什么意义, 那么我们对于这个公式的含义, 就还具有不确定性。直至我们知道了字母E 代表能量, m代表质量, c 代表光速, ( )2 代表平方关系, 我们才知道这一公式的真正含义。这就是说, 我们获得了这一公式所包含的语义信息,明白了质量与能量的转换关系。那么这一公式以及它所代表的物理意义对于观察者( 信宿或用户) 具有什么效用呢? 弄清了这一公式的含义, 并且确实证明了该公式在逻辑上的真实性之后, 信宿就懂得利用这一公式所表明的关系, 就可以找到办法来改变原子核的质量状态, 从而获得巨大的原子能。当然, 要实际地实现语用信息所提供的效用和价值, 还需要具备各方面的条件, 而且不同的信宿对于利用这一效用和价值的条件和兴趣是大不相同的。一般来说, 衡量语法信息的主要指标是数量的多少, 衡量语义信息的主要指标是逻辑的真实性, 而衡量语用信息的主要指标则是对信宿所提供的价值或效用的大小。

为了进一步理解和把握语法信息、语义信息和语用信息的本质及其关系, 我们不妨再结合信息的获取与传递过程作进一步的阐释。

获取与传递信息一般有几个基本环节, 一个是信源( 消息的发送者) , 一个是信宿(消息的接受者) , 二者之间还必须有传递消息的通道。通常, 信息的获取和传递大体上可以分为三个不同的阶段: 第一阶段, 消息从信源到信宿, 尽可能正确地复制出来, 这时消息中载荷的信息就是技术信息或语法信息。第二阶段, 消息的接受者( 信宿) 所理解的消息载荷的新知识、新内容的原义尽可能与消息的发送者( 信源) 试图说明的原义近似或者相符, 这时从消息中获得的信息就是语义信息。近似或者相符的程度越大, 信宿获取的语义信息就越多。不过, 由于种种主客观原因的影响, 在消息传递过程中语义信息丢失的现象是经常发生的。从一般情况来看, 只有当消息在人掌握的知识范围之内, 才能准确地提取它的语义信息。同样听一场音乐会, 训练有素的音乐家与缺乏欣赏能力的听众, 二者获得的语义信息显然是不同的。第三阶段, 消息接受者的行为和动作影响与消息发送者在这方面的意图尽可能地近似或符合起来, 这就是语用信息。哥尔德曼等人认为语用信息的实质就是消息接受者消除了双重不确定性: 从量上说, 它消除了信宿对消息是否出现的不确定性; 从质上说, 它消除了消息对信宿的行为、动作、目标实现是否有价值、有效用的不确定性。人们在利用信息来同事物打交道的时候, 最经常的就是通过语用信息来作判断和决策的。

总之, 语法信息、语义信息和语用信息是相互联系的, 语法信息只考虑运动的状态和方式, 语义信息是将状态和方式与现实世界联系起来, 而语用信息则将状态、方式及其含义与信宿联系起来,它们三者之间的相互联系构成了信息概念的全部外延。

3 信息的度量

信息的作用是用来消除用户关于事物运动状态、方式的不确定性, 其数值可以用它所消除的不确定性的多少来度量。那么何为不确定性呢? 我们怎样通过所消除的不确定性的多少来对信息进行度量呢?

(1 ) 不确定性与信息量

众所周知, 任何事物都处在不断的运动过程之中, 而事物运动的状态和方式往往存在着不确定性。从通信的观点看, 信息就是通信的内容。人们之所以要互相通信, 目的就在于消除事物的某种“疑问” 或“未知”, 这里所说的“ 疑问” 或“ 未知” 便可以称之为“不确定性”。例如, 通信系统传送的内容一般是接收方事先不知道的, 对接收方来说是不能事先确定的; 雷达之所以要不断搜索, 就是因为目标的出现与否以及会收到什么样的目标参数是事先不可预知的; 等等。这些事先不能确知的通信内容、目标参数、控制指令、发射参数等便是不确定性。而消除这种不确定性就意味着得到了信息, 或者反过来说, 取得了信息, 就可以消除不确定性。也正因为如此, 在信息论中, 有人将信息定义为消除不确定性的东西。

例如, 甲告诉乙“ 今年某地粮食增产”, 乙收到这个消息之后, 就消除了他对某地粮食是增产还是减产的不确定性; 但是, 到底增产多少, 还存在着某些不确定性, 还需要补充新的信息。显然, 收到的信息越多, 所能消除的不确定性也就越大。所以, 信息的数量(或者叫信息量) 便可以通过它所消除的不确定性的大小来计算。

(2 ) 信息的度量方法

从本质上说, 不确定性是与“ 多种结果( 或状态) 的可能性”相联系的, 而在数学上, 这种可能性是以概率来计算的, 因而事物不确定性的大小便可以用概率分布来描述。例如, 考察掷硬币这一事件, 它的不确定性表现为具有两种同样可能的状态或结果, 即状态x1 (字朝上) 出现的可能性(即概率) P( x1) 1/ 2 , 状态x2 ( 画朝上)出现的概率P ( x2 ) 也是1/ 2。再比如, 投掷均匀正立面体骰子 , 具有六种同样可能的状态, y1( 1 ) , y2( 2 ) , y3( 3 ) , y4 (4) , y5( 5 )y6( 6 ) 出现的概率为p ( y1 ) = p ( y2 ) = p ( y3 ) = p( y4 ) = p( y5 ) = p ( y6 ) = 1/ 6。在这种情况下, 当然掷六面体的不确定性比掷硬币的不确定性大, 为了消除它的不确定性, 掷骰子场合所需要的信息应该比掷硬币场合多。但是, 如果骰子不是各面同重, 而是其中一面特别重, 那么, 投掷的结果, 往往都是出现某一特定的点数, 比如, 这时有:

p( y1 ) = 0. 95

p( y2 ) = p( y3 ) = p( y4 ) = p( y5 ) = p( y6 ) = 0. 01

那么, 虽然它的可能状态数比掷硬币时多, 但是不确定性反而比掷硬币时少。可见, 事物的不确定性大小, 一方面与它的可能状态的数目有关, 另一方面与各可能状态的概率分别情况有关。信息论证明: 若某事物具有几种独立的可能状态: x1 , x2 , , xn , 每一状态出现的概率分别为P ( x1 ) , P ( x2 ) , , P ( xn ) , 且有- ΣP( xi ) = 1 , 那么, 该事物所具有的不确定性数量

H ( x) = - ΣP( xi ) logP( xi )

当对数底取为2 , H ( x ) 的单位为比特。值得注意的是, 函数H ( x) 与统计热力学中L. 克劳胥斯定义的熵公式是相同的。因此,在信息论中, H ( x ) 也被称为熵。事实上, L. 克劳胥斯的熵是表征统计热力系统的无组织性的, 这与不确定性的意义恰好相通。这样, 熵函数H ( x ) 表征了事物的不确定性数量, 因而就可以用它来表示信息的数量———信息量( I )

在通信的场合, 如果在通信之前收信者对某事物存在的不确定性数量———熵值为H ( x) , 经过通信收到信息后, 这个不确定性被完全消除了, 那么, 我们就说, 收信者收到的信息量

I = H ( x) - 0 = H ( x )

但是, 如果收到信息之后, 收信者的这个不确定性并未完全消除, 只是减少到H ( y) , 那么, 收信者收到的信息量就为

I = H ( x) - H ( y)

这就是前面所说的, 信息量等于被消除的不确定性数量, 或者说, 信息量等于熵的减少量。这是信息论的最重要的结论之一。


 
关键词: 信息 分类 度量
(文/小编)
免责声明
• 
本文为小编原创作品,作者: 小编。欢迎转载,转载请注明原文出处:http://www.dawindow.com/tech/201808/174.html 。本文仅代表作者个人观点,本站未对其内容进行核实,请读者仅做参考,如若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,作者需自行承担相应责任。涉及到版权或其他问题,请及时联系我们kf@dawindow.com。
 

Copyright © 2018 档案之窗(dawindow.com)     深圳司捷科技有限公司    版权所有       粤ICP备18047471号-1