1.1 信息、数据与数据处理
数据库系统已经成为现代社会人们日常生活的重要组成部分,在每天的工作和学习中,人们经常与数据库系统打交道,如在网上选课、预订火车票或飞机票、在图书馆的网站上查找图书、网上购物等。数据库中存储的数据本身可提供信息,经过数据处理又可提供一些信息。
1.信息
信息(Information)是现实世界中各种事物(包括有生命的和无生命的、有形的和无形的)的存在方式、运动形态,以及它们之间的联系等诸多要素在人脑中的反映,是通过人脑抽象后形成的概念。人们不仅可以认识和理解信息,还可以对它进行推理、加工和传播。信息甚至可为达成某种目的提供决策依据,例如,根据某种商品第一季度的销售数量来决定第二季度的进货数量。
2.数据
数据(Data)是信息的载体,是信息的一种符号化表示,而采用什么符号,完全是人为规定的。例如,为了便于用计算机处理信息,我们把信息转换为计算机能够识别的符号,即采用0和1两个符号的编码来表示各种各样的信息。所以数据的概念具有两方面的含义:一是数据的内容是信息,二是数据的表现形式是符号。凡是能够被计算机处理的数字、字符、图形、图像、声音等统称为数据。数据具有如下基本特征。
(1)数据有型和值之分。
【例1.1】描述一个学生的基本信息的型和值。
型:学生(学号,姓名,性别,出生日期,系别,总学分)。
值:student('001102','程明','男','90-02-01','计算机',50)。
值:student('001103','王燕','女','90-01-03','计算机',50)。
计算机的数据库系统在处理数据时,首先要建立外部对象特定的型,然后将数据按型进行存储。
(2)数据有类型和取值范围的约束。
【例1.1】中的学号、姓名、性别、系别是字符型的数据,出生日期是日期型的数据,总学分是数值型的数据。性别的取值范围可以是{男,女}或{0,1},总学分的取值范围可以是0≤总学分≤200。
3.信息与数据的关系
信息和数据既有联系又有区别。信息是数据的内涵,而数据是承载信息的物理符号,或称为载体。信息是抽象的,同一信息可以有不同的数据表示形式。例如,在足球世界杯期间,同一场比赛的新闻,可以分别在报纸上以文字形式、在电台中以声音形式、在电视上以图像形式来表现。数据可以表示信息,但不是任何数据都能表示信息,对同一数据也可以有不同的理解。比如2000,可以理解为一个数值,也可以理解为2000年。
4.数据处理
数据处理是指将数据转换成信息的过程,这一过程主要涉及对所输入的数据进行加工整理,包括对数据进行收集、存储、加工、分类、检索和传播等一系列活动。其根本目的是从大量、已知的数据出发,根据事物之间的固有联系和变化规律,采用分析、推理、归纳等手段,提取出对人们有价值、有意义的信息,作为制定某种决策的依据。
数据与信息之间的关系如图1.1所示,其中数据是输入,而信息是输出。数据加上语义后就能表达一定的信息,人们所说的“信息处理”的真正含义应该是为了产生信息而处理数据。例如,“出生日期”是人有生以来不可改变的基本特征之一,属于原始数据,而“年龄”是当年与出生年份相减而得到的数字,具有相对性,可视为二次数据;职工的“参加工作时间”、产品的“购置日期”是职工和产品的原始数据,职工的“工龄”、产品的“报废日期”则是经过简单计算所得到的结果。
图1.1 数据与信息之间的关系
在数据处理活动中,计算过程相对简单,很少涉及复杂的数学模型,但是有数据量大,且数据之间有着复杂的逻辑联系的特点。因此数据处理活动的焦点不是计算,而是把数据管理好。
5.数据管理
数据管理是指对数据进行收集、整理、编目、组织、存储、查询、维护和传送等各种操作。数据管理是数据处理的基本环节,是数据处理活动必有的共性部分。因此,对数据管理应当加以重视,集中精力开发出通用而方便、实用的软件,把数据有效地管理起来,以最大限度地减轻计算机软件用户的负担。数据管理技术正是瞄准这一目标而逐渐完善起来的一门计算机软件技术。