机器视觉技术基础
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.1 图像和数字图像

图像是客观对象的一种相似性的、生动性的描述或写真,是人类社会活动中最常用的信息载体。或者说图像是客观对象的一种表示,它包含了被描述对象的有关信息。图像在人类对外部世界的感知中起着最重要的作用,因为视觉系统是人类具备的感官系统中最高级也是最复杂的。图像与其他的信息形式相比,具有直观、具体、生动等诸多显著的优点。自然界中的图像都是模拟量,但是,计算机只能处理数字量,而不能直接处理模拟图像,数字化后的图像就称为数字图像。数字图像扩展了人类获取信息的渠道,可以帮人们更加客观、准确、快速地了解世界和认识世界。

2.1.1 图像

广义上,图像就是所有具有视觉效果的画面,它包括:纸介质上的,底片或照片上的,电视、投影仪或计算机屏幕上的。我们可以按照图像的存在形式、亮度等级和图像的光谱这几种形式对其进行分类。

(1)按照图像的存在形式分类

①可见图像 包括照片、形状线条图片等和透镜、光栅等成像的光图像。

②不可见图像 包括红外、微波成像的不可见光成像和温度、压力等按数学模型生成的图像。

(2)按照图像的亮度等级分类

①二值图像 只有黑白两种亮度等级的图像。

②灰度图像 有多种亮度等级的图像。

按照图像的亮度等级分类如图2.1所示。

图2.1 按照图像的亮度等级分类

(3)按照图像的光谱分类

①彩色图像 每个像素由R(红)、G(绿)、B(蓝)分量构成的图像,其中R、G、B是由不同的灰度级来描述的。

②黑白图像 每个像素点只有一个亮度值分量,如黑白照片、黑白电视画面。

按照图像的光谱分类如图2.2所示。

图2.2 按照图像的光谱分类

(4)按照图像是否随时间变换分类

①静态图像 不随时间而变化的图像,如各种图片等。

②动态图像 随时间而变化的图像,如电影和电视画面等。

(5)按照图像所占空间和维数分类

①二维图像 平面图像,如照片等。

②三维图像 空间分布的图像,一般使用两个或者多个摄像头得到。

2.1.2 数字图像

一幅图像可定义为一个二维函数f(x,y),其中xy是空间坐标,而在任何一对空间坐标(x,y)处的幅值f称为图像在该点处的强度或灰度。当(x,y)和灰度值f是有限的离散数值时,我们称该图像为数字图像。注意,一个大小为M×N的数字图像是由MN列的有限元素组成的,每个元素都有特定的位置和幅值,代表了其所在行列位置上的图像物理信息,如灰度和色彩等。这些元素称为图像元素或像素。

每个图像的像素在二维空间中的特定“位置”,均由一个或者多个与那个点相关的采样值组成数值。根据这些采样数目及特性的不同,数字图像可以划分为:

(1)二值图像(Binary Image)

二值图像的灰度值只有0、1,其中灰度值0代表黑色,1代表白色。二值图像包含信息少,占用空间少,但是二值图像往往能够排除干扰,获得对象的最突出点,如指纹图像的识别、文字的自动识别等。

(2)灰度图像(Gray Scale Image)

在二值图像中进一步加入许多介于黑色与白色之间的颜色深度,就构成了灰度图像。图像中每个像素可以由0(黑)~255(白)的灰度值表示,每种灰度(颜色深度)称为一个灰度级,通常用L表示。在灰度图像中,像素可以取0~(L-1)之间的整数值,根据保存灰度数值所使用的数据类型不同,可能有256种取值或者说2k种取值。

(3)彩色图像(Color Image)

彩色图像是指由红、绿、蓝三种基本颜色组合而成,通常称它们为RGB三原色。计算机显示彩色图像时采用最多的就是RGB模型,对于每个像素,通过控制R、G、B三原色的合成比例就可以决定该像素的最终显示颜色。

(4)伪彩色图像(False-Color)

伪彩色图像的每个像素值实际上是一个索引值或代码,该代码值作为色彩查找表CLUT(Color Look-Up Table)中某一项的入口地址,根据该地址可查找出包含实际R、G、B的强度值。这种用查找映射的方法产生的色彩称为伪彩色,生成的图像为伪彩色图像。

(5)三维图像(3D Image)

三维图像是由一组堆栈的二维图像组成。每一幅图像表示该物体的一个横截面。数字图像也用于表示在一个三维空间分布点的数据,例如计算机断层扫描(Computed Tomography,CT)设备生成的图像,在这种情况下,每个数据都称作一个体素。