1.2 数字图像的基本概念
1.2.1 图像与数字图像
图像(Image)是人类获取信息、表达信息和传递信息的重要手段,是人类感知和认识世界的基础。图像是通过各种观测系统,以不同的形式和手段观测客观世界而获得的,可以直接或间接作用于人眼,进而产生视知觉的实体。图像的种类有很多,根据人眼的视觉特性可分为可见图像和不可见图像。可见图像包括生成图像(通常称图形或图片)和光图像两类。图像侧重于根据给定的物体描述模型、光照及想象中的摄像机的成像几何,生成一幅图或像的过程。光图像侧重于用透镜、光栅、全息技术产生的图像。通常所说的图像是指后者。不可见图像包括不可见光成像和不可见量形成的图像,如:γ射线、X射线、紫外线、红外线、微波等。利用图像处理技术能够把不可见射线所成的图像加以处理转换成可见图像。
数字图像(Digital Image)是由模拟图像数字化得到的、以像素为基本元素的、可以用数字计算机或数字电路存储和处理的图像。数字图像的空间坐标和明暗程度都是离散的、不连续的,由数组或矩阵来表示。图像中每个基本单元称为图像的元素,简称像素(Pixel)。
根据每个像素所代表信息的不同,可将数字图像分为RGB图像、灰度图像、二值图像、和索引图像。
1.RGB图像
RGB色彩模式是工业界的一种颜色标准,是通过对红(R)、绿(G)、蓝(B)三个颜色通道的变化以及它们相互之间的叠加来得到各式各样的颜色的,RGB即是代表红、绿、蓝三个通道的颜色,这个标准几乎包括了人类视力所能感知的所有颜色,是目前运用最广的颜色模型之一。
在计算机中,RGB的所谓“多少”就是指亮度,并使用整数来表示。通常情况下,R、G、B各有256级亮度,用数字表示为从0、1、2、…、255。注意虽然数字最高是255,但0也是数值之一,因此共256级。按照计算,256级的RGB色彩总共能组合出约1678万种色彩,即256×256×256=16777216。通常也被简称为1600万色或千万色,也称为24位色(2的24次方)。
RGB是从颜色发光的原理来设计的,通俗点说它的颜色混合方式就好像有红、绿、蓝三盏灯,当它们的光相互叠合的时候,色彩相混,而亮度却等于两者亮度之和,越混合亮度越高,即加法混合。红、绿、蓝三盏灯的叠加情况,中心三色最亮的叠加区为白色,加法混合的特点:越叠加越明亮。红、绿、蓝三个颜色通道每种颜色各分为256阶亮度,在0时“灯”最弱,而在255时“灯”最亮。当三色灰度数值相同时,可以产生不同灰度值的灰色调,即三色灰度都为0时,是最暗的黑色调;三色灰度都为255时,是最亮的白色调。
如图1-2a所示的蓝色加号图像,其R、G、B分量在计算机中由图1-2b所示的三个矩阵来表示。根据RGB分量矩阵可知,图1-2a的分辨率为9×9×3。
图1-2 RGB图像的矩阵表示
2.灰度图像
灰度图像通常显示为从最暗的黑色到最亮的白色的灰度,每种灰度称为一个灰度级,通常用L表示。彩色图像可按照一定规律向灰度图像转换。在灰度图像中,像素可以取0~L-1之间的整数值,根据保存灰度数值所使用的数据类型的不同,可能有256种取值或者2m种取值,当m=1时即退化为二值图像。
图1-3a为图1-2a的灰度图,该灰度图在计算机中由图1-3b所示的灰度矩阵来表示。图1-3a的图像分辨率为9×9。
图1-3 灰度图像的矩阵表示
3.二值图像
二值图像中只有黑和白两种颜色,也就是说每个像素非黑即白。在二值图像中,像素只有0和1两种取值,一般用0来表示黑色,用1来表示白色。有时,二值图像中的白色像素也用255来表示。
图1-4a是图1-2a和图1-3a的二值图像,可由图1-4b所示的二值矩阵来表示。图1-4a的分辨率为9×9。
图1-4 二值图像的矩阵表示
4.索引图像
索引图像的文件结构比较复杂,除了存放图像的二维矩阵外,还包括一个称为颜色索引矩阵MAP的二维数组。MAP的大小由存放图像的矩阵元素值域决定,如果矩阵元素值域为[0,255],则彩色图像的MAP矩阵的大小为256×3,用MAP=[RGB]表示。MAP中每一行的三个元素分别指定该行对应颜色的红、绿、蓝单色值,MAP中每一行对应图像矩阵像素的一个灰度值,如某一像素的灰度值为64,则该像素就与MAP中的第64行建立了映射关系,该像素在屏幕上的实际颜色由第64行的[RGB]组合决定。也就是说,图像在屏幕上显示时,每一像素的颜色由存放在矩阵中该像素的灰度值作为索引通过检索颜色索引矩阵MAP得到。索引图像的数据类型一般为8位无符号整型(int8),相应索引矩阵MAP的大小为256×3,因此一般索引图像只能同时显示256种颜色,但通过改变索引矩阵,颜色的类型可以调整。索引图像的数据类型也可采用双精度浮点型(double)。索引图像一般用于存放色彩要求比较简单的图像,如Windows系统中色彩构成比较简单的壁纸多采用索引图像存放,如果图像的色彩比较复杂,就要用到RGB真彩色图像。
1.2.2 数字图像的存储格式
图像处理的程序必须考虑图像文件的格式,否则无法正确地打开和保存图像文件。每一种图像处理软件几乎都有各自处理图像的方式,用不同的格式存储图像。为了利用已有的图像文件,或者在不同的软件中使用图像,就要注意图像格式,必要时还得进行图像格式的转换。下面介绍几种常用的图像存储格式。
(1)BMP格式
BMP是Bitmap的简写,它是Windows操作系统中的标准图像文件格式,能够被多种Windows应用程序所支持。这种格式的特点是包含的图像信息较丰富,几乎不进行压缩,但由此导致了它与生俱来的缺点——占用磁盘空间过大。BMP文件的图像深度可选1bit、4bit、8bit及24bit。BMP位图文件默认的文件扩展名是“.bmp”“.dib”或“.rel”。
(2)JPEG格式
JPEG(Joint Photographic Experts Group,联合图像专家组)是一种有损压缩的图像格式,其文件扩展名为“.jpg”或“.jpeg”,是目前互联网和数字照相机中常见的图像存储格式。严格地说,JPEG并不是一种图像格式,而是一种压缩图像数据的方法。但是,由于它的用途广泛而被人们认为是图像格式中的一种。
JPEG是由联合图片专家组提出的,它定义了图片、图像的共用压缩和编码方法,这是目前为止最好的压缩技术。JPEG主要是存储颜色变化的信息,特别是亮度的变化。JPEG格式压缩的是图像相邻行和列间的多余信息,只要压缩掉的颜色信息不至于引起人眼视觉上的明显变化(视觉可接受),它就是一种很好的图像存储格式。
由JPEG压缩方法处理图像而节省的空间是大量的。例如,一个727×525的真彩色图像,其原始的每个像素24位格式占用1145KB, GIF格式是240KB,非常高质量的JPEG格式为155KB,而标准的JPEG格式则仅为58KB。当在显示器上观看时,58KB的JPEG图像同GIF图像格式的质量相同,155KB的JPEG图像比起256色的GIF图像则要好得多。当压缩比取得不太大时,由JPEG解压缩程序重建后的真彩色图像与使用某种像素存储的原始图片相比,几乎看不出什么区别,故能正常浏览显示。
JPEG的压缩方式通常是破坏性资料压缩(lossy compression),即在压缩过程中图像的品质会遭受到可见的破坏。一张图片多次上传下载后,图片逐渐会失真。另外,多次存储需采用同一压缩比对同一幅图像压缩后再解压缩,所得到的图像与原图像是不同的。因此,对同一幅图像应采用一个压缩比保存,如果在用JPEG方法压缩后存储,打开后保存为另外的格式,并在下一次又用JPEG方法压缩,这是不可取的。切记,图像一旦用JPEG方法压缩保存后,建议不要再存储为其他格式;如果确实要保存为其他格式,则应该记住该图像文件以后不再用JPEG格式保存。
(3)PNG格式
PNG(Portable Network Graphics)是便携式网络图形,是新型图像文件格式,其文件扩展名为“.png”。PNG能够支持较高级别的无损压缩图像文件,可以减少占用空间和网络传输所需的带宽,常用于计算机程序或网页上的图像显示。
PNG格式常用的有8位、24位、32位三种,其中8位PNG支持两种不同的透明形式(索引透明和alpha透明),24位PNG不支持透明,32位PNG在24位基础上增加了8位透明通道(32-24=8),即RGB+alpha,因此可展现256级透明程度。PNG这种支持图像半透明格式的功能,可使图像中某些部分不显示出来,在图像与背景颜色内容出现叠加时更加友好,可用来创建一些有特色的图像。
(4)TIFF格式
标签图像文件格式(Tag Image File Format, TIFF)是一种灵活的位图格式,主要用来存储包括照片和艺术图在内的图像,其文件扩展名为“.tif”。
TIFF是基于标记的文件格式,它广泛地应用于对图像质量要求较高的图像的存储与转换。由于它的结构灵活和包容性大,已成为图像文件格式的一种标准。TIFF格式是桌面出版系统中使用最多的图像格式之一,它不仅在排版软件中普遍使用,也可以用来直接输出。用Photoshop编辑的TIFF文件可以保存路径和图层。