第1 章 数字视频信号
1.1 视觉感知特性
光是具有波形性和微粒性的电磁波,不同波长的光具有不同的特性。随着可见光波长从780nm到380nm递减,光的颜色依次为红、橙、黄、绿、青、蓝、紫,比 780nm更长的电磁波是红外线,比380nm更短的电磁波是紫外线。光照射到物体表面,反射到人眼形成视频图像。
人眼的生理构造是非常复杂的,人眼的视觉特性主要包括:亮度感觉、对比度、视敏函数、色彩深度、分辨率、观察视角、马赫效应、色彩恒常、视网膜皮层理论、侧抑制网络等。
1.亮度感觉
亮度(Brightness)是光源或反射面的明暗程度,单位为cd/m2或尼特(1nit=1 cd/m2)。人眼的感光范围非常宽广,明视觉的亮度感觉范围为 1~106 cd/m2,暗视觉的亮度感觉范围为0.003~3cd/m2。
人眼不能同时感觉到亮度范围的全体,观察图 1.1(a)所示P1 和P2 两个画面,P1 和P2 的亮度可调节,保持P1 亮度B不变,将P2 亮度从B缓慢递增至B+ΔBmin,直到眼睛刚刚觉察到两者亮度有差别为止,表示在亮度B下的亮度感觉变化了一级。采用相同方法,可以制成图1.1(b)所示曲线,横坐标代表实际亮度的变化,纵坐标代表主观亮度感觉的级数,该曲线的意义是实际亮度变化所引起的主观亮度感觉变化。要使人眼感觉到P1 和P2 两个画面有亮度差别,必须使两者的亮度差大于ΔBmin,ΔBmin是有限小量,表明人眼察觉亮度变化的能力是有限的;对于不同的环境亮度B,ΔBmin是不同的,但ΔBmin/B是常数,表明人眼亮度感觉的增量ΔS不是正比于亮度增量ΔB,而是正比于亮度的相对增量ΔS(记为kΔB/B),经积分后得:
式中,k、k0 均为常数,表明主观亮度感觉与客观亮度的对数成线性关系,称为韦伯—费赫涅尔定律(Weber-Fechner)。对于不同的亮度B,人眼能觉察的ΔBmin并非定值,ΔBmin/B称为韦伯—费赫涅尔系数Ψ,通常Ψ为0.005~0.02,在亮度很高或很低时,Ψ增大至0.05。
2.对比度
在不同的亮度环境下,人眼对于同一客观亮度所产生的相对亮度感觉是不相同的,如对同一电灯,在白天和黑夜人眼对它产生的相对亮度感觉有很大差异。当人眼适应了某一环境亮度时,所能感觉的亮度范围将变小,如白天环境亮度为 10 000尼特时,人眼能分辨的亮度范围为200~20 000尼特,低于200尼特的亮度感觉为黑色;但是黑夜环境亮度为 30尼特时,可分辨的亮度范围为 1~200尼特,100尼特的亮度感觉就很高,低于 1 尼特的亮度才引起黑色感觉。在图 1.1中,当人眼分别适应了A、B、C点的环境亮度时,人眼感觉黑白的范围如虚线所示,所对应的实际亮度范围比人眼的视觉范围小很多,A点的实际亮度对于适应了B点亮度的眼睛来说感觉很暗,对于适应了C点亮度的眼睛来说感觉很亮。
图 1.1 亮度感觉的级数曲线
人眼对亮度变化过程敏感,在比较两个不同亮度时,有较好的判断力。对于不同亮度的背景,人能察觉到的最小亮度差别也不同,人眼分辨亮度的能力与背景亮度BΦ有关,因此对比度C定义为:
Bmax和Bmin是前景图像的最大和最小亮度,亮度和对比度之间不是线性关系。在理想亮度附近的对比度可以达到最大值;当光照亮度太小时,由于最大亮度过小,对比度会降低;当光照亮度过大时,背景亮度BΦ过大,导致对比度降低。
根据人眼对实际亮度明暗感觉的相对性、察觉实际亮度变化能力的有限性,在设计视频可视化系统中,不必传送原景物的实际亮度,只需保持原景物点的相对亮度不变,通常只要保证景物最大亮度Bmax和最小亮度Bmin的比值C不变。对于人眼不能察觉的亮度变化,不必精确地重现,只要保证重现图像和原景物有相同的亮度级数。简言之,只要重现图像与原景物对人眼具有相同的对比度和亮度级数,就能给人以真实的感觉。
在视频可视化系统中,亮度与对比度对使用者视觉感受影响最大。主流系统的亮度是250cd/m2以上,对比度在200∶1以上,达到400cd/m2以上才算高亮产品,高亮度能够使显示画面更加清晰鲜艳;但是过高的对比度(如 800∶1 以上)没有实际意义,人眼已经无法分辨。因此,亮度必须要与对比度相配合,只有都达到最佳状态时,才能使图像的细节表现得层次丰富,文字显示清晰锐利、色彩绚丽。
3.视敏函数
明视觉过程主要由锥状细胞完成,既产生明感觉,又产生彩色感觉。图 1.2中的粗曲线为明视觉视敏函数,表示在白天正常光照下人眼对各种不同波长光的敏感程度。
暗视觉过程主要由杆状细胞完成,在弱光条件下,杆状细胞只有明暗感觉,没有彩色感觉;图 1.2中的细曲线为暗视觉视敏函数,表示在弱光条件下人眼对各种不同波长光的敏感程度,杆状细胞对波长短的光敏感度有所增大,即曲线向左移。
图 1.2 视敏函数曲线
4.色彩深度
色彩深度也称为色彩模式或色彩分辨率,表示灰度细腻程度或彩色等级,单位是 bit(位),用多少位来表示一个像素,如 1bit只能表示黑白像素,8bit可以表示 256(28)个灰度级,代表从黑到白的不同灰度等级,表示灰度图像的亮度层次范围,表明从纯黑到纯白之间平滑过渡的能力;灰度级越大,层次越丰富,效果越好。24bit可以表示 16,777,216(224)种色彩,其中红(R)绿(G)蓝(B)各通道分别占用 8bit,各有 256(28)个等级,一般称 24bit以上的色彩为真彩色,如30bit、36bit和42bit,色彩位数越多,颜色就越逼真。
5.分辨率
分辨率是人眼分辨景物细节的有限能力,如空间平面上两个黑点相互靠拢到一定程度时,离开黑点一定距离的观察者就无法区分它们。当照度太强、太弱或当背景亮度太强时,人眼分辨率降低;当目标运动速度加快时,人眼分辨率降低;人眼对彩色细节的分辨率比对亮度细节的分辨率要差,如果黑白分辨率为 1,则黑红为0.4,绿蓝为0.19。
在视频处理系统中,分辨率(Resolution)是视频图像的密度,指每行或每列有多少像素点,以 640×480的分辨率来说,即每行有 640个像素点且共有 480行,分辨率越高,视频图像越精细。
在视频可视化系统中,场频(Vertical Scan Frequency)是垂直扫描频率,即每秒钟屏幕刷新的次数;与图像内容的变化没有关系,即使屏幕上显示的是静止图像,扫描线也照常更新,垂直扫描频率越高,闪烁情况越不明显,眼睛越不容易疲劳。行频(Horizontal Scan Frequency)是每秒扫描的水平线数量,等于“行数×场频”,行频是一个综合分辨率和场频的参数,值越大,显示器可以提供的分辨率越高,稳定性越好,以800×600的分辨率、85Hz的场频为例,显示器的行频至少应为 51kHz(即 600×85)。
6.观察视角
在视频可视化系统中,视角包括水平可视角度和垂直可视角度。以屏幕的垂直法线为基准,在垂直于法线左方或右方一定角度的位置上仍然能够正常看见显示图像,这个角度范围就是水平可视角度;如果以水平法线为基准,上下的可视角度就称为垂直可视角度。一般地,可视角度以对比度变化为参照标准,当观察角度加大时,该位置看到的显示图像的对比度会下降,当观察角度加大到一定程度,对比度下降到 10∶1 时,所对应的角度就是最大可视角。
7.马赫效应
当亮度发生跃变时,会有一种边缘增强的感觉,视觉上会感到亮侧更亮,暗侧更暗。马赫效应会导致局部阈值效应,即在边缘的亮侧,靠近边缘像素的误差感知阈值比远离边缘的阈值高3~4倍,可以认为边缘掩盖了其邻近像素,因此对靠近边缘的像素处理误差可以大一些。
8.色彩恒常
色彩恒常是指在照度发生变化的条件下人们对物体表色的知觉趋于稳定的心理倾向,同一表面在不同照度下会产生不同反射谱,人眼的颜色机制能分辨这种由照度变化导致的表面反射谱变化,对该表面颜色的认知在一定范围内保持恒定。有三种主流理论解释视觉系统的色彩恒常,赫尔姆霍茨(Helmholtz)认为这是一种“建立在无意识感觉上的理智判断”;黑林(Hering)提出“颜色记忆”的概念;卡茨(Katz)把颜色常性问题引入心理实验室,集中研究照明变化对于常性知觉的影响。