现代声像技术
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2 人类听觉

实践证明,声音虽然是客观存在的,但人类的主观感觉与客观实际有一致的地方,也有偏离的地方,甚至还会产生错觉(立体声技术就是利用了听觉的部分错觉)。了解人类的听觉特性对电声工作者来说是十分重要的。在科学技术高度发达的今天,电声设备质量优劣的最高和最后判断者仍是人的听觉。

1.2.1 听觉的主观感觉

当声波传播到人的听觉器官——人耳处时,耳膜受到相应的声压变化而对听觉神经产生刺激,该刺激沿神经系统传入大脑听觉中枢形成感觉,使人感觉到声音的存在。并非所有声波都能被人耳听觉所感知,甚至即使对人耳能感知到的声音,其感觉也各有不同,因为人的听感是一个非常复杂的物理-生理-心理过程。人对声音的感知有响度、音调和音色三个主观听感要素。人的主观听感要素与声波的客观物理量——声压、频率和频谱成分之间既有密不可分的联系,又有一定的区别,这就是本章所要讨论的人的听觉特性。尽管人类听觉的许多特性还难以从生理解剖的听觉机制角度做出满意的解释,但是电声系统的完善、电声技术的发展、电声设备的研制却必须依赖于对人类听觉特性的认识和深化。

1.响度

响度是人耳对声音强弱的主观感觉程度,对于同一强度的声波,不同的人听到的效果并不一致,因而对响度的描述有很大的主观性。一般来说,在人类听觉的动态范围内,响度同声压级大体成比例,即声压级越大响度也越大。但这只是对同一频率的声音来说是正确的。实验表明,声压级不是决定响度的唯一因素,另一个重要因素是频率。举一个极端的例子,频率极低的纯次声和频率极高的纯超声,无论其声压级有多大,我们都会觉得它“不响”。

为了把声音强弱的客观尺度与在此声音刺激下的主观感受的强弱联系起来,引入了响度级概念。为了对响度进行计量,定义响度的单位为宋(sone),并规定:声级为40dB的1kHz标准音的主观感受为响度等于1 sone。任何声音的响度级,在数值上等于与标准音(1kHz)一样响时所对应的标准音的声压级值,用符号LN表示。响度级的单位为方(phon)。根据定义,人耳判断与1000 Hz纯音的1dB声压级等响的响度级为l phon。若某一声音(纯音或复合音)听起来与声压级为70dB的1000 Hz纯音同样响,则该声音的响度级就是70 phon。

经过大量测试,在声压级与频率的坐标系中,声压级作为参变量,将频率不同、人们听起来却有同等响度的声压级分别连接起来组成一组曲线,就成为如图1.3所示的等响度曲线。图中每条曲线代表某一个响度等级。显然,其中最低的一条曲线是响度为0 phon的闻阈曲线,最高的一条等响曲线是痛阈级,其响度级为120 phon。

图1.3 等响度曲线

等响度曲线从人耳的实际测量得出,它与人的年龄及人耳结构有关。对该曲线进行分析可得出如下结论。

① 响度与人耳处的声压级有关,声压级提高,相应的响度随之增大。在每条曲线与f=1kHz相交的点上,响度值与对应声压级的值相等。

② 低声压级时,等响曲线上各频率声音的声压级相差很大。例如,频率为30 Hz的声音达到10 phon响度时,需有约70dB的声压级,而对于频率为10kHz的声音,相同的响度只需约20dB的声压级,两者的声压级差约50dB。频率在3~5kHz左右的响度曲线处在最低位置,说明人耳对这一频段最为敏感,这是由于外耳道对其产生共鸣。

③ 高声压级时,等响曲线较为平坦,说明在高声压时,各频率的听感响度基本相同。为了改善在低声压级听音时低频响度下降的现象,有些电声设备中加入了响度控制。例如,录音机有响度开关(Loudness),在音量较小的低声级时,能按等响曲线的规律对高、低频电平进行提升,以达到展宽频带、均匀音量的效果。

2.音调

人耳对声音调子高低的主观感觉称为音调,频率低的调子给人以低沉、厚实、粗犷的感觉,而频率高的调子则给人以亮丽、明快的感觉。以客观的物理量来度量,音调与声波基频相对应,但这种对应也是不完全一致的,即音调与频率之间不存在线性关系,特别是在闻阈的高频与低频两端,不一致性就更为明显。大量人耳对声音频率的主观感觉实验证明,人耳对音调变化的感觉大体呈现对数关系,故为了符合听感的音调特征,也便于表征和分析,通常频率坐标多用对数刻度。与此同时,人们还引进了倍频程的概念以适应这种频率感觉。频率增加1倍,即增加1个倍频程,音乐上称提高了1个八度。

音调的单位为美,响度40 phon、频率1000 Hz的纯音的音调规定为1000美。另一个声音与它比较,如果两者的音调感觉相同,那么纯音的频率即可用来描述这个声音的音调。人耳对响度的感觉有一个从闻阈到痛阈的范围,人耳对频率的感觉同样有一个从最低可听频率20 Hz到最高可听频率20kHz的范围。其高频上限范围因个体间的不同而有较大差异,主要是年龄的影响,随着年龄增加,感知上限会降低一些。

音调还与声音的持续时间、声压级及温度有关。要使人耳能明确感觉到声音的音调,所需的声音持续时间随频率和声压级而变化,感受低频声的音调需要比高频声有更长的持续时间。两个频率相同而声压级不同的纯音,听起来常会觉得音调不同。在低频段,频率不变而声强提高时,音调降低;在1000~5000 Hz的频率内,频率不变而声强提高时,音调升高。音调也会随温度变化,即产生声音的温度效应,原因是气温的变化引起声速变化。

3.音色

人耳不但对音强和音调具有较强的辨别能力,还能准确地辨别出音色。音色又称音品,由声音波形的谐波频谱和包络决定。乐器发出的声音都是复音,其频率成分含有基波和高次谐波,即基音和泛音。各种乐器所发出的声音的谐波分布不同,谐波分量的幅度也不相同,因而音色也就不同。

例如,黑管和钢琴发出等响度且基频同为100 Hz的乐音时,我们完全能分辨出这是两种截然不同的乐器发出的声响,绝不会混淆,这就是因为它们有不同的谐波分量。若在声压级-频率的坐标系中画出各谐波分量,即可见它们呈现密线状排列的频谱图,如图1.4所示。由图可知,两种乐器产生的声音尽管基频相同,它们谐波成分的大小和分布却不尽相同。人耳正是根据频谱分布的不同特点得出足以区分声源的综合印象。

图1.4 钢琴和黑管的乐音频谱(基频100 Hz)

1.2.2 听觉效应

人类的听觉系统并不是完全线性的,声音信号在听觉系统中会被非线性加工,形成听觉效应。

1.人耳听觉的非线性掩蔽效应

人耳听觉的掩蔽效应是一个非常复杂的心理-生理过程。实验表明,当两个或两个以上的声音同时存在时,其中的一个声音在听觉上会掩盖另一个(或其他的)声音,这种现象称为掩蔽效应。人们把被掩蔽声音的闻阈在受其他声音干扰时应提高的分贝数定义为掩蔽量,以dB表示。掩蔽量不仅与频率有关,也与声音的性质有关。

一个声强为60dB、频率为1000 Hz的纯音的存在,产生的掩蔽效应会使原有的闻阈曲线在1000 Hz附近被提升。若另外还有一个1100 Hz的纯音,比它低18dB,在这种情况下人耳就只能听到那个1000 Hz的强音。如果有一个1000 Hz的纯音和一个声强比它低18dB的2000 Hz的纯音,那么人耳将会同时听到这两个声音。要想让2000 Hz的纯音也听不到,则需要把它降到比1000 Hz的纯音低45dB处。有关这一特性的图形说明及分析参见第7章。

上述掩蔽现象都发生在掩蔽声与被掩蔽声同时作用的情况下,称为同时掩蔽。但是掩蔽也可以发生在两者不同时作用的条件下。被掩蔽声作用于掩蔽声之前的掩蔽称为前掩蔽。掩蔽声作用在前,被掩蔽声作用在后的掩蔽称为后掩蔽。一般情况下,前掩蔽只有5~50 ms,而后掩蔽却可以持续50~200 ms,它们的掩蔽量及掩蔽信号的关系如图1.5所示。

图1.5 听觉的时域掩蔽效应

对掩蔽效应的进一步研究可得出以下结论:

① 掩蔽声的声压级越高,掩蔽量越大,且掩蔽的频率范围越宽;

② 被掩蔽声的频率越接近掩蔽声,掩蔽量越大;

③ 掩蔽声对比其频率低的纯音掩蔽作用小,而对比其频率高的纯音掩蔽作用大,即低频声易掩蔽高频声,所以,演播室特别要注意将空调的低频振动声、电子线路产生的交流嗡声减小到最低限度;

④ 掩蔽声在时间上越接近被掩蔽声,掩蔽量越大,即掩蔽效应越强,且后掩蔽比前掩蔽效应更为明显;

⑤ 单耳的掩蔽效应比双耳显著。

2.人耳听觉的延时效应

如果两个不同声源发出同样频率、同样强度的声音,其中一个延迟到达,当延迟时间小于50 ms时,人耳一般难以区分这是两个声音,而当延迟时间大于50 ms时,人耳便能立刻明确的区分出这是两个声音。人耳的这种对这几个声音的分辨能力的特性称为延时效应,又称哈斯效应。

哈斯效应经常应用于会场、厅堂的扬声器布置等方面。为了确保听者对语言声、音乐声的清晰感受,必须使不同扬声器传入人耳的时间差小于50 ms,常把延迟时间控制在30 ms之内。在剧场演出时,主扬声器一般都装置在舞台口两侧。观众席的前排观众和后排观众听到舞台上的演员演唱时送入人耳的声音强度是不一样的,前区座位声音响度大,而后排观众听到的声音响度小。为了减小前排和后排声压级之间的差异,有些剧场增加了顶部扬声器或中区侧部扬声器,使前区和后区的观众都能听到很强的响度。但是,这样就会出现新的情况:当演员在台上演唱表演时,因为顶部扬声器或侧部扬声器距离后区的观众较近,根据哈斯效应,人们的感觉是全部声音都是从顶部扬声器或侧面扬声器传来的,从而产生了演员在台上演唱,而声音都是从顶部或侧面传来的听觉、视觉不统一的现象。

为了消除这种听觉、视觉不统一的现象,在高级剧场中,对顶部扬声器系统和侧面扬声器系统都通过扩音器做了延时处理,使舞台两侧的主扬声器的声音和顶部扬声器与侧面扬声器的声音同时送入人耳,使听觉、视觉统一协调。

3.多普勒效应

当声源和听者发生相对运动时,听者感受到的声波频率和声源频率产生差异。当声源朝向听者运动时,听者感到频率变高;当声源背向听者而去时,听者感到频率变低。这是1843年多普勒发现的一种声音传播现象,称为多普勒效应。它常用于在演播室里人为地制造出频率变化,使影视节目中的运动物具有真实感。例如,在乘火车时,当两列火车错车时,会感到火车鸣笛声由低逐渐变高,而当火车远离时,又会感觉到火车鸣笛声由高变低。其实,火车鸣笛的声音频率是固定不变的,人们之所以感到它的频率在改变,是因为人耳与音源之间的距离发生变化所造成的。提高汽车鸣叫声的频率,让人感到汽车在“急驶而来”,而降低频率并减小音量,则可以产生汽车正“驶离现场”的感觉。

1.2.3 立体声的听觉机理

因为声音有确凿的方位来源,人们的听觉有辨别声源方位的能力,于是产生了立体声。

1.立体声的概念及特点

当有多个声源同时发声时,人们可以凭听觉感知声群在空间的分布状况。在听音者的听感中所展现的各声部空间位置,并由此而形成的声画面,通常称为声像。因此可以说自然界中声音是“立体”的。不过,当声音经过记录、放大等处理过程而后,重放时,所有的声音都可能从一个扬声器中放出来,这种重放声就不是“立体”的了,原来的空间感(特别是声群的空间分布感)也就消失了。这种重放声叫做单声。如果重放系统能够在一定程度上恢复原发声的空间感,那么这种重放声就称为立体声。所以,立体声一词一般特指那种有某种空间感(或方位感)的重放声。

立体声具有以下两个特点。

(1)声像的临场感

立体声的重放,能够比较真实地再现声场,使人感到声源的“像”(或声像)已被分布到空间的各个角落或某些范围,而不仅限于少数几个扬声器。不仅如此,借助于立体声声像空间的分布感及空间的层次感,使得那些需要突出的声部也能真实的再现。

(2)较高的清晰度和信噪比

立体声由于具有声像空间分布感的特点,声源来自于各个方位,掩蔽效应虽然还存在,但比单声道的影响小得多,因而清晰度较高。立体声可以相对减小噪声,提高信噪比。虽然立体声不能实质性地降低背景噪声(背景噪声依然存在),可是由于噪声的随机性,当立体声重放时,这些背景噪声声像也被分散到空间的各个方位上去了。

2.听觉定位机理

(1)德拜效应——双声源实验

进行德拜效应(Debye)实验时,扬声器布置如图1.6所示。将两个扬声器 YL、YR对称放置在听者的前方,分别送给扬声器相同的信息(即强度级差ΔL=0,时间差Δt=0),这时听者不能分辨出两个声音,而感到声音来自于两个扬声器YL与YR连线的中点上的一个声源,而实际中点并不存在声源,故称此中点为声像。如果增加两只扬声器辐射的强度级差ΔL,则声像向声音响的那只扬声器的方向移动,偏移量的大小与ΔL有关。当ΔL≥15dB时,听者会感觉到声音完全来自于较响的那只扬声器。

图1.6 双声源实验

经理论分析,在这种情况下,听音者感觉到的幻象声源I的位置与两扬声器信号的强度差有关。设左声道和右声道的输入电压分别为ULUR,两只扬声器特性相同,可推出幻象声源I偏离中心线的角度θI符合如下关系:

式中,θ I为幻象声源方位角,顺时针为正;θY为扬声器方位角。当频率低于700 Hz时,式(1.11)十分符合听觉实测值。当高于700 Hz以后,在相当宽的角度上符合如下关系:

可见信号频率基本关系式与低频相同,只需引进一个修正系数。由此,可以得出双扬声器系统声像的二路立体声正弦定律:给两扬声器送入内容相同、没有时间差的信号,只要改变信号电压的比例,声像就可以在两扬声器之间有规律的移动。

如果强度级差ΔL=0,但使两只扬声器辐射的声音有一些时间差Δt,这时听者感到声像向声音先到达的那只扬声器的方向移动,当Δt≥3 ms,声像好像完全来自先到达声音的方向。实验还表明,Δt与ΔL所引起的效果是类似的,它们可以互为补偿。当馈给两声源的信号反相时,听者将感到声像跳至两声源以外,利用这一特性,可构成立体声的声像展宽(Widening)功能。

德拜效应说明:不同程度地改变输送给两个声源同相位信号的电平,或者让两个声源的信号具有不同的时间差,就可以使听者产生声源移动的幻觉。这个移动的声像也称做虚声源。现代调声技术中的声像移动器(P.P)(或称全景电位器)就是借助于电路设计,将一个单声道信号按一定比例分配到左、右声道中去,从而使声像出现在重放声画面的任一位置上。

(2)双耳效应

当声源偏向左耳或右耳,即偏离两耳正前方的中轴线时,声波到达左、右耳的距离存在差异,而且受头颅阻隔,这将导致到达两耳的声音在声级、时间、相位上存在差异。研究发现,正是这种微小差异被人耳的听觉所感知,传导给大脑并与存储在大脑里已有的听觉经验进行比较、分析,得出声音方位的判别,这就是双耳效应。这些差异主要在于声音到达两耳的声级差ΔLP、时间差Δt和相位差Δφ

① 声音到达两耳的声级差ΔLP

两耳相距虽然不远,但由于头颅对声音的阻隔作用,声音到达两耳的声级可能不同。靠近声源一侧的声级较大,而另外一侧较小。其中低频绕射损失不大,由于遮蔽区的存在,高频声音损失较大,而且频率越高或声源偏离两耳中轴线的角度越大,两耳声级差ΔLP也就越大。这种现象称为遮蔽效应(注意:遮蔽效应与掩蔽效应不同)。由以上分析可知,声级差ΔLP用来判别高频声的定位。不过,当声源较远时,双耳处的声压将近似相等,因而定位作用不甚明显。

需要补充说明的是,遮蔽效应引起声级差的同时,也会导致两耳听到的音色不同,从而成为人们判别声源方位的一种依据。

② 声音到达两耳的时间差Δt

由于左右两耳之间有一定距离,因此除了正前方和正后方传来的声音之外,由其他方向传来的声音到达两耳的时间有先有后,从而造成了时差。如果声源偏右,则声音必先到达右耳而后到达左耳;反之,则必先到达左耳而后到达右耳。声源越是偏向一侧,时差也越大。实验证明,如果人为地造成两耳听音的时差,就可以产生声源偏向的幻觉。当时差到达0.6 ms左右(刚好是声音传过人两耳间距离所用的时间)时,就感到声音完全来自某一侧了。

③ 声音到达两耳的相位差Δφ

声源一旦偏离两耳的中轴线,声波到达两耳的路程就不等,到达两耳的时间也存在着差异。正是由于这个时间差使得声波到达两耳时的相位就可能有差别。耳朵内的鼓膜是随声波而振动的,这个振动的相位差也就成为判断声源方位的一个因素。实验证明,即使声音到达两耳时的声级、时间都相同,只改变其相位,也会感到声源方位有很大差异。

但是,以上种种差别在不同条件下,对听觉定位的影响也各不相同。一般来说,在声频的低、中频段,相位差的作用较大,中、高频段以声级差的作用为主。对于猝发声,时间差的作用特别显著。

(3)耳廓效应

使单耳具有声方位判断能力的耳廓效应,其心理-生理机制目前还不十分清楚。研究表明,人类耳廓的形状很特别,里面有多个形状复杂的曲面。当声波到达耳廓时,一部分声波直接进入耳道,另一部分则经过耳廓反射后才进入耳道。由于声音到达的方向不同,反射波和直达波之间的强度比不仅会发生变化,而且反射波和直达波之间在不同频率上会产生不同的时间差和相位差,使反射波与直达波在鼓膜处形成一种与声源方向位置有关的频谱特性,听觉神经据此判断声音的空间方向。实验证明,耳廓效应对4~20kHz频段的辨位能力最强。

耳廓效应对双耳的定位功能起着重要的补充作用。