1.4 声音的基本知识
声音的基本知识包括声音的基本性质、听觉的基本特性、立体声基本原理等。掌握这些基本知识,是正确理解音响技术所涉及的性能指标、电路原理和维修的必要基础。
1.4.1 声音的基本性质
声音是声源振动引起的声波传播到听觉器官所产生的感受。因此,声音是由声源振动、声波传播和听觉感受3个环节所形成的。下面首先来看声波的传播特性。
1. 声波的传播特性
声波在传播中不仅会衰减,而且遇到障碍物还会产生反射与散射、吸收与透射、绕射与干涉等现象,并具有一定的传播规律。
(1)声波的反射与散射。声波从一种媒质进入另一种媒质的分界面时,会产生反射现象。例如,声波在空气中传播时,若遇到坚硬的墙壁,一部分声波将反射,反射角等于入射角。当声波遇到凹面墙时,声源发出的声波经凹面墙反射后可以向某点集中,称为声波的聚焦;当声波遇到凸面墙时,将产生扩散反射,声波遇到凹凸不平的墙面则产生散射现象。
(2)声波的吸收。当声波遇到障碍物时,除了产生反射现象外,还有一部分声波将进入障碍物,进入障碍物(如吸声材料)的声波能量转变为热能而损失的现象称为吸收。障碍物吸收声波的能力与其材料的吸声特性有关。
声波的反射与吸收现象是听音环境设计中首先需要考虑的问题。在演播室、听音室、歌剧厅和电影院的四周总是建造成凹凸不平的墙面,就是为了使声波产生杂乱反射,产生均匀声场,并让墙壁吸收一部分能量,使这些空间具有适当的混响时间。
(3)绕射。当声波遇到墙面或其他障碍物时,会有一部分声波绕过障碍物的边缘而继续向前传播,这种现象称为绕射,又称衍射。绕射的程度取决于声波的波长与障碍物大小之间的关系。若声波波长远大于障碍物线度尺寸,则绕射现象非常显著;若声波的波长远小于障碍物线度尺寸,则绕射现象较弱,甚至不发生绕射。因此,对于同一个障碍物,频率较低的声波较易绕射,而频率较高的声波不易绕射。这种现象表现为低频的声音在传播时没有方向性,而高频的声音在传播时则有较强的方向性。
当声波通过障碍物的洞孔时,也会发生绕射现象。当声波波长远大于洞孔尺寸时,洞孔好像一个新的点声源,声波从洞孔向各个方向传播。当声波波长小于洞孔尺寸时,只能从洞孔向前方传播。
由于反射和绕射的共同作用,从没有关严的门缝里传播到房间中的声波几乎和门打开时的情况不相上下。
(4)干涉。干涉是指一些频率相同的声波在传播中互相叠加后所发生的一种现象。多个声源发出的声波,在传播过程中会产生叠加。如果两个声波的频率相同,相位也相同,即同一时刻处于相同的膨胀或压缩状态,则两个声波互相叠加而使声波增强;如果两个声波的频率相同,相位相反,则叠加会使声波互相抵消;如果两个声波频率相同,相位不同,则叠加会使声波在有的地方增强,有的地方削弱。若两个声波的频率、相位都不同,则叠加是很复杂的。声波干涉的结果是使空间声场有一个固定的分布。在扩声系统中需要通过改变扬声器的摆放位置与角度来调节声场分布的均匀性。
除了上述几种主要特性外,声波在传播过程中还有折射与透射现象、谐振现象、衰减现象等特性,即使声波在空气中传播也会有一部分声能损失而衰减。
2. 声音的三要素
声音主要是通过音量、音调、音色这3个要素来表现其特性的。在日常生活中,习惯用音量的大小、音调的高低和不同的音色来区分各种声音。这不仅与声音的声压、频率和频谱有关,而且也包括听者的心理和生理因素。
(1)音量。音量又称响度,是指人耳对声音强弱的主观感受。音量的大小主要取决于声波的振幅大小,如图1.3(a)所示。
图1.3 声音的性质和与之对应的波形
(2)音调。音调又称音高,是指人耳对声音的调子高低的主观感受。音调主要取决于声波的基波频率,如图1.3(b)所示。
(3)音色。音色是指人耳对声音特色的主观感受。音色主要取决于声音的频谱结构,如图1.3(c)所示。不同的乐器,即使发音的响度和音调完全相同,人耳也能通过不同的音色将它们分辨出来。另外,音色也与声音的响度、音调、持续时间、建立过程及衰变过程等因素有关。
1.4.2 人耳听觉的基本特性
1. 人耳听觉范围
人耳能够听到声音的听觉范围有两个方面:一是声波的频率范围,二是声压的幅值范围。人耳能听到的声音的频率范围称为可闻声,而听阈和痛域则决定了人耳能够正常听音的声压幅值范围。
(1)可闻声。可闻声是指正常人可以听到的声音,其频率范围为20Hz~20kHz,称为音频。频率在20Hz以下称为次声,频率在20kHz以上称为超声。在音频范围内,人耳对中频段1~4kHz的声音最为灵敏,对低频段和高频段的声音则比较迟钝。对于次声和超声,即使强度再大,人耳也是听不到的。
(2)听阈。可闻声必须达到一定的强度才能被听到,正常人能听到的强度范围为0~140dB。使声音听得见的最低声压级称为听觉阈值,它和声音的频率有关。在良好的听音环境中,听力正常的青年人,在800~5000Hz频率范围内的听阈十分接近于0dB,0dB定义为声波的强弱为20μPa(帕)的声压值,1个大气压=105Pa。当左右两耳听阈有差异时,双耳听阈主要决定于灵敏度较好的那只耳朵。当两耳灵敏度完全相同时,能听到的声音更微弱,双耳听阈比单耳听阈可低3dB左右。
(3)痛域。使耳朵感到疼痛的声压级称为痛域,它与声音的频率关系不大。通常声压级达到120dB时,人耳感到不舒适;声压级大于140dB时,人耳感到疼痛;声压级超过150dB时,人耳会发生急性损伤。
2. 听觉等响特性
听觉等响特性是反映人们对不同频率的纯音的响度感觉的基本特性,通常用等响曲线来表示。如图1.4所示是国际标准化组织(ISO)推荐的等响曲线,这是对大量具有正常听力的年轻人进行测量统计的结果,该曲线中声音的响度用“方”(phon)表示,以典型听音者刚能听到1kHz纯音的响度作为0“方”。等响特性曲线说明了人耳判断声音的响度,与声压级和频率都有关系。
图1.4 等响曲线
等响特性曲线反映的一个基本规律,是人耳对3~4kHz频率范围内的声音响度感觉最灵敏。这是因为图中纵坐标表示的是耳壳处的声压级,外耳道谐振腔提高了3~4kHz附近的声音强度。如果纵坐标表示的是鼓膜处的声压级,那么人耳对1kHz声音是最灵敏的。人耳对低频和高频声音的灵敏度都要降低。例如,对于人耳能听到响度为40phon的声音,若是1kHz的信号其声压级只要40dB,而如果是20Hz的信号其声压级却需要90dB才能感到同样的响度,两者的声压级相差50dB。
等响特性反映的另一个基本规律是声压级越高等响曲线越趋于平坦,声压级不同,等响曲线有较大差异,特别是在低频段。这个规律在音响技术中是有实际指导意义的,它说明若以低于或高于原始声音的声压级重放声源,则会改变原始声音各频率成分的相对响度关系,产生音色变化。例如,在重放音乐时音量开得很小,即使音乐节目中低音成分比较丰富,但听起来低频却明显少,低时不够丰满,不如声音开得大些好听。所以,在放音时,特别是小音量放音时,为了不改变原始音色,就应借助于等响曲线所揭示的听觉特性在电路中进行补偿,以提升低音及高音,这就是所谓的等响控制电路。
3. 听觉阈值特性
听觉阈值特性就是指人耳对不同频率的声音具有不同的听觉灵敏度的特性。通常情况下,正常人能听到的声音强度范围为0~140dB。人耳在800Hz~5kHz频率范围内的听阈十分接近于0dB,而对100Hz以下的信号或18kHz以上的信号的听觉灵敏度却大大降低,可觉察的声级明显高于800Hz~5kHz的中音频段。
在现代数字音响设备中,如DVD-Audio(DVD音频播放器)、MP3播放器等,就是充分利用了人耳的听觉阈值特性。如果我们把可闻频段的信号保留,而把不敏感频段的信号只反映其强信号,对人耳难以觉察的弱信号则可以忽略,这样就可以使信息量大大减少,如图1.5所示。从阈值曲线可以看出,如果舍去阈值界限以下的声音信息,其结果是对实际的听音效果毫无影响,但声音的信息量却可大大减少,从而达到了压缩声音信息量的目的。
4. 听觉掩蔽特性
听觉掩蔽特性是指一个较强的声音往往会掩盖住一个较弱的声音,使较弱的声音不能被听到,这种特性有频域掩蔽和时域掩蔽。
(1)频域掩蔽。频域掩蔽是指在稳定条件下,一个包含多种频率成分的声音同时发声时,幅值较大的频率信号会掩蔽相邻的幅值较小的频率信号,使之完全听不见,而且低于该频率的掩蔽范围较窄(掩蔽曲线比较陡峭),高于该频率的掩蔽范围较宽,可达该频率的数倍,如图1.5所示。
频域掩蔽特性揭示了当某一频率段附近如果存在着若干频率的声音信号,而其中一个信号A的幅度远大于其他信号的幅度,则人耳的听觉阈值将提高,使大音量信号A频率附近的小音量信号变得不可闻,像是小音量信号被大音量信号所掩盖;而与大音量信号不在同一频率附近的小音量信号,其可闻阈值不受影响,一样听得见。例如,有一复合音频信号,包含400Hz、1200Hz、2800Hz三个频率成分的声音,它们的声压级分别为60dB、20dB、20dB。对60dB的400Hz大信号来说,它的掩蔽曲线已示于图1.5中,位于该掩蔽曲线下的声音都被它所掩蔽而不能听到,由该掩蔽曲线可见,它在400Hz附近的掩蔽量为40dB,在1200Hz处的掩蔽量为32dB,在2800Hz处的掩蔽量为8dB。所以,此时人耳只能听到400Hz的大信号和2800Hz的小信号(2800Hz在听阈以上只有20dB -8dB =12dB),1200Hz的信号听不到,原来的复合音频的音色发生了变化。
图1.5 听觉阈值特性和频域掩蔽特应
在现代数字音频技术中,人耳听觉的这种掩蔽特性非常有用。根据这一特性,可以将大音量信号频率附近的小音量信号舍去,仍不会影响实际听音效果,但信息量会大大减少,从而达到压缩声音信息量的目的。
(2)时域掩蔽。人耳除了对同时发出的声音在相邻频率信号之间有掩蔽现象以外,在时间上相邻的声音之间也存在掩蔽现象,称为时域掩蔽。时域掩蔽分为前掩蔽和后掩蔽。如图1.6所示。一般说来,前掩蔽时间很短,大约只有5到10毫秒,而后掩蔽时间较长,可达50到200毫秒。产生时域掩蔽的主要原因是人的大脑处理信息需要花费一定的时间,导致紧随强信号后的弱信号听不到。
图1.6 时域掩蔽特性
根据时域掩蔽特性,在现代数字音频技术中,处理与传送音频信号的数据时,代表信号幅度的数据,可以从数毫秒传送1次延长到每几十毫秒传送1次,起到进一步压缩声音信息量的作用。
5. 哈斯效应
人耳对回声的感觉规律,首先是由哈斯提出的,故称为哈斯效应(Haas Effect)。其内容为:当两个频率相同、幅度相等的声源按不同的时间从不同方向传到人耳时,人耳对声源方位的听觉会出现下列3种情况:
(1)一个声音比另一个声音先到达5~30ms,则会感觉到一个延长了的声音,它来自先到达声音的方向,迟到的声音好像不存在。
(2)若两个声音先后到达的时间差为30~50ms,就会感到存在两个声音,声音的方向仍由先到达的声音决定。
(3)如果两个声音先后到达的时间差在50ms以上,则可清楚地听到两个声音来自各自方向。
利用哈斯效应,可以在常规条件下,利用人工延时、混响等技术来调整、合成各声道的发声,以模拟出音乐厅、电影院等厅堂的音响效果。
6. 德·波埃效应
德·波埃效应是一种利用不同的声音到达人耳的声级差(即强度差)和时间差来确定声音方位的听觉效应。若将两只扬声器左右对称地放在听者正前方,则听者感觉到两扬声器的声的声像位置有下列3种情况:
(1)当馈给两只扬声器的信号相等时,两只扬声器的发声无强度差与时间差,此时听者感觉声音来自两扬声器的中间方向。
(2)当馈给两扬声器的信号无时间差,但增益不同而使发声的音量有强度差时,则声像位置向音量大的扬声器方向移动。
(3)当馈给两扬声器的信号无强度差,但延时量不同而使两扬声器的发声有时间差时,则听者所感觉到的声像位置向先到达的扬声器方向移动。
上述时间差和强度差所产生的听觉效果类似,并且在声级差小于15dB和时间差小于3ms时,两者近似呈线性关系,即大约5dB的声级差与1ms的时间差所引起的声像移动量相同。
1.4.3 立体声基本知识
立体声基本知识是研究现代音响设备工作原理的基础。
1. 立体声基本概念
人耳对于声音的鉴别不仅有强弱、高低之分,还有确定声音方向、位置的能力。在音乐厅内欣赏交响乐时,不但能区别出乐器的类别,还能判断出各种乐器的位置。这种具有方位、层次等空间分布特性的声音就称为立体声。
用立体声音响技术来传播和再现声音,不仅能反映出声音的空间分布感,而且能够提高声音的层次感、清晰度和透明度,明显地改善重放声音的质量,大大地增强临场效果。
2. 立体声的成分
在音乐厅中,立体声的成分可以分为3类,如图1.7所示。
图1.7 直达声、反射声、混响声
第1类为直达声。它们从舞台上直接传播到听众的左、右耳。同一声音到达双耳所形成的声级差和时间差对判断乐器的方位起着决定作用。直达声能帮助人们确定声源方位。
第2类为反射声。它们是从音乐厅内的表面上经过一次反射后,到达听众耳际的声音,约比直达声晚十几到几十毫秒到达耳际。它对听众判断音乐厅空间的大小起决定作用,同时对听众心理也有重要影响。该时差小于20ms,会令人感到音质亲切;滞后30~50ms时,听众会感到连发两次,给人一种浮雕感;滞后50ms以上时,反射声尤如清晰的回声。一般音乐厅将初始反射声时差设计为小于30ms,以20ms为最佳。总之,反射声给人空间感,可以感觉到音乐厅的空间大小。
第3类为混响声。它们是声音在厅堂内经过各个边界面和障碍物多次无规则的反射后,形成弥漫整个空间、无方向性的袅袅余音。混响时间的长短决定于厅堂的几何形状及各界面吸音特性。混响时间对音质和清晰度有着重要的影响。总之,混响给人包围感,可以感受到声音在三维空间环绕。
反射声和混响声共同作用,综合形成现场环境音响气氛,即产生所谓临场感。优良的立体声应能再现这些要素。
3. 立体声的特点
与单声道重放声相比,立体声具有一些显著的特点:
(1)具有明显的方位感和分布感。用单声道放音时,即使声源是一个乐队的演奏,聆听者仍会明显地感到声音是从扬声器一个点发出的。而用多声道重放立体声时,聆听者会明显感到声源分布在一个宽广的范围,主观上能想像出乐队中每个乐器所在的位置,产生了对声源所在位置的一种幻像,简称为声像。幻觉中的声像,重现了实际声源的相对空间位置,具有明显的方位感和分布感。
(2)具有较高的清晰度。用单声道放音时,由于辨别不出各声音的方位,各个不同声源的声音混在一起,受掩蔽效应的影响,使听音清晰度较低。而用立体声系统放音,聆听者明显感到各个不同声源来自不同方位,各声源之间的掩蔽效应减弱很多,因而具有较高的清晰度。
(3)具有较小的背景噪声。用单声道放音时,由于背景噪声与有用声音都从一个点发出,所以背景噪声的影响较大。而用立体声系统放音时,重放的噪声声像被分散开了,背景噪声对有用声音的影响减小,使立体声的背景噪声显得比较小。
(4)具有较好的空间感、包围感和临场感。立体声系统放音对原声场音响环境的感觉是单声道放音所望尘莫及的。这是因为立体声系统能比单声道系统更好地传输近次反射声和混响声。音乐厅里的混响声是无方向性的,它包围在听众四周;而近次反射声虽然有方向性,但由于哈斯效应的缘故,听众也感觉不到反射声的方向,即对听感来说也是无方向性的。单声道系统中,重放的近次反射声、混响声都变成一个方向传来的声音;而立体声系统中,能够再现近次反射声和混响声,使聆听者感受到原声场的音响环境,具有较好的空间感、包围感和临场感。
4. 立体声定位机理
立体声的定位机理主要是通过人的双耳效应和耳廓效应进行的,它是双声道立体声放音系统的基础。
(1)双耳效应。人的双耳位置处在头部的两侧,假如声源不在听音者的正前方而是偏向一边,即偏离听音者正前方的中轴线,则声音到达两耳的距离不等,时间和相位就有差异,如图1.8所示。同时人的头部对侧向入射的声波,由于其中一只耳朵有遮蔽效应,因而传入两耳所感受的声音强度也有差别,即为声级差。就因为存在这些差异,才使我们能辨别出声源的方向来。如果用手捂住一只耳朵,则方向感就会立即下降。
图1.8 双耳效应与声音方位的关系
人的听觉中枢神经便是根据声音到达两耳的声级差ΔLp、时间差Δt、相位差Δφ等因素进行综合判断,来确定声音方位,所以称为双耳效应,这是人能够确定声音方位的最主要因素。另外,人耳辨别声音方向的能力还与声音的频率有关。声学常识告诉我们,前进中的声波如果遇到几何尺寸等于或小于声波波长的障碍物,声波可以绕射过去。由于人的两耳之间的平均距离在16.25~17.5cm之间,正好对应800~1000Hz频率声波波长的一半。当频率低于1kHz时,由于其波长大于17.5cm,因此声波能绕过人的头部而达到被遮蔽的那只耳朵,使偏离中轴线的低频声波到达两耳的声级差和时间差极小;当频率高于1kHz时,由于其波长较短,声波不能绕过头部传送,所以到达被遮蔽的那只耳朵的声级也就比另一只耳朵的声级低得多。故在双耳效应中,低音主要依靠相位差来判别,高音主要依靠强度差来判断。
(2)耳廓效应,也称单耳效应。人耳的轮廓结构较复杂,当声源的声波传到人耳时,不同频率的声波会由于耳廓形状特点而产生不同的反射。反射声进入耳道与直达声之间就产生了时间差和相位差,其时间差一般在几微秒到几十微秒之间,我们把这种效应称为耳廓效应,如图1.9所示。
图1.9 耳廓效应
耳廓效应对声音定位能起到一定的辅助作用,特别是频率较高的声音。当声波波长较短时,声波在两耳间形成的相位差对声音定位已无明确意义,但此时因耳廓效应,反射声与直达声在同一耳道中形成的相位差却是明显的,人耳的听觉神经中枢便根据这一相位差对声音进行辅助定位。正是由于耳廓效应,有时凭借一只耳朵也能对声音进行定位。
1.4.4 环绕立体声
当人们到音乐厅欣赏音乐时,除了直接听到从舞台上发出的乐器演奏声之外,还可以听到周围墙壁反射的混响声。然而,当我们利用双声道立体声系统播放音乐节目时,所能感受到的“声像”就仅为“点声源”,至多为“面声源”,这就失去了音乐厅里那种声音来自四面八方的立体感和空间感。为了弥补双声道立体声系统的这一缺陷,人们又研制、发展了环绕立体声系统。
1. 什么是环绕立体声
环绕立体声是近年来迅速发展起来的一种多声道立体声系统,它能够产生类似于立体空间形式的“声像”,使重放声场具有回旋的、缭绕的、空间的感觉,带有真正“立体效应”,聆听者犹如置身于真实的实际声场中,我们称这种立体声为“环绕立体声”,能产生环绕立体声的音响设备则称为环绕立体声系统。
环绕立体声是在双声道和多声道立体声的基础上发展起来的。不同之处在于它增加了后方的环绕声道,因而大大增强了声像的纵深感和临场感。而通常所指的环绕声,就是指声场中位于聆听者后方的声场,这个后方声场主要由混响声构成,其特点是无固定方向,均匀地向各个方向传播。因其包围着或者说环绕着聆听者,使听音者获得了空间感和包围感,故此得名。
2. 环绕立体声系统的类型
目前,环绕立体声系统主要有以下几种。
(1)杜比环绕声系统(Dolby Surround System),即Dolby AC-1。杜比环绕声系统是一种能兼容双声道立体声的多声道环绕立体声系统。它是由杜比实验室研制的一种矩阵式4声道立体声,它通过矩阵运算对原信号进行处理,将4声道信号变换(编码)为两路信号,以便由双声道音频系统进行传输或记录;在还音时又将两路编码信号还原(解码)为4声道信号,再通过前左(L)、前右(R)、中央(C)、后环绕(S)等扬声器系统进行放音,从而营造出一个具有空间包围感的立体声场。
(2)杜比定向逻辑环绕声系统(Dolby Pro-Logic Surround System),即Dolby AC-2。杜比定向逻辑环绕声系统是对杜比环绕声系统进行改进后的环绕声系统,仍属于矩阵式4声道系统。它通过方向增强技术,采用自适应矩阵代替原有的固定式矩阵,并增设了中置声道和中置声道模式控制电路,使各声道的信号分离度大大提高,方向感更强,声道之间的串音大为降低,所营造的三维环绕声场比杜比环绕声有了很大的改善。
(3)杜比数字环绕声系统(Dolby Surround Digital),即Dolby AC-3。Dolby AC-3是5.1声道的数字环绕声系统,即前左(L)、前右(R)、中置(C)、后左环绕(SL)、后右环绕(SR)5个声道,另加一个重低音(SUB)。各声道完全独立、全频响(即5个声道的频响均为20Hz~20kHz)。AC-3是一种数字音频感觉编码系统,即利用人耳的听觉掩蔽特性来对各声道的数字音频信号进行高效的压缩编码处理,使5个声道的音频数据传输量大大减少。AC是Audio Perceptual Coding System,即音频感觉编码系统的缩写。由AC-3所营造的三维环绕声场具有极高的保真度和极好的环绕声效果,各项性能指标比上述的两种模拟音频技术的环绕声要高出很多。现在,Dolby AC-3在电影、DVD、数字电视等方面得到普遍应用。
(4)数字影院系统。数字影院系统称为DTS(Digital Theater System),这是继杜比AC-3之后出现的一种效果更好的环绕声系统。DTS采用了一种新的数字环绕声格式来记录声音,其最大特点是它的声画分离方式。DTS的声音处理需要有专门的DTS解码器。DTS也为5.1声道(类似于杜比数字环绕声)。在DTS标准中,左、中、右3路的频响为20Hz~20kHz,左环绕、右环绕声道的频响为80Hz~20kHz,超低频为20~80Hz。DTS系统在实际听音中,可以得到更清晰的声场分布和身临其境的感觉。
(5)虚拟环绕声系统。虚拟环绕声系统是利用虚拟扬声器技术,通过双声道系统来再现三维(3D)环绕立体声效果的一种新颖的环绕声系统。这种环绕声系统只要用双声道的功率放大器和两个声道的音箱,即可虚拟出3D环绕声场,实现三维环绕声效果。不需像杜比环绕声那样,需要配置4声道或5声道的功率放大器和音箱,以及配置杜比环绕声解码器,可以大大节省音响设备的投资。目前使用的有SRS(Sound Retrieval System,声音恢复系统)、Q-Sound、Spatializer(空间感环绕声)、VDS(Virtual Dolby Surround,虚拟杜比环绕声系统)等,其中SRS虚拟环绕声的应用最为普遍。