03 和谐之声 Sounds in Harmony
音符是什么
“音调”(tone)和“音符”(note)[1]这两个词分别反映了声音的主客观性质,音调是具有特定频率的声波,音符是其给人留下的主观印象,对应特定音高。
除了音高,一个音符还具有时值、响度和音色等特征。音色是迄今为止识别乐器最重要的特征,也是情感内容的主要载体。实际上,由于音色极为复杂,它与其他特征相比有明显区别。这有点像根据性别、身高、体重和指纹来定义一个人,前三个参数都可以明确到某项具体值,但是对一个人指纹的完整描述是非常复杂和多维的。同样,只有音色是特定的乐器或人所特有的特征,所以它是大脑用来识别声音唯一性的东西。
指纹侦探没有这种担忧,但对大脑来说音色是个问题。音色是一种动态特性,也就是说,它会随着时间而改变。铙钹、钢琴或鼓的音色从开始到结束都有很大的变化(这种变化称为流)。特定乐器或扬声器的音质也会随着音调和响度而改变。例如,大提琴的高音与低音相比有着不同的音质,同样的一个字吼出来和讲出来相比并不仅仅是声音大了一些,而一个男高音歌唱家在唱出他能达到的最高音时比唱低音听起来更单薄。幸运的是,我们可以依靠高度进化的听力,专注于声源发出的第一个声音,从而理解这一切。
史前议程
我们对音乐的欣赏和我们对噪声的厌恶可能源于进化的压力,这种压力塑造了我们远祖的听觉系统。他们听到声音之后的首要任务是识别它,且没有时间去纠结。弓箭弦的响声、雪崩的隆隆声、正在接近的滚滚蹄声或蛇发出的咝咝声,只有在听者反应迅速的情况下才是有利的声音,因此听觉系统将其分析能力集中在听到声音的最初时刻。这就产生了一个令人惊讶的结果,即一件乐器在最初几秒内发出“突发”声,尽管通常是不和谐的,听起来也不像乐器的“稳态”声,但正是“突发”声使我们能够识别出那件乐器是什么。一段经过编辑,删除了所有突发声音的录音音乐听起来很奇怪,我们很难识别出发声乐器。多年来,这一事实阻碍了人们制做更符合听觉规律的乐器。
通常情况下,乐器,甚至乐曲都能在一秒内被辨认出来。曾经有一个相当受欢迎的电台(后来又上了电视)智力竞赛节目叫《听歌识曲》(Name That Tune)。你很容易就能识别一段你熟悉的录音,即使只是听到开始的一点声音,你也足以识别它。同样,一些声音会立即告诉听众整首曲子的味道:一个和弦可能有一种“墨西哥”的味道;几下小提琴弦的拔弦可能听起来有“乡村风”;一个尖的风笛音有“苏格兰”的风味;或者几个音符就描绘出“凶猛鲨鱼在逼近”。
我们对这些简短提示的反应主要是情绪上的,这与它们最初作为危险警告的作用相吻合。狮子的吼声或安全搭扣松开时发出的咔嗒声会立即引起本能反应,使人释放肾上腺素,为逃跑或战斗做准备。事实上,我们对身边突然出现的巨大声响的瞬间反应是远离它,如扬声器发出的尖叫声会让我们立刻跳开。即使是连续的声音,如果足够大,也会令人反感。因此,基本上没人愿意从风钻旁边经过。
与我们对突发声音的关注相反,我们会渐渐失去对持续声音的关注,这导致一个看似矛盾的现象,即恒定音量的声音在持续几十秒后听起来变得安静了。在自然界中,这些声音听起来可能像微风一样无害。但是,如果这种长时间存在的声音突然停止,这种戛然而止就像声音刚出现时一样引人注目。
从声音研究的角度来看,听音乐的行为受到了相当大的关注。例如,音乐学家和哲学家彼得·森迪(Peter Szendy)认为,听音乐的重点是与其他作品、表演者、乐器以及其他听众的比较。他的观点是,由于听音乐的行为不断地以这种方式“占用”了其他东西,所以我们永远无法完全把握一段音乐的本质。
学习如何唱歌
对许多人来说,音乐之声远比其他类型的声音重要得多,以至于许多人几乎无法抑制自己想要突然放声歌唱的冲动。你通过唱《飞越彩虹》(Somewhere Over the Rainbow)来愉悦自己,可能在一定程度上也愉悦了周围的人。朱迪·加兰(Judy Garland)当然唱得更好,这一点毋庸置疑。但她是如何做到这一点的?虽然你的听众可能不喜欢这首曲子,但他们肯定能听出来,因为即使很多音符是错的,它们至少会按正确的顺序在音高上上下移动,并用他们熟悉的规律改变着音长。
音符和休止符(即音符之间的间隙)的长短由它们的形状表示,定义为“完全的音符”(全音符)长度的几分之几,如表2所示。
表2 音符和休止符
通常,音符没有标准的持续时间。尽管在某些情况下,作曲家在其乐谱上会标类似“♩=66”的记号,这意味着“一个四分音符持续1/66分钟”。然而,通常情况下,一首乐曲速度(专业术语为tempo[2])的唯一标记是一个有丰富含意的短语(通常是意大利语),比如行板(以步行的速度)或从容的快板(快但不太快)。也许是因为节奏的概念在生活中不适用,我们对它的判断力很差——无论是业余爱好者还是专业人士,能发现乐曲里大约4%的节奏差异,就是极限了。
除非你是一个训练有素的歌手,或者天生的好歌手,否则你可能会唱出一些稍微“平一些”(也就是说,比本应该唱的音要低一点)或“尖一些”(比本应该唱的音要高一点)的音符。但这里的“应该”是什么意思呢?这并不意味着“唱对了音”。你在唱“在”字的时候是300赫兹还是333赫兹并不重要,重要的是你要得到一个正确的频率比。所以,如果你用300赫兹唱“在”,就必须用600赫兹唱“哪里”,也就是高一个八度,要不然人们听了就会直皱眉头。
因此,如果你在用钢琴给自己伴奏,唱的调却和钢琴不同,那听起来肯定是不合调的。对钢琴家来说,“在”是一个“Fa”。一架88键的钢琴上有8个“Fa”键,任何一个“Fa”键都可以用在这里——如果选择第四个“Fa”,钢琴就会发出349赫兹的音符。
如果你真的发现自己能“自动”与钢琴合调,那么你可能拥有一种罕见的特质,即绝对音准(absolute pitch,也叫绝对音高)。拥有绝对音准的你只需要唱出与钢琴相同的音符即可。但如果你回到两个世纪以前,那时钢琴的音调和现在不一样,那你也就无法和它们保持一致。如果你想和当时绝对音准的歌手合唱一首无伴奏的二重唱,其结果听起来可能并不令人满意。
不过,从某种意义上说,你的音准比你19世纪朋友的要好。如果你穿越两个世纪去未来,你的绝对音准就可以和其他人相比较,但19世纪的人就不一样了。这是因为,1939年在伦敦举行的国际标准组织(International Standards Organization)会议上,许多国家都同意将特定音符规定为特定频率。同许多其他国际协定一样,产生这项协定是因为长久以来的走调情况已经变得让人无法容忍。
由于乐器制造者、音乐家和作曲家在不同的国家基本上是独立发展起来的,所以他们都采用自己的音高标准。在拥有多个音乐中心的国家,音高甚至因城市而异。1780年,一个拥有绝对音准的柏林人在维也纳也会走调。在一个城市制造的小号在另一个城市就会走调,而且小号一旦做出来就不能再调音了。因此,随着音乐家的国内和国际旅行变得越来越普遍,成功的乐器制造商想要将他们的客户群扩大到更远的地方,对国际标准的需求变得更加紧迫——因此就有了这次会议,会议举办的时间甚至定在战争前夕。
绝对音准并不是与生俱来的天赋,必须靠学习掌握,而且得在6岁之前学习,通常是通过记住乐器上的所有音符。从表面上看,这几乎是一项令人难以置信的记忆壮举,而这种记忆技巧对成年人来说已经是不可能习得了。有些孩子似乎更容易学习绝对音准。在中国和越南拥有绝对音准的人要高于欧洲或美国,这可能是由于东方语言中的词语对音调有更高的依赖性。
对我们这些缺乏绝对音准的人来说,我们记住的是音符之间的差异(音程),而不是音符本身。因此,无论是低音提琴还是小提琴,我们都能立即识别出来其演奏的熟悉曲调。
为什么我们喜欢我们所做的事情
到目前为止,音乐中最重要的音程是八度,即一个音符的频率是另一个音符的两倍。八度的重要性有一个事实支持,在我们今天大多数人使用的A到G的记谱系统中,相隔一个八度音程的音符由相同的字母表示。为了区分每个音符的不同,一般会要求使用数字下标(所以钢琴上的第四个F是F4)。
一个八度的音程是和谐的,我们听到和谐音程,即和音的感觉就是听觉上的愉悦。除两个相同的音符外,八度是所有音程中最和谐的音程。
虽然我们知道大脑对谐音的反应会受神经刺激,但对和谐音程听起来很协调的原因还不是很清楚。也就是说,对这类声音的每个组成部分做出反应的神经元倾向于彼此同步它们的放电速率,因此,和谐的音程对我们来说显然很重要。为什么我们觉得和谐音程令人愉快,而不和谐的音程就没有这种感觉呢?事实上,尽管我们通常不喜欢单独的不和谐的声音,但从古希腊时代起,作曲家和他们的观众却渐渐喜欢上了不和谐的声音。西方音乐史上一直有人不断采用更多的不和谐的声音,这就是为什么听斯特拉文斯基(Stravinsky)的《春之祭》(Rite of Spring)或莫扎特(Mozart)的《弦乐四重奏》(Dissonance Quartet)不像过去的那样令人害怕。然而,如果按照人们的感受对音程进行排序,其结果常常与地理或历史因素无关,所以和谐是客观存在的。事实上,有两件事值得注意:
1.我们的耳朵还不够“粗糙”。当耳朵接收到两个频率相近的音调时(大约5%的不同,或两三个半音),我们会认为听到单个不太精确的音符。
2.与谐波系列的相似音调,也就是说一组具有1千赫、2千赫、3千赫、4千赫等频率的音调也很和谐。
更多的音符
音乐创作不能仅仅依靠八度音阶。首先,人类的听力范围不超过10个八度。其次,演奏出这样一个音域也是一种挑战,小提琴和吉他能演奏大约四个八度,天赋异禀的人能演唱五六个八度,钢琴能演奏七八个八度。此外,如果每首曲子都是最纯粹的和音,很快就会变得单调乏味。
八度音阶被定义之后,毕达哥拉斯和其他探索者就开始在八度音阶上添加音符,开始了一项长达千年的研究项目。尽管毕达哥拉斯研究的是单弦,但最容易的方法是用几个长度可变的弦,并要求它们都具有相同的张力和粗细,且由相同的材料制成。
在八度音阶之外,第二和谐的一对音符是由一对长度比为2/3的弦组成的。其他三个简单的弦长比产生了其他听起来相当不错的音符组合,如表3所示。
表3 和谐音程
如果我们按照表3中定义的弦长制作一个竖琴,并要求弦的粗细、张力和材料都一样,我们会很容易得到简单、听起来令人愉悦的和弦。事实上,任何一对或大量这样的弦在一起弹奏,听起来都不会太糟。
这个系统被称为五声音阶。它是由世界各地的许多古代音乐家独立发现的。至今仍很流行的《奇异恩典》(Amazing Grace)、《我的女孩》(My Girl)和《我射杀了警长》(I Shot the Sheriff)等乐曲都是按五声音阶创作的。钢琴上的黑色琴键是一系列五声音阶,所以如果你随意按下它们,听起来不会像随便乱按白色琴键时那么糟糕。
更多更多的音符
人们虽然喜欢和谐的音乐,但同时也喜欢带一点点不和谐的音乐,五声音阶对那些想要挑战听众、突破界限的作曲家来说,实在是太和谐、太安全了。而且,每八度只有5个音符仍然不算是很多,但是如何添加更多的音符呢?这个问题引发了数百年的仔细实验和学术辩论,最终形成了一种被称为“十二平均律”的系统。在这个系统中,一个八度音阶被分成12个音符,相邻的两个音符之间相差一个半音,或者100音分。
在音乐中,重要的是音符的比例,而不是音符本身,因此半音和音分都是按比例设定的。每一个半音比前一个的频率高约6%。这意味着与半音对应的频率越高,音符就越高。
一些作曲家曾经尝试在每个八度音阶上使用超过12个音符。在从一个音符逐渐到另一个音符的过程中,额外的音符可能会短暂地出现(这被称为滑音,或滑奏)。然而,在所有的文化中,每个八度的“合适”音符几乎总是12个。
在定义了12个音符之后,人们开始在每个八度音阶中只使用其中的8个音符(因此得名八度音阶)。一个八度音阶中只有7个不同的音符——第八个和第一个是一样的,只是比第一个高一个八度(即使是能立即识别一个音符的专业音乐家也很难说出它是哪个八度)。
心理学家乔治·米勒(George Miller)在1956年解答了我们在一个八度之间只用12个音符中的8个的原因。他通过实验发现,我们的短时记忆最多只能同时存储7个项目,也就是只能有7个不同的音符。
整组12个音符中相邻的音符之间有一个半音的跳跃,所以我们选择的任何7个音符组成的音阶都会间隔一些全音(两个半音)。这样我们才能有ABCDEFG这样的音阶。音阶是每个音符都高于前一个音符的任意序列。
我们选择了7个不同的音符来定义音阶,但这并不意味着我们不能在一段音乐中使用其他音符。如果想要使用那些“间隙”音符,我们可以用符号来标记它们,这些符号表示“比音阶中下一个最低音符高半音阶”或“比下一个最高音符低半音阶”。
在上面我们给出的音阶例子中,在第一个间隔中产生的额外音符被称为升A(升号记作♯)或者降B(降号记作♭)。如有需要,音符还可以进一步细分,这种更小的音阶被称为微分音。
在写一首乐曲时,通常有一个比其他音符更重要的音符——主调或主音。通常,这个音符是一首歌开始和结束的音符。在《飞跃彩虹》中,主音是落在Some和I上的。在影片中朱迪·加兰演唱时主音是降E(♭E)。因此,她唱的版本被称为降E调。
如何选定一个音阶呢?乐曲的情绪是主要的考虑因素。如果作曲家写的是一首自信、欢快、节奏快的曲子,他可能会选择大调。要写一首情感不太清晰的曲子,通常要选一个小调。大调和小调音阶的主要客观区别是(自然)大调音阶主要由主音(可以是任何音符)再加上6个与主音搭配最和谐的音符。“搭配最和谐”的意思是它们的波长比是整数的概率最大。因此,声波结合在一起形成了最规则的模式。在实践中,我们拿一个五声音阶并增加两个音[3]。这两个音符中的一个叫导音,其频率是音阶最低音的 。
在一个自然的小调音阶中是没有五声音阶中的两个音符以及导音的(它们被下移了一个半音)。其结果是,不再有大量的简单整数比,结果更模糊、更复杂,听起来更不完整。
此外,当我们听到任何演唱或演奏时,音符总是伴随着完整的和声(除了一些电子乐器)。大调音阶也包含所有这些和声,小调音阶则不包含。因此,在大调音阶中有一种真正的“自然性”或“完备性”,而这在小调音阶中是没有的。《奇异恩典》和《我的女孩》都属于大调,《我射杀了警长》属于小调。
过去(现在也仍然)有人声称,除了大调和小调的区别,每个调都有自己的情感特质。大量的实验证明事实并非如此。这一想法很可能是受著名或有影响力的音乐作品的影响而产生的——模仿往往具有相同的基调,因此与原作的情感品质有关。这并不是说曲调的选择是任意的,有些乐器的设计是为了让特定曲调从生理角度来说更容易演奏一些。
声音序列
虽然世界各地音乐创作的“原材料”相似,但在发展上却有很大的不同。在西方音乐中,使用的音符相对较少,但它们经常被同时演奏(和弦)或相互关联(和声)。如果我们同时处理7个以上不同的音符,作曲就会更加困难。特别是,同时演奏或演唱不同旋律的复调乐曲将变得几乎不可能。在东方音乐中,作曲家往往使用更多的音符,但更少和声。这种方法上的差异也通过乐器设计体现出来。西方的乐器,如吉他和管风琴,是复调的;而东方的乐器,如锡塔琴,通常一次只能发出一个音符,但可以很容易快速而微妙地改变那个音符。
西方音乐和其他音乐之间的差异可能起源于10世纪,那时复调音乐诞生于欧洲(尽管有些人认为复调音乐的诞生要早得多)。从复调音乐中产生了西方特有的多音调方法和发展这种方法所需要的和声研究。有人认为,第一次进行复调实验是为了让男人、女人和孩子们一起唱歌。
旋律
按顺序演奏一些音符,你就能得到一段曲调,从技术上讲就是一段旋律了。如果我们不考虑不同的音高,那么剩下的就只有所谓的节奏,即音符的相对长度和休止符,演奏整首曲子的速度(节奏),以及节奏的模式(节拍,或称拍子)。这不仅代表单词“韵律”这种技术意义,它其实是指音长的模式。在《飞越彩虹》中,从技术角度看它的节奏就是“长、长、中、短、短、短、中、中”。
节拍是由时间拍号标出的。最普通的节拍四四拍的拍号是。分母上的数字给出了用来指定节拍的单位;分子指定了每组的节拍数。在乐谱中,每组的结尾都用一条竖线表示,这条线叫作小节线(四四拍指每小节有4个四分音符)。
音乐中的重要拍子类型并不只有这一种,两个波长相似的音调同时演奏时会产生另一种拍子。每隔一段时间,两种声波的波峰或波谷就会重合,叠加在一起,形成特高压区或特低压区。这种效应被称为低频“拍”,拍的频率等于两个声波频率之差(见图13)。
观看任何一部讲述伦敦警察的黑白惊悚片,当警察吹哨子时,你都会听到节拍。这种哨子用两根长度略有不同的管子来发出引人注意的声音。但节拍也并不总是令人不快,有一些管风琴中包含一个名为天籁音栓(voix c leste)的止音器,它控制着一组稍微走调的管子。当与普通的管子一起演奏时,产生的节拍会发出令人愉快的摇摆声。
图13 节拍
间奏
传统的乐器是根据它们最初是由什么材料制作来决定分类的,因此有弦乐器、铜管乐器、木管乐器和其他乐器(比如打击乐器)。另一种方法是通过乐器是有音调的(像钢琴)还是无音调的(如沙球)来决定分类。任何音乐都需要节奏,使用没有音调的音源可以避免与“旋律”乐器产生不和谐。节奏源不一定是一种乐器,让-巴普提斯特·卢利(Jean-Baptiste Lully)曾用一根大棒敲打地面。这已经不流行了,部分原因可能是卢利死于这种演奏:大棒打到了脚背,导致他患上了晚期坏疽。鼓很快成为一个更受欢迎的音源,尽管它们也被用作“实际”的乐器。低音鼓和小军鼓这样的鼓是没有音调的,但定音鼓有音调。
大多数有音调的乐器都是通过敲击或拨弄弦、线、板或其他固体来发声,也有一些通过肺部或风箱提供能量使空气柱振动来发声。在这些情况下,乐器由共振加上泛音(在有铃铛的时候还有底音,也称为次谐波)来提供所需的声音。
这使得制作乐器看似挺简单,但实际上有三个难点。第一点,像金属板这样的物体不仅在两倍于其长度的波长上共振,在两倍于其宽度和厚度的波长上也共振,它旋转时还会发出其他声音。
对弦乐器演奏者来说,第二点非常有用。当一个物体,比如说120厘米长的弦被击打(或弹奏、运弓),它的运动模式不仅取决于它的长度,还取决于击打的位置点。因为击弦点只能是一个波腹,而弦的末端只能是节点,所以如果弦在距离端点40厘米的地方被击打,它就会形成一个节点与反节点距离为40厘米的基频,因此波长会达到160厘米。此外,还会有一种节点与反节点距离为80厘米的声音。当弦的振动变成它的固有振动模式时,这些成分会迅速消失,这种振动模式的中心有一个腹点,因此会产生240厘米波长的音调。主观上的影响是,近中点拨弦发出的声音更柔和,近端点拨弦发出的声音更刺耳。
风笛和管乐器的工作方式与此类似。在一个开放的管中,最常见的是有一个可以自由运动的开口端和不能自由运动的封闭端(封闭端不可能有自由运动)。12厘米长的管会有一个基本节点在0厘米处,第一波腹在12厘米(由于终端修正会多出一点点),因此波长约48厘米。但是,就像在弦乐器中的情况一样,这还没完。虽然基频是由管的长度来定义的,但是其他的共振会根据管道的宽度来产生。这些与基本音及其泛音的混合产生了不同的音色,在更宽的管子里,较低谐波中有更多的能量,音色更圆润,而更薄的管子音色则更明亮(或更尖锐,每个人的感觉不同,因而描述也会不同)。
乐器制造商最后要考虑的是,一根位于两点之间的弦只会发出非常小的声音,因为它非常薄的横截面只会影响到周围很小体积的空气。为了把弦变成乐器,必须使更大体积的空气运动。在电吉他中,这是通过使用金属弦的振动在拾音器(用细线缠绕的磁铁)中产生小电流来实现的。在原声吉他和其他弦乐器中,顶部木质共鸣板受弦影响而振动,它的面积更大,比弦本身能够移动的空气更多。此外,在低频段,这些乐器的空心体充当亥姆霍兹谐振器。
非电子的乐器没有能量输入。相反,它们将琴弓、拨片或气流所提供的能量转化为一种声学形式。在某些情况下,当乐器的主体将频率移到4千赫左右时会听起来更响,尽管由于摩擦损失,声音功率实际上减少了一点。这种响度的增加源于我们听觉系统的结构,我们将在第4章中看到。
[1] 原文note统一译为音符。但实际原意更接近单音,和其让人产生的听觉感受。
[2] tempo是意大利语“乐曲速度”的意思。
[3] 指在五声音阶CDEGA中间添加F和B这两音构成七声调式,其中B就是那个导音。