科学角度看音响:先了解声音,再认识音乐,最后挑音响.
台湾水电工原本是拍摄爱情动作片出身,对于音响这种声光娱乐专业技能当然是有练过的行家。但音响领域真的是相当专业的学问,也是现代电子电机学生最不擅长的一块。因为多数做模拟的工程师,都已经在数字时代的洪流中,被那22K薪资搞死了。
各位,模拟工程是极需经验的工作,不是说念完一本电子学就可以搞定的东西。况且声音对于电子讯号来说极为复杂,由低频至高频相差近千倍的低带宽模拟讯号。像是多数音乐和录像带,声频讯号都在40Hz10年,处理过几十个项目,绝对不会有很好的设计能力。音响与线路设计是没有快捷方式可走的工作,都得在实战中获取经验,这也是为什么专业人才难以培养的原因之一。
听不出来的小细节
因为人才养成费用高昂,加上每个人听力有不小的差异,多数人很难辨别细微的差异。很多公司干脆就不养这么高级的人力了,反正各大3C厂商就赌听得出声音有问题的人不到1%,所以声音糊、声音烂都无所谓,只要有声音别太夸张就好。身为计算机3C相关产业的一股清流,计算机王当然有义务告诉大家,什么样的声音才是好的声音,而怎么样才可以破除某些花大钱但又没学理基础的音响迷信。
▲低价位声卡近10年来几乎绝迹,主因就是主板内建音效芯片,就能满足多数人的使用需求,加上价位因素让低价声卡几乎没有竞争力
频率单位:Hz
讲到声音一定会提到频率,频率是指单位时间内重复发生的次数。常用的国际单位是赫兹,英文为Hz,该单位是纪念德国物理学家Heinrich Hertz。Hz是指每秒内重复发生的次数,例如400Hz即代表每秒重复400次。
谈音响前先了解声音
声音到底是什么?这个问题真是很尴尬,说简单很简单,但仔细说来又很复杂。小学教材都念过,声音是因为物质振动,而打动了周遭的空气分子,造成空气产生了疏密分布的波动,而这个波动会以约每秒300公尺的速度前进,就成了声音,而这个速度也就是音速。以上是小学生的程度,要达到水电工的程度还需要再努力一些。
同声频不同声音
声音最关键的是「组成成份」,好比我们人说话的声频都在相当的范围内,但每一个人的声音听起来都不一样,差异就是组成的元素不同。又好比同样一架钢琴和一架手风琴发出同样频率的音阶,但是绝对不会有人把钢琴的声音和手风琴的声音搞错。经过近代讯号学的各种实验发现,我们的大脑神经在解释声音讯号时,除了可以认出声音的基本频率之外,更可以认出其它的部分而且相当灵敏。
认识泛音和相位
自然界物体很少有所谓的纯净声音,因为自然界大部分物体都是成份复杂的复合物。当我们加入1个能量产生振动时,发出的声音频率一定不只1个。而且每个频率讯号产生的时间点也不相同,因而产生大量不同的排列组合,才造就了如此多变的声音。经过许多世纪的数学发展,水电工前辈们发现,当我们把这些讯号经过数学方式,像是用级数方法拆解成各种的正弦波(Sin波),就可以看出声音有几个重要的组成成份:基频、泛音、相位等元素。
基频是比例最大的能量
基本频率(Fundamental Frequency,简称基频)是指声音经过拆解后,占比最大的能量落在哪个频率。通常在自然界的声音中,这个成份会落在最低的频率。好比我们用钢琴发出标准音A的声音,最低的频率就会在440Hz,此时440Hz就是基频。
人类发声的基频
人类是透过声腔区域发出声音,由于口腔结构的差异,造成每个人基频不同。小孩的基频约在250∼400Hz,成年女性基频约200∼300Hz,男性则是100∼150Hz。从数据中不难看出男性基频比女性低很多,这也是为什么男高音相当少见。
单一频率的纯音
看到基频与泛音,那应该会想到,世界上有没有单一频率的声音。自然界中单一频率的声音相当少见,在生活中比较容易看到单一频率的例子是音叉。在定义上,我们将单一频率的声音称之为纯音。
泛音可能有多个
如同先前所述,当复杂的复合物体产生振动时,绝对不会只出现单一频率,那其他的频率就称为泛音(Overtone)。通常在乐器上出现的频率,都会是基频的整数倍数。好比用钢琴弹奏标准音A440时,我们将声音拆解成正弦波,就会发现除了基频440Hz外,另外存在880Hz和1320Hz及1760Hz的弦波,而且所占的比例也不低。
钢琴的880Hz大约占了总能量的14%上,1320Hz和1760Hz也大约是这个比例。若基频的频率为N,则频率为2N的就称为第二泛音,这在讯号处理中则叫二次谐波,3N的叫做第三泛音依此类推。离基频愈远的泛音通常占能量的比例会愈小,但也不是必然。好比钢琴有时第三泛音的成份会超过第二泛音一点点,但大致上来说还是愈远的泛音愈小,像钢琴的第四泛音就只有3%左右,之后泛音占有的比例会更小。声音最单纯清亮的三角铁,第二泛音就小到只有2%不到,而第三泛音连0.01%都不到。
▲上图为乐器之王钢琴的声音的频率分布及波形
自然界的声音有时相当复杂,因为可发出声音的物体太多了,有些不牵涉到共振,像是2颗石头互撞,海浪声等等。会一次发出多种基频和各自的泛音,但各种高等生物的神经却都有办法依经验辨识出来。相位落差能听出来相位是指正弦波产生的角度,好比范例图中2个正弦波频率相同但是相位却不同。相位在单一音频时没有很大的重要性,但是在复合音频中却有绝对的重要性。相位就算只改变一点点,却可能让波形看起来差很多,而人的耳朵的灵敏度可能比一般人想象更好,只要有一点点相位变化就可以听得出来。
范例的2种声频讯号,人类听觉可能会觉得它们相似,但仔细听时仍然会感觉出差别,这也是烂音响也照样能听的主要原因之一。在测量仪器上面,目前市售的各类量测噪声、失真和干扰的精密仪器全都测量不出来这种相位变化。至于频谱仪更不用说了,频率成份没有变,只有相位有变,在频谱仪上看起来差异会小到完全看不出差别。
▲图中显示了2组包括3个频率的复合波,它们的组成成份都相同,但是相位不同。注意这2张图唯一的不同点,只有在虚线的弦波相位不同,但红色的最终合成波差异却相当明显。
复合声音及定位认知
单一的声音大约就只有以上几种特性,但是多点音源的声音就会出现更复杂的状况。包括了波的干涉现象,由反射音形成的堂音和残音等等。多点音源造成了声音的复杂性,加上录音时的误差,让音响很难还原现场真实的声音。
声音的干涉现象
多点发射出来不同频率的声音,会出现干涉现象,这是显而易见的,连水波都可以造出干涉现象了,声音没道理不会出现干涉。干涉现象会造成一些多出来的频率,且声音也不像雷射光会是同调,所以干涉波是会以很高的速度在现场乱跑。而这速度则会依声音角速度差,产生速度上的差异。
水电工曾经在花莲布农族部落中,欣赏小朋友以四部合音演唱捕狐狸之歌,在现场就听到四部合音造成的明显干涉波,是种很低频的呜呜声。像风一样非常快速地一下子从左边跑到右边,又从右边跑到左边,听说这首歌就是以这种方式来代表狐狸跑来跑去。干涉现象的泛音也是大脑立体听觉解析现场的细节,因此能够忠实呈现临场感的好音响,必然也能够重现此部分,但前提是录音设备也得够好才行。
▲频率相同相位不同,在机器上难以辨识,但对人类听觉来说仍可辨识出差异
▲图形是先前2个组合成的讯号,是透过傅立叶变换至频谱后的结果。红线和蓝线几乎看不出任何差别,但在生物的耳朵及大脑分析下却是有显著的不同
堂音形成空间感
通常在密死循环境中,一旦声音发出后即会撞到四周的物体及墙壁,我们的耳朵或者是录音的麦克风,在接收到直线传来且最快速的直接音后,再一段时间即会收到第一次的反射音。第一次的反射音是最大声的反射音,它会对大脑造成某种效果,我们的大脑会以此为基准产生空间感,知道这个空间有多大。若是第二次第三次反射音通常都会小得多了,也无法让大脑产生直接的空间感。
大脑的补偿功能
很多生物的大脑对于频率和相位的组合异常敏感,同时也有补偿功能。若我们放出1组频率序列并把基频抽掉,大脑竟然能够辨认出基频,并在听觉产生的过程中自动补上基频。假设放出1组声音,共含有300Hz、450Hz、600Hz、750Hz共4组弦波,人的大脑会自动感知为150Hz的声音。
这也是很多人觉得自己是「木耳」,音响烂也听不太出来的因素之一,因为自动补偿功能开太强大了,导致心理认知和实际声音有很大的差别。奥地利指挥家卡拉扬就曾说过,虽然他在录音室和现场对声音质量异常挑剔,但是在家里却也可以用一台烂烂的床头音响听得很高兴。
残响会影响音质
如同前述,声音在发出后经过空间不断反射及干涉,在一段时间中在测量点的人或机器都可以持续听到这些声音,就叫做残响。在吸音不良的场所中,残响可以拉到很长而导致听者不愉快的经验。目前残响的定义为声音发出后到达小于-60dB所花的时间。残响对于音质的感觉有决定性影响,声音是否听起来很干,或很华丽都取决于残响的几项参数。残响也会造成距离感,若是残响很小的声音会让人觉得离自己很近。以上只是一般水电工对声音的认知,做音响的水电工还要再了解,音乐是什么?以及音响追求的境界是什么?
▲不同频率或相位下的干涉波,会随着相角差飘来飘去,不会固定在同一位置
从十二平均律聊音乐
十二平均律发展以来,基本上人们对于音乐的音符频率有固定的演算方式。没错,音乐家可以精确地算出音符与音符之间的频率差异以及阶调关系。十二平均律的重点之一,即是每八度音程频率即加倍。这中间当然也牵涉到人脑的感知功能,我们的大脑会很自然地让我们觉得频率加倍的音听起来是一样的。音符有Do、Re、Mi、Fa、So、La、Si共7个,到了上升一度的Do,符号又回到了Do,但频率是加倍的。
音调高但感觉不变
就大脑认知上,我们会感觉这个Do和其它音符的关系没有改变。若把每个音频率都加倍来放,整首乐曲听起来会较高但我们的感觉是不变的。古代调音是用敲击乐器或固定弦乐器处理,工匠们很早就发现了弦或者敲击物的长度和发出的频率呈反比。
第二个重点即是音符的切分频率,当然在1个倍频范围中,更重要的是切出固定的频率代表音符。经过东西方工匠上百年的实验,在16世纪末都不约而同地使用了1.0592也就是2^(1/12),即12次根号2做为切分音符,称为一个半音,若是一个全音就是2^(1/6)倍频。现今中央标准音A4的频率被定为440Hz,其它所有音符都可以乘以或除以2^(1/12)算出来。所以按照此规则,在一个倍频范围中会分出七个音符,意大利乐师给了他们大家熟悉的唱名,也就是Do、Re、Mi、Fa、So、La、Si。
第三个重点是常用的频率及音符范围,在标准88键钢琴中,最左边的Do在科学记号表示法为A0,中央的Do为A4(也就是频率为440Hz的那个Do),最高音的键是B6为3950Hz。除非是发神经的音乐家,否则大多数乐器用的频率范围就在这个范围中。而A0∼G0以下及A7∼G7以上也是很少人使用。
锁定频率范围选音响
由频率我们可以知道,若只是处理音乐的话,我们的设备只要专心处理55Hz到4KHz的范围即可。而炸弹爆炸等等音效,则会较常用到位于12∼55Hz的范围。这在某些情况是意义的,若喇叭是专门设计给音乐使用,好比很多玩家追捧到不行的近场监听用扬声器,必然会放弃极低频范围。假使自知音响系统的用途或自己听力的极限,也不必去追求这个范围的表现,反而可以在合理的价格里找到表现很好的设备。
人耳听力有极限
人耳的听力极限在20Hz∼20KHz左右,因构造差异使得听觉频率范围不大相同,并非每个频率都可以听到或者听得清楚。
光是水电工本身,右耳和左耳对20KHz的感觉差别就差了7dB以上。如果各位有兴趣的话,有些网站是有提供听觉测试用的正弦波取样wav档,可以用好一些的耳机来测一下自己的听觉表现如何。
音响只处理22KHz以下
当然,现代音响在数字化之前,就已经很明确地定义了只处理22KHz以下的声音。先前我们特别提到了音乐的常用频率,在这频率范围中聆听音响时,可分为低频、中频与高频。
这些频段在音乐中各有不同的组成成分,还有极端的发烧友提倡细分为极低频、低频、中低频、中频、中高频、高频、极高频等7段。接下来,水电工介绍一下常出现的7段声音频率、乐器还有应用。
极低频
范围:20Hz∼40Hz
乐器与应用:低音提琴、低音巴松管、土巴号、管风琴、钢琴等。由于这段极低频A-1∼G-1,以及A0∼G0并不是乐器的最美音域,因此作曲家们也很少将音符写得那么低。但炸弹爆炸,海浪声等等电影音效中,则被很频繁地使用。
低频
范围:40Hz∼80Hz
乐器与应用:大鼓、低音提琴、大提琴、低音巴松管、巴松管、低音伸缩号、低音单簧管、土巴号、法国号等。同样地很多震撼的音效也多落在这一段之中,乐器中也可看到与极低频的乐器重复率相当高。
中低频
范围:80Hz∼160Hz
乐器与应用:大鼓、低音提琴、大提琴、低音巴松管、巴松管、低音伸缩号、低音单簧管、土巴号、法国号、定音鼓、男低音等。
中频
范围:160Hz∼1280Hz
乐器与应用:这个频段几乎把所有乐器、人声都包含在内,就连女高音都在这个范围之内。一般而言,双音路喇叭的分频点大多在2500Hz或3000Hz左右,也就是说,2500Hz以上由高音单体负责,2500Hz以下由中低音单体负责。这2500Hz约莫是1280Hz的2倍,也就是说,为了怕中低音单体在中频极限,产生太大的分频点失真,设计师们统统把分频点提高到中频上限的2倍处,如此一来,最完美的中频就可以由中低音单体发出。
中高频
范围:1280Hz∼2560Hz
乐器与应用:小提琴约有四分之一的较高音域在此,中提琴的上限、长笛、单簧管、双簧管的高音域、短笛的一半较低音域、钹、三角铁等。其实中高频很容易辨认,只要弦乐群的高音域及木管的高音域都是中高频。
高频
范围:2560Hz∼5120Hz
乐器与应用:小提琴的音域上限、钢琴、短笛高音域以外,其余乐器大多不会出现在这个频段中。基本上写曲的人也都不太会动用到这个音域的音符。从喇叭的分频点中来说,高音单体几乎很少发出乐器或人声的基音,它只是发出基音的高倍泛音而已。
极高频
范围:5120Hz∼20000Hz
乐器与应用:从高频开始就很少有乐器能发出这么高频率的声音,而极高频所容纳的大多是乐器与人声的泛音。这些泛音如同前面章节所述,它们表达的是空间感,乐器位置,乐器间互相干扰的声波,现场空气感等等较抽象的感觉,也就是它们虽然没有什么音乐上的用途,但是却是欺骗大脑很重要的成份。
这段的表现不佳,就无法让听者有临场感。频率高的讯号大多振幅都很小,所以只要稍有失真或者带宽不足就马上被牺牲掉了,这就是很多玩家都很重视所谓「细节」的原因。
Test Sounds听力测试网站
音响讯号千倍广
从频率范围我们可以发现,音响真的不太好做,光是就讯号处理这块而论,放大器要面对的,有近似乎于直流的12Hz超低频,也有近乎于可以发出无线电波的20KHz高频,两者差距千倍,这中间只要有频率反应不佳,瞬时不良,相角改变等问题,马上会被玩家听出来。
好音响的条件
什么是好音响?这实在是个大哉问,音响界什么奇人都有,水电工之所以不在发烧界发表什么意见,就是因为见过太多特殊的论调。音响是门电机科学,包括了电子及机械科学在内,就发展史来看,水电工前辈们一直在追求的目标其实很单纯,那就是完美地重现现场。
试想一场精采的表演若是能经由高科技搬进客厅,让您不必出门也能好好欣赏,这是多么美好的一件事。能完美重现现场的音响系统必然只有1个特点,就是发出来的声音和现场聆听的细节非常相近。为了达成这个目标,水电工们必需克服很多问题,包括各类型的失真、各频段的响应不一、各频段的讯号反应时间不一、喇叭反应不佳造成的各类原音无法重现的问题。附带一提,水电工一直认为喇叭是音响系统中失真最大的一块。
好听感的要件
本连载第一篇绝大部分都在陈述声音是什么,水电工在此便以好听感做为结束。好的听感是玩家亲耳去听才会有感触,但老经验的玩家还是会有些基本教条,相信读者们有空也可以去高级音响店试听练习一下。
第1点:是声音在高低频分布平均,不会有高音太尖锐感,低频轰轰叫,中音太突出等等不平均的感觉。
第2点:是声音饱满而温暖,不会有尖锐生冷的感觉。通常生冷的声音都不会太耐听。造成生冷音的原因有很多,残响太早消失,有高阶谐波失真等都会,未来水电工也会专门讨论。
第3点:是细节丰富但不超过,音乐中的很多小细节,比如编曲中特意要小声的三角铁、响板,背景的大提琴等都不会消失,但又不会不耐听。
第4点:要解析力好,各频段之中的解析力都很清楚,好像声音是直接穿进耳朵中而不是隔了一层纱布的感觉。低频段之中,像大鼓定音鼓等乐器,鼓皮的震动和鼓身箱子回音都要很清晰,绝对不能轰轰轰糊成一团,那样子的低音叫做震荡,是低频自我回授震荡的结果,而不是原来的声音。
第5点:舒适有临场感,无论如何音响一定是听舒服的,所以花个10分钟确认一下设备组合是否真的舒适有临场感是最终必要的条件。
柔美耐听
就算完美重现原音,仍然有调整的空间,这就是老玩家爱挂在嘴上的柔美耐听。主要还是在各频段相角变化以及频率反应之间的调整,绝对不是把高频细节通通砍掉才叫柔美耐听。有时在展场会看到某些号称柔美耐听的贵族级设备,放出来的音乐却像FM收音机那样缺乏动态和细节,这是绝对不正确的,真正好的听感绝不是把细节砍光。
在音响制造商而言,要达成以上这些要件,要花的心力肯定非常庞大,因为只有避免掉了所有类型的失真才有可能达成这种效果。