豪迈音响-文章-DAV音视工程网

科学角度看音响：先了解声音，再认识音乐，最后挑音响.

台湾水电工原本是拍摄爱情动作片出身，对于音响这种声光娱乐专业技能当然是有练过的行家。但音响领域真的是相当专业的学问，也是现代电子电机学生最不擅长的一块。因为多数做模拟的工程师，都已经在数字时代的洪流中，被那22K薪资搞死了。

各位，模拟工程是极需经验的工作，不是说念完一本电子学就可以搞定的东西。况且声音对于电子讯号来说极为复杂，由低频至高频相差近千倍的低带宽模拟讯号。像是多数音乐和录像带，声频讯号都在40Hz10年，处理过几十个项目，绝对不会有很好的设计能力。音响与线路设计是没有快捷方式可走的工作，都得在实战中获取经验，这也是为什么专业人才难以培养的原因之一。

听不出来的小细节

因为人才养成费用高昂，加上每个人听力有不小的差异，多数人很难辨别细微的差异。很多公司干脆就不养这么高级的人力了，反正各大3C厂商就赌听得出声音有问题的人不到1%，所以声音糊、声音烂都无所谓，只要有声音别太夸张就好。身为计算机3C相关产业的一股清流，计算机王当然有义务告诉大家，什么样的声音才是好的声音，而怎么样才可以破除某些花大钱但又没学理基础的音响迷信。

▲低价位声卡近10年来几乎绝迹，主因就是主板内建音效芯片，就能满足多数人的使用需求，加上价位因素让低价声卡几乎没有竞争力

频率单位：Hz

讲到声音一定会提到频率，频率是指单位时间内重复发生的次数。常用的国际单位是赫兹，英文为Hz，该单位是纪念德国物理学家Heinrich Hertz。Hz是指每秒内重复发生的次数，例如400Hz即代表每秒重复400次。

谈音响前先了解声音

声音到底是什么？这个问题真是很尴尬，说简单很简单，但仔细说来又很复杂。小学教材都念过，声音是因为物质振动，而打动了周遭的空气分子，造成空气产生了疏密分布的波动，而这个波动会以约每秒300公尺的速度前进，就成了声音，而这个速度也就是音速。以上是小学生的程度，要达到水电工的程度还需要再努力一些。

同声频不同声音

声音最关键的是「组成成份」，好比我们人说话的声频都在相当的范围内，但每一个人的声音听起来都不一样，差异就是组成的元素不同。又好比同样一架钢琴和一架手风琴发出同样频率的音阶，但是绝对不会有人把钢琴的声音和手风琴的声音搞错。经过近代讯号学的各种实验发现，我们的大脑神经在解释声音讯号时，除了可以认出声音的基本频率之外，更可以认出其它的部分而且相当灵敏。

认识泛音和相位

自然界物体很少有所谓的纯净声音，因为自然界大部分物体都是成份复杂的复合物。当我们加入1个能量产生振动时，发出的声音频率一定不只1个。而且每个频率讯号产生的时间点也不相同，因而产生大量不同的排列组合，才造就了如此多变的声音。经过许多世纪的数学发展，水电工前辈们发现，当我们把这些讯号经过数学方式，像是用级数方法拆解成各种的正弦波（Sin波），就可以看出声音有几个重要的组成成份：基频、泛音、相位等元素。

基频是比例最大的能量

基本频率（Fundamental Frequency，简称基频）是指声音经过拆解后，占比最大的能量落在哪个频率。通常在自然界的声音中，这个成份会落在最低的频率。好比我们用钢琴发出标准音A的声音，最低的频率就会在440Hz，此时440Hz就是基频。

人类发声的基频

人类是透过声腔区域发出声音，由于口腔结构的差异，造成每个人基频不同。小孩的基频约在250∼400Hz，成年女性基频约200∼300Hz，男性则是100∼150Hz。从数据中不难看出男性基频比女性低很多，这也是为什么男高音相当少见。

单一频率的纯音

看到基频与泛音，那应该会想到，世界上有没有单一频率的声音。自然界中单一频率的声音相当少见，在生活中比较容易看到单一频率的例子是音叉。在定义上，我们将单一频率的声音称之为纯音。

泛音可能有多个

如同先前所述，当复杂的复合物体产生振动时，绝对不会只出现单一频率，那其他的频率就称为泛音（Overtone）。通常在乐器上出现的频率，都会是基频的整数倍数。好比用钢琴弹奏标准音A440时，我们将声音拆解成正弦波，就会发现除了基频440Hz外，另外存在880Hz和1320Hz及1760Hz的弦波，而且所占的比例也不低。

钢琴的880Hz大约占了总能量的14%上，1320Hz和1760Hz也大约是这个比例。若基频的频率为N，则频率为2N的就称为第二泛音，这在讯号处理中则叫二次谐波，3N的叫做第三泛音依此类推。离基频愈远的泛音通常占能量的比例会愈小，但也不是必然。好比钢琴有时第三泛音的成份会超过第二泛音一点点，但大致上来说还是愈远的泛音愈小，像钢琴的第四泛音就只有3%左右，之后泛音占有的比例会更小。声音最单纯清亮的三角铁，第二泛音就小到只有2%不到，而第三泛音连0.01%都不到。

▲上图为乐器之王钢琴的声音的频率分布及波形

自然界的声音有时相当复杂，因为可发出声音的物体太多了，有些不牵涉到共振，像是2颗石头互撞，海浪声等等。会一次发出多种基频和各自的泛音，但各种高等生物的神经却都有办法依经验辨识出来。相位落差能听出来相位是指正弦波产生的角度，好比范例图中2个正弦波频率相同但是相位却不同。相位在单一音频时没有很大的重要性，但是在复合音频中却有绝对的重要性。相位就算只改变一点点，却可能让波形看起来差很多，而人的耳朵的灵敏度可能比一般人想象更好，只要有一点点相位变化就可以听得出来。

范例的2种声频讯号，人类听觉可能会觉得它们相似，但仔细听时仍然会感觉出差别，这也是烂音响也照样能听的主要原因之一。在测量仪器上面，目前市售的各类量测噪声、失真和干扰的精密仪器全都测量不出来这种相位变化。至于频谱仪更不用说了，频率成份没有变，只有相位有变，在频谱仪上看起来差异会小到完全看不出差别。

▲图中显示了2组包括3个频率的复合波，它们的组成成份都相同，但是相位不同。注意这2张图唯一的不同点，只有在虚线的弦波相位不同，但红色的最终合成波差异却相当明显。

复合声音及定位认知

单一的声音大约就只有以上几种特性，但是多点音源的声音就会出现更复杂的状况。包括了波的干涉现象，由反射音形成的堂音和残音等等。多点音源造成了声音的复杂性，加上录音时的误差，让音响很难还原现场真实的声音。

声音的干涉现象

多点发射出来不同频率的声音，会出现干涉现象，这是显而易见的，连水波都可以造出干涉现象了，声音没道理不会出现干涉。干涉现象会造成一些多出来的频率，且声音也不像雷射光会是同调，所以干涉波是会以很高的速度在现场乱跑。而这速度则会依声音角速度差，产生速度上的差异。

水电工曾经在花莲布农族部落中，欣赏小朋友以四部合音演唱捕狐狸之歌，在现场就听到四部合音造成的明显干涉波，是种很低频的呜呜声。像风一样非常快速地一下子从左边跑到右边，又从右边跑到左边，听说这首歌就是以这种方式来代表狐狸跑来跑去。干涉现象的泛音也是大脑立体听觉解析现场的细节，因此能够忠实呈现临场感的好音响，必然也能够重现此部分，但前提是录音设备也得够好才行。

▲频率相同相位不同，在机器上难以辨识，但对人类听觉来说仍可辨识出差异

▲图形是先前2个组合成的讯号，是透过傅立叶变换至频谱后的结果。红线和蓝线几乎看不出任何差别，但在生物的耳朵及大脑分析下却是有显著的不同

堂音形成空间感

通常在密死循环境中，一旦声音发出后即会撞到四周的物体及墙壁，我们的耳朵或者是录音的麦克风，在接收到直线传来且最快速的直接音后，再一段时间即会收到第一次的反射音。第一次的反射音是最大声的反射音，它会对大脑造成某种效果，我们的大脑会以此为基准产生空间感，知道这个空间有多大。若是第二次第三次反射音通常都会小得多了，也无法让大脑产生直接的空间感。

大脑的补偿功能

很多生物的大脑对于频率和相位的组合异常敏感，同时也有补偿功能。若我们放出1组频率序列并把基频抽掉，大脑竟然能够辨认出基频，并在听觉产生的过程中自动补上基频。假设放出1组声音，共含有300Hz、450Hz、600Hz、750Hz共4组弦波，人的大脑会自动感知为150Hz的声音。

这也是很多人觉得自己是「木耳」，音响烂也听不太出来的因素之一，因为自动补偿功能开太强大了，导致心理认知和实际声音有很大的差别。奥地利指挥家卡拉扬就曾说过，虽然他在录音室和现场对声音质量异常挑剔，但是在家里却也可以用一台烂烂的床头音响听得很高兴。

残响会影响音质

如同前述，声音在发出后经过空间不断反射及干涉，在一段时间中在测量点的人或机器都可以持续听到这些声音，就叫做残响。在吸音不良的场所中，残响可以拉到很长而导致听者不愉快的经验。目前残响的定义为声音发出后到达小于-60dB所花的时间。残响对于音质的感觉有决定性影响，声音是否听起来很干，或很华丽都取决于残响的几项参数。残响也会造成距离感，若是残响很小的声音会让人觉得离自己很近。以上只是一般水电工对声音的认知，做音响的水电工还要再了解，音乐是什么？以及音响追求的境界是什么？

▲不同频率或相位下的干涉波，会随着相角差飘来飘去，不会固定在同一位置

从十二平均律聊音乐

十二平均律发展以来，基本上人们对于音乐的音符频率有固定的演算方式。没错，音乐家可以精确地算出音符与音符之间的频率差异以及阶调关系。十二平均律的重点之一，即是每八度音程频率即加倍。这中间当然也牵涉到人脑的感知功能，我们的大脑会很自然地让我们觉得频率加倍的音听起来是一样的。音符有Do、Re、Mi、Fa、So、La、Si共7个，到了上升一度的Do，符号又回到了Do，但频率是加倍的。

音调高但感觉不变

就大脑认知上，我们会感觉这个Do和其它音符的关系没有改变。若把每个音频率都加倍来放，整首乐曲听起来会较高但我们的感觉是不变的。古代调音是用敲击乐器或固定弦乐器处理，工匠们很早就发现了弦或者敲击物的长度和发出的频率呈反比。

第二个重点即是音符的切分频率，当然在1个倍频范围中，更重要的是切出固定的频率代表音符。经过东西方工匠上百年的实验，在16世纪末都不约而同地使用了1.0592也就是2^(1/12)，即12次根号2做为切分音符，称为一个半音，若是一个全音就是2^(1/6)倍频。现今中央标准音A4的频率被定为440Hz，其它所有音符都可以乘以或除以2^(1/12)算出来。所以按照此规则，在一个倍频范围中会分出七个音符，意大利乐师给了他们大家熟悉的唱名，也就是Do、Re、Mi、Fa、So、La、Si。

第三个重点是常用的频率及音符范围，在标准88键钢琴中，最左边的Do在科学记号表示法为A0，中央的Do为A4（也就是频率为440Hz的那个Do），最高音的键是B6为3950Hz。除非是发神经的音乐家，否则大多数乐器用的频率范围就在这个范围中。而A0∼G0以下及A7∼G7以上也是很少人使用。

锁定频率范围选音响

由频率我们可以知道，若只是处理音乐的话，我们的设备只要专心处理55Hz到4KHz的范围即可。而炸弹爆炸等等音效，则会较常用到位于12∼55Hz的范围。这在某些情况是意义的，若喇叭是专门设计给音乐使用，好比很多玩家追捧到不行的近场监听用扬声器，必然会放弃极低频范围。假使自知音响系统的用途或自己听力的极限，也不必去追求这个范围的表现，反而可以在合理的价格里找到表现很好的设备。

人耳听力有极限

人耳的听力极限在20Hz∼20KHz左右，因构造差异使得听觉频率范围不大相同，并非每个频率都可以听到或者听得清楚。

光是水电工本身，右耳和左耳对20KHz的感觉差别就差了7dB以上。如果各位有兴趣的话，有些网站是有提供听觉测试用的正弦波取样wav档，可以用好一些的耳机来测一下自己的听觉表现如何。

音响只处理22KHz以下

当然，现代音响在数字化之前，就已经很明确地定义了只处理22KHz以下的声音。先前我们特别提到了音乐的常用频率，在这频率范围中聆听音响时，可分为低频、中频与高频。

这些频段在音乐中各有不同的组成成分，还有极端的发烧友提倡细分为极低频、低频、中低频、中频、中高频、高频、极高频等7段。接下来，水电工介绍一下常出现的7段声音频率、乐器还有应用。

极低频

范围：20Hz∼40Hz

乐器与应用：低音提琴、低音巴松管、土巴号、管风琴、钢琴等。由于这段极低频A-1∼G-1，以及A0∼G0并不是乐器的最美音域，因此作曲家们也很少将音符写得那么低。但炸弹爆炸，海浪声等等电影音效中，则被很频繁地使用。

低频

范围：40Hz∼80Hz

乐器与应用：大鼓、低音提琴、大提琴、低音巴松管、巴松管、低音伸缩号、低音单簧管、土巴号、法国号等。同样地很多震撼的音效也多落在这一段之中，乐器中也可看到与极低频的乐器重复率相当高。

中低频

范围：80Hz∼160Hz

乐器与应用：大鼓、低音提琴、大提琴、低音巴松管、巴松管、低音伸缩号、低音单簧管、土巴号、法国号、定音鼓、男低音等。

中频

范围：160Hz∼1280Hz

乐器与应用：这个频段几乎把所有乐器、人声都包含在内，就连女高音都在这个范围之内。一般而言，双音路喇叭的分频点大多在2500Hz或3000Hz左右，也就是说，2500Hz以上由高音单体负责，2500Hz以下由中低音单体负责。这2500Hz约莫是1280Hz的2倍，也就是说，为了怕中低音单体在中频极限，产生太大的分频点失真，设计师们统统把分频点提高到中频上限的2倍处，如此一来，最完美的中频就可以由中低音单体发出。

中高频

范围：1280Hz∼2560Hz

乐器与应用：小提琴约有四分之一的较高音域在此，中提琴的上限、长笛、单簧管、双簧管的高音域、短笛的一半较低音域、钹、三角铁等。其实中高频很容易辨认，只要弦乐群的高音域及木管的高音域都是中高频。

高频

范围：2560Hz∼5120Hz

乐器与应用：小提琴的音域上限、钢琴、短笛高音域以外，其余乐器大多不会出现在这个频段中。基本上写曲的人也都不太会动用到这个音域的音符。从喇叭的分频点中来说，高音单体几乎很少发出乐器或人声的基音，它只是发出基音的高倍泛音而已。

极高频

范围：5120Hz∼20000Hz

乐器与应用：从高频开始就很少有乐器能发出这么高频率的声音，而极高频所容纳的大多是乐器与人声的泛音。这些泛音如同前面章节所述，它们表达的是空间感，乐器位置，乐器间互相干扰的声波，现场空气感等等较抽象的感觉，也就是它们虽然没有什么音乐上的用途，但是却是欺骗大脑很重要的成份。

这段的表现不佳，就无法让听者有临场感。频率高的讯号大多振幅都很小，所以只要稍有失真或者带宽不足就马上被牺牲掉了，这就是很多玩家都很重视所谓「细节」的原因。

Test Sounds听力测试网站

http://www.testsounds.com

音响讯号千倍广

从频率范围我们可以发现，音响真的不太好做，光是就讯号处理这块而论，放大器要面对的，有近似乎于直流的12Hz超低频，也有近乎于可以发出无线电波的20KHz高频，两者差距千倍，这中间只要有频率反应不佳，瞬时不良，相角改变等问题，马上会被玩家听出来。

好音响的条件

什么是好音响？这实在是个大哉问，音响界什么奇人都有，水电工之所以不在发烧界发表什么意见，就是因为见过太多特殊的论调。音响是门电机科学，包括了电子及机械科学在内，就发展史来看，水电工前辈们一直在追求的目标其实很单纯，那就是完美地重现现场。

试想一场精采的表演若是能经由高科技搬进客厅，让您不必出门也能好好欣赏，这是多么美好的一件事。能完美重现现场的音响系统必然只有1个特点，就是发出来的声音和现场聆听的细节非常相近。为了达成这个目标，水电工们必需克服很多问题，包括各类型的失真、各频段的响应不一、各频段的讯号反应时间不一、喇叭反应不佳造成的各类原音无法重现的问题。附带一提，水电工一直认为喇叭是音响系统中失真最大的一块。

好听感的要件

本连载第一篇绝大部分都在陈述声音是什么，水电工在此便以好听感做为结束。好的听感是玩家亲耳去听才会有感触，但老经验的玩家还是会有些基本教条，相信读者们有空也可以去高级音响店试听练习一下。

第1点：是声音在高低频分布平均，不会有高音太尖锐感，低频轰轰叫，中音太突出等等不平均的感觉。

第2点：是声音饱满而温暖，不会有尖锐生冷的感觉。通常生冷的声音都不会太耐听。造成生冷音的原因有很多，残响太早消失，有高阶谐波失真等都会，未来水电工也会专门讨论。

第3点：是细节丰富但不超过，音乐中的很多小细节，比如编曲中特意要小声的三角铁、响板，背景的大提琴等都不会消失，但又不会不耐听。

第4点：要解析力好，各频段之中的解析力都很清楚，好像声音是直接穿进耳朵中而不是隔了一层纱布的感觉。低频段之中，像大鼓定音鼓等乐器，鼓皮的震动和鼓身箱子回音都要很清晰，绝对不能轰轰轰糊成一团，那样子的低音叫做震荡，是低频自我回授震荡的结果，而不是原来的声音。

第5点：舒适有临场感，无论如何音响一定是听舒服的，所以花个10分钟确认一下设备组合是否真的舒适有临场感是最终必要的条件。

柔美耐听

就算完美重现原音，仍然有调整的空间，这就是老玩家爱挂在嘴上的柔美耐听。主要还是在各频段相角变化以及频率反应之间的调整，绝对不是把高频细节通通砍掉才叫柔美耐听。有时在展场会看到某些号称柔美耐听的贵族级设备，放出来的音乐却像FM收音机那样缺乏动态和细节，这是绝对不正确的，真正好的听感绝不是把细节砍光。

在音响制造商而言，要达成以上这些要件，要花的心力肯定非常庞大，因为只有避免掉了所有类型的失真才有可能达成这种效果。