乐音和语音本质区别是什么?
据说目前世界上至少有1000多种乐器。尽管它们能演奏出各种悦耳动听的乐曲,但却无法完全完全模拟或合成出人类说、唱的声音。且不论是民族乐器中的体鸣、膜鸣、气鸣、弦鸣乐器还是西洋乐器中的弦、管、打击、键盘等乐器;不论是古典乐器还是现代乐器;不论是独奏、齐奏还是合奏。即便是在人工智能及语音合成技术日臻成熟的今天也是如此。这到底是为什么呢?
有人说,是否频率范围的宽窄不同造成的啊?问题是可以作为音域最广乐器代表的钢琴,其音域可比人声的音域广阔多了。钢琴的频率范围为27.5~4186赫兹。而人声的频率范围大致为41~1046赫兹。前者的两者频率范围可是大大超过了后者的。所以说,频率范围的宽窄应该不是该问题的真正原因。
也有人说,雷琴就能模仿的很像啊。像著名雷琴演奏家张X生利用雷琴演奏的《沙家浜》中的"智斗”以及王X玉、宋x安等人的"雷琴拉戏"等。
雷琴模仿各种声音的能力确实不错,加上艺术家的苦心雕琢,的确出神入化。但再像也仅仅是其音色很像而已。只能听到其模仿出戏曲演员的唱腔而不能模仿出演员的吐字。包括某些影音团队用多种乐器分别模仿京剧《沙家浜》智斗中不同演员的唱腔,效果也是如此。
也有人感到纳闷:怎么人能模仿多种乐器,而反过来为什么就不行了呢?确实,人模仿乐器由来已久。而且目前中外都有都有不少非常成功的人士或团队靠所谓的阿卡贝拉(acappella——没有乐器伴奏的纯人声演唱)活跃在世界各国的舞台且广受欢迎。阿卡贝拉团队成员只用人声就可模仿出各种乐器的声音,像二胡、唢呐、雷琴、架子鼓、吉他、铜管乐器、打击乐器等等,都可以"演奏"得惟妙惟肖。但是,不论用多少种乐器,都无法合成为人声。虽然清代戏剧家李渔曾经说过的"丝不如竹,竹不如肉"。其意思是最美的声音来自于人声,任何乐器都无法超越人声。但是他并没有揭示出其中的道理何在。
还有人调侃到:那是因为没有一样乐器是人肉做成的,发不出人类的声音没什么奇怪的。但问题是,也没有一个人的声带是匏土革、木石金、丝与竹这"八音"做成的啊,怎么人就能发出"八音"的乐声呢?
我们还能注意到一个现象:凡是人耳所能听到的自然界的声音,经过电子设备的采集、处理、复制、传播等流程后,依然能够完美复现。那为什么同样借助电子设备,演奏者用乐器就无法模拟出人声呢。即便是电声乐器也做不到,哪怕是水平再高的演奏家也无可奈何。问题到底出在哪里了呢?
其实,个中道理并不复杂。虽然我们知道音阶中的每个音都对应着一个固定的振动频率,但往往会忽略另外一个事实:音阶中哪怕是相邻的两个乐音,它们各自所对应的频率之间也并不是首尾相接的,而是间断的,不连续的。也就是说,再复杂的乐器,其所能用到的振动频率也是非常有限的若干个点而已。而人类发声则不受此限制。人类发声所能涉及到的频率范围尽管会因人而异,但在其自身条件所限定的最低频率和最高频率这个频谱范围之内,正常人发声时所用到的频率应该是连续的,而且是可以随心所欲的调用、组合和变幻的。所以,想用乐器发出的非常有限的若干个固定频率去模拟出无限多(或近乎无限至少也是足够多)的任意频率的声音就是不可能的了。