DAV首頁(yè)
數字音視工程網(wǎng)

微信公眾號

數字音視工程網(wǎng)

手機DAV

null
null
null
卓華,
null
null
null
null
null
null

我的位置:

share

關(guān)于語(yǔ)言清晰度(可理解性)的深入洞察(二)

來(lái)源:同創(chuàng )音頻        編輯:ZZZ    2024-06-18 09:42:23     加入收藏

在語(yǔ)音中,共振峰是另一個(gè)重要的概念。它們是通過(guò)聲道中空腔的共振“調諧”而產(chǎn)生的,

  在上一期的探討中,我們深入了解了語(yǔ)音產(chǎn)生的原理,并分享了關(guān)于錄擴音的實(shí)用建議。本期,我們將繼續這一旅程,聚焦于語(yǔ)音頻譜、共振峰以及影響語(yǔ)言清晰度的關(guān)鍵因素,以期為大家呈現更全面的語(yǔ)言清晰度(可理解性)洞察。

 

  語(yǔ)音頻譜

  語(yǔ)音的頻譜覆蓋了可聽(tīng)頻譜的廣泛區域,其中元音輔音 構成了語(yǔ)音的基本元素。元音 由聲帶振動(dòng)產(chǎn)生,經(jīng)過(guò)聲腔的精細過(guò)濾,賦予聲音獨特的音色。而輔音 則是由空氣在喉嚨和口腔中的流動(dòng),特別是舌頭和嘴唇的精細操作產(chǎn)生的。

  元音的特征,即使是在講悄悄話(huà)中也能被識別,這是因為形成不同元音的空腔結構依然影響著(zhù)空氣的流動(dòng)。男性復雜語(yǔ)音音調的基頻通常在100-120 Hz之間,女性則高出一個(gè)八度,而兒童則更高。輔音則通常位于500 Hz以上的高頻區域,對語(yǔ)音的清晰度至關(guān)重要。

 

  共振峰

  在語(yǔ)音中,共振峰是另一個(gè)重要的概念。它們是通過(guò)聲道中空腔的共振“調諧”而產(chǎn)生的,

  如果你聽(tīng)兩個(gè)人以相同的音高說(shuō)或唱同一個(gè)元音,那么在這兩種情況下,元音可能是相同的。然而,任何兩種聲音都不一定產(chǎn)生完全相同的頻譜。共振峰為元音提供了可感知的特征,每個(gè)人獨特的聲道結構使得共振峰具有個(gè)體差異,這也是我們能夠區分不同說(shuō)話(huà)者聲音的原因。

 

  影響語(yǔ)言清晰度的關(guān)鍵因素

  一、輔音的重要性:

  在漢語(yǔ)、泰語(yǔ)等聲調語(yǔ)言中,語(yǔ)調或基本頻率承載著(zhù)意義。而在非聲調語(yǔ)言中,如英語(yǔ)、西班牙語(yǔ)和日語(yǔ),元音和輔音的變化則是區分單詞的關(guān)鍵。其中,輔音的重要性尤為突出。輔音主要位于高頻區域,對于語(yǔ)言的清晰度具有決定性作用。

  二、頻率的重要性:

  西方語(yǔ)音中,頻率的重要性如下圖所示:

  在圖中我們可以看到,2kHz左右的頻帶是感知清晰度方面最重要的頻率范圍。因為大多數輔音都在這個(gè)頻帶中。

  (Ref: N.R. French & J.C. Steinberg: Factors governing the intelligibility of speech sounds. JASA vol. 19, No 1, 1947).

  對語(yǔ)音信號進(jìn)行高通或低通濾波的實(shí)驗也驗證了這一點(diǎn)。使用20 Hz的高通濾波器,語(yǔ)音可以100%被理解,這是因為完整的語(yǔ)音頻譜并未被過(guò)濾。當高通濾波器切斷500Hz以下的信號時(shí),因為即使一部分語(yǔ)音能量被刪除,語(yǔ)音的可理解性?xún)H降低5%;但當低通濾波器在1kHz處切斷時(shí),可理解性已大幅下降至40%以下。這再次強調了1kHz至4kHz頻率范圍對語(yǔ)音清晰度的重要性。

  三、背景噪聲:

  背景噪聲是影響語(yǔ)音清晰度的另一重要因素。在語(yǔ)音系統中,除了語(yǔ)音本身之外的所有信號都可以被認為是噪聲。因此,在禮堂或教室里,空調和其他嘈雜的設備運行時(shí)都會(huì )使語(yǔ)音變得不那么清晰。此外,其他人的存在也會(huì )產(chǎn)生噪音。在電視或電影音效中,對白的電平與背景音樂(lè )或氛圍聲音電平之間的關(guān)系問(wèn)題也是非常重要的。

  在這個(gè)圖表中,語(yǔ)音可理解度是根據信噪比(S/N)繪制的。較低的曲線(xiàn)表明,即使信噪比為負,也就是說(shuō)噪聲比語(yǔ)音水平高10 dB,語(yǔ)音仍然可以在一定程度上被理解。但在任何情況下,最佳的感知語(yǔ)音水平約為60 dB或20 μPa。

  通過(guò)大量的研究,總的來(lái)說(shuō)結果表明:

  1. 當背景噪音低于40dBA時(shí),最佳語(yǔ)音電平不變。

  2. 當背景噪聲電平大于40 dB(A)時(shí),最佳語(yǔ)音電平或信噪比保持在+15 dB(A)左右的電平。

  3. 在信噪比足夠好的情況下,聽(tīng)力可理解性的難度隨著(zhù)語(yǔ)音電平的增加而增加,使可理解性接近完美。

  此外,1kHz-4kHz的頻率范圍應該“保持清晰”。例如,當添加音樂(lè )在影視作品中作為背景時(shí),參量均衡器在該頻率范圍內衰減音樂(lè )5-10 dB,這樣將會(huì )提高語(yǔ)音對白的可理解性。

  四、混響:

  在談?wù)撜Z(yǔ)音清晰度時(shí),混響也被視為一種“噪音”。雖然輕微的混響可以支持講話(huà),但一旦輔音被抹去,可理解性將大幅下降。因此,在錄音和擴聲過(guò)程中,需要仔細控制混響的影響。

  通過(guò)深入了解語(yǔ)音頻譜、共振峰以及影響語(yǔ)言清晰度的關(guān)鍵因素,我們可以更好地掌握如何確保在各種場(chǎng)景下維持高質(zhì)量的語(yǔ)音清晰度。無(wú)論是面對面交流還是通過(guò)擴聲系統傳播聲音,這些洞察都將為我們提供寶貴的指導。

免責聲明:本文來(lái)源于同創(chuàng )音頻,本文僅代表作者個(gè)人觀(guān)點(diǎn),本站不作任何保證和承諾,若有任何疑問(wèn),請與本文作者聯(lián)系或有侵權行為聯(lián)系本站刪除。
掃一掃關(guān)注數字音視工程網(wǎng)公眾號

相關(guān)閱讀related

評論comment

 
驗證碼:
您還能輸入500