勵志

勵志人生知識庫

聲學特徵

聲學特徵是表示語音聲學特性的物理量,主要包括音色音長音強音高這四個基本要素,以及基於人類發聲機理和基於人耳聽覺感知的特徵,如線性預測倒譜係數(LPCC)和Mel頻率倒譜係數(MFCC)。

音色也被稱為音品,是聲音的品質或特色,由發聲體的材質和結構決定,例如,不同人唱歌時聲音的不同。音長是指聲音的持續時間。音強是指聲音的強度或響度,它與聲音振動幅度相關,振幅越大,聲音越響。音高或音調是指聲音的高低,取決於發聲體在單位時間內聲波振動次數的頻率。

基於人類發聲機理的特徵和基於人耳聽覺感知的特徵分別基於不同的原理。例如,MFCC特徵模擬了人耳對不同頻率的感知程度,對中低頻語音信號較敏感,而線性預測倒譜係數(LPCC)則是基於人類發聲機理的特徵。