智能语音处理
上QQ阅读APP看书,第一时间看更新

1.2.3 语音处理基本方法

关于经典语音处理的研究主要涉及基础理论、算法实现及实际应用等几个方面。对语音处理的基础理论及各种处理算法的研究主要包括以下两个方面[1]

1. 基于语音产生和语音感知来研究语音

语音产生的研究涉及大脑中枢的语言活动如何转换成人发声器官的运动,从而形成声波的传播。语音感知的研究涉及人耳对声波的收集并经过初步处理后转换成神经元的活动,然后逐级传递到大脑皮层的语言中枢。语音产生和语音感知方面的研究与语音学、语言学、心理学和神经生理学等学科紧密相关。目前,对于整个语言链的物理层(包括发声器官和人耳的功能)已经研究得比较清楚。

2. 基于数字信号处理方法来研究语音

20世纪60年代形成了一系列数字信号处理方法和算法,如数字滤波器、快速傅里叶变换等,这些都与语音信号处理紧密联系;后来出现的线性预测编码技术成为语音信号最有效的处理方法之一,广泛应用于语音分析合成及各个语音应用领域;20世纪80年代出现的分析合成法、码激励线性预测、矢量量化等极大地推动了语音编码和语音识别等技术的发展。图1-3给出了经典语音处理的基本框图。

图1-3 经典语音处理的基本框图