Kaldi语音识别实战
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

3 数据整理

本章介绍如何为Kaldi的训练环境准备数据和其他资源文件。在使用语音识别工具训练声学模型时,一个新手的常见问题就是如何准备训练数据。这里面包含两个问题,第一个是如何选择训练数据,第二个是如何将数据整理成工具可以支持的格式。如果数据格式不正确或不规范,则可能导致训练过程无法进行,或者训练出来的模型性能极差。Kaldi的通用脚本将工具整合在一起,避免了工具误用带来的问题,但同时,也要求使用者保证数据格式的正确。不同数据来源的格式千差万别,本章还将讲解如何构建符合Kaldi脚本规范的数据资源文件,包括数据文件夹data和语言文件夹data/lang,并以Librispeech为例,详解如何划分训练数据,以及各种资源文件的内容及其用途。