本书为语音信号处理领域的指导书。作者在东南大学、南京理工大学开设的本科生课程的基础上,介绍了语音信号处理的基本原理、分析方法以及该学科领域近年来取得的一些研究成果和技术,在理论和应用之间达到了极好的平衡。全书共11章,内容包括:绪论、语音信号处理的声学理论与模型、传统语音信号分析方法、现代语音信号处理方法、语音信号的参数估计、语音编码、语音增强、语音合成、语音识别、说话人识别、语音信号中的情感信息处理。另外,在本书的每章中都加入了复习题,供读者思考。本书可作为高等院校计算机应用、信号与信息处理、
本书围绕语音识别的原理和应用讲解,理论结合实际,采用大量插图,辅以实例,力求深入浅出,让读者能较快地理解语音识别的基础理论和关键技术。为了帮助读者动手操作,提高实战技能,本书最后还结合Kaldi、ESPnet和WeNet等开源工具,介绍了具体的工程实践方法。
随着语音算法技术的不断发展与完善,如何进行工程落地成为语音商业应用中普遍面临的问题。工程落地不仅要考虑模型效果,还要考虑资源占用、模块联调且整个架构要具有可靠性、可扩展性和可维护性。本书围绕如何从零构建一个完整的语音识别系统,深入浅出地介绍了语音识别前端算法、语音识别算法及说话人日志算法原理;基于Kaldi的模型训练;语音识别工程落地和服务搭建。本书适合作为语音技术研究人员及对语音技术感兴趣的开发人员的参考用书。