应用MAP方差估计的话者自适应训练方法

doi:10.3969/j.issn.1000-3428.2006.20.075

计算机工程 ›› 2006, Vol. 32 ›› Issue (20): 203-204. doi: 10.3969/j.issn.1000-3428.2006.20.075

应用MAP方差估计的话者自适应训练方法

黄盈椿1，王欢良2，冯涛2

(1. 中国科学院电子学研究所，北京 100080；2. 哈尔滨工业大学计算机科学与技术学院，哈尔滨 150001)

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2006-10-20 发布日期:2006-10-20

Speaker Adaptive Training of Appling MAP Estimation for Covariance

HUANG Yingchun1, WANG Huanliang2, FENG Tao2

(1. Institute of Electronics, Chinese Academy of Sciences, Beijing 100080; 2. School of Computer Science and Technology, Harbin Institute of Technology, Harbin 150001)

Received:1900-01-01 Revised:1900-01-01 Online:2006-10-20 Published:2006-10-20

摘要/Abstract

摘要： 近年来话者自适应训练(SAT)方法日益受到重视。然而在实际中此方法通常因为部分方差的估计失误而导致识别性能下降。该文提出了一种应用最大后验概率(MAP)估计方差的全新SAT方法，它能够根据后验概率动态地调整模型的方差，从而解决上述问题。在Switchboard数据库上的实验显示，新方法能够显著地提高识别性能，并且有效地提升系统的稳定性。

关键词: 语音识别, 话者自适应, 话者自适应训练, MAP

Abstract: Recently there has been a growing interest in speaker adaptive training(SAT). However, errors can often arise when estimating covariance matrices in the original SAT framework due to the lack of observations in some Gauss components. This paper presents a novel approach which applies maximum a posteriori (MAP) covariance-estimating into original SAT. Experimental results in Switchboard corpus demonstrate that the proposed method can deliver significant reductions in word error rate (WER) and raise the robustness of SAT process.

Key words: Speech recognition, Speaker adaptation, Speaker adaptive training(SAT), Maximum a posteriori(MAP)

黄盈椿;王欢良;冯涛. 应用MAP方差估计的话者自适应训练方法[J]. 计算机工程, 2006, 32(20): 203-204.

HUANG Yingchun; WANG Huanliang; FENG Tao. Speaker Adaptive Training of Appling MAP Estimation for Covariance[J]. Computer Engineering, 2006, 32(20): 203-204.

http://www.ecice06.com/CN/Y2006/V32/I20/203

[1]	李宜亭, 屈丹, 杨绪魁, 张昊, 沈小龙. 基于分解门控注意力单元的高效Conformer模型[J]. 计算机工程, 2023, 49(5): 73-80.
[2]	柏财通, 崔翛龙, 李爱. 基于本地蒸馏联邦学习的鲁棒语音识别技术[J]. 计算机工程, 2022, 48(10): 103-109.
[3]	柏财通, 高志强, 李爱, 崔翛龙. 基于门控网络的军事装备控制指令语音识别研究[J]. 计算机工程, 2021, 47(7): 301-306.
[4]	王谟瀚, 翟俊海, 齐家兴. 基于MapReduce和Spark的大规模压缩模糊K-近邻算法[J]. 计算机工程, 2020, 46(11): 139-147.
[5]	陈军晓, 李中升, 刘逸敏, 李秋虹, 汪卫. 基于MapReduce的时间序列索引与批量查询技术[J]. 计算机工程, 2019, 45(11): 47-53.
[6]	郑兵,陈世利,刘蓉. 基于萤火虫算法优化的Gmapping研究[J]. 计算机工程, 2018, 44(9): 22-27.
[7]	宁可,孙同晶,徐洁洁. 面向海量数据的改进最近邻优先吸收聚类算法[J]. 计算机工程, 2018, 44(4): 35-40.
[8]	王俊超,黄浩,徐海华,胡英. 基于迁移学习的低资源度维吾尔语语音识别[J]. 计算机工程, 2018, 44(10): 281-285,291.
[9]	胡文君,傅美君,潘文林. 基于Kaldi的普米语语音识别[J]. 计算机工程, 2018, 44(1): 199-205.
[10]	胡鹏威,倪志伟,伍章俊,张霖. 基于MapReduce离散萤火虫群优化算法的服务选择方法[J]. 计算机工程, 2018, 44(1): 211-218,225.
[11]	张乐,张雪英,孙颖,张卫. 基于聚合经验模态分解的情感语音特征提取[J]. 计算机工程, 2017, 43(8): 306-309,315.
[12]	朱嘉舟,邵培南,陈景. 影像数据分布并行计算处理平台体系架构研究[J]. 计算机工程, 2017, 43(5): 60-66,74.
[13]	项秉伟,景新幸,杨海燕. 基于噪声分类与补偿的车载语音识别[J]. 计算机工程, 2017, 43(3): 220-224.
[14]	赵星,李石君,余伟,杨莎,丁永刚,胡亚慧. 大数据环境下Web数据源质量评估方法研究[J]. 计算机工程, 2017, 43(2): 48-56.
[15]	罗小波,王超. 考虑服务质量的并行MapReduce启发式车载云资源调度[J]. 计算机工程, 2017, 43(12): 30-37.

选择文件类型/文献管理软件名称

选择包含的内容

应用MAP方差估计的话者自适应训练方法

Speaker Adaptive Training of Appling MAP Estimation for Covariance

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

应用MAP方差估计的话者自适应训练方法

Speaker Adaptive Training of Appling MAP Estimation for Covariance

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价