半监督学习机制下的说话人辨认算法

doi:10.3969/j.issn.1000-3428.2009.14.077

计算机工程 ›› 2009, Vol. 35 ›› Issue (14): 221-223. doi: 10.3969/j.issn.1000-3428.2009.14.077

半监督学习机制下的说话人辨认算法

李燕萍，唐振民，丁辉，张燕

(南京理工大学模式识别与智能系统实验室，南京 210094)

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2009-07-20 发布日期:2009-07-20

Speaker Identification Algorithm of Semi-Supervised Learning Mechanism

LI Yan-ping, TANG Zhen-min, DING Hui, ZHANG Yan

(Lab of Pattern Recognition and Intelligence System, Nanjing University of Science and Technology, Nanjing 210094)

Received:1900-01-01 Revised:1900-01-01 Online:2009-07-20 Published:2009-07-20

摘要/Abstract

摘要： 针对说话人辨认中训练语音有限时系统泛化能力差的问题，提出一种基于半监督学习的复合高斯混合模型算法。通过复合高斯混合模型对所有说话人的特征分布统一建模，基于半监督学习机制下的EM算法对学习样本进行学习。实验证明，该算法能够充分利用未标记样本对系统进行有效的自适应更新，改善系统的性能，获得比传统高斯混合模型更高的识别率，提高系统的泛化能力。

关键词: 说话人辨认, 半监督学习, 复合高斯混合模型, EM算法

Abstract: Aiming at the limitation of generalization ability when the speaker identification system falls short of training data, this paper proposes a new method of complex Gaussian Mixture Model(GMM) based on Semi-Supervised Learning(SSL). It uses complex GMM to model the feature distribution of all speakers and the training period adopted SSL based on iterative algorithm. Experimental shows that this new method can take full advantage of unlabeled data on the self-adaptive updating, improve the performance, get higher recognition rate compared with traditional GMM, and effectively enhance the generalization ability of system.

Key words: speaker identification, Semi-Supervised Learning(SSL), complex Gaussian Mixture Model(GMM), EM algorithm

中图分类号:

TP18

李燕萍;唐振民;丁辉;张燕. 半监督学习机制下的说话人辨认算法[J]. 计算机工程, 2009, 35(14): 221-223.

LI Yan-ping; TANG Zhen-min; DING Hui; ZHANG Yan. Speaker Identification Algorithm of Semi-Supervised Learning Mechanism[J]. Computer Engineering, 2009, 35(14): 221-223.

http://www.ecice06.com/CN/Y2009/V35/I14/221

[1]	陈仲磊, 伊鹏, 陈祥, 胡涛. 基于集成学习的系统调用实时异常检测框架[J]. 计算机工程, 2023, 49(6): 162-169,179.
[2]	佘朝阳, 严馨, 徐广义, 陈玮, 邓忠莹. 融合数据增强与半监督学习的药物不良反应检测[J]. 计算机工程, 2022, 48(6): 314-320.
[3]	胡彬, 王晓军, 张雷. 一种半监督对抗鲁棒模型无关元学习方法[J]. 计算机工程, 2022, 48(12): 112-118.
[4]	高伟, 吴顺. 基于多尺度注意力半监督学习的老照片划痕修复[J]. 计算机工程, 2022, 48(10): 245-251,261.
[5]	廖俊帆, 顾益军, 张培晶, 廖茜. 端到端说话人辨认的对抗样本应用比较研究[J]. 计算机工程, 2021, 47(6): 132-141.
[6]	康璐璐, 范兴容, 王茜竹, 杨晓雅, 明蕊. 基于特征组分层与半监督学习的鼠标轨迹识别[J]. 计算机工程, 2021, 47(4): 277-284.
[7]	薛子晗, 潘迪, 何丽. 结合改进密度峰值聚类的LGC半监督学习方法优化[J]. 计算机工程, 2021, 47(2): 77-83,89.
[8]	庄立纯, 张正军, 张乃今, 李君娣. 基于非线性Logistic模型的改进UDEED算法[J]. 计算机工程, 2019, 45(7): 208-211.
[9]	刘其开,姜代红,李文吉. 基于分段损失的生成对抗网络[J]. 计算机工程, 2019, 45(5): 155-160,168.
[10]	林金钏,艾浩军. 噪声可容忍的标记组合半监督学习算法[J]. 计算机工程, 2019, 45(4): 157-162,168.
[11]	张小斐,耿俊成,孙玉宝. 图正则非线性岭回归模型的异常用电行为识别[J]. 计算机工程, 2018, 44(6): 8-12.
[12]	赵英,韩春昊. 马尔科夫模型在网络流量分类中的应用与研究[J]. 计算机工程, 2018, 44(5): 291-295.
[13]	刘锦文,许静,张利萍,芮伟康. 基于标签传播和主动学习的人物社会关系抽取[J]. 计算机工程, 2017, 43(2): 234-240.
[14]	彭利红,李泽军,陈敏,任日丽. 一种多信息融合的药物-靶标关联预测算法[J]. 计算机工程, 2016, 42(6): 218-223,229.
[15]	张雁，吴保国，吕丹桔，林英. 基于Tri-training的主动学习算法[J]. 计算机工程, 2014, 40(6): 215-218,229.

选择文件类型/文献管理软件名称

选择包含的内容

半监督学习机制下的说话人辨认算法

Speaker Identification Algorithm of Semi-Supervised Learning Mechanism

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

半监督学习机制下的说话人辨认算法

Speaker Identification Algorithm of Semi-Supervised Learning Mechanism

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价