作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2012, Vol. 38 ›› Issue (2): 207-209. doi: 10.3969/j.issn.1000-3428.2012.02.068

• 人工智能及识别技术 • 上一篇    下一篇

家用机器人的说话人识别系统

武 宁,肖星星,冯 瑞   

  1. (复旦大学计算机科学技术学院,上海 201203)
  • 收稿日期:2011-06-20 出版日期:2012-01-20 发布日期:2012-01-20
  • 作者简介:武 宁(1985-),男,硕士研究生,主研方向:语音识别,多媒体技术;肖星星,硕士研究生;冯 瑞,副教授
  • 基金资助:

    国家“863”计划基金资助项目(2009AA01A346);上海市科委科技攻关计划基金资助项目(09511501404);上海宝山区科委产学研基金资助项目(CXY-2009-03)

Speaker Recognition System of Home Robot

WU Ning, XIAO Xing-xing, FENG Rui   

  1. (School of Computer Science, Fudan University, Shanghai 201203, China)
  • Received:2011-06-20 Online:2012-01-20 Published:2012-01-20

摘要: 现有说话人识别系统对环境噪声及说话人声音变迁等干扰的鲁棒性较差。为此,在改进和优化高斯混合-通用背景模型的基础上,根据家庭环境中的典型特征,设计并实现一种用于家用机器人的说话人识别系统。应用结果表明,该系统具有较好的识别性能和较高的鲁棒性,适用于声控门禁和语音签到等领域。

关键词: 说话人识别, 家用机器人, 梅尔频率倒谱系数, 高斯混合模型, 通用背景模型

Abstract: Based on a home robot platform, this paper implements a classical speaker recognition algorithm: Gaussian mixed-universal background model algorithm. It also introduces the speaker recognition theory in the robot system. In order to improve the robustness of the system in real home environment, it make some improvements in framework and algorithms. The recognition system can be applied in access system or check-in system as well.

Key words: speaker recognition, home robot, Mel Frequency Cepstrum Coefficient(MFCC), Gaussian Mixed Model(GMM), Universal Background Model(UBM)

中图分类号: