家用机器人的说话人识别系统

doi:10.3969/j.issn.1000-3428.2012.02.068

计算机工程 ›› 2012, Vol. 38 ›› Issue (2): 207-209. doi: 10.3969/j.issn.1000-3428.2012.02.068

家用机器人的说话人识别系统

武宁，肖星星，冯瑞

(复旦大学计算机科学技术学院，上海 201203)

收稿日期:2011-06-20 出版日期:2012-01-20 发布日期:2012-01-20
作者简介:武宁(1985－)，男，硕士研究生，主研方向：语音识别，多媒体技术；肖星星，硕士研究生；冯瑞，副教授
基金资助:
国家“863”计划基金资助项目(2009AA01A346)；上海市科委科技攻关计划基金资助项目(09511501404)；上海宝山区科委产学研基金资助项目(CXY-2009-03)

Speaker Recognition System of Home Robot

WU Ning, XIAO Xing-xing, FENG Rui

(School of Computer Science, Fudan University, Shanghai 201203, China)

Received:2011-06-20 Online:2012-01-20 Published:2012-01-20

摘要/Abstract

摘要： 现有说话人识别系统对环境噪声及说话人声音变迁等干扰的鲁棒性较差。为此，在改进和优化高斯混合-通用背景模型的基础上，根据家庭环境中的典型特征，设计并实现一种用于家用机器人的说话人识别系统。应用结果表明，该系统具有较好的识别性能和较高的鲁棒性，适用于声控门禁和语音签到等领域。

关键词: 说话人识别, 家用机器人, 梅尔频率倒谱系数, 高斯混合模型, 通用背景模型

Abstract: Based on a home robot platform, this paper implements a classical speaker recognition algorithm: Gaussian mixed-universal background model algorithm. It also introduces the speaker recognition theory in the robot system. In order to improve the robustness of the system in real home environment, it make some improvements in framework and algorithms. The recognition system can be applied in access system or check-in system as well.

Key words: speaker recognition, home robot, Mel Frequency Cepstrum Coefficient(MFCC), Gaussian Mixed Model(GMM), Universal Background Model(UBM)

中图分类号:

TP391.42

武宁, 肖星星, 冯瑞. 家用机器人的说话人识别系统[J]. 计算机工程, 2012, 38(2): 207-209.

WU Ning, XIAO Xing-Xing, FENG Rui. Speaker Recognition System of Home Robot[J]. Computer Engineering, 2012, 38(2): 207-209.

http://www.ecice06.com/CN/Y2012/V38/I2/207

[1]	曹书鑫, 冯藤藤, 葛凤培, 梁春燕. 基于尺度相关‐双向长短期记忆网络模型的说话人识别[J]. 计算机工程, 2023, 49(4): 289-296.
[2]	王文欣, 贺煜航, 陈刚. 基于EM路由算法的医学图像分割UCaps网络[J]. 计算机工程, 2022, 48(2): 268-274.
[3]	胡高珍, 徐胜军, 孟月波, 刘光辉, 冯峰, 段中兴. 基于边缘约束局部区域MRF的图像分割方法[J]. 计算机工程, 2021, 47(6): 253-261,270.
[4]	张墨华, 彭建华. 面向图像先验建模的可扩展高斯混合模型[J]. 计算机工程, 2020, 46(4): 220-227.
[5]	姚博凡, 邓红平, 蔡铭. 基于随机抽样GMM的城市交通运行状态模式分类[J]. 计算机工程, 2020, 46(12): 36-42.
[6]	郑文秀, 赵峻毅, 文心怡, 姚引娣. 基于瓶颈复合特征的声学模型建立方法[J]. 计算机工程, 2020, 46(11): 301-305,314.
[7]	王忠民, 刘戈, 宋辉. 基于多核学习特征融合的语音情感识别方法[J]. 计算机工程, 2019, 45(8): 248-254.
[8]	邓路佳,刘平山. 基于GMM-FMs的广告点击率预测研究[J]. 计算机工程, 2019, 45(5): 122-126.
[9]	王万耀,段先华,徐丹,於跃成,黄炜亮. 基于显著性的Grabcut图像分割方法[J]. 计算机工程, 2018, 44(7): 230-236,243.
[10]	朱晓妤,严云洋,刘以安,高尚兵. 基于深度森林模型的火焰检测[J]. 计算机工程, 2018, 44(7): 264-270.
[11]	胡志隆,文畅,谢凯,贺建飚. 联合HMM-UBM与RVM的声纹密码识别算法[J]. 计算机工程, 2018, 44(11): 129-134.
[12]	刘宇廷,毕海滨,郭强,倪颖杰. 基于网络拓扑与节点元数据的社团检测算法[J]. 计算机工程, 2018, 44(11): 178-183.
[13]	刘攀登,刘清明. 稀疏数据中基于高斯混合模型的位置推荐框架[J]. 计算机工程, 2018, 44(1): 62-68.
[14]	陈锦飞,徐欣. 基于梅尔频率倒谱系数与动态时间规整的安卓声纹解锁系统[J]. 计算机工程, 2017, 43(2): 201-205.
[15]	高晨兰,朱嘉钢. 静止背景下的人体行为识别方法[J]. 计算机工程, 2017, 43(10): 192-197.

选择文件类型/文献管理软件名称

选择包含的内容

家用机器人的说话人识别系统

Speaker Recognition System of Home Robot

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

家用机器人的说话人识别系统

Speaker Recognition System of Home Robot

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价