VoIP压缩码流说话人识别研究

doi:10.3969/j.issn.1000-3428.2009.07.063

计算机工程 ›› 2009, Vol. 35 ›› Issue (7): 180-182. doi: 10.3969/j.issn.1000-3428.2009.07.063

VoIP压缩码流说话人识别研究

唐　晖，李弼程，屈　丹，张连海

(解放军信息工程大学信息工程学院，郑州 450002)

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2009-04-05 发布日期:2009-04-05

Research on Speaker Recognition from Compressed VoIP Packet Stream

TANG Hui, LI Bi-cheng, QU Dan, ZHANG Lian-hai

(Institute of Information Engineering, PLA Information Engineering University, Zhengzhou 450002)

Received:1900-01-01 Revised:1900-01-01 Online:2009-04-05 Published:2009-04-05

摘要/Abstract

摘要： 研究基于微聚类算法的VoIP压缩码流说话人识别算法。给出直接从G.729, G.723.1(6.3 Kb/s), G.723.1(5.3 Kb/s)压缩语音的码流中提取识别参数，以微聚类算法作为识别结构的说话人识别算法。实验结果表明，对比在压缩码流中使用同样识别参数的GMM模型，微聚类算法在识别正确率和效率上都有很大的提高。

关键词: 说话人识别, 微聚类, 压缩参数

Abstract: This paper presents compressed speaker recognition approach for VoIP(Voice over IP) which is based on the micro-clustering algorithm. It designs a framework based on the micro-clustering algorithm and performs speaker recognition on the feature vector which is directly extracted from G.729, G723.1(6.3 Kb/s), G723.1(5.3 Kb/s) compressed stream. Experimental result shows that the new method is more accurate and efficient than the widely used Gaussian Mixture Model(GMM) which uses the same feature vector.

Key words: speaker recognition, micro-clustering, compressed parameter

中图分类号:

TN912.3

唐　晖;李弼程;屈　丹;张连海. VoIP压缩码流说话人识别研究[J]. 计算机工程, 2009, 35(7): 180-182.

TANG Hui; LI Bi-cheng; QU Dan; ZHANG Lian-hai. Research on Speaker Recognition from Compressed VoIP Packet Stream[J]. Computer Engineering, 2009, 35(7): 180-182.

http://www.ecice06.com/CN/Y2009/V35/I7/180

[1]	曹书鑫, 冯藤藤, 葛凤培, 梁春燕. 基于尺度相关‐双向长短期记忆网络模型的说话人识别[J]. 计算机工程, 2023, 49(4): 289-296.
[2]	项要杰，杨俊安，李晋徽，陆俊. 一种适用于说话人识别的改进Mel滤波器[J]. 计算机工程, 2013, 39(11): 214-217,222.
[3]	杜晓青，于凤芹. 基于发声机理与人耳感知特性的说话人识别[J]. 计算机工程, 2013, 39(11): 197-199,204.
[4]	徐晨, 曹辉, 赵晓. 基于SVM的说话人识别参数选择方法[J]. 计算机工程, 2012, 38(21): 175-177.
[5]	胡峰松, 曹孝玉. 基于Gammatone滤波器组的听觉特征提取[J]. 计算机工程, 2012, 38(21): 168-170,174.
[6]	武宁, 肖星星, 冯瑞. 家用机器人的说话人识别系统[J]. 计算机工程, 2012, 38(2): 207-209.
[7]	张学锋, 王芳, 夏萍. 融合LPC与MFCC的特征参数[J]. 计算机工程, 2011, 37(4): 216-217.
[8]	周萍, 唐李珍. 基于信息融合的短语音说话人识别方法研究[J]. 计算机工程, 2011, 37(2): 169-171.
[9]	陈黎, 徐东平. 基于SVM-GMM的开集说话人识别方法[J]. 计算机工程, 2011, 37(14): 172-174.
[10]	郑泽萍, 王万良, 郑建炜. 基于保局部核RVM的说话人识别方法[J]. 计算机工程, 2011, 37(14): 208-210.
[11]	尹许梅, 何选森. 基于Bark子波变换的MFCC特征提取[J]. 计算机工程, 2011, 37(11): 192-194.
[12]	李睿;李伟娟;李明. 基于加权量子粒子群的分类器设计[J]. 计算机工程, 2010, 36(7): 203-204,.
[13]	王佳毅, 张丽清. 基于稀疏约束判别分析的说话人识别算法[J]. 计算机工程, 2010, 36(10): 206-208.
[14]	孔维功;张国杰;张效军. MFCC中DCT结构的设计与实现[J]. 计算机工程, 2009, 35(5): 265-267.
[15]	张燕;唐振民;李燕萍. 基于单字音特征提取的说话人识别方法[J]. 计算机工程, 2009, 35(10): 188-189.

选择文件类型/文献管理软件名称

选择包含的内容

VoIP压缩码流说话人识别研究

Research on Speaker Recognition from Compressed VoIP Packet Stream

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

VoIP压缩码流说话人识别研究

Research on Speaker Recognition from Compressed VoIP Packet Stream

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价