改进的语音特征提取方法及其应用

doi:10.3969/j.issn.1000-3428.2008.05.069

计算机工程 ›› 2008, Vol. 34 ›› Issue (5): 196-197,.

改进的语音特征提取方法及其应用

王安娜，王勤万，刘俊芳，袁文静

(东北大学信息科学与工程学院，沈阳 110004)

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2008-03-05 发布日期:2008-03-05

Improved Speech Feature Extraction and Its Application

WANG An-na, WANG Qin-wan, LIU Jun-fang, YUAN Wen-jing

(School of Information Science & Engineering, Northeastern University, Shenyang 110004)

Received:1900-01-01 Revised:1900-01-01 Online:2008-03-05 Published:2008-03-05

摘要/Abstract

摘要： 噪音是降低语音识别系统精度的关键因素，因此，如何从带噪语音信号中提取出有效的语音特征是提高语音识别系统识别率的重要途径。该文在分析语音特征提取方法的基础上提出改进算法。实验表明，采用LDA+MLLT+CMS算法组合提取出的语音特征具有较好的鲁棒性，在噪音环境下的平均音节识别率为43.79%。该组合在中文大词汇量连续语音识别系统中也有较好的性能，音节识别率达到83.56%。

关键词: 特征提取, 主分量分析(PCA), 线性区分分析(LDA), 语音识别

Abstract: Noise is a pivotal factor that reduces recognition rate of a speech recognition system. So how to extract effective speech characteristics becomes an important path for a speech recognition system to increase accuracy. This paper analyses speech feature extraction and makes improvement of it. Experimental results indicate that the algorithm combined with LDA+MLLT+CMS has better robustness than other combinations. Average syllable recognition rate reaches 43.79% by using it under conditions of noises. The algorithm combination has also a good performance in Mandarin Large Vocabulary Continuous Speech Recognition (LVCSR). Syllable recognition accuracy achieves 83.56%.

Key words: feature extraction, Principal Component Analysis(PCA), Linear Discriminant Analysis(LDA), speech recognition

中图分类号:

TP311

王安娜;王勤万;刘俊芳;袁文静. 改进的语音特征提取方法及其应用[J]. 计算机工程, 2008, 34(5): 196-197,.

WANG An-na; WANG Qin-wan; LIU Jun-fang; YUAN Wen-jing. Improved Speech Feature Extraction and Its Application[J]. Computer Engineering, 2008, 34(5): 196-197,.

https://www.ecice06.com/CN/Y2008/V34/I5/196

[1]	董红亮, 钮焱, 孙杨, 李军. 基于记忆胶囊与注意力的语音情感识别[J]. 计算机工程, 2025, 51(4): 169-177.
[2]	许明, 屈泰澎, 姜彦吉. 改进YOLOv7在复杂场景下的交通标志检测算法[J]. 计算机工程, 2025, 51(2): 335-343.
[3]	孙义康, 高建华. 基于卷积神经网络和长短期记忆的死代码检测方法[J]. 计算机工程, 2025, 51(2): 223-237.
[4]	张新波, 张雪英, 黄丽霞, 陈桂军. 基于半监督深度自编码网络的分类算法及应用[J]. 计算机工程, 2025, 51(1): 71-80.
[5]	赵俊涛, 李陶深, 卢志翔. 基于最优近邻的局部保持投影方法[J]. 计算机工程, 2024, 50(9): 161-168.
[6]	钱清, 龙永, 蒋忠远, 段春红, 王宏. 基于深度强化学习的自适应图像隐写算法[J]. 计算机工程, 2024, 50(8): 319-327.
[7]	胡庆. 多尺度融合与双输出U-Net网络的行人重识别[J]. 计算机工程, 2024, 50(6): 102-109.
[8]	梁松林, 林伟, 王珏, 杨庆. 面向后渗透攻击行为的网络恶意流量检测研究[J]. 计算机工程, 2024, 50(5): 128-138.
[9]	李振鲁, 黄威, 孙锴. 复杂环境下的轻量化道路目标识别算法研究[J]. 计算机工程, 2024, 50(4): 219-227.
[10]	袁文涛, 卫文韬, 高德民. 融合注意力机制的多视图卷积手势识别研究[J]. 计算机工程, 2024, 50(3): 208-215.
[11]	王文静, 范涛, 王国中, 赵海武. 基于SA-BPNN多模态融合的教学质量评价方法[J]. 计算机工程, 2024, 50(11): 390-398.
[12]	任义, 苏博, 袁帅. 教育领域下多维度特征命名实体识别方法[J]. 计算机工程, 2024, 50(10): 110-118.
[13]	马娜, 温廷新, 贾旭, 李晓会. 复杂光照条件下自适应的车脸重识别模型[J]. 计算机工程, 2023, 49(8): 275-282, 290.
[14]	戴浩磊, 黄永慧, 周郭许. 基于超图正则化非负张量链分解的聚类分析[J]. 计算机工程, 2023, 49(6): 81-89.
[15]	宋羽凯, 谢江. 基于多任务学习的轻量级语音情感识别模型[J]. 计算机工程, 2023, 49(5): 122-128.

选择文件类型/文献管理软件名称

选择包含的内容

改进的语音特征提取方法及其应用

Improved Speech Feature Extraction and Its Application

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

改进的语音特征提取方法及其应用

Improved Speech Feature Extraction and Its Application

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价