基于DDBHMM的维吾尔语音声学识别

doi:10.3969/j.issn.1000-3428.2011.02.068

计算机工程 ›› 2011, Vol. 37 ›› Issue (2): 197-199. doi: 10.3969/j.issn.1000-3428.2011.02.068

基于DDBHMM的维吾尔语音声学识别

王飞飞^1a，吾守尔•斯拉木^1a，那斯尔江•吐尔逊^1b,2

(1. 新疆大学a. 信息科学与工程学院；b. 数学与系统科学学院，乌鲁木齐 830046；2. 西安交通大学电子与信息工程学院，西安 710049)

出版日期:2011-01-20 发布日期:2011-01-25
作者简介:王飞飞(1984－)，女，硕士研究生，主研方向：语音信息处理；吾守尔?斯拉木，教授、博士生导师；那斯尓江?吐尔逊，副教授、博士研究生
基金资助:
国家自然科学基金资助项目(60762006, 60863008)；国家语委基金资助重点项目(MZ115-75)

Uyghur Speech Acoustics Recognition Based on DDBHMM

WANG Fei-fei ^1a, Wushour Silamu ^1a, Nasirjan Tursun ^1b,2

(1a. Information Science and Engineering College; 1b. Mathematics and Systems Science College, Xinjiang University, Urumqi 830046, China; 2. Electronic and Information Engineering College, Xi’an Jiaotong University, Xi’an 710049, China)

Online:2011-01-20 Published:2011-01-25

摘要/Abstract

摘要： 在维吾尔语连续语音识别试验的声学层建模基础上，引用DDBHMM模型将上下文相关的三音子作为基本识别单元，并提出一种状态绑定的思想，对状态进行优化。为得到更充分的训练模型，提高识别效率，对语料库进行扩充，在多组对比试验的基础上，分析扩充前后对声学层识别速度、准确率等各个方面的影响。

关键词: 语料库, 维吾尔语, DDBHMM模型理论, 三音子

Abstract: DDBHMM(Duration Distribution Based HMM) is adopted as the acoustic model for Uyghur continuous speech recognition, and the context-dependent triphone model is selected as the best recognition unit, the Uyghur speech recognition system is optimised by using the state-binding method. In order to make the models be trained more sufficiently to improve the recognition performance, the corpus is enlarged, the emphasis is on analysis of the effect that the speech database’s enlargement brings to the recognition rate and accuracy and so on based on several groups of contrasted experiments.

Key words: corpus, Uyghur, DDBHMM model theory, triphone

中图分类号:

N945

王飞飞, 吾守尔?斯拉木, 那斯尔江?吐尔逊. 基于DDBHMM的维吾尔语音声学识别[J]. 计算机工程, 2011, 37(2): 197-199.

WANG Fei-Fei, WU Shou-Er-?Shi-La-Mu, NA Shi-Er-Jiang-?Tu-Er-Xun. Uyghur Speech Acoustics Recognition Based on DDBHMM[J]. Computer Engineering, 2011, 37(2): 197-199.

http://www.ecice06.com/CN/Y2011/V37/I2/197

[1]	张博旭, 蒲智, 程曦. 基于提示学习的维吾尔语文本分类研究[J]. 计算机工程, 2023, 49(6): 292-299,313.
[2]	穆妮热·穆合塔尔, 李晓, 杨雅婷. 维吾尔语复杂形态对汉维机器翻译的影响研究[J]. 计算机工程, 2020, 46(2): 309-314.
[3]	陈曦, 朱小栋, 高广阔, 肖芳雄. 基于混合向量模型的中文评论情感分析[J]. 计算机工程, 2020, 46(1): 309-314.
[4]	塞麦提·麦麦提敏, 司马义·阿不都热依木. 维吾尔语停用词抽取方法研究[J]. 计算机工程, 2019, 45(10): 288-292,300.
[5]	王淑媛,田生伟,禹龙,冯冠军,艾山·吾买尔,李圃,赵建国. 基于堆栈降噪自编码的维吾尔语事件共指关系识别[J]. 计算机工程, 2018, 44(6): 305-310.
[6]	罗延根,李晓,蒋同海,杨雅婷,周喜,王磊. 基于词向量的维吾尔语词项归一化方法[J]. 计算机工程, 2018, 44(2): 220-225.
[7]	李雁群,何云琪,钱龙华,周国栋. 基于维基百科的中文嵌套命名实体识别语料库自动构建[J]. 计算机工程, 2018, 44(11): 76-82.
[8]	王俊超,黄浩,徐海华,胡英. 基于迁移学习的低资源度维吾尔语语音识别[J]. 计算机工程, 2018, 44(10): 281-285,291.
[9]	莫源源,潘丽同,严馨,余正涛,刘小惠. 基于最大熵模型的柬英平行网页获取[J]. 计算机工程, 2016, 42(5): 194-200.
[10]	塞麦提·麦麦提敏,侯敏,吐尔根·伊布拉音. 基于锚点句对的汉维句子对齐方法[J]. 计算机工程, 2015, 41(4): 166-170.
[11]	年梅,张兰芳. 维吾尔文网络查询扩展词的构建研究[J]. 计算机工程, 2015, 41(4): 187-189,194.
[12]	姑丽加玛丽·麦麦提艾力,艾斯卡尔·肉孜,古力米热·依玛木,艾斯卡尔·艾木都拉. 结合分层条件随机场与标点符号的维吾尔语韵律边界预测[J]. 计算机工程, 2015, 41(11): 299-302,307.
[13]	刘凯,周雪忠,于剑,张润顺. 基于条件随机场的中医临床病历命名实体抽取[J]. 计算机工程, 2014, 40(9): 312-316.
[14]	热依莱木·帕尔哈提,孟祥涛,艾斯卡尔·艾木都拉. 基于区分性关键词模型的维吾尔文本情感分类[J]. 计算机工程, 2014, 40(10): 132-136,142.
[15]	姑丽加玛丽.麦提艾力a, 艾斯卡尔.孜b, 古丽娜尔.力a, 艾斯卡尔.木都拉a. 基于分类及最佳匹配读音的维吾尔多音词消歧[J]. 计算机工程, 2013, 38(18): 22-25.

选择文件类型/文献管理软件名称

选择包含的内容

基于DDBHMM的维吾尔语音声学识别

Uyghur Speech Acoustics Recognition Based on DDBHMM

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于DDBHMM的维吾尔语音声学识别

Uyghur Speech Acoustics Recognition Based on DDBHMM

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价