MFCC中DCT结构的设计与实现

doi:10.3969/j.issn.1000-3428.2009.05.091

计算机工程 ›› 2009, Vol. 35 ›› Issue (5): 265-267.

MFCC中DCT结构的设计与实现

孔维功，张国杰，张效军

(解放军信息工程大学信息工程学院，郑州 450002)

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2009-03-05 发布日期:2009-03-05

Design and Implementation of DCT Structure in MFCC

KONG Wei-gong, ZHANG Guo-jie, ZHANG Xiao-jun

(School of Information Engineering, PLA Information Engineering University, Zhengzhou 450002)

Received:1900-01-01 Revised:1900-01-01 Online:2009-03-05 Published:2009-03-05

摘要/Abstract

摘要： 根据MFCC中DCT的特点，设计一种基于DA算法的实现结构，采用先分解ROM再偏移二进制编码的方法对DA算法进行优化，将ROM表的大小由2N减小到(N/K)2K-1。通过仿真与FPGA测试，验证了该设计的正确性，能够满足说话人识别中MFCC参数提取的实时性要求和精度要求。

关键词: 说话人识别, 美尔频率倒谱系数, 离散余弦变换, 分布式算法

Abstract: This paper presents an implementation structure based on Distributed Arithmetic(DA) according to DCT character in MFCC, which optimizes DA by using ROM reduction and offset binary coder, and reduces the size of ROM table from 2N to (N/K)2K-1. The results of simulation and FPGA test show this kind of design is correct, which meets the requirement of real-time and precision in MFCC computation for speaker recognition.

Key words: speaker recognition, Mel-Frequency Cepstral Coefficients(MFCC), discrete cosine transform, distributed arithmetic

中图分类号:

TP311.12

孔维功;张国杰;张效军. MFCC中DCT结构的设计与实现[J]. 计算机工程, 2009, 35(5): 265-267.

KONG Wei-gong; ZHANG Guo-jie; ZHANG Xiao-jun. Design and Implementation of DCT Structure in MFCC[J]. Computer Engineering, 2009, 35(5): 265-267.

https://www.ecice06.com/CN/Y2009/V35/I5/265

[1]	张雷, 沈国琛, 欧冬秀. 用于热成像数据的卷积神经网络特征图筛选方法[J]. 计算机工程, 2024, 50(4): 31-40.
[2]	曹书鑫, 冯藤藤, 葛凤培, 梁春燕. 基于尺度相关‐双向长短期记忆网络模型的说话人识别[J]. 计算机工程, 2023, 49(4): 289-296.
[3]	付鹏程, 杨关, 刘小明, 刘阳, 张紫明, 成曦. 基于空间关系与频率特征的视觉问答模型[J]. 计算机工程, 2022, 48(9): 96-104.
[4]	刘余福,郎文辉,贾光帅. HXDSP平台上矩阵乘法的实现与性能分析[J]. 计算机工程, 2019, 45(4): 25-29.
[5]	齐向明, 张晶, 谭昕奇. 基于低频奇异值均值的强鲁棒零水印算法[J]. 计算机工程, 2019, 45(12): 214-221.
[6]	王奎奎,玉振明. 基于DCT零系数与局部结构张量的局部模糊检测[J]. 计算机工程, 2017, 43(6): 207-211,218.
[7]	李勇,魏珰,王柳渝. 基于PSOLA与DCT的情感语音合成方法[J]. 计算机工程, 2017, 43(12): 278-282,291.
[8]	张晓丹,李春来. 基于离散余弦变换与共生矩阵特征的图像隐写算法[J]. 计算机工程, 2015, 41(8): 127-131.
[9]	王颖,袁开国,席敏超. 基于离散余弦变换的可移除数字视频水印算法[J]. 计算机工程, 2015, 41(5): 169-174.
[10]	王威,刘婧,杨蔚蔚,李骥. 基于DCT域纹理结构相似度的模糊图像质量评价[J]. 计算机工程, 2015, 41(11): 253-256.
[11]	向亦宏,朱燕民. 无线传感器网络中高效建立干扰模型的研究[J]. 计算机工程, 2014, 40(8): 1-5.
[12]	李瑞珍,张晓旭,马德,黄凯,严晓浪. 一种灵活可配置的JPEG 编解码器软硬件架构[J]. 计算机工程, 2014, 40(11): 266-272.
[13]	肖佳林，赵聿晴，王英. 基于HMM与SVM的语音活动检测[J]. 计算机工程, 2014, 40(1): 203-208.
[14]	仝威，赵旭东，王士林，李生红. 基于熵和多步马尔可夫特征的图像拼接检测[J]. 计算机工程, 2014, 40(1): 236-238,245.
[15]	聂秀山, 董飞, 孙建德. 基于峭度图像的视频指纹算法[J]. 计算机工程, 2013, 39(2): 141-144.

选择文件类型/文献管理软件名称

选择包含的内容

MFCC中DCT结构的设计与实现

Design and Implementation of DCT Structure in MFCC

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

MFCC中DCT结构的设计与实现

Design and Implementation of DCT Structure in MFCC

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价