基于分形特征的音频检索

doi:10.3969/j.issn.1000-3428.2008.11.076

计算机工程 ›› 2008, Vol. 34 ›› Issue (11): 211-213. doi: 10.3969/j.issn.1000-3428.2008.11.076

基于分形特征的音频检索

李坚1，毛先领2，文贵华2

(1. 华南理工大学计算机应用工程研究所，广州 510641；2. 华南理工大学计算机学院，广州 510641)

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2008-06-05 发布日期:2008-06-05

Fractal Feature-based Audio Retrieval

LI Jian1, MAO Xian-ling2, WEN Gui-hua2

(1. Computer Engineering Institute, South China University of Technology, Guangzhou 510641; 2. Computer College, South China University of Technology, Guangzhou 510641)

Received:1900-01-01 Revised:1900-01-01 Online:2008-06-05 Published:2008-06-05

摘要/Abstract

摘要： 提出利用分形几何抽取音频特征的全局化音频检索，将其学习阶段计算音频数据库中每个音频的分维作为特征向量，保存在音频特征数据库中，并建立索引。其检索阶段则首先计算查询音频的分维，然后从音频数据库中快速找出分维最相似的若干音频对象。分维刻画了音频的内在属性如自相似性，使其具有片段检索对匹配的起点不敏感、抗噪音、检索速度快等优点。用FRACTAL, MFCC和SOLAR 3种方法对数据集分别检索，实验结果表明基于分维的音频检索在性能和时间复杂度上有显著优势。

关键词: 音频检索, 分形, 音频特征

Abstract: The fractal geometry-based feature extraction is proposed for audio retrieval system. During the learning process, the system computes the fractal dimension as the feature vector for each audio in audio database and then saves it in the feature vector database. In the retrieval process, the fractal dimension for the query audio is firstly extracted, by which the most similar audios from the audio database are retrieved. The fractal dimension is intrinsic for each audio such as self-similarity so as to make it not sensitive to noise and position of the audio fragment to be retrieved from the long audio. It also retrieves the audios quickly. Compared with FRACTAL, MFCC and SOLAR, the experimental results validate that the proposed approach advances in performance and time complexity.

Key words: audio retrieval, fractal, audio feature

中图分类号:

TP18

李坚;毛先领;文贵华. 基于分形特征的音频检索[J]. 计算机工程, 2008, 34(11): 211-213.

LI Jian; MAO Xian-ling; WEN Gui-hua. Fractal Feature-based Audio Retrieval[J]. Computer Engineering, 2008, 34(11): 211-213.

http://www.ecice06.com/CN/Y2008/V34/I11/211

[1]	郑巍, 张紫枫, 潘浩. 移动社交网络的多重分形影响因素分析[J]. 计算机工程, 2019, 45(10): 90-95.
[2]	孙宁,赵维平,陈美,李超. 一种改进的Philips音频指纹检索算法[J]. 计算机工程, 2018, 44(1): 280-284.
[3]	姚琪,殷智,易云飞,李元香. 具有Hub聚集特性的分形网络优化模型分析[J]. 计算机工程, 2017, 43(4): 239-243.
[4]	朱灵蕾,姚远程,秦明伟. 自相似业务量生成方法研究及改进[J]. 计算机工程, 2016, 42(7): 54-58.
[5]	梁金平,董唯光,毛向德. 变流器故障特征提取与维数约简方法研究[J]. 计算机工程, 2015, 41(12): 280-287.
[6]	王凤，邓念东，马逢清，王超，江星辰. 基于CT的黄土大孔隙形态三维分形研究[J]. 计算机工程, 2014, 40(7): 217-220.
[7]	金国平，余宗桥，郭延文，蒋和. 基于GPU加速的音频检索技术[J]. 计算机工程, 2014, 40(5): 266-269.
[8]	陈国彬,张广泉. 基于LFSN 和小波变换的业务流预测算法[J]. 计算机工程, 2014, 40(10): 214-218.
[9]	孙媛媛, 孔瑞卿. 一种基于字典的快速分形图像编码方法[J]. 计算机工程, 2013, 39(1): 230-233.
[10]	李文敬, 钟智, 元昌安. 基于GEP的分形图像压缩并行算法[J]. 计算机工程, 2012, 38(7): 201-202.
[11]	金建业, 倪志伟, 汪莎. 基于密度与分形维数的数据流聚类算法[J]. 计算机工程, 2012, 38(5): 38-40.
[12]	杨得国, 李智, 姜金娣. 基于音频特征和低频系数较小值的水印算法[J]. 计算机工程, 2012, 38(21): 10-13.
[13]	王富丽, 欧阳建权. 基于AdaBoost的多特征融合指纹检索方法[J]. 计算机工程, 2012, 38(21): 272-275.
[14]	谈会星, 陈福才, 李邵梅. 基于模板子空间的快速固定音频检索方法[J]. 计算机工程, 2012, 38(20): 260-263.
[15]	姚燕, 汤进, 罗斌. 基于迭代分形解码和边缘扩展的图像修复算法[J]. 计算机工程, 2012, 38(2): 218-220.

选择文件类型/文献管理软件名称

选择包含的内容

基于分形特征的音频检索

Fractal Feature-based Audio Retrieval

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于分形特征的音频检索

Fractal Feature-based Audio Retrieval

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价