基于改进视觉词袋模型的图像标注方法

doi:10.3969/j.issn.1000-3428.2012.22.069

计算机工程 ›› 2012, Vol. 38 ›› Issue (22): 276-278.

基于改进视觉词袋模型的图像标注方法

霍华，赵刚

(河南科技大学电子信息工程学院，河南洛阳 471003)

收稿日期:2012-02-07 修回日期:2012-03-27 出版日期:2012-11-20 发布日期:2012-11-17
作者简介:霍华(1968－)，男，副教授、博士后，主研方向：智能信息处理，光纤通道技术，嵌入式系统；赵刚，硕士研究生
基金资助:
国家自然科学基金资助项目(60743008)；河南省国际科技合作计划基金资助项目(104300510063)

Image Annotation Method Based on Improved BoVW Model

HUO Hua, ZHAO Gang

(Electronic Information Engineering College, Henan University of Science and Technology, Luoyang 471003, China)

Received:2012-02-07 Revised:2012-03-27 Online:2012-11-20 Published:2012-11-17

摘要/Abstract

摘要： 针对传统视觉词袋模型对图像尺度变化较为敏感的缺点，提出一种基于改进视觉词袋模型的图像标注方法。该方法引入图像的多尺度空间信息，对图像进行多尺度变换并构建多尺度视觉词汇表，将图像表示为不同尺度特征，结合多核学习的方法优化各尺度特征的相应权重，获取特征表示。实验结果验证了该方法的有效性，其标注准确率比传统BoVW模型提高17.8%~25.7%。

关键词: 图像标注, 视觉词袋模型, 多尺度空间, 多尺度视觉词, 多核学习, 权重优化

Abstract: Aiming at overcoming the traditional Bag of Visual Word(BoVW) model’s sensitivity to image scale’s variation, this paper proposes an image annotation method based on improved BoVW model. It incorporates with multiple spaces information and transfers original images into multiple scale spaces and constructs multiple scale vocabularies. Images are represented as a family of feature histograms with different scale. Multiple kernel learning is introduced to optimize the histograms weights of different scale in order to acquire discriminative classifying power. Experimental results prove the validity of the method, it outperforms BoVW on image annotation precision ranged from 17.8% to 25.7%.

Key words: image annotation, Bag of Visual Word(BoVW) model, multiple scale space, multiple scale visual word, multiple kernel learning, weight optimization

中图分类号:

TP391

霍华, 赵刚. 基于改进视觉词袋模型的图像标注方法[J]. 计算机工程, 2012, 38(22): 276-278.

HE Hua, DIAO Gang. Image Annotation Method Based on Improved BoVW Model[J]. Computer Engineering, 2012, 38(22): 276-278.

https://www.ecice06.com/CN/Y2012/V38/I22/276

[1]	何俊, 张彩庆, 李小珍, 张德海. 面向深度学习的多模态融合技术研究综述[J]. 计算机工程, 2020, 46(5): 1-11.
[2]	刘燕芝, 陈立福, 崔先亮, 袁志辉, 邢学敏. 基于空间特征重标定网络的遥感图像场景分类[J]. 计算机工程, 2020, 46(1): 229-235.
[3]	王忠民, 刘戈, 宋辉. 基于多核学习特征融合的语音情感识别方法[J]. 计算机工程, 2019, 45(8): 248-254.
[4]	任胜兵, 谢如良. 基于AdaBoost的弹性网型正则化多核学习算法[J]. 计算机工程, 2019, 45(10): 189-195.
[5]	陈新荃,陈晓东,蒋林华. 基于Spark平台的人脸图像检索系统[J]. 计算机工程, 2018, 44(2): 251-256.
[6]	王建文,林劼. 基于颜色直方图金字塔的图像自动标注方法[J]. 计算机工程, 2016, 42(6): 235-240.
[7]	彭天强,栗芳. 基于二进制哈希与空间金字塔的视觉词袋模型生成方法[J]. 计算机工程, 2016, 42(12): 164-170.
[8]	顾文娇，张化祥. 基于跨媒体字典的图像检索[J]. 计算机工程, 2014, 40(6): 238-240,246.
[9]	张凯军，梁循. 马氏距离多核支持向量机学习模型[J]. 计算机工程, 2014, 40(6): 219-225.
[10]	王昌达, 石廷娟. 基于概念图和权重优化的智能学习模型[J]. 计算机工程, 2013, 39(8): 270-273,280.
[11]	郭玉堂, 韩昌刚. 基于CCA子空间和GMM的自动图像标注[J]. 计算机工程, 2013, 39(6): 277-282.
[12]	吴定海, 张培林, 王怀光, 傅建平. 基于多核支持向量数据描述的单类分类方法[J]. 计算机工程, 2013, 39(5): 165-168,173.
[13]	黄勇辉, 尚赵伟, 张明新. 反馈日志与混合概率模型相结合的图像标注[J]. 计算机工程, 2012, 38(21): 202-205.
[14]	霍华, 赵刚. 基于视觉词模糊权重的视频语义标注[J]. 计算机工程, 2012, 38(13): 131-133.
[15]	郭海凤. FAC算法在图像检索中的应用[J]. 计算机工程, 2012, 38(12): 211-213.

选择文件类型/文献管理软件名称

选择包含的内容

基于改进视觉词袋模型的图像标注方法

Image Annotation Method Based on Improved BoVW Model

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于改进视觉词袋模型的图像标注方法

Image Annotation Method Based on Improved BoVW Model

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价