词包模型中视觉单词歧义性分析

doi:10.3969/j.issn.1000-3428.2011.19.067

计算机工程 ›› 2011, Vol. 37 ›› Issue (19): 204-206,209. doi: 10.3969/j.issn.1000-3428.2011.19.067

词包模型中视觉单词歧义性分析

刘扬闻，霍宏，方涛

(上海交通大学图像处理与模式识别研究所，上海 200240)

收稿日期:2011-04-26 出版日期:2011-10-05 发布日期:2011-10-05
作者简介:刘扬闻(1985－)，男，硕士研究生，主研方向：图像分类，图像处理；霍宏，讲师、博士；方涛，教授、博士生导师
基金资助:
国家“973”计划基金资助项目(2006CB701303)；国家自然科学基金资助项目(41071256)

Visual Words Ambiguity Analysis in BOW Model

LIU Yang-wen, HUO Hong, FANG Tao

(Institute of Image Processing and Pattern Recognition, Shanghai Jiaotong University, Shanghai 200240, China)

Received:2011-04-26 Online:2011-10-05 Published:2011-10-05

摘要/Abstract

摘要： 传统词包(BOW)模型中的视觉单词是通过无监督聚类图像块的特征向量得到的，没有考虑视觉单词的语义信息和语义性质。为解决该问题，提出一种基于文本分类的视觉单词歧义性分析方法。利用传统BOW模型生成初始视觉单词词汇表，使用文档频率、χ2分布和信息增益这3种文本分类方法分析单词语义性质，剔除具有低类别信息的歧义性单词，并采用支持向量机分类器实现图像分类。实验结果表明，该方法具有较高的分类精度。

关键词: 图像分类, 视觉单词, 文本分类, 支持向量机, 词包模型

Abstract: Visual words in the traditional Bag of Word(BOW) model can be gotten by an unsupervised method of clustering the visual features. But one critical limitation of existing BOW is not concerned with the semantic natures of visual words. This paper proposes a visual words ambiguity analysis method based on text categorization. The codebook is generated by the BOW model. There are three ways of analysis——document frequency, χ2 distribution and information gains, and then they reduce the low information visual words after analyzing. It gets optimized visual words, the histogram formed by the frequency of visual words is used in image categorization task by the Support Vector Machine(SVM) classifier. Experimental results show that this method has higher classification accuracy.

Key words: image classification, visual words, text classification, Support Vector Machine(SVM), Bag of Word(BOW) model

中图分类号:

TP306

刘扬闻, 霍宏, 方涛. 词包模型中视觉单词歧义性分析[J]. 计算机工程, 2011, 37(19): 204-206,209.

LIU Yang-Wen, HE Hong, FANG Chao. Visual Words Ambiguity Analysis in BOW Model[J]. Computer Engineering, 2011, 37(19): 204-206,209.

http://www.ecice06.com/CN/Y2011/V37/I19/204

[1]	曹坪, 杨怀志, 薄一军, 尤嘉, 张淳杰, 李丹勇. 面向低质量裂缝图像的多知识蒸馏分类[J]. 计算机工程, 2023, 49(7): 204-213.
[2]	张博旭, 蒲智, 程曦. 基于提示学习的维吾尔语文本分类研究[J]. 计算机工程, 2023, 49(6): 292-299,313.
[3]	石进, 徐杨, 曹斌. 基于自适应三线性池化网络的细粒度图像分类[J]. 计算机工程, 2023, 49(5): 239-246,254.
[4]	王春东, 孙嘉琪, 杨文军. 基于矫正理解的中文文本对抗样本生成方法[J]. 计算机工程, 2023, 49(2): 37-45.
[5]	韩彦岭, 沈思扬, 徐利军, 王静, 张云, 周汝雁. 面向深度学习图像分类的GPU并行方法研究[J]. 计算机工程, 2023, 49(1): 191-200.
[6]	陈珊, 孙仁诚, 邵峰晶, 隋毅. 基于胶囊网络的动态路由研究与改进[J]. 计算机工程, 2022, 48(5): 208-214.
[7]	陈可嘉, 刘惠. 基于改进BiGRU-CNN的中文文本分类方法[J]. 计算机工程, 2022, 48(5): 59-66,73.
[8]	袁单飞, 陈慈发, 董方敏. 基于多尺度分割的图像识别残差网络研究[J]. 计算机工程, 2022, 48(5): 258-262,271.
[9]	王志江, 秦品乐, 柴锐, 武峰, 程一彤, 史玥. 基于深度学习的牙齿嵌塞自动判别方法[J]. 计算机工程, 2022, 48(4): 307-313.
[10]	李冉冉, 刘大明, 刘正, 常高祥. 融合笔画特征的胶囊网络文本分类[J]. 计算机工程, 2022, 48(3): 69-73,80.
[11]	谭润, 叶武剑, 刘怡俊. 结合双语义数据增强与目标定位的细粒度图像分类[J]. 计算机工程, 2022, 48(2): 237-242,249.
[12]	刘鹏飞, 朱健晨, 万良易, 江波. 低功耗异构计算架构的高光谱遥感图像分类研究[J]. 计算机工程, 2022, 48(12): 9-15,23.
[13]	李伟, 黄鹤鸣, 武风英, 张会云. 基于深度多特征融合的自适应CNN图像分类算法[J]. 计算机工程, 2021, 47(9): 235-239,251.
[14]	武娇, 洪彩凤, 顾永春, 顾兴全, 金世举. 基于类邻域字典的线性回归文本分类[J]. 计算机工程, 2021, 47(8): 93-99,108.
[15]	陶洋, 鲍灵浪, 胡昊. 结合表示学习与嵌入子空间学习的降维方法[J]. 计算机工程, 2021, 47(6): 83-87,97.

选择文件类型/文献管理软件名称

选择包含的内容

词包模型中视觉单词歧义性分析

Visual Words Ambiguity Analysis in BOW Model

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

词包模型中视觉单词歧义性分析

Visual Words Ambiguity Analysis in BOW Model

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价