基于手语视觉单词特征的手语字母识别研究

doi:10.3969/j.issn.1000-3428.2014.04.037

计算机工程

基于手语视觉单词特征的手语字母识别研究

杨全，彭进业

(西北大学信息科学与技术学院，西安 710127)

收稿日期:2013-07-12 出版日期:2014-04-15 发布日期:2014-04-14
作者简介:杨全(1980－)，女，讲师、博士研究生，主研方向：模式识别，数字图像处理；彭进业，教授、博士生导师。
基金资助:
国家自然科学基金资助项目(61075014)；高等学校博士学科点专项科研基金资助项目(20116102110027)。

Study of Sign Language Alphabet Recognition Based on Sign Language Visual Word Features

YANG Quan, PENG Jin-ye

(School of Information Science and Technology, Northwest University, Xi’an 710127, China)

Received:2013-07-12 Online:2014-04-15 Published:2014-04-14

摘要/Abstract

摘要： 为有效识别手语字母，提出一种手语视觉单词(SLVW)的识别方法。采用Kinect获取手语字母视频及其深度信息，在深度图像中，通过计算获得手语手势的主轴方向角和质心位置以调整搜索窗口，利用基于深度图像信息的DI_CamShift方法对手势进行跟踪，进而使用基于深度积分图像的Ostu方法分割手势，并提取其尺度不变特征变换数据。将局部特征描述子表示的图像小区域量化生成SLVW，统计一幅手语图像中的视觉单词频率，用词包模型表示手语字母，并用支持向量机进行识别。实验结果表明，该方法不受颜色、光照和阴影的干扰，具有较高的识别准确性和鲁棒性，对复杂背景手语视频中的30个手语字母的平均识别率达到96.21%。

关键词: 手势跟踪, 手语视觉单词, Ostu方法, 深度图像, 词包, 手语字母

Abstract: In order to effectively recognize the sign language alphabet, this paper presents an algorithm based on Sign Language Visual Word(SLVW). It uses Kinect to obtain the video and depth image information of sign language gestures, calculates spindle direction angle and mass center position of the depth image to adjust the search window and for gesture tracking which depends on depth image information DI_CamShift. An Ostu method based on depth integral image is used to gesture segmentation, and the Scale Invariant Feature Transform(SIFT) data are extracted. It generates SLVW from small regions represented by local feature descriptors. After counting the frequency of visual words in a sign language alphabet image, it builds Bag of Words(BoW) to describe manual alphabets and uses Support Vector Machine(SVM) for recognition. Experimental results show that this method has high recognition accuracy and good robustness. Meanwhile, all of color, light and shadow have no effect on it. The average recognition rate of 30 sign language alphabets in the sign language video under complex background is 96.21%.

Key words: gesture tracking, Sign Language Visual Word(SLVW), Ostu method, depth image, Bag of Words(BoW), sign language alphabet

中图分类号:

TP181

杨全，彭进业. 基于手语视觉单词特征的手语字母识别研究[J]. 计算机工程, doi: 10.3969/j.issn.1000-3428.2014.04.037.

YANG Quan, PENG Jin-ye. Study of Sign Language Alphabet Recognition Based on Sign Language Visual Word Features[J]. Computer Engineering, doi: 10.3969/j.issn.1000-3428.2014.04.037.

http://www.ecice06.com/CN/Y2014/V40/I4/192

参考文献

参考文献 [1] Wachs J P, Kolsch M, Stern H, et al. Vision-based Hand- gesture Applications[J]. Communications of the ACM, 2011, 54(2): 60-72. [2] Ren Zhou, Yuan Junsong, Zhang Zhengyou. Robust Hand Gesture Recognition Based on Finger-earth Mover’s Distance with a Commodity Depth Camera[C]//Proc. of the 19th ACM International Conference on Multimedia. New York, USA: ACM Press, 2011: 1093-1096. [3] Doliotis P, Stefan A, Murrough C, et al. Comparing Gesture Recognition Accuracy Using Color and Depth Infor- mation[C]//Proc. of the 4th International Conference on Pervasive Technologies Related to Assistive Environments. New York, USA: ACM Press, 2011: 123-133. [4] 杨筱林, 姚鸿勋. 基于多尺度形状描述子的手势识别[J]. 计算机工程与应用, 2004, 44(32): 76-78. (下转第202页) (上接第197页) [5] 张良国, 高文, 陈熙霖, 等. 面向中等词汇量的中国手语视觉识别系统[J]. 计算机研究与发展, 2006, 43(3): 476-482. [6] 姜峰, 高文. 非特定人手语识别问题中的合成数据驱动方法[J]. 计算机研究与发展, 2007, 44(5): 873-881. [7] Deng J W. A Two-step Approach Based on HMM for the Recognition of ASL[C]//Proc. of Asian Conference on Computer Vision. Melbourne, Australia: [s. n.], 2002: 126- 131. [8] Chen Qing, Georganas N D, Petriu E M. Real-time Vision- based Hand Gesture Recognition Using Haar-like Features[C]//Proc. of Instrumentation and Measurement Technology Conference. Warsaw, Poland: [s. n.], 2007: 1-6. [9] Silanon K, Suvonvorn N. Hand Motion Analysis for Thai Alphabet Recognition Using HMM[J]. International Journal of Information and Electronics Engineering, 2011, 1(1): 65-71. [10] Jon O E, Helen C, Nicolas P, et al. Sign Language Recognition Using Sequential Pattern Trees[C]//Proc. of IEEE Conference on Computer Vision and Pattern Recognition. Rhode Island, USA: [s. n.], 2012: 2200-2207. [11] 王宇石, 高文. 用基于视觉单词上下文的核函数对图像分类[J]. 中国图象图形学报, 2010, 15(4): 607-616. [12] 刘扬闻, 霍宏, 方涛. 词包模型中视觉单词歧义性分析[J]. 计算机工程, 2011, 37(19): 204-209. [13] 张秋余, 王道东, 张墨逸, 等. 基于特征包支持向量机的手势识别[J]. 计算机应用, 2012, 32(12): 3392-3396. [14] 朱志亮, 刘富国, 陶向阳, 等. 基于积分图和粒子群优化的肤色分割[J]. 计算机工程与应用, 2013, 49(5): 298-303. [15] 郎咸朋, 朱枫, 都颖明, 等. 基于积分图像的快速二维Otsu算法[J]. 仪器仪表学报, 2009, 30(1): 39-43. 编辑顾逸斐

选择文件类型/文献管理软件名称

选择包含的内容

基于手语视觉单词特征的手语字母识别研究

Study of Sign Language Alphabet Recognition Based on Sign Language Visual Word Features

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

[1]	张跃,朱启兵,黄敏,李浩. 基于递阶辨识与交替方向乘子法的深度图像增强[J]. 计算机工程, 2019, 45(4): 228-234.
[2]	娄达平,王晓东,富显祖,章联军. 基于深度图像分割的虚拟视点绘制[J]. 计算机工程, 2016, 42(10): 12-19.
[3]	徐岳峰,周书仁,王刚,佘凯晟. 基于深度图像梯度特征的人体姿态估计[J]. 计算机工程, 2015, 41(12): 200-205.
[4]	方路平,洪文杰,潘清,姚家良. 基于视觉图像的手指关节角度检测方法及其实现[J]. 计算机工程, 2015, 41(10): 221-225,231.
[5]	刘飞，郝矿荣，丁永生，刘欢. 基于深度图像的人体动作识别方法[J]. 计算机工程, 2014, 40(8): 168-172,178.
[6]	刘金荣，李淳芃，欧阳建权，刘京. 基于联合双边滤波的深度图像增强算法[J]. 计算机工程, 2014, 40(3): 249-252,257.
[7]	曹昊，诸宸辰，李杨. 一种深度图像中人体的实时跟踪算法[J]. 计算机工程, 2013, 39(9): 201-205.
[8]	李朋, 韦穂, 孙庆, 章权兵. 基于图像金字塔修复的虚拟视点绘制[J]. 计算机工程, 2013, 39(7): 31-34,50.
[9]	林鹏, 张超, 李竹良, 赵宇明. 基于深度图像学习的人体部位识别[J]. 计算机工程, 2012, 38(16): 185-188.
[10]	曹雏清, 李瑞峰, 赵立军. 基于深度图像技术的手势识别方法[J]. 计算机工程, 2012, 38(08): 16-18.
[11]	任亚恒, 温佩芝, 黄文明, 吴晓军, 石俊涛. 一种改进的大鼠精子图像分割及计数算法[J]. 计算机工程, 2011, 37(7): 243-245,248.
[12]	刘扬闻, 霍宏, 方涛. 词包模型中视觉单词歧义性分析[J]. 计算机工程, 2011, 37(19): 204-206,209.
[13]	范剑英, 于舒春, 王洋, 于贵江, 于晓洋. 基于法向分量边缘融合的深度图像分割[J]. 计算机工程, 2010, 36(17): 221-222,225.
[14]	路兴昌;张艳红;张爱武. 面向对象的城市建筑物点云数据加载和组织[J]. 计算机工程, 2008, 34(9): 238-239,.
[15]	张梅;张祖勋. 基于微分不变量和区域增长法的深度图分割[J]. 计算机工程, 2008, 34(19): 15-17.

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于手语视觉单词特征的手语字母识别研究

Study of Sign Language Alphabet Recognition Based on Sign Language Visual Word Features

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价