基于子树特征的中文实体关系抽取

doi:10.3969/j.issn.1000-3428.2012.01.012

计算机工程 ›› 2012, Vol. 38 ›› Issue (01): 48-50,54. doi: 10.3969/j.issn.1000-3428.2012.01.012

基于子树特征的中文实体关系抽取

姚全珠，王美君，李如琼

(西安理工大学计算机科学与工程学院，西安 710048)

收稿日期:2011-07-01 出版日期:2012-01-05 发布日期:2012-01-05
作者简介:姚全珠(1960－)，男，教授、博士，主研方向：数据库技术，自然语言处理，数据挖掘；王美君、李如琼，硕士研究生

Chinese Entity Relation Extraction Based on Subtree Feature

YAO Quan-zhu, WANG Mei-jun, LI Ru-qiong

(School of Computer Science and Engineering, Xi’an University of Technology, Xi’an 710048, China)

Received:2011-07-01 Online:2012-01-05 Published:2012-01-05

摘要/Abstract

摘要： 基于核函数的实体关系抽取方法将信息隐含在核函数中，无法辨别有用和无用信息，会引入噪声。为此，提出一种基于子树特征的实体关系抽取方法。利用子树挖掘和特征选择得到有效子树，并将其作为特征模板构造特征向量。在中文语料库上进行的实验结果表明，该方法具有较好的分类效果。

关键词: 实体关系抽取, 短语结构语法, 依存语法, 特征选择, 卡方统计量

Abstract: Kernel methods for relation have the implicit representation of feature spaces which can’t distinguish useful feature from useless. As a result, it introduces noise and affect performance. Aiming at this problem, this paper presents entity relation extraction based on the feature of subtrees. The proposed method uses subtree mining and feature selection to get the more useful subtrees, and the feature vector is constructed on them for categorization. Experimental result in Chinese language database shows that the proposed method for entity relation extraction is effective.

Key words: entity relation extraction, phrase structure grammar, dependency grammar, feature selection, Chi-squared statistic

中图分类号:

TP391.1

姚全珠, 王美君, 李如琼. 基于子树特征的中文实体关系抽取[J]. 计算机工程, 2012, 38(01): 48-50,54.

TAO Quan-Zhu, WANG Mei-Jun, LI Ru-Qiong. Chinese Entity Relation Extraction Based on Subtree Feature[J]. Computer Engineering, 2012, 38(01): 48-50,54.

https://www.ecice06.com/CN/Y2012/V38/I01/48

[1]	吴国霞, 邱雅茹, 江峰. 基于邻域粒度条件熵的动态萤火虫特征选择算法[J]. 计算机工程, 2026, 52(1): 144-153.
[2]	周莎, 车生兵, 考友琛, 张旭, 郭甚驿. 基于特征选择和时空特征的网络入侵检测[J]. 计算机工程, 2025, 51(7): 223-231.
[3]	马思远, 江粼, 李春林, 胡钦太, 武继刚. 基于Gabor滤波器和改进线性判别分析的掌纹识别方法[J]. 计算机工程, 2025, 51(6): 320-326.
[4]	刘闻凯, 凌青华, 王智超. 基于决策空间多样性增强的两阶段多模态多目标粒子群优化特征选择算法[J]. 计算机工程, 2025, 51(12): 171-179.
[5]	张健, 张博. 基于生物入侵的特征选择算法[J]. 计算机工程, 2024, 50(9): 46-53.
[6]	李俊仪, 李向阳, 龙朝勋, 李海燕, 李红松, 余鹏飞. 基于多级区域选择与跨层特征融合的野生菌分类[J]. 计算机工程, 2024, 50(9): 179-188.
[7]	刘仲民, 严梁. 融合动态特征与注意力的敦煌壁画修复模型[J]. 计算机工程, 2024, 50(5): 342-353.
[8]	赵洁, 叶文浩, 梁周扬, 陈建新, 董振宁. 基于不一致近邻的模糊粗糙集特征选择[J]. 计算机工程, 2024, 50(1): 110-119.
[9]	杨璇, 马建敏, 赵曼君. 基于邻域互信息的高维时序数据特征选择[J]. 计算机工程, 2023, 49(7): 135-142.
[10]	廖涛, 孙皓洁, 张顺香. 基于跨度和特征融合的实体关系联合抽取模型[J]. 计算机工程, 2023, 49(6): 107-114.
[11]	吴雪莹, 段友祥, 昌伦杰, 李世银, 孙歧峰. 面向地质领域的实体关系联合抽取研究[J]. 计算机工程, 2023, 49(3): 121-127.
[12]	杨红菊, 靳新宇. 一个实体关系与事件抽取的通用模型[J]. 计算机工程, 2023, 49(2): 143-149.
[13]	艾成豪, 高建华, 黄子杰. 混合特征选择和集成学习驱动的代码异味检测[J]. 计算机工程, 2022, 48(7): 168-176,198.
[14]	刘利, 张德生, 肖燕婷. 基于隶属度的模糊加权k近质心近邻算法[J]. 计算机工程, 2022, 48(7): 122-129.
[15]	范林歌, 武欣嵘, 童玮, 曾维军. 基于概率矩阵分解的不完整数据集特征选择方法[J]. 计算机工程, 2022, 48(6): 57-64.

选择文件类型/文献管理软件名称

选择包含的内容

基于子树特征的中文实体关系抽取

Chinese Entity Relation Extraction Based on Subtree Feature

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于子树特征的中文实体关系抽取

Chinese Entity Relation Extraction Based on Subtree Feature

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价