基于多核学习的医学文献蛋白质关系抽取

doi:10.3969/j.issn.1000-3428.2011.10.063

计算机工程 ›› 2011, Vol. 37 ›› Issue (10): 184-186. doi: 10.3969/j.issn.1000-3428.2011.10.063

基于多核学习的医学文献蛋白质关系抽取

唐楠，杨志豪，林鸿飞，李彦鹏

(大连理工大学计算机科学与技术学院，辽宁大连 116024)

出版日期:2011-05-20 发布日期:2011-05-20
作者简介:唐楠(1986－)，女，硕士研究生，主研方向：文本挖掘；杨志豪，副教授、博士；林鸿飞，教授、博士、博士生导师；李彦鹏，博士研究生
基金资助:
国家自然科学基金资助项目(60373095, 60673039)；国家“863”计划基金资助项目(2006AA01Z151)

Protein-protein Interaction Extraction from Medical Literature Based on Multiple Kernels Learning

TANG Nan, YANG Zhi-hao, LIN Hong-fei, LI Yan-peng

(College of Computer Science and Technology, Dalian University of Technology, Dalian 116024, China)

Online:2011-05-20 Published:2011-05-20

摘要/Abstract

摘要： 从生物医学文献中抽取蛋白质交互作用关系对蛋白质知识网络的建立、新药的研制等均具有重要的意义。为此，提出一种基于多核学习的方法，用于从文献中自动抽取蛋白质关系信息。该方法融合基于特征的核、树核以及图核，并扩展最短路径依存树以及依存路径以利用更多的上下文关系信息。在AImed语料上的实验得到63.9%的F值和87.83%的AUC值，表明该方法具有较好的性能。

关键词: 文本挖掘, 信息抽取, 蛋白质关系抽取, 核方法, 多核学习

Abstract: Automatic extracting protein-protein interaction information from biomedical literature can help to build protein relation network and design new drugs. This paper presents a multiple kernels learning based approach to automatically extract protein-protein interactions from biomedical literature. The approach combines feature-based kernel, tree kernel and graph kernel. In particular, it extends shortest path-enclosed tree and dependency path tree to capture richer contextual information. Experimental evaluations show that the method can achieve state-of-the-art performance with respect to comparable evaluations, with 63.9% F-score and 87.83% AUC on the AImed corpus.

Key words: text mining, information extraction, protein-protein interaction extraction, kernel method, multiple kernels learning

中图分类号:

TP311.12

唐楠, 杨志豪, 林鸿飞, 李彦鹏. 基于多核学习的医学文献蛋白质关系抽取[J]. 计算机工程, 2011, 37(10): 184-186.

TANG Nan, YANG Zhi-Hao, LIN Hong-Fei, LI Pan-Feng. Protein-protein Interaction Extraction from Medical Literature Based on Multiple Kernels Learning[J]. Computer Engineering, 2011, 37(10): 184-186.

http://www.ecice06.com/CN/Y2011/V37/I10/184

[1]	衡红军, 苗菁. 语义与句法信息加强的二元标记实体关系联合抽取[J]. 计算机工程, 2023, 49(4): 77-84.
[2]	张吉祥, 张祥森, 武长旭, 赵增顺. 知识图谱构建技术综述[J]. 计算机工程, 2022, 48(3): 23-37.
[3]	张军莲, 张一帆, 汪鸣泉, 黄永健. 基于图卷积神经网络的中文实体关系联合抽取[J]. 计算机工程, 2021, 47(12): 103-111.
[4]	何阳宇, 晏雷, 易绵竹, 李宏欣. 融合CRF与规则的老挝语军事领域命名实体识别方法[J]. 计算机工程, 2020, 46(8): 297-304.
[5]	何俊, 张彩庆, 李小珍, 张德海. 面向深度学习的多模态融合技术研究综述[J]. 计算机工程, 2020, 46(5): 1-11.
[6]	王忠民, 刘戈, 宋辉. 基于多核学习特征融合的语音情感识别方法[J]. 计算机工程, 2019, 45(8): 248-254.
[7]	卢晨阳,康雁,杨成荣,蒲斌. 基于语义结构的迁移学习文本特征对齐算法[J]. 计算机工程, 2019, 45(5): 116-121.
[8]	任胜兵, 谢如良. 基于AdaBoost的弹性网型正则化多核学习算法[J]. 计算机工程, 2019, 45(10): 189-195.
[9]	李雁群,何云琪,钱龙华,周国栋. 基于维基百科的中文嵌套命名实体识别语料库自动构建[J]. 计算机工程, 2018, 44(11): 76-82.
[10]	赵知劲,金明明. 基于块自适应滤波的核最小均方算法[J]. 计算机工程, 2017, 43(9): 162-166.
[11]	王辉,郁波,洪宇,肖仰华. 基于知识图谱的Web信息抽取系统[J]. 计算机工程, 2017, 43(6): 118-124.
[12]	聂文汇,曾承,贾大文. 基于热度矩阵的微博热点话题发现[J]. 计算机工程, 2017, 43(2): 57-62.
[13]	李明耀,杨静. 基于依存分析的开放式中文实体关系抽取方法[J]. 计算机工程, 2016, 42(6): 201-207.
[14]	张凯军，梁循. 马氏距离多核支持向量机学习模型[J]. 计算机工程, 2014, 40(6): 219-225.
[15]	吴定海, 张培林, 王怀光, 傅建平. 基于多核支持向量数据描述的单类分类方法[J]. 计算机工程, 2013, 39(5): 165-168,173.

选择文件类型/文献管理软件名称

选择包含的内容

基于多核学习的医学文献蛋白质关系抽取

Protein-protein Interaction Extraction from Medical Literature Based on Multiple Kernels Learning

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于多核学习的医学文献蛋白质关系抽取

Protein-protein Interaction Extraction from Medical Literature Based on Multiple Kernels Learning

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价