计算机工程 ›› 2015, Vol. 41 ›› Issue (1): 284-288.doi: 10.3969/j.issn.1000-3428.2015.01.054

• 开发研究与工程应用 • 上一篇    下一篇

基于语义关系的疾病知识提取系统

吴晓芳,杨志豪,林鸿飞,王健   

  1. 大连理工大学计算机科学与技术学院,辽宁 大连 116024
  • 收稿日期:2013-12-30 修回日期:2014-03-14 出版日期:2015-01-15 发布日期:2015-01-16
  • 作者简介:吴晓芳(1989-),女,硕士研究生,主研方向:知识发现,文本挖掘;杨志豪,副教授、博士、博士生导师;林鸿飞,教授、博士、博士生导师;王 健,副教授。
  • 基金项目:
    国家自然科学基金资助项目(61070098,61272373,61340020);中央高校基本科研业务费专项基金资助项目(DUT13JB09);国家社会科学基金资助项目(08BTQ025)

Disease Knowledge Extraction System Based on Semantic Relation

WU Xiaofang,YANG Zhihao,LIN Hongfei,WANG Jian   

  1. School of Computer Science and Technology,Dalian University of Technology,Dalian 116024,China
  • Received:2013-12-30 Revised:2014-03-14 Online:2015-01-15 Published:2015-01-16

摘要: 在生物医学领域,通过知识提取过程从海量的生物医学文献中提取疾病、基因和药物之间的关系并可视化显示,可以为临床医学实验提供有效的假设检验,推动生物医学科技的发展。为此,提出一种基于语义关系的以疾病为中心的疾病、基因和药物间的知识提取系统。利用SemRep得到特定主题Medline文献的语义输出,通过显著信息提取算法提取SemRep的语义输出关系。对照OMIM和GHR在线数据库进行评估,实验结果显示该显著信息提取系统的准确率可达0.76。

关键词: 知识提取, 语义关系提取, 显著信息提取算法, SemRep工具, 语义输出, 网络图可视化

Abstract: In the biomedical field,knowledge summarization can greatly promote the innovation of biomedical science and technology.Dynamic summarization can provide novel clinical experimental hypothesis by extracting the links among diseases,genes,drugs from the mass of biomedical literature and visualizing it.This paper presents a system which summarizes the salient relations by the salient extraction algorithm using the specific subject Medline corpus by SemRep semantic output.Experimental results show that the precise of experimental result is 0.76 referring to OMIM and GHR online databases.

Key words: knowledge extraction, semantic relation extraction, significant information extraction algorithm, SemRep tool, semantic output, network diagram visualization

中图分类号: