基于知识库的多层级中文文本查错推理模型

doi:10.3969/j.issn.1000-3428.2012.20.006

计算机工程 ›› 2012, Vol. 38 ›› Issue (20): 21-25. doi: 10.3969/j.issn.1000-3428.2012.20.006

基于知识库的多层级中文文本查错推理模型

吴林，张仰森

(北京信息科技大学智能信息处理研究所，北京 100192)

收稿日期:2011-11-03 修回日期:2011-12-28 出版日期:2012-10-20 发布日期:2012-10-17
作者简介:吴林(1988－)，男，硕士研究生，主研方向：智能信息处理；张仰森，教授
基金资助:
：国家自然科学基金资助项目(60873013, 61070119)；北京大学计算语言学教育部重点实验室开放课题基金资助项目(KLCL-1005)；北京市属市管高等学校人才强教计划基金资助项目(PHR201007131)

Reasoning Model of Multi-level Chinese Text Error-detecting Based on Knowledge Bases

WU Lin, ZHANG Yang-sen

(Institute of Intelligence Information Processing, Beijing Information Science and Technology University, Beijing 100192, China)

Received:2011-11-03 Revised:2011-12-28 Online:2012-10-20 Published:2012-10-17

摘要/Abstract

摘要：

以往的中文文本查错研究主要针对字词错误，对句法、语义的错误推理研究不够。为此，利用统计模型和大规模人民日报语料库构建并扩充查错知识库，针对文本中字词、语法以及语义3个层次的错误，提出相应的多层级查错推理模型。设计并实现3个层级的文本查错算法，构建自动查错系统进行综合查错。实验结果表明，该系统查错性能较优，召回率达到85.62%。

关键词: 中文文本\知识库, 多层级查错, 查错推理, 语义查错

Abstract:

The previous search on text error-detecting focused on words-level, and the syntax and semantic errors reasoning are not paid enough attention. Words, syntax and semantic knowledge bases are enlarged and constructed by taking advantage of statistic model and massive People’s Daily corpus to resolve the relevant level error reasoning, and the relevant multi-level reasoning model is put forward. The comprehensive three-level text proofreading algorithm is implemented. The constructed system can check various text errors. Experimental results show that the system has a better performance, and the recall rate is 85.62%.

Key words: Chinese text, knowledge bases, multi-level error-detecting, error-detecting reasoning, semantic error-detecting

中图分类号:

TP317

吴林, 张仰森. 基于知识库的多层级中文文本查错推理模型[J]. 计算机工程, 2012, 38(20): 21-25.

TUN Lin, ZHANG Ang-Sen. Reasoning Model of Multi-level Chinese Text Error-detecting Based on Knowledge Bases[J]. Computer Engineering, 2012, 38(20): 21-25.

http://www.ecice06.com/CN/Y2012/V38/I20/21

[1]	雷翔霄,欧阳红林,肖乐意,范朝冬. 基于等价三维熵与鲸鱼优化算法的图像分割研究[J]. 计算机工程, 2019, 45(4): 217-222.
[2]	陈国栋,曾惠燕. 基于层次结构的三维矢量场建模[J]. 计算机工程, 2015, 41(12): 216-219.
[3]	韩奕，姜建国，仇新梁，马新建，赵双. 基于云计算的恶意程序检测平台设计与实现[J]. 计算机工程, 2014, 40(4): 26-31.
[4]	李竹良，赵宇明. 基于单幅图片的相机完全标定[J]. 计算机工程, 2013, 39(11): 5-8.
[5]	杜晶, 雷志辉, 周翔. 基于红外探测技术的无人机视觉引导助降系统[J]. 计算机工程, 2013, 39(7): 237-241.
[6]	殷俊鹏, 田应洪, 赖宗声, 严琼. 基于小波域数字滤波的心电信号BW去噪算法[J]. 计算机工程, 2013, 39(3): 267-271.
[7]	王伟, 毕笃彦, 孙恒义. 基于改进ISOMAP的飞机识别算法[J]. 计算机工程, 2011, 37(21): 144-145.
[8]	贺锦鹏, 孙枫, 刘利强. 基于滤波器阵列与图割的彩色纹理分割[J]. 计算机工程, 2011, 37(14): 217-219.
[9]	孙国飞, 谷建华, 胡金华, 赵天海. 基于预拷贝的虚拟机动态内存迁移机制改进[J]. 计算机工程, 2011, 37(13): 36-39.
[10]	黄永忠;陈左宁;周蓓. 产生式重构代理的轻量级移动模型[J]. 计算机工程, 2008, 34(16): 150-152.
[11]	韩合民;郭宝龙;赵连凤. 基于兴趣点颜色及纹理特征的图像检索算法[J]. 计算机工程, 2008, 34(10): 184-186.
[12]	王金一;南凯;陈琦. 源路由控制的研究与实现[J]. 计算机工程, 2007, 33(12): 117-118,.
[13]	张桥;陈学民;伏小勇. 环境信息系统的设计与实现[J]. 计算机工程, 2007, 33(07): 276-278.
[14]	饶颖露, 邢金昊, 张恒, 马晓静, 马思乐. 基于视觉的无人机板载自主实时精确着陆系统[J]. 计算机工程, 2021, 47(10): 290-297.
[15]	张海涛, 张梦. 引入通道注意力机制的SSD目标检测算法[J]. 计算机工程, 2020, 46(8): 264-270.

选择文件类型/文献管理软件名称

选择包含的内容

基于知识库的多层级中文文本查错推理模型

Reasoning Model of Multi-level Chinese Text Error-detecting Based on Knowledge Bases

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于知识库的多层级中文文本查错推理模型

Reasoning Model of Multi-level Chinese Text Error-detecting Based on Knowledge Bases

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价