计算机工程 ›› 2018, Vol. 44 ›› Issue (6): 162-168,175.doi: 10.19678/j.issn.1000-3428.0047454
刘小蝶 1,朱筠 2,晋耀红 2
LIU Xiaodie 1,ZHU Yun 2,JIN Yaohong 2
摘要: 中文专利中名词性有标记并列结构分布广泛、结构复杂,现有的识别技术仅能运用有限的特征识别某些简单类型的并列结构,总体识别效果不佳。为此,提出一种基于边界感知原则的识别方法。在概念层次网络(HNC)理论的基础上,从数量、层级、语义类型、语义特征、干扰特征、结构特征、外部环境和位置特征8个维度对并列结构进行标注,考察并总结语义特征、结构特征和外部词特征,制定217条形式化规则,并将其融合到已有的HNC翻译系统中。测试结果表明,与Google在线翻译系统相比,该方法对有标记并列结构的识别正确率较高。
中图分类号: