作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2011, Vol. 37 ›› Issue (22): 270-272. doi: 10.3969/j.issn.1000-3428.2011.22.090

• 开发研究与设计技术 • 上一篇    下一篇

基于语料库的藏文字属性分析系统设计

才智杰,才让卓玛   

  1. (青海师范大学藏文信息处理省部共建教育部重点实验室,西宁 810008)
  • 收稿日期:2011-05-25 出版日期:2011-11-18 发布日期:2011-11-20
  • 作者简介:才智杰(1970-),男,副教授、硕士,主研方向:藏文信息处理;才让卓玛,副教授、硕士
  • 基金资助:
    国家自然科学基金资助项目(61163018);国家“973”计划前期研究专项基金资助项目(2010CB334708);国家社会科学基金资助项目(09XYY024);青海省科技厅应用基础研究计划基金资助项目(2011-Z-755);青海师范大学科研创新计划基金资助项目;青海师范大学中青年科研基金资助项目

Design of Tibetan Character Property Analysis System Based on Corpora

CAI Zhi-jie, CAI Rang-zhuo-ma   

  1. (Key Laboratory of Tibetan Information Processing, Ministry of Education, Qinghai Normal University, Xining 810008, China)
  • Received:2011-05-25 Online:2011-11-18 Published:2011-11-20

摘要: 通过对藏语语料库的统计和现代藏文字结构的分析,研究现代藏文字属性分析系统的模型,设计基本构件字表库、组合构件字表库、粗粒度结构字表库及细粒度结构字表库,并阐述各字表库的结构特征,介绍藏文字属性分析算法。运用该算法及藏文字属性分析系统模型,解析现代藏文字的使用频度、结构、字长、构件分解、各构件的位置及频度等属性,从而为藏文键盘布局、藏文输入法研究、藏文搜索引擎、机器翻译和网络信息安全等提供理论依据。

关键词: 中文信息处理, 属性, 构件, 字结构

Abstract: According to the statistical analysis of Tibetan corpus and the research of the Tibetan grammar, this paper gives an analysis system model of Tibetan character property, meanwhile designs basic components character database, combination component character data base, coarse-grained structure character database, fine-grained structure character database, and the analysis algorithm of character property for the system. This system enables to conduct deep research on properties for modern Tibetan characters, and provides theoretical foundation for the Tibetan keyboard layout, the Tibetan input method, the Tibetan search engine, the Tibetan-related machine translation, and the network security. This system promotes the further development of Tibetan information processing.

Key words: Chinese information processing, property, component, character structure

中图分类号: