作者投稿和查稿 主编审稿 专家审稿 编委审稿 远程编辑

计算机工程 ›› 2011, Vol. 37 ›› Issue (19): 71-72,75. doi: 10.3969/j.issn.1000-3428.2011.19.022

• 软件技术与数据库 • 上一篇    下一篇

数据集成环境下基于相似度的数据库聚类算法

郑 凯   a,b,梁卓明   b,郑文栋   b   

  1. (华南师范大学 a. 教育信息技术学院;b. 网络中心,广州 510631)
  • 收稿日期:2011-03-04 出版日期:2011-10-05 发布日期:2011-10-05
  • 作者简介:郑 凯(1978-),男,高级实验师、硕士,主研方向:数据库技术,教育信息技术;梁卓明、郑文栋,工程师
  • 基金资助:
    国家科技支撑计划基金资助项目(2008BAH37B05084)

Database Clustering Algorithm Based on Similarity in Data Integration Environment

ZHENG Kai a,b, LIANG Zhuo-ming b, ZHENG Wen-dong b   

  1. (a. School of Education Information Technology; b. Network Center, South China Normal University, Guangzhou 510631, China)
  • Received:2011-03-04 Online:2011-10-05 Published:2011-10-05

摘要: 数据集成环境中的全局数据规划方法复杂度很高,且需要经历较长的周期。针对该问题,提出一种基于相似度集合运算的数据库聚类算法,利用自定义的相似数据库、数据库聚类和聚类距离描述数据库的聚类过程,并给出聚类效果的评价方法。实例分析结果证明,该算法简单且具有通用性。

关键词: 数据集成, 数据库相似度, 语义缺失, 数据库聚类, 聚类距离

Abstract: The current methods in the plan of global-data in data integration should abstract a realistic model first, which is very complicated and needs a long period. In order to solve the problem, this paper presents a database clustering algorithm based on similarity. It defines similar database, database clustering and clustering distance, describes the database clustering process and gives evaluation method for clustering effect. Analysis on the case proves that the algorithm is concise and general.

Key words: data integration, database similarity, lack of semantic, database clustering, clustering distance

中图分类号: