基于压缩结构树的XML数据频繁模式挖掘研究

doi:10.3969/j.issn.1000-3428.2006.19.039

计算机工程 ›› 2006, Vol. 32 ›› Issue (19): 108-110,. doi: 10.3969/j.issn.1000-3428.2006.19.039

基于压缩结构树的XML数据频繁模式挖掘研究

曹洪其1，牛天耘2，孙志挥2

（1. 南通职业大学电子工程系，南通 226007；2. 东南大学计算机科学与工程系，南京 210096）

收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2006-10-05 发布日期:2006-10-05

Research of Frequent Pattern Mining from XML Data Based on Compressed Structure Tree

CAO Hongqi1, NIU Tianyun2, SUN Zhihui2

（1. Department of Electronic Engineering, Nantong Vocational College, Nantong 226007;
2. Department of Computer Science and Engineering, Southeast University, Nanjing 210096）

Received:1900-01-01 Revised:1900-01-01 Online:2006-10-05 Published:2006-10-05

摘要/Abstract

摘要： XML文档频繁模式挖掘是XML相关研究工作中的重要内容。在现有的频繁树结构挖掘算法WL的基础上，提出了一种高效的基于压缩结构树存储结构的XML数据频繁模式挖掘算法AFPMX_CST。该算法压缩了搜索空间，减少了扫描次数，相对于WL算法在时间效率和空间效率方面具有更加良好的性能。同时，该文进一步研究了将挖掘结果转换为相应的DTD格式的方法及过程。实验结果表明AFPMX_CST算法是可行和有效的。

关键词: XML, 数据挖掘, 频繁模式, 算法, DTD

Abstract: Frequent pattern mining based on XML document is an important content in XML-related research. An efficient algorithm called AFPMX_CST is presented to discover frequent pattern in XML data based on compressed structure tree of storing XML data, with the existing frequent tree structure mining algorithm WL. It compresses the searching space, reduces scanning times, so it is much better than WL in time efficiency and space efficiency. At the same time, the methods and process to change mining results into corresponding DTD patterns are researched. It is proved both in theory and practice that this algorithm is adoptable and effective.

Key words: XML, Data mining, Frequent pattern, Algorithm, DTD

中图分类号:

TP311

曹洪其;牛天耘;孙志挥. 基于压缩结构树的XML数据频繁模式挖掘研究[J]. 计算机工程, 2006, 32(19): 108-110,.

CAO Hongqi; NIU Tianyun; SUN Zhihui. Research of Frequent Pattern Mining from XML Data Based on Compressed Structure Tree
[J]. Computer Engineering, 2006, 32(19): 108-110,.

http://www.ecice06.com/CN/Y2006/V32/I19/108

[1]	黄保华, 郑慧颖, 屈锡, 陈宁江. 联盟链高效存储访问控制方案[J]. 计算机工程, 2023, 49(8): 37-45.
[2]	王春东, 王翔宇. 多层次实用拜占庭容错算法改进[J]. 计算机工程, 2023, 49(8): 29-36.
[3]	班玉琦, 段利国, 温昊宇, 李爱萍, 赵菊敏. 面向移动感知的计算卸载及资源分配策略研究[J]. 计算机工程, 2023, 49(8): 163-173.
[4]	刘俊豪, 王美林, 谢兴, 宋烨兴, 许莉花. 基于改进YOLOv5的皮革瑕疵检测算法[J]. 计算机工程, 2023, 49(8): 240-249.
[5]	陈露萌, 曹彦彦, 黄民, 谢鑫钢. 基于改进YOLOv5的火焰检测方法[J]. 计算机工程, 2023, 49(8): 291-301, 309.
[6]	梅晶, 戴龙宝, 童钊, 邓昕, 王嘉珂. 资源约束下基于Lyapunov优化的自适应卸载算法[J]. 计算机工程, 2023, 49(7): 34-46.
[7]	蔡星娟, 郭彦亨, 赵天浩, 张文生. 基于进化多任务的边缘计算服务部署和任务卸载[J]. 计算机工程, 2023, 49(7): 1-9.
[8]	程适, 王雪萍, 刘悦, 史玉回. 面向非线性方程组的学习型头脑风暴优化算法[J]. 计算机工程, 2023, 49(7): 47-54.
[9]	蔡倩倩, 史旭华. 自适应迁移的分解多目标多任务进化算法[J]. 计算机工程, 2023, 49(7): 55-64.
[10]	齐咏生, 杜晓旭, 朱俊峰, 高胜利, 刘利强. 基于增强型轻量深度网络的牧区牲畜高效检测[J]. 计算机工程, 2023, 49(7): 278-287.
[11]	常戬, 刘鑫姝. 空间转换与自适应灰度校正的低照度图像增强[J]. 计算机工程, 2023, 49(6): 193-200,207.
[12]	付嘉豪, 杨嘉怡, 李爱国. 面向安防系统的高效用语义轨迹模式挖掘[J]. 计算机工程, 2023, 49(6): 62-70.
[13]	陈倩倩, 秦宝东. 基于SM9的两方协同盲签名方案[J]. 计算机工程, 2023, 49(6): 144-153,161.
[14]	饶金涛, 崔喆. 基于SM9盲签名与环签名的安全电子选举协议[J]. 计算机工程, 2023, 49(6): 13-23,33.
[15]	何建江, 陈玉玲. 基于DLIN加密的可监管联盟链隐私保护方案[J]. 计算机工程, 2023, 49(6): 170-179.

选择文件类型/文献管理软件名称

选择包含的内容

基于压缩结构树的XML数据频繁模式挖掘研究

Research of Frequent Pattern Mining from XML Data Based on Compressed Structure Tree

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价

模态框（Modal）标题

选择文件类型/文献管理软件名称

选择包含的内容

基于压缩结构树的XML数据频繁模式挖掘研究

Research of Frequent Pattern Mining from XML Data Based on Compressed Structure Tree

PDF

可视化

被引次数

摘要/Abstract

引用本文

使用本文

参考文献

相关文章 15

编辑推荐

Metrics

本文评价