搜索结果: 1-12 共查到“算法理论 XML”相关记录12条 . 查询时间(0.074 秒)
XML元素级检索的反馈算法
可扩展标记语言检索 相关性反馈 相关元素 高频词集
2010/5/5
XML作为网上数据表示和交换的标准具有日益广泛的应用。近年来,XML元素级检索得到越来越多信息检索领域研究者的关注。如何提高XML元素级检索效果已经成为一个重要的研究课题。在LEMUR系统里实现了一种针对XML元素级检索的新反馈算法,大幅度地提高了检索结果的精度。利用INEX提供的XML文档集、评测系统等进行了长期的实验。实验数据显示,该算法以内容作为反馈信息使系统的平均精度提高了15.70%,以...
XML/GML非空间数据查询的结构连接算法
可扩展标记语言 地理标记语言 编码索引
2010/1/29
为利用Dewey前缀编码索引方案实现对XML/GML文档的编码并消除其缺点,提出一种扩展的Dewey编码方案——Ex-Dewey。在保留Dewey前缀编码优点的同时提出节点插入及删除对已有节点编码值串无影响的更新策略。针对Ex-Dewey编码方案提出一种在XML/GML非空间数据查询时快速确定候选节点间先辈-子孙、父-子关系的结构化连接算法——ED-XQ-SJ。给出算法思想、描述与验证。该算法无须...
Active XML文档物化终止性检验算法
AXML文档 Web服务 物化
2009/10/12
Active XML(简记为AXML)文档在XML文档中引入嵌入式Web服务,通过调用这些服务,来获取相应的内涵信息,为AXML文档物化过程。研究了AXML文档物化的终止性检验问题,提出了多项式时间的检验算法,该算法通过构造AXML模式依赖图,检验其无环性来判定AXML文档物化终止性问题,证明了算法的正确性和有效性。
基于XML的完全频繁查询模式挖掘算法
XML 数据挖掘 频繁查询模式
2009/9/21
使用树结构建模对XML查询进行研究,提出了一种基于树同构的查询包含检测方法。采用最右分枝扩展方法,系统地枚举查询模式树的同根子树。在枚举过程中,采用Diffset结构记录包含同根子树的事务集的查询事务标识,并给出挖掘算法DiffFRSTMiner。实验结果证实了该算法合理、高效,并可以减少一定的内存开销。
一种启发式XML结构重构算法
XML键 向量矩阵 投影频繁模式树
2009/9/17
基于海量XML文档查询时信息关联和服务请求多样性的需求,提出一个重构XML结构的频繁向量选择增量模式树(XFP-tree)算法。该算法以XML键为基础,利用向量矩阵处理方法、投影频繁模式树实现XML结构的分裂、合并、更改与取消等操作,同时讨论XML键向量矩阵频繁项集的划分规则及相应启发式策略与支持度阈值。对比其他关联算法,一系列仿真实验表明所提出算法具有一定的有效性及合理性,是重构XML结构的一种...
基于XML的可继承BIRCH研究
BIRCH算法 XML语言 可继承性
2009/8/10
针对BIRCH算法过分依赖内存且无法高效处理新增数据的问题,提出一种BIRCH算法的可继承性处理模型。该模型利用XML技术存储聚类特征树,并通过解析XML文档来还原聚类特征树,增强了BIRCH算法的灵活性,解决了BIRCH算法中处理新增数据的效率问题。实验结果表明,该模型是有效的。
基于Bagging的XML文档集成聚类研究
可扩展标记语言(XML) 文档聚类 Bagging算法
2009/7/21
将集成学习方法应用到XML文档聚类中来改进传统聚类算法的不足。提出一种标签与路径相结合的XML文档向量模型,基于这个模型,首先对原始文档集进行多次抽样,在新文档集上进行K均值聚类,然后对得到的聚类中心集合进行层次聚类。在人工数据集和真实数据集上的实验表明,该算法在召回率和精确率上优于K均值算法,并且增强了其鲁棒性。
基于XML数据的FP-growth算法挖掘研究
关联规则 XML FP-growth
2009/7/20
XML是跨平台的数据表示、交换技术,由于其本身在自描述性、开放性等方面的优势,在短短的时间内迅速成为行业标准。大量XML数据的涌现给数据挖掘提出了新的挑战。传统关联规则挖掘是基于关系数据库的,即把XML数据文档映射成关系数据库来完成。给出一个使用FP-growth算法直接从XML文档挖掘关联规则的类接口,并且在J2EE平台下用Java语言实现。
基于频繁结构的XML文档聚类
最大频繁路径 最大频繁子树 层次聚类
2009/7/16
研究基于频繁结构的XML文档聚类方法,其频繁结构包括频繁路径和频繁子树。首先介绍一种挖掘XML文档中所有嵌入频繁子树的算法SSTMiner,对SSTMiner算法进行修改,得到FrePathMiner算法和FreTreeMiner算法,分别用于挖掘XML文档中最大频繁路径和最大频繁子树,在此基础上,提出一种凝聚的层次聚类算法XMLCluster,分别以最大频繁路径和最大频繁子树作为XML文档的特征...
基于DTD的XML与SQL查询转换算法
文档类型定义 XSL转换 模式映射 SQL
2009/4/27
针对如何将XML查询转换成SQL查询提出了一个XSLT查询到SQL查询的转换框架和算法,研究了文档类型定义(DTD)和关系模式的相互映射方法及基于XML DTD且不使用任何中间语言将XSLT查询转换为SQL查询的具体过程和算法:从XSLT代码中抽取指令集合,合并、简化并分割其中的XPath,最后抽取出SQL语句的各个组成部分。该算法具有较高的通用性。
一种高效的基于序列匹配的XML求解算法——SCALER+
序列匹配 分支查询求解 唯一深度优先遍历序列
2008/12/29
解决了基于序列的XML查询算法(SCALER)存在的两个问题,一是明确地对通配符*和后代轴//的支持,二是支持兄弟节点无序的模式树的查询。扩展后的算法命名为SCALER+,实验结果证明它不仅具有与SCALER一样优异的性能,而且对分支查询的求解更加完备。
A Query System for XML Data Stream and its Semanticsbased Buffer Reduction
XML Data Stream Query Optimization Buffer Management SAX
2014/3/11
With respect to current methods for query evaluation over XML data streams, adoption of certain types of buffering techniques is unavoidable. Under lots of circumstances, the buffer scale may increase...