|
计算机科学 2015
一种基于聚类模式的rdf数据聚类方法Abstract: 如何有效管理并利用日益庞大的rdf数据是当今web数据管理领域面临的挑战之一。对大规模的rdf数据集进行聚类操作从而得到数据集的有效划分是rdf数据存储和应用时通常采取的策略。针对现有rdf聚类过程中忽略rdf三元组自身模式特征的问题,在对rdf聚类结果的形式深入分析的基础上,定义了3种不同类型的聚类模式,从而提出基于模式的聚类方法。通过对rdf数据集的重新描述,自动生成适用于rdf数据集特征的聚类模式,在此基础上实现数据聚类的任务。在不同测试集上的实验结果验证了所提方法的正确性和有效性。
|