%0 Journal Article %T 基于聚类分析分库策略的社交网络数据库查询性能与数据迁移 %A 周丽华 %A 杨培忠 %J 计算机应用 %D 2017 %R 10.11772/j.issn.1001-9081.2017.03.673 %X 摘要 社交网络数据具有一定的聚合性,即特征上相近的用户之间更容易产生某种行为。依照常规的水平切分方法,在执行这些事件的信息查询时,将会耗费大量的时间和连接损耗去依次访问多个数据库。针对此问题,提出了基于聚类分析的社交网络数据库分库策略。将社交网络主体的特征标量进行聚类,使得聚集程度高的主体尽量分割到一个或尽可能少的几个分库中去,从而提高事件的查询效率,并在此基础上兼顾负载均衡与大数据迁移等问题。实验结果表明,该策略在社交网络的主流事件查询上都表现出不同程度的性能提升,最高提升程度达到23.4%,并且实现了局部最优负载均衡和零数据迁移。总的来说,基于聚类分析的社交网络数据库分库策略在提高查询效率、平衡负载以及大数据迁移可行性上,比传统水平切割分库有了相当的优势 %K 社交网络 %K 数据库分库 %K 聚类分析 %K 查询性能 %K 数据迁移 %U http://www.joca.cn/CN/abstract/abstract20312.shtml