%0 Journal Article %T 一种Spark GraphX框架下的关键词抽取方法 %A 程传鹏 %J 中山大学学报(自然科学版) %D 2019 %X 摘要 TextRank算法根据文本词语的位置关系构造图,应用图排序的算法计算出词语的权重,在计算过程中需要进行大量的迭代运算,在数据规模较大的时候,计算时间尤为可观.针对此问题,提出了一种基于Spark GraphX的关键词抽取方法,利用Spark GarpX所提供的分布式计算的图框架,将文本图数据分布式存储在不同的节点上,高效地实现了文本关键词的抽取.实验表明,本文中提出的基于Spark GraphX的关键词抽取方法,不仅计算时间短,抽取的关键词与人工标注的结果非常接近,具有一定的合理性 %K Spark GraphX %K 关键词提取 %K 图排序 %K 词语权重 %U http://xwxt.sict.ac.cn/CN/abstract/abstract4833.shtml