%0 Journal Article %T 改进的k-means聚类算法在公交IC卡数据分析中的应用研究 %A 杨健兵 %J 软件工程 %D 2019 %X 摘 要: 针对传统k-means算法中初始聚类中心随机确定的问题,提出k-means改进算法。首先,定义变量权 值,权值的大小等于样本密度乘以簇间距离除以簇内样本平均距离,通过最大权值来确定聚类中心,克服了随机确定 聚类中心的不稳定性。然后在Hadoop平台上用Map-Reduce框架下实现算法的并行化。最后以南通公交IC刷卡记录为 例,通过改进的k-means聚类算法进行IC卡刷卡记录的分析。实验表明,在Hadoop平台下改进k-means算法运行稳 定、可靠,具有很好的聚类效果。 %K MapReduce %K 改进k-means算法 %K k-means %K 聚类 %U http://www.rjgczz.com/ch/reader/view_abstract.aspx?file_no=20190507&flag=1