%0 Journal Article %T 一种基于高斯混合模型、结合拓扑与内容的大规模社团发现方法 %A 何东晓 %A 王英奎 %A 罗国华 %A 金弟 %A 龚欣哲 %J 中山大学学报(自然科学版) %D 2018 %X 摘要 复杂网络社团发现是当前多学科交叉的研究热点.已有社团发现方法主要是针对网络拓扑,且难于处理大规模网络.基于此,Ruan等提出了CODICIL算法,不仅通过引入文本内容提升社团发现质量,且适用于大规模网络聚类问题.然而该方法采用TF-IDF对网络中结点的文本内容进行处理,由于TF-IDF算法维度较高,故难于精确刻画结点的内容表征,且计算量较大.本文对CODICIL算法进行改进,通过提出可有效处理结点内容的高斯混合模型,更好的融合了复杂网络上的内容信息,进一步提升社团发现的精度和效率.在五个真实网络上对提出的新方法进行验证,性能明显优于CODICIL算法.此外,由于新算法可采用不同参数拟合高斯混合模型中的数据点,故具有更好的可扩展性 %K 复杂网络 %K 社团发现 %K 高斯混合模型 %K 网络聚类 %U http://xwxt.sict.ac.cn/CN/abstract/abstract4459.shtml