%0 Journal Article
%T Application of Improved Information Gain Feature Selection Methodto Text Clustering
改进的信息增益特征选择方法在文本聚类中的应用*
%A Chen Tao
%A Song Yan
%A Xie Yangqun
%A
陈涛
%A 宋妍
%A 谢阳群
%J 现代图书情报技术
%D 2004
%I
%X 利用改进的信息增益特征选择的方法,对文本进行了有效的自动聚类。从语料库中抽取了250篇文本,利用向量空间模型和信息增益特征降维方法,构造文本特征向量,并最终利用C-均值方法聚类,聚类结果精度、召回率、F-measure分别达到0.82、0.88、0.83。
%K Information gain Feature selection Clustering
信息增益
%K 特征选择
%K 聚类
%U http://www.alljournals.cn/get_abstract_url.aspx?pcid=B5EDD921F3D863E289B22F36E70174A7007B5F5E43D63598017D41BB67247657&cid=E46382710BF131B2&jid=24AADBCD0D5373C73F37F78D10E2F717&aid=5E8368448100CB6E&yid=D0E58B75BFD8E51C&vid=A04140E723CB732E&iid=59906B3B2830C2C5&sid=DF92D298D3FF1E6E&eid=9CF7A0430CBB2DFD&journal_id=1003-3513&journal_name=现代图书情报技术&referenced_num=0&reference_num=6