|
现代图书情报技术 2014
提取核心特征词的惩罚性矩阵分解方法——以共词分析为例Abstract: ?[目的]在共词分析时对高维共词矩阵进行稀疏降维,直观快速地凸显出高维矩阵中的核心特征词。[方法]提出基于惩罚性矩阵分解(pmd)的文本核心特征词提取方法,选取有关高校图书馆使用社交网络这一主题的文献进行实验,用matlabr2012a对构建的共词矩阵进行pmd分解降维。[结果]利用pmd从1648个特征词中提取出65个核心特征词,不仅大于用主成分分析提取的34个特征词,而且揭示出高校图书馆使用社交网络的研究热点。[局限]实验中提取的高校图书馆使用社交网络的特征词未能全面涉及,有一定的主观性。[结论]用pmd方法对高维共词矩阵进行稀疏后,所获核心特征词更容易被理解和解释,也能够表明一些边缘化的主题。
|