%0 Journal Article %T 基于分析特征与动态步长的微博排序学习算法 %A 周诗龙? %A 徐俊刚? %J 软件学报 %P 150-161 %D 2013 %X 目前,微博搜索大多应用向量空间模型计算查询词与文档间的相关程度,通常使用tf-idf(termfrequency-inversedocumentfrequency)统计方法来确定词的权重.然而仅使用词进行微博搜索并不能检测到某条微博的信息含量,而这些往往是查询用户所关注的问题.为此提出了一种基于分析特征与动态步长的微博排序学习算法.首先,定义了一些微博分析特征,经过统计分析获得的这些分析特征可以用来预测用户行为;其次,在此基础上,提出了以词性为单位计算微博相关度的方法,结合信息熵计算方法得到微博词性信息的含量,并用来预测该微博的信息含量;最后,在现有listnet排序学习算法的基础上,引入了动态步长的概念,对步长进行了动态优化,最终形成了一种基于动态步长的微博排序学习算法——rdls(rankingbasedondynamiclearningstepsize)算法.实验结果表明,无论是基于直接特征还是加入分析特征,在相同迭代轮数情况下,相比listnet算法,rdls算法可以训练出更优的模型,在微博排序方面有更好的表现. %K 微博 %K listnet %K 动态步长 %K 分析特征 %K 排序学习 %U http://www.jos.org.cn/ch/reader/view_abstract.aspx?file_no=13033&flag=1