|
软件学报 2013
基于分析特征与动态步长的微博排序学习算法, PP. 150-161 Keywords: 微博,listnet,动态步长,分析特征,排序学习 Abstract: 目前,微博搜索大多应用向量空间模型计算查询词与文档间的相关程度,通常使用tf-idf(termfrequency-inversedocumentfrequency)统计方法来确定词的权重.然而仅使用词进行微博搜索并不能检测到某条微博的信息含量,而这些往往是查询用户所关注的问题.为此提出了一种基于分析特征与动态步长的微博排序学习算法.首先,定义了一些微博分析特征,经过统计分析获得的这些分析特征可以用来预测用户行为;其次,在此基础上,提出了以词性为单位计算微博相关度的方法,结合信息熵计算方法得到微博词性信息的含量,并用来预测该微博的信息含量;最后,在现有listnet排序学习算法的基础上,引入了动态步长的概念,对步长进行了动态优化,最终形成了一种基于动态步长的微博排序学习算法——rdls(rankingbasedondynamiclearningstepsize)算法.实验结果表明,无论是基于直接特征还是加入分析特征,在相同迭代轮数情况下,相比listnet算法,rdls算法可以训练出更优的模型,在微博排序方面有更好的表现.
|