%0 Journal Article %T 面向互联网的大规模重复图像检索技术研究 %A 王树鹏 %A 陈明 %A 吴广君 %J 通信学报 %D 2014 %X ?针对互联网上典型的社交媒体应用,提出了一个基于随机投影和分块dct系数的大规模分布式重复图像检索方法。该方法在hadoop集群的基础上,首先利用随机投影映射生成图像签名,再由图像签名高效的检索hbase表以获得具有高召回率的候选图像集,最后依赖分块dct系数对候选图像进行进一步过滤来提高检索精度。实验结果表明,对于1200万张微博图像,当h=2且t=150时,该方法的召回率为98%,精确率为93.2%,平均检索时间为6.7s。 %U http://www.joconline.com.cn/CN/abstract/abstract147914.shtml