全部 标题 作者
关键词 摘要

OALib Journal期刊
ISSN: 2333-9721
费用:99美元

查看量下载量

相关文章

更多...

利用并行gpu对分层分布式狄利克雷分布算法加速

Keywords: 分层分布式狄利克雷分布,潜在狄利克雷分布,文本分类,分布式框架,并行图形处理器

Full-Text   Cite this paper   Add to My Lib

Abstract:

?分层分布式狄利克雷分布(hd-lda)算法是一个对潜在狄利克雷分布(lda)进行改进的基于概率增长模型的文本分类算法,与只能在单机上运行的lda算法相比,可以运行在分布式框架下,进行分布式并行处理。mahout在hadoop框架下实现了hd-lda算法,但是因为单节点算法的计算量大,仍然存在对大数据分类运行时间太长的问题。而大规模文本集合分散到多个节点上迭代推导,单个节点上文档集合的推导仍是顺序进行的,所以处理大规模文本集合时仍然需要很长时间才能完成全部文本的分类。为此,提出将hadoop与图形处理器(gpu)相结合,将单节点文本集合的推导过程转移到gpu上运行,实现单节点多个文档并行推导,利用多台并行的gpu对hd-lda算法进行加速。应用结果表明,使用该方法能使分布式框架下的hd-lda算法对大规模文本集合处理达到7倍的加速比。

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133