oalib

Publish in OALib Journal

ISSN: 2333-9721

APC: Only $99

Submit

Any time

2019 ( 2 )

2018 ( 87 )

2017 ( 66 )

2016 ( 79 )

Custom range...

Search Results: 1 - 10 of 4547 matches for " 主题挖掘 "
All listed articles are free for downloading (OA Articles)
Page 1 /4547
Display every page Item
基于动态lda主题模型的内容主题挖掘与演化
胡吉明,陈果
图书情报工作 , 2014,
Abstract: ?指出文本内容主题的挖掘和演化研究对于文本建模和分类及推荐效果提升具有重要作用。从分析基于lda主题模型的文本内容主题挖掘原理入手,针对当前网络环境下的文本内容特点,构建适用于动态文内容本主题挖掘的lda模型,并通过改进的gibbs抽样估计提高主题挖掘的准确性,进而从主题相似度和强度两个方面研究内容主题随时间的演化问题。实验表明,所提方法可行且有效,对后续有关文本语义建模和分类研究等具有重要的实践意义。
一种基于主题的概率文档相关模型
计算机科学 , 2008,
Abstract: 现有文档关系分析模型难以从主题层次上判别文档相关性。为此,提出了一个基于主题的概率文档相关模型(tpdc)。tpdc借助latentdirichletallocation模型学习文档的主题结构;在计算出主题后验概率和主题相似度的基础上推导出文档后验概率;基于文档后验概率构建文档相关性分析模型。实验结果证明,tpdc模型在文档检索精度和文档压缩程度两方面优于向量空间模型,因而更能胜任实际应用中的文档检索任务。
主题数据模型的可视化挖掘方法应用研究*
周宁,陈旭毅,曾桢
现代图书情报技术 , 2010,
Abstract: ?以一个通信公司为研究对象,在etom框架下讨论主题数据模型的可视化挖掘方法。探讨企业信息化所面临的新理论和实施方法问题。在实施过程中,通过采用可视化工具pajek和treemap实现业务流程分析与梳理、可视化挖掘,并以人力资源主题数据模型为例,具体讨论可视化挖掘的实施方案。
基于lda模型和微博热度的热点挖掘
唐晓波,向坤
图书情报工作 , 2014,
Abstract: ?分析传统lda模型在进行微博热点挖掘时所得概率结果抽象且难以结合实际解释的缺点;考虑到微博本身的数据特点和信息论中信息量的观点,提出微博热度的概念,并将其引入到lda模型的热点挖掘研究中,构建基于微博热度的lda模型;通过api采集微博数据上的实验,证明新方法与旧方法具有相同的性能,而且能得到更直观的微博热度表,并得出更具有说服力的挖掘结论。
基于专利技术功效主题词与专利引文共现的核心专利挖掘
许海云,岳増慧,雷炳旭,方曙
图书情报工作 , 2014,
Abstract: ?认为利用专利技术功效主题词与专利引文进行共现分析可直观识别核心专利簇的技术功效特征。与专利引文共现分析相比,专利技术功效主题词与专利引文的交叉共现增加了主题标识,使得基于相同标引主题词的被引专利有相似的技术主题和功效特征。同时,不同的技术功效主题词通过专利引文交叉共现,可以识别不同技术主题的关联度以及技术主题对应的功效特征。最后,选择医用显微内窥镜领域相关专利做实证分析,通过技术功效主题词-专利引文、技术主题词-专利引文以及专利引文共现分析,论证专利技术功效主题词与专利引文共现方法在核心专利挖掘方面的特征、优越性及不足。
基于web挖掘的主页多主题更新模型
张顺香,朱广丽,陆奎
计算机应用 , 2009,
Abstract: ?针对改善网站主页中多个主题更新的合理性问题,提出了一种新颖的基于web数据挖掘技术的主页主题更新模型。对当前主页主题更新方法进行分析,指出目前一些大学校园网站主页主题更新的不合理性,然后通过数据挖掘,从安徽理工大学网站web日志中提取有效数据,分析各个主题的点击率随时间的变化趋势,进而提出基于点击率的网站主页主题更新模型。实验结果证明,模型能够实现对主页主题的合理更新,有效提高网站主页的受欢迎程度。
基于PLSA的即时通信取证方法 A PLSA Based Forensic Method of Instant Messenger
马庆杰,李炳龙
- , 2016,
Abstract: 面对大量繁杂的即时通信数据,司法取证人员很难快速从中找到与案件相关的数据.本文提出一种基于PLSA(probability latent semantic analysis)算法的即时通信取证方法,即利用PLSA算法进行主题挖掘,快速获取与案件相关的可疑数据.通过建立自定义词库和动态调整词库中词项的矢量权重,提高PLSA算法主题挖掘的准确性,对聊天会话中主题的矢量值进行可视化.实验结果表明,该方法的准确率,召回率及F1值比单纯用PLSA算法都有提高
基于复合主题演化模型的作者研究兴趣动态发现
Dynamic discovery of authors research interest based on the combined topic evolutional model

余传明,左宇恒,郭亚静,安璐
YU Chuan-ming
, ZUO Yu-heng, GUO Ya-jing, AN Lu

- , 2018, DOI: 10.6040/j.issn.1671-9352.1.2017.044
Abstract: 摘要: 以金融领域的科技文献作为实验数据,提出了一种新的用于动态挖掘领域相关的作者研究兴趣的复合主题演化模型。该模型能够获取作者在不同时间片下的主题概率分布以及主题下词汇概率分布,并充分考虑作者在合作作者文献中的排名对于其研究主题和主题变化的影响。通过金融领域的实证研究表明,该复合主题演化模型能够有效地揭示金融领域作者研究兴趣的动态变化。
Abstract: We propose a new combined topic model, i.e. author topic time-latent dirichlet allocation(ATT-LDA)with author ranking(AR), for the of dynamic discovery of researchers' interest, which is based on the academic literature in the financial field. Through the proposed model, we can easily acquire the probability distribution of the authors' interest, as well as the probability distribution of topics on deferent words. The influence of the ranking in the co-author list are fully taken into consideration. The empirical study shows that the proposed method can effectively reveal the dynamic change of interest of the authors in the financial field
基于时空主题模型的微博主题提取
段炼,呙维,朱欣焰,胡宝清
武汉大学学报(信息科学版) , 2014,
Abstract: ?目的已有地理主题模型没有考虑不同区域对微博主题影响程度的差异性,同时他们将时间要素离散化,难以得到连续时间上的微博主题强度。提出了一种顾及连续时间及区域影响力因素的时空主题模型。该方法将城市划分为多个区域,依据各兴趣点类型及数量对区域赋予权重以表达区域社会功能对微博主题的影响程度,基于稀疏增量式生成模型表达微博主题分布,利用beta分布描述主题在连续时间中的强度,最终通过gibbs采样得到时空主题模型各参数。实验表明,本文方法能发现连续时间上微博主题的演变,与已有地理主题模型相比,能更加准确地提取微博主题。
Topic-based Probabilistic Document Correlation Model
一种基于主题的概率文档相关模型

JIAXi-ping,PENG Hong,ZHENG Qi-lun,SHI Shi-xu,
贾西平
,彭宏,郑启伦,石时需

计算机科学 , 2008,
Abstract: Existing models on document relationship analysis have a difficulty in learning document correlation from topic level.To overcome this difficulty,a topic-based probabilistic document correlation model(TPDC)was proposed.The model learns the topic structure of a document through the latent dirichlet allocation model,infers the posterior probability of a document by computing the posterior probability of its topics and topic similarity,and then constructs the document correlation model based on the document po...
Page 1 /4547
Display every page Item


Home
Copyright © 2008-2017 Open Access Library. All rights reserved.