OALib Journal期刊
ISSN: 2333-9721
费用：99美元

投递稿件

查看量	下载量

相关文章
更多...

北京工业大学学报 2011

基于链接结构分析的主题搜索

Keywords: 针对目前一般文本搜索引擎采用的匹配方法导致搜索效率相对低下的问题,在分析语义相关性的度量方案基础上,利用Wikipedia丰富链接结构所蕴涵信息,提出基于链接结构分析的主题搜索策略.设计了词条相关性算法,用以描述词间距离,并对词条进行相关度的重新排序.实验中引入用户评价机制,并与传统策略搜索结果进行对比.结果证明,该策略在扩大主题覆盖度的同时保证了较高的用户意图识别度.维基百科,网络聚类,知识发现

Full-Text Cite this paper Add to My Lib

Abstract:

针对目前一般文本搜索引擎采用的关键词匹配方法导致搜索效率相对低下的问题,在分析语义相关性的度量方案基础上,利用Wikipedia丰富链接结构所蕴涵信息,提出基于链接结构分析的主题搜索策略.设计了词条相关性算法,用以描述词间距离,并对词条进行相关度的重新排序.实验中引入用户评价机制,并与传统策略搜索结果进行对比.结果证明,该策略在扩大主题覆盖度的同时保证了较高的用户意图识别度.

References

[1]	CHAKRABARTI S.Data mining for hypertext:a tutorial survey[C]∥SIGKDD Explorations.Cambridge:MIT Press,2000:113-125.
[2]	JAKOB V.Measuring Wikipedia[C]∥ISSI 2005.Stockholm,Sweden:Karolinska University Press,2005:21-36.
[3]	MARKUS K,DENNY V,MAX V.Wikipedia and the semantic Web:the missing links[C]∥Wikimania 2005.Frankfurt amMain,Germany:Association for Computing Machinery Press(ACM),2005:117-125.
[4]	MAX V,MARKUS K,DENNY Vrandecic,et al.Semantic Wikipedia[C]∥WWW2006.Edinburgh,Scotland:Associationfor Computing Machinery Press(ACM),2005:265-274.
[5]	DAVID A.SHAWN:structure helps a Wiki navigate[C]∥BTW Workshop WebDB Meets IR.Arlington:AAAI Press,2005:97-108.
[6]	NATALIA K.Automatic ontology extraction for document classification[D].Saarbrücken,Germany:Max-Plank-Institute forComputer Science,Saarland University,2006.
[7]	DANIEL K.Wikisense-mining the Wiki[C]∥Wikimania 2005.Frankfurt am Main,Germany:Association for ComputingMachinery Press(ACM),2005:254-276.
[8]	FRANCESCO B,ROBERTO B.Network analisis for Wikipedia[C]∥Wikimania 2005.Frankfurt am Main,Germany:Association for Computing Machinery Press(ACM),2005:334-367.
[9]	SERGEY B,LAWRENCE P.The anatomy of a large-scale hypertextual Web search engine[J].Computer Networks and ISDNSystems,1998,30(1/7):107-117.
[10]	JON K.Authoritative sources in a hyperlinked environment,RJ 10076[R].New York:IBM,1997.

Full-Text

Contact Us

service@oalib.com

QQ:3279437679

WhatsApp +8615387084133