|
软件学报 2010
面向股票新闻的情感分类方法, PP. 349-362 Keywords: 中文新词发现,n-gram,模型,情感分类 Abstract: 互联网新闻资讯对证券市场和投资者有举足轻重的影响,新闻进行情感分类后再展示给用户,可以帮助投资者迅速做出投资决定.从文本分类的基本方法出发,实现了基于n-gram统计模型的新词发现方法,并将所得结果用于构建中文分词词典和情感词典.同时引入评价理论,并用朴素贝叶斯、k近邻和支持向量机3种方法进行股票新闻标题的情感分类实验.所用实验数据来自2009年“新浪财经”共计23万余条的新闻标题,结果表明二分类的准确率最高可达82.9%.此外,还实现了一个原型系统用于展示股票新闻的分类结果.
|