摘要
通过扩充情感词典词基数,新建中立词词典,引入网络流行词等方式丰富情感词典,提高分词后情感词匹配的准确性;以某评价类网站网民评论作为原始数据进行分词,提取相应的正向情感分数,负向情感分数,中立情感词个数,评论情感总分值等特征,通过对连续数据的规约提炼离散属性,按照信息增益最大原则生成决策树进行评论的情感分类,去除小概率节点后进行两次实验,对好评的识别率达到90%,对差评的识别率达到92%。对中评的识别率达到75%。
出版日期
2017年11月21日(中国Betway体育网页登陆平台首次上网日期,不代表论文的发表时间)