|本期目录/Table of Contents|

[1]王正成,李丹丹.基于词向量和情感本体的短文本情感分类[J].浙江理工大学学报,2018,39-40(社科1):33-38.
 WANG Zhengcheng,LI Dandan.Short text sentiment classification: Based on the word vector and emotional ontology[J].Journal of Zhejiang Sci-Tech University,2018,39-40(社科1):33-38.
点击复制

基于词向量和情感本体的短文本情感分类()
分享到:

浙江理工大学学报[ISSN:1673-3851/CN:33-1338/TS]

卷:
第39-40卷
期数:
2018年社科1期
页码:
33-38
栏目:
出版日期:
2018-01-30

文章信息/Info

Title:
Short text sentiment classification: Based on the word vector and emotional ontology
文章编号:
1673-3851 (2018) 02-0033-06
作者:
王正成李丹丹
浙江理工大学经济管理学院,杭州 310018
Author(s):
WANG Zhengcheng LI Dandan
School of Economics and Management, Zhejiang Sci-Tech University, Hangzhou 310018, China
关键词:
短文本情感分类词向量情感本体
分类号:
G350
文献标志码:
A
摘要:
目前短文本情感分类主要采取统计自然语言处理、情感语义特性两种方式,而将这两种方式相结合进行情感分类的研究较少,故提出将这两种方式进行结合,设计基于词向量与情感本体相融合的短文本情感分类方法。首先利用Word2Vec模型训练词向量,以相加平均法合成短文本向量;在此基础上结合基于情感本体所得出的每条短文本的情感值,构建词向量与情感本体相融合的短文本表示模型;最后采用K最近邻分类算法完成短文本情感分类。相比传统的基于词向量、基于情感本体或其他单一技术路线的分类方法,词向量与情感本体相融合的分类方法在准确率、召回率、F-1值均有明显的提升。

参考文献/References:

[1] 夏火松,刘建,朱慧毅.中文情感分类挖掘预处理关键技术比较研究[J].情报杂志,2011,30(9):160-163.
[2] Yu N. Exploring cotraining strategies for opinion detection[J]. Journal of the Association for Information Science&Technology,2014,65(10):2098-2110.
[3] 唐晓波,朱娟,杨丰华.基于情感本体和KNN算法的在线评论情感分类研究[J].情报理论与实践,2016,39(6):110-114.
[4] Pang B, Lee L. Seeing stars: exploiting class relationships  for sentiment categorization with respect to rating scales[C]//43rd Annual Meeting of the Association for Computational  Linguistics. Michigan: The Association for Computational Linguistics,2005.
[5] Isidoros P, Ioannis H. Recognizing emotions in text  using ensemble of classifiers[J]. Engineering Applications of Artificial Intelligence,2016,51(C):191-201.
[6] 杨锋,彭勤科,徐涛.基于随机网络的在线评论情绪倾向性分类[J].自动化学报,2010,36(6):837-844.
[7] 杨小平,马奇凤,余力,等.评论簇在网络舆论中的情感倾向代表性研究[J].现代图书情报技术,2016,32(z1):51-59.
[8] Philipp M. Support vector machines in automated emotion  classification[D]. Cambridge: Churchill College,2003.
[9] Gamon M. Sentiment classification on customer feedback  data: noisy data, large feature vectors, and the role of linguistic analysis[C]//20th International Conference on  Computational Linguistics. Geneva: International Committee  on Computational Linguistics,2004.
[10] Tong R M. An operational system for detecting and tracking opinions in online discussion[C]//the 24th Annual International ACM SIGIR Conference. New Orleans: ACM,2001.

备注/Memo

备注/Memo:
收稿日期: 2017-09-11
网络出版日期: 2018-01-11
基金项目: 国家自然科学基金项目(71271192)
作者简介: 王正成(1974-),男,浙江武义人,教授,博士,主要从事先进制造模式与技术、企业信息化方面的研究
更新日期/Last Update: 2018-03-14