|本期目录/Table of Contents|

[1]陈巧红,王磊,孙麒,等.基于混合神经网络的中文短文本分类模型[J].浙江理工大学学报,2019,41-42(自科四):509-516.
 CHEN Qiaohong,WANG Lei,SUN Qi,et al.Chinese short text classification model based on hybrid neural network[J].Journal of Zhejiang Sci-Tech University,2019,41-42(自科四):509-516.
点击复制

基于混合神经网络的中文短文本分类模型()
分享到:

浙江理工大学学报[ISSN:1673-3851/CN:33-1338/TS]

卷:
第41-42卷
期数:
2019年自科四期
页码:
509-516
栏目:
出版日期:
2019-06-20

文章信息/Info

Title:
Chinese short text classification model based on hybrid neural network
文章编号:
1673-3851 (2019) 07-0509-08
作者:
陈巧红王磊孙麒贾宇波
浙江理工大学信息学院,杭州 310018
Author(s):
CHEN Qiaohong WANG Lei SUN Qi JIA Yubo
School of Informatics Science and Technology, Zhejiang Sci-Tech University, Hangzhou 310018, China
关键词:
卷积神经网络循环神经网络短文本分类特征表示注意力机制
分类号:
TP181
文献标志码:
A
摘要:
针对已有算法中特征表示存在的稀疏问题以及文本高层特征提取效果不佳问题,提出了一种基于混合神经网络的中文短文本分类模型。该模型首先通过自定义筛选机制将文档以短语层和字符层进行特征词筛选;然后将卷积神经网络(CNN)和循环神经网络(RNN)相结合,提取文本高阶特征,并引入注意力机制优化高阶向量特征;最后将得到的高阶向量特征输入到全连接层得到分类结果。实验结果表明:该方法能有效提取出文档的短语层和字符层特征;与传统CNN、传统LSTM和CLSTM模型对比,二分类数据集上准确率分别提高1036%、501%和239%,多分类数据集上准确率分别提高1233%、416%和233%。

参考文献/References:

[1] Sebastiani F. Machine learning in automated text categorization[J]. ACM Computing Surveys, 2001, 34(1):1-47.
[2] 王义真,郑啸,后盾,等. 基于SVM的高维混合特征短文本情感分类[J].计算机技术与发展, 2018,28(2),88-93
[3] Kim Y. Convolutional neural networks for sentence classification. (2014-09-03) [2018-12-17]. https://arxiv.org/abs/1408-5882.
[4] Kalchbrenner N, Grefenstette E, Blunsom P. A convolutional neural network for modelling sentences. (2014-04-08) [2018-12-17]. https://arxiv.org/abs/14042188.
[5] 黄文明, 莫阳. 基于文本加权KNN算法的中文垃圾短信过滤[J]. 计算机工程, 2017, 43(3):193-199.
[6] 黄磊, 杜昌顺. 基于递归神经网络的文本分类研究[J]. 北京化工大学学报(自然科学版),2017(1):100-106.
[7] Wang C, Xu B. Convolutional neural network with word embeddings for chinese word segmentation. (2017-12-13) [2018-12-17].https://arxiv.org/abs/1711-04411.
[8] Zhou Y, Xu B, Xu J, et al. Compositional recurrent neural networks for Chinese short text classification[C]//Web Intelligence (WI), 2016 IEEE/WIC/ACM International Conference on. IEEE, 2016: 137-144
[9] Xu C Z, Liu D. Chinese text summarization algorithm based on Word2vec[C]//Journal of Physics: Conference Series. IOP Publishing, 2018, 976(1): 012006.
[10] Qu S, Xi Y, Ding S. Visual attention based on longshort term memory model for image caption generation[C]//Control And Decision Conference (CCDC), 2017 29th Chinese. IEEE, 2017: 4789-4794.

相似文献/References:

[1]李斯凡,高法钦.基于卷积神经网络的手写数字识别[J].浙江理工大学学报,2017,37-38(自科3):438.
 LI Sifan,GAO Faqin.Handwritten Numeral Recognition Based on Convolution Neural Network[J].Journal of Zhejiang Sci-Tech University,2017,37-38(自科四):438.
[2]张玮,张华熊.基于卷积神经网络的纺织面料主成分分类[J].浙江理工大学学报,2019,41-42(自科一):1.
 ZHANG Wei,ZHANG Huaxiong.Classification of main components of textile fabrics based on convolutional neural network[J].Journal of Zhejiang Sci-Tech University,2019,41-42(自科四):1.
[3]邓远远,沈炜.基于注意力反馈机制的深度图像标注模型[J].浙江理工大学学报,2019,41-42(自科二):208.
 DENG Yuanyuan,SHEN Wei.Depth image caption model based on  attention feedback mechanism[J].Journal of Zhejiang Sci-Tech University,2019,41-42(自科四):208.
[4]邓远远,沈炜.基于注意力反馈机制的深度图像标注模型[J].浙江理工大学学报,2019,41-42(自科二):208.
 DENG Yuanyuan,SHEN Wei.Depth image caption model based on attention feedback mechanism[J].Journal of Zhejiang Sci-Tech University,2019,41-42(自科四):208.
[5]陈巧红,董雯,孙麒,等.基于混合神经网络的单文档自动文摘模型[J].浙江理工大学学报,2019,41-42(自科四):489.
 CHEN Qiaohong,DONG Wen,SUN Qi,et al.Single document automatic summarization model based on hybrid neural network[J].Journal of Zhejiang Sci-Tech University,2019,41-42(自科四):489.
[6]程诚,任佳.基于自适应卷积核的改进CNN数值型数据分类算法[J].浙江理工大学学报,2019,41-42(自科五):657.
 CHENG Cheng,REN Jia.Improved CNN classification algorithm based on adaptive convolution kernel for numerical data[J].Journal of Zhejiang Sci-Tech University,2019,41-42(自科四):657.

备注/Memo

备注/Memo:
收稿日期:2018-12-13
网络出版日期: 2019-03-31
基金项目:国家自然科学基金项目(51775513)
作者简介:陈巧红(1978-),女,浙江临海人,副教授,博士,主要从事计算机辅助设计及机器学习技术方面的研究
更新日期/Last Update: 2019-09-16