|本期目录/Table of Contents|

[1]陈巧红,董雯,孙麒,等.基于混合神经网络的单文档自动文摘模型[J].浙江理工大学学报,2019,41-42(自科四):489-498.
 CHEN Qiaohong,DONG Wen,SUN Qi,et al.Single document automatic summarization model based on hybrid neural network[J].Journal of Zhejiang Sci-Tech University,2019,41-42(自科四):489-498.
点击复制

基于混合神经网络的单文档自动文摘模型()
分享到:

浙江理工大学学报[ISSN:1673-3851/CN:33-1338/TS]

卷:
第41-42卷
期数:
2019年自科四期
页码:
489-498
栏目:
出版日期:
2019-06-20

文章信息/Info

Title:
Single document automatic summarization model based on hybrid neural network
文章编号:
1673-3851 (2019) 07-0489-10
作者:
陈巧红董雯孙麒贾宇波
浙江理工大学信息学院,杭州310018
Author(s):
CHEN Qiaohong DONG WenSUN Qi JIA Yubo
School of Information Science and Technology, Zhejiang Sci-Tech University, Hangzhou 310018, China
关键词:
混合神经网络自动文摘卷积神经网络长短期记忆网络深度学习
分类号:
TP181
文献标志码:
A
摘要:
针对现有单文档自动文摘方法获取文摘的连贯性和准确度较差的问题,提出了一种基于混合神经网络的自动文摘模型。该模型将卷积神经网络和长短期记忆网络相结合,并在长短期记忆网络的输入端增加了一个记忆细胞状态。该模型首先利用卷积神经网络对句子进行向量表示;然后将每个句子中的词向量和文档中的句向量分别输入两个长短期记忆网络,得到句子和文档的匹配程度;最后将匹配程度高的句子进行组合,获得文摘。实验发现:基于混合神经网络的单文档自动文摘模型与LSI、LDA、TextRank、PCA以及长短期记忆网络模型相比,ROUGE-2和ROUGE-3值均有0-01左右的提升,这表明提出的模型获取文摘的可读性较好,上下文关系明确,有效提升了自动文摘的质量。

参考文献/References:

[1] Hadyan F, Shaufiah, Bijaksana M A. Comparison of document index graph using TextRank and HITS weighting method in automatic text summarization[J]. Journal of Physics: Conference Series, 2017,801(1): 012076.
[2] 胡侠, 林晔, 王灿,等. 自动文本摘要技术综述[J]. 情报杂志, 2010, 29(8):144-147.
[3] Hu B, Chen Q, Zhu F. LCSTS: A large scale Chinese short text summarization dataset. (2016-02-19)[2018-07-10]. https://arxiv.org/abs/150605865v4.
[4] Nichols J, Mahmud J, Drews C. Summarizing sporting events using twitter[C]// ACM International Conference on Intelligent User Interfaces. ACM, 2012: 189-198.
[5] Blei D M, Ng A Y, Jordan M I. Latent dirichlet allocation[J]. Journal of Machine Learning Research, 2003, 3: 993-1022.
[6] Rush A M, Chopra S, Weston J. A neural attention model for abstractive sentence summarization. (2015-09-03)[2018-07-10]. https://arxiv.org/abs/1509-00685.
[7] Wong K F, Wu M, Li W. Extractive summarization using supervised and semisupervised learning[C]//22nd International Conference on Computational Linguistics. Manchester: Association for Computational Linguistics Stroudsburg, 2008: 985-992.
[8] Majak M, Zolnierek A, Wegrzyn K, et al. Tweet classification framework for detecting events related to health problems[C]// 10th International Conference on Computer Recognition Systems. Polanica Zdroj:Springer, 2017: 453-461.
[9] Nahian M A, Iftekhar A S M, Islam M T, et al. CNNbased prediction of framelevel shot importance for video summarization. (2017-8-23)[2018-07-10].https://arxiv.org/abs/1708-07023.
[10] 应文豪,肖欣延,李素建, 等.一种利用语义相似度改进问答摘要的方法[J].北京大学学报, 2017, 53(2):197-203.

备注/Memo

备注/Memo:
收稿日期:2018-09-10
网络出版日期: 2019-03-30
基金项目:国家自然科学基金项目(51775513)
作者简介:陈巧红(1978-),女,浙江临海人,副教授,博士,主要从事计算机辅助设计及机器学习技术方面的研究
更新日期/Last Update: 2019-09-16