|本期目录/Table of Contents|

[1]陈巧红,凌明杰,孙麒,等.基于集成学习框架的用户画像方法[J].浙江理工大学学报,2020,43-44(自科一):86-93.
 CHEN Qiaohong,LING Mingjie,SUN Qi,et al.User profile method based on ensemble learning framework[J].Journal of Zhejiang Sci-Tech University,2020,43-44(自科一):86-93.
点击复制

基于集成学习框架的用户画像方法()
分享到:

浙江理工大学学报[ISSN:1673-3851/CN:33-1338/TS]

卷:
第43-44卷
期数:
2020年自科一期
页码:
86-93
栏目:
出版日期:
2020-01-08

文章信息/Info

Title:
User profile method based on ensemble learning framework
文章编号:
1673-3851 (2020) 01-0086-08
作者:
陈巧红凌明杰孙麒贾宇波
浙江理工大学信息学院,杭州 310018
Author(s):
CHEN Qiaohong LING Mingjie SUN Qi JIA Yubo
School of Information Science and Technology, Zhejiang Sci-Tech University, Hangzhou 310018, China
关键词:
集成学习StackingBERT用户画像机器学习
分类号:
TP181
文献标志码:
A
摘要:
针对已有算法中特征构建效果不佳以及泛化能力不足的问题,提出一种基于集成学习框架的用户画像方法。该方法将整体架构分为集成学习模块与语义编码模块,并在决策时加入了投票机制。集成学习模块采用两层Stacking完成特征构建以及模型融合;语义编码模块使用BERT模型对文本进行编码,提取深层语义信息;然后对两个模块的输出结果进行投票,从而产生最终结果。对两组数据进行实验,结果显示:该方法与基于单模型的方法对比,在用户查询词数据集上,用户性别、年龄、学历标签分类准确率平均提高了127%、352%、342%;在微博用户数据集上,用户性别、年龄、学历标签的分类准确率平均分别提高了561%、649%、596%。这表明该方法对于用户画像任务有较好的效果,并且对不同形式的文本具有很好的适应性。

参考文献/References:

[1] Cooper A. The Inmates are Running the Asylum: Why HighTech Products Drive Us Crazy and How to Restore the Sanity[M]. Indianapolis: Sams, 2004: 2.
[2] Pruitt J, Adlin T. The Persona Lifecycle: Keeping People in Mind Throughout Product Design[M]. San Francisco: Morgan Kaufmann, 2006: 15.
[3] 饶元, 吴连伟, 王一鸣, 等. 基于语义分析的情感计算技术研究进展[J]. 软件学报, 2018, 29(8): 2397-2426.
[4] 弭宝瞳, 梁循, 张树森. 社交物联网研究综述[J]. 计算机学报, 2018, 41(7): 1448-1475.
[5] Cha M, Haddadi H, Benevenuto F, et al. Measuring user influence in twitter: The million follower fallacy[C]// Fourth International AAAI Conference on Weblogs and Social Media. Palo Alto: AAAI Press, 2010:10-17.
[6] Rbiger S, Spiliopoulou M. A framework for validating the merit of properties that predict the influence of a twitter user[J]. Expert Systems with Applications, 2015, 42(5): 2824-2834.
[7] 陈姝, 窦永香, 张青杰. 基于理性行为理论的微博用户转发行为影响因素研究[J]. 情报杂志, 2017,36(11): 147-152.
[8] 费鹏, 林鸿飞, 杨亮, 等.一种用于构建用户画像的多视角融合框架[J]. 计算机科学, 2018, 45(1): 179-182.
[9] 李恒超, 林鸿飞, 杨亮, 等. 一种用于构建用户画像的二级融合算法框架[J]. 计算机科学, 2018, 45(1): 157-161.
[10] Jahrer M, Tscher A, Legenstein R. Combining predictions for accurate recommender systems[C]//Proceedings of the 16th ACM SIGKDD International Conference on Knowledge Discovery And Data Mining. New York: ACM, 2010: 693-702.

备注/Memo

备注/Memo:
收稿日期:2019-06-30
网络出版日期: 2019-10-08
基金项目:国家自然科学基金项目(51775513)
作者简介:陈巧红(1978-),女,浙江临海人,副教授,博士,主要从事计算机辅助设计及机器学习技术方面的研究
更新日期/Last Update: 2020-01-08