[1]毕云杉,钱亚冠,张超华,等.基于ERNIE模型的中文文本分类研究[J].浙江科技学院学报,2021,(06):461-468.
 BI Yunshan,QIAN Yaguan,ZHANG Chaohua,et al.Research on Chinese text classification based on ERNIE model[J].,2021,(06):461-468.
点击复制

基于ERNIE模型的中文文本分类研究(/HTML)
分享到:

《浙江科技学院学报》[ISSN:1001-3733/CN:61-1062/R]

卷:
期数:
2021年06期
页码:
461-468
栏目:
出版日期:
2021-12-26

文章信息/Info

Title:
Research on Chinese text classification based on ERNIE model
文章编号:
1671-8798(2021)06-0461-08
作者:
毕云杉钱亚冠张超华潘俊徐庆华
浙江科技学院 理学院,杭州 310023
Author(s):
BI Yunshan QIAN Yaguan ZHANG Chaohua PAN Jun XU Qinghua
School of Sciences, Zhejiang University of Science and Technology, Hangzhou 310023, Zhejiang, China
关键词:
自然语言处理文本分类深度学习卷积神经网络ERNIE
分类号:
TP391.1
文献标志码:
A
摘要:
针对基于深度学习的中文文本分类任务中词向量表示无法充分利用语义信息的问题,提出一种基于知识增强语义表示(enhanced representation through knowledge integration,ERNIE)模型的中文文本分类方法。首先,通过ERNIE模型获得语义表达更充分的分布式文本表示;然后引入深度卷积神经网络对上下文的编码特征进一步提取,以获得更深层次的文本特征表达;最后采用分类器(soft maximum,softmax)实现中文文本分类。在3个公开的中文数据集上进行了多组对比试验,发现本模型与传统基于双向编码器表征量(bidirectional encoder representation from transformers,BERT)的分类模型相比,准确率和F1值分别平均提升了6.34%、4.82%,表明基于ERNIE模型的文本分类方法能有效提高中文文本分类的性能。本方法在多领域中文文本数据集上能够更准确地实现文本的分类,可为后续自然语言处理领域研究提供参考。

相似文献/References:

[1]程盼,徐弼军.基于word2vec和logistic回归的中文专利文本分类研究[J].浙江科技学院学报,2021,(06):454.
 CHENG Pan,XU Bijun.Research on Chinese patent text classification based on word2vec and logistic regression model[J].,2021,(06):454.

更新日期/Last Update: