[1]程盼,徐弼军.基于word2vec和logistic回归的中文专利文本分类研究[J].浙江科技大学学报,2021,(06):454-460.
 CHENG Pan,XU Bijun.Research on Chinese patent text classification based on word2vec and logistic regression model[J].,2021,(06):454-460.
点击复制

基于word2vec和logistic回归的中文专利文本分类研究(/HTML)
分享到:

《浙江科技大学学报》[ISSN:2097-5236/CN:33-1431/Z]

卷:
期数:
2021年06期
页码:
454-460
栏目:
出版日期:
2021-12-26

文章信息/Info

Title:
Research on Chinese patent text classification based on word2vec and logistic regression model
文章编号:
1671-8798(2021)06-0454-07
作者:
程盼徐弼军
浙江科技学院 理学院,杭州 310023
Author(s):
CHENG Pan XU Bijun
School of Sciences, Zhejiang University of Science and Technology, Hangzhou 310023, Zhejiang, China
关键词:
中文专利文本分类word2veclogistic回归机器学习
分类号:
TP391.1
文献标志码:
A
摘要:
专利文本作为重要的信息载体,对其实现自动分类具有重要的研究意义。针对海量的专利文本,提出一种基于word2vec和logistic回归的中文专利文本分类模型的机器学习方法。本方法利用word2vec产生的词向量对专利文本进行表示,然后配合logistic回归模型,对专利说明和摘要合并的文本语料进行学习和训练,从而实现对专利文本的自动分类。试验结果表明,我们提出的机器学习方法能够得到较好的分类效果,其中个别类别的分类准确率达到了84%;并且与k近邻算法相比,该模型在精确度、召回率及F1值方面均有显著提高。本方法可为专利文本自动分类提供可靠的研究依据。

相似文献/References:

[1]毕云杉,钱亚冠,张超华,等.基于ERNIE模型的中文文本分类研究[J].浙江科技大学学报,2021,(06):461.
 BI Yunshan,QIAN Yaguan,ZHANG Chaohua,et al.Research on Chinese text classification based on ERNIE model[J].,2021,(06):461.

更新日期/Last Update: