[1]孔 颖.基于HTML卡方算法的垃圾邮件过滤器设计[J].浙江科技学院学报,2010,(06):525-529.[doi:10.3969/j.issn.1671-8798.2010.06.008]
KONG Ying.Design of spam filtering model based on HTML chi-square algorithm[J].,2010,(06):525-529.[doi:10.3969/j.issn.1671-8798.2010.06.008]
点击复制
基于HTML卡方算法的垃圾邮件过滤器设计
()
《浙江科技学院学报》[ISSN:1001-3733/CN:61-1062/R]
- 卷:
-
- 期数:
-
2010年06期
- 页码:
-
525-529
- 栏目:
-
工程技术研究
- 出版日期:
-
2010-12-30
文章信息/Info
- Title:
-
Design of spam filtering model based on HTML chi-square algorithm
- 文章编号:
-
1671-8798(2010)06-0525-05
- 作者:
-
孔 颖
-
浙江科技学院 信息与电子工程学院,杭州 310023
- Author(s):
-
KONG Ying
-
-
- 关键词:
-
垃圾邮件过滤; HTML标签; 卡方分布
- 分类号:
-
TP393.098
- DOI:
-
10.3969/j.issn.1671-8798.2010.06.008
- 文献标志码:
-
A
- 摘要:
-
介绍基于HTML标签的卡方分布算法在垃圾邮件过滤中的应用。首先对通过浏览器收集到的邮件进行分析,将其转换为HTML源代码的形式,再根据HTML语言的特点对其进行特征提取,从而达到邮件预处理的目的。随后采用LVQ神经网络建立分类器模型,以达到最终分离正常邮件(ham)和垃圾邮件(spam)的目的。对比实验表明,结合HTML代码的卡方分布特征提取和LVQ神经网络的分类器模型效果更好。
更新日期/Last Update: