[1]孔 颖.基于HTML卡方算法的垃圾邮件过滤器设计[J].浙江科技学院学报,2010,(06):525-529.[doi:10.3969/j.issn.1671-8798.2010.06.008]
 KONG Ying.Design of spam filtering model based on HTML chi-square algorithm[J].,2010,(06):525-529.[doi:10.3969/j.issn.1671-8798.2010.06.008]
点击复制

基于HTML卡方算法的垃圾邮件过滤器设计
()
分享到:

《浙江科技学院学报》[ISSN:1001-3733/CN:61-1062/R]

卷:
期数:
2010年06期
页码:
525-529
栏目:
工程技术研究
出版日期:
2010-12-30

文章信息/Info

Title:
Design of spam filtering model based on HTML chi-square algorithm
文章编号:
1671-8798(2010)06-0525-05
作者:
孔 颖
浙江科技学院 信息与电子工程学院,杭州 310023
Author(s):
KONG Ying
关键词:
垃圾邮件过滤HTML标签卡方分布
分类号:
TP393.098
DOI:
10.3969/j.issn.1671-8798.2010.06.008
文献标志码:
A
摘要:
介绍基于HTML标签的卡方分布算法在垃圾邮件过滤中的应用。首先对通过浏览器收集到的邮件进行分析,将其转换为HTML源代码的形式,再根据HTML语言的特点对其进行特征提取,从而达到邮件预处理的目的。随后采用LVQ神经网络建立分类器模型,以达到最终分离正常邮件(ham)和垃圾邮件(spam)的目的。对比实验表明,结合HTML代码的卡方分布特征提取和LVQ神经网络的分类器模型效果更好。
更新日期/Last Update: