反垃圾邮件技术之巧用特征码制服垃圾邮件


 

  各种反垃圾邮件技术风起云涌,但依然无法阻挡垃圾邮件的来势汹汹。俗话说的好:“道高一尺,魔高一丈”。这些垃圾邮件发布者永远有新的鬼点子。从2006年起,图片垃圾邮件开始飞速膨胀,成为邮件安全从业者非常头疼的事情,一直致力于反垃圾研究的263提出:由于目前的垃圾邮件辨识机制多使用关键字作为辨识工具,因此图形垃圾邮件便容易规避这样的过滤机制,必须使用光学辨识技术,才能辨识图片中的文字。

  由于使用的是图像格式,没有具备识别意义的文字,犯罪分子的垃圾邮件在通过各大公司的邮件服务器时畅通无阻,这其中也包括了雅虎、微软等赫赫有名的大公司。 据263提供的数据显示,2006年,图片垃圾邮件每天数量高达150多亿封,比2005年整整增长了10倍,占到所有垃圾邮件的25%~45%。虽然这些垃圾邮件没有文本、没数字、没超级链接,有的只是图片,但图片的平均大小是50KB,是常规垃圾邮件的10倍,这使得许多企业薄弱的电子邮件基础设施已不堪重负。

  作为多年来专注于网络通信的邮件服务提供商263为有效防御此类型的垃圾邮件,特别制定出全校解决方案

  首先,图片垃圾邮件广告一般由一个内嵌的文件附件(如一个.gif 或 .jpg图片)组成,除此之外在邮件中没有任何富有含义的文本,而其他垃圾邮件一般有包括一些富有含义的文本或一个可点击的URL,垃圾邮件过滤器可检测到并确定邮件是垃圾邮件,如果这些普通的垃圾邮件防护技术不起作用了,那么被捕捉的垃圾邮件数量必然会减少不少,相应的进入邮箱的垃圾邮件数量也会增加不少。

  其次,近来图片垃圾邮件发送者技术不断增强,提高了图片垃圾邮件的有效性。其中主要举措是一份图片会随机生成多个版本,对于个人阅读来说这些版本是一样的,但对垃圾邮件过滤器来说则是完全不同的。比如说,垃圾邮件发送者发送带有附件为.gif 文件的垃圾邮件时,会在这份.gif 文件中随机插入几个视觉“点”来造成生成图片的不同,或者他们还可通过改变图片颜色、边框的宽度和模式、还有字体样式来达到这个目的。在所有这些情况下,在用户看来图片都是同样的,但图片的检验值却是不同的。由此躲过过滤器的垃圾邮件越多,造成到达邮箱的垃圾邮件也就越多,从而不仅降低了员工的工作效率,相应地也增加了IT员工的工作量。

  面对日益增加的智能型垃圾邮件,传统的基于语义分析的方法识别率越来越有限。垃圾邮件发送技术发展了,我们站在反垃圾邮件的一方不能束手无策。国内最大的电子邮件服务运营商—263提出了一个基于特征码的智能垃圾邮件过滤技术:通过提取垃圾邮件的特征码来识别垃圾邮件,从而达到阻挡垃圾邮件的最终目的。

  新的特征码系统部署对于原有网关未识别的垃圾邮件,经过新的特征码系统再过滤一遍。这样既继承了原来反垃圾网关的优点,又增加了新的特性。

  传统的图像识别技术包括:颜色直方图、区域识别、轮廓识别、边缘识别、OCR识别等,这些技术只适合识别信息量很少的小图片。而特征码图像识别技术,抛弃传统图像识别技术的观念,不关心图像的大小,不关心图片的语义,仅关心图片的特征。

图:特征码图像识别技术流程图

  特征码系统主要识别对象有:重复出现的邮件、图片不带干扰信息的邮件、图片带干扰信息的邮件、正文相似邮件、以附件形式隐藏的邮件等。

公司网站:www.chundi.com 产品技术支持网站:www.mailer.com.cn  产品商务渠道网站:www.turbomail.cn
Copyright 1997-2017 北京春笛信息技术有限公司 地址:北京海淀区知春路23号863软件园量子银座九层