浅析邮件系统中垃圾邮件过滤技术

2017-12-29 13:16张宇帆冯为华方家茜宁波大红鹰学院
数码世界 2017年5期
关键词:垃圾邮件电子邮件邮件

张宇帆 冯为华 方家茜 宁波大红鹰学院

浅析邮件系统中垃圾邮件过滤技术

张宇帆 冯为华 方家茜 宁波大红鹰学院

作为现代社会中人们交流的一种重要方式,邮件对于提高用户之间的沟通效率具有重要作用。然而在电子邮件的大量应用过程中,垃圾邮件也逐渐崭露头角。对于用户来说,垃圾邮件不仅需要占用较多的时间精力去处理,其还会浪费大量的存储与宽带资源。所以,加强有关邮件系统垃圾邮件过滤技术的研究,对于改善邮件使用现状具有重要的现实意义。在当今社会中,人与人之间联系的方式变得越来越方便快捷,电子邮件自然成了为当下人们互相联系的新宠。

电子邮件 安全 邮件过滤

垃圾邮件是说通过非正当途径甚至违法途径传递的用来推广违法,犯罪,暴力血腥等限制内容的邮件。

1 内容过滤模块的总体设计

截获包含对互联网不利信息的邮件并监管是邮件审查制度的主流规划思路,按照这种设计思路,一般把互联网邮件的过滤系统的基础能力分为这样几种模组:

(1)使用专门的客户端程序能够对危险邮件执行检查,同时利用远程操纵软件对程序执行状况进行监视与管控;(2)检查过滤信息报告,对邮件内信息进行排列;(3)截取信息报告,对信息执行分割处理。

按照规定的IP地址信息和邮件发送IP等检测关键字对邮件执行收取,并分析邮件解码后的相关编码,还原邮件中最初的内容,在还原邮件的过程中对敏感词汇执行搜索,对内容可能包含违法信息的邮件做出记录。

互联网邮件的过滤功能是目前屏蔽垃圾邮件的核心科技,一般从两个角度着手处理,第一个角度是使用电脑程序进行屏蔽垃圾邮件,而针对互联网内部的垃圾邮件的屏蔽和删除一般都是从邮件平台方的服务器着手进行屏蔽和处理,也就是把邮件过滤系统放置在邮件传递平台上对邮件进行过滤并找到垃圾邮件来处理。

当互联网上的邮件经过各种不同渠道平台传递的时候,邮件信息过滤端口把挑选出来的垃圾邮件相关信息上传至中转服务器,收件人在处理完成前无法进行浏览,需要等待邮件中转站的后续通知。邮件过滤中转站一般是对邮件内容里的文本内容,附带程序,图像等关键信息通过检索关键字等进行处理。邮件过滤中转站一般依据事先设置好的规定和要求执行对邮件信息的检查,同时依靠多方并进的工作方式完成对多封电子邮件的共同检索,分析,排查,邮件过滤中转站还可以按照对单独词句的方泓福情况对邮件内容有无非法进行定性。

2 文本过滤技术

2.1 PDF文档的文本过滤技术

一般来说,文本体,文本尾,文本头,重叠引用表格是PDF算法框架的基础构成元素,文本体一般嵌有许多PDF对接目标,这些元素的重组就能够重现PDF格式文件的图形,网页,文字等传统邮件的内容,文本尾一般来记录重叠引用表格的位置,并且依据文本体的根目录对保密处理的文件进行记录,文本头一般记录编写文本所选择的PDF规定版本编号,经常会删除PDF的首行地址。重叠引用表格是一种间接目标位置检索表格,可以完成对目标的不定时存档。使用文本尾得到的资料,PDF相关组件可以截取。检查文本尾存储的资料,PDF服务器可以截取完整的PDF文本和重叠引用表格的原始目标,从而视线对文本的存档。

PDF文本是一种树突分叉形状的结构,主要枝干文本构造是文本中间目标层面联系的具体表现。文本构造中原始目标是树根端点,断点之下分成四个主要分支:网页分支,标记分支,工作线路分支,名称分支。

PDF文本的物理格式用于对文字在页面上的显示方式的分析,基本有文字字体、位置、大小、颜色等属性描述。在大量PDF文件中为降低文件占用大小,通常会将文本进行deflate压缩编码。对于压缩完成的文本只有在解码完成后才能继续进行分析、描述研究。

2.2 HTML文档的文本过滤技术

超文本标识算法HTML是网页的通用算法,是建立可浏览网页和公布网页资料的模式,是建立一个网页的基石,是管理网页客户端在桌面上展示文本图像的重要技术。HTML的核心技能是针对在不同APP商店上利用链接的超文本文档执行编程,其标识步骤可以表现出超文本的文件、在网上展示影音、图像、电子邮件、新闻等资料内容。

2.3 MS-Word/PowerPoint文档的文本过滤技术

在Microsoft提供的Office产品中,基本都具有OLE Automation自动化程序接口。若用户采用Script、VBA或VB使用Office功能,则要比简单的使用VC要容易很多。如在使用WORD软件时,将菜单“工具(T)宏(M)录制新宏(R)”调出的过程中,程序就对用户在WORD中采取的基本键盘与菜单操作过程都记录并储存下来,以利于下次继续调用。而在对这些操作记录进行储存时,便是应用了VBA程序。

3 结束语

垃圾邮件过滤技能的使用情况会直接影响到电子邮件服务方的运营稳定与否,所以,有关科技和科研工作人员需要强化对相关电子邮件中垃圾邮件过滤技能的研究,归纳科学的过滤方式和手段,慢慢填补过滤垃圾邮件技术中的短板内容,为建立健康的网络环境增砖添瓦。

[1]梁志罡.电子邮件病毒传播模型的研究[J].计算机技术与发展.2011(01)

[2]缪宁,欧蕾.浅谈垃圾邮件的危害及对策[J].电脑知识与技术.2010(16)

猜你喜欢
垃圾邮件电子邮件邮件
有关旅行计划的电子邮件
基于James的院内邮件管理系统的实现
从“scientist(科学家)”到“spam(垃圾邮件)”,英语单词的起源出人意料地有趣 精读
来自朋友的邮件
垃圾邮件会在2020年消失吗
一封邮件引发的梅赛德斯反弹
小测试:你对电子邮件上瘾了吗?
Outlook和Foxmail邮件互导
东方国家垃圾邮件输出日益严重
有奖问答