第一篇:反垃圾邮件保证书
这是小编为你精选的反垃圾邮件保证书,希望你喜欢。
我/我公司 ,购买上海网麒科技有限公司提供的电子邮件服务,域名:
型号:
由于网站涉及垃圾邮件事件,将导致该网站所在ip地址可能被相关国际组织封杀,我/我公司已充分认识到该等事件的发生将给我/我公司及上海网麒科技有限公司带来不可估量的损失。我保证将严格遵守上海网麒科技有限公司的在线网站寄放服务条款,不会发送任何垃圾邮件也不会卷入任何垃圾邮件事件。
我同意我的网站若被任何国际反垃圾邮件组织投诉,上海网麒科技有限公司将有权立即永久性关闭我的网络服务(包括域名、主机和邮箱服务),并保留追究法律责任的权力。
上述承诺构成我/我公司与上海网麒科技有限公司之间的协议。
保证人:haoword
(签字盖章)
年 月 日
第二篇:浅析反垃圾邮件技术
淺析反垃圾郵件技術
杜暖男 馬瑩瑩
(平頂山工業職業技術學院,河南平頂山 467001)
摘要:現如今,垃圾郵件已經成為困擾人們網路交流的安全隱患之一,本文主要針對這個問題,簡要分析一些較為實用的反垃圾郵件技術。
關鍵字:資訊安全;反垃圾郵件;過濾技術;
中圖分類號:tp393.08
眾所周知,電子郵件已成為人們進行網路交流溝通的重要途徑,但是人們需要花費時間來處理日益增長的垃圾郵件。由於垃圾郵件數量多,具有反復性、強制性、欺騙性、不健康性和傳播速度快等特點,嚴重干擾了人們正常生活,浪費用戶的時間、精力甚至造成很多額外的經濟支出和資訊安全隱患。因此,對反垃圾郵件技術的研究已經成為影響互聯網發展的重要課題之一。本文主要對反垃圾郵件技術進行簡要的分析。
目前存在的垃圾郵件主要有帶附件的垃圾郵件、內容為圖片的垃圾郵件和文本型垃圾郵件三種類型。針對這三種類型的垃圾郵件的典型技術有通信協定掃描技術和貝葉斯過濾技術。 1規則過濾技術
使用規則過濾技術進行判斷可以相對快速的判斷垃圾郵件,這種技術通過設置一些規則,然後對要識別的郵件評估了大量的模式大多數(本站向您推荐wWw.HAoWoRd.com)是正則運算式。只要符合這些規則的一條或幾條,就認為是垃圾郵件。使用這種技術最重要的是評定規則的更新。這些規則通常有:
(1)利用郵件位址、ip、功能變數名稱"黑白名單"或反向功能變數名稱查詢進行的郵件限制或過濾。為了有效地拒絕來自惡意的垃圾郵件來源站點和域被利用的垃圾郵件來源站點所發來的垃圾郵件,最直接和有效的辦法就是拒絕該來源的連接。
即時黑名單(realtime bolckhole list,簡稱rbl)技術通過檢查收到郵件的ip地址,與在rbl中的ip地址核對來阻止垃圾郵件。即時黑名單不需要手工維護ip位址列表清單,而是通過dns方式來動態地查找一個ip位址的 a(address)記錄是否存在。因此即時黑名單技術也被稱為rbls。
反向功能變數名稱驗證的方法就是啟動郵件伺服器的反向功能變數名稱解析功能,對收到郵件的來源ip位址採用反向dns查找驗證真實性。如果反向dns查找提供的域與郵件上的來源ip地址相符號,該郵件被接受,如果不符合,該郵件被拒絕。例如其聲稱的名字為mail.changan.net,而其ip位址為202.96.172.185,與其dns記錄相符,則予以接收。這種方法可以有效過濾掉來自動態ip的垃圾郵件,大大降低垃圾郵件的數量。但是,由於很多反向dns目錄未被有效建立,或無法正常建立,在這種情況下,由這些域發送的郵件將被阻斷,造成不可接受的高誤報率。
(2)通過smtp通信鏈結速率、頻度的設定,過濾不符合規定的郵件。垃圾郵件發送者經常試圖通過在很短一段時間內發送大量郵件阻塞郵件伺服器,這被稱為dos(拒絕服務)攻擊。垃圾郵件的一個基本特徵是會在短時間內發送大量的郵件,這就表現為某個ip地址會在短時間內重複連接收件伺服器的smtp埠,並佔用大量的帶寬。根據這個特點,一種方法是對每個ip位址可用的帶寬比例進行限制,另一種是對每個ip位址的併發smtp連接數目進行限制。結合動態黑名單方式,更好地限制那些異常的網路流量,採用郵件重複技術進行限制,對那些郵件頭中關鍵資訊重複的郵件進行限制,如發送ip位址、發件人、郵件主題。這樣既可以達到限制垃圾郵件的目的,也可以減少伺服器由於處理垃圾郵件所消耗的資源。
規則過濾技術雖然可以過濾一類垃圾郵件,但是不能適應垃圾郵件的發展,只要垃圾郵件的郵件作了一些改變,就要手動更新規則才能滿足垃圾郵件的變化。
2基於統計的內容過濾技術
基於統計內容的郵件過濾技術,可以不考慮語義環境,利用文本分類與統計分類演算法進行垃圾郵件檢測。比較有代表性的是貝葉斯篩檢程式,貝葉斯分析採用過去事件的知識預測未來事件。
其基本流程是:首先在已經確定的垃圾郵件集和正常郵件集中進行學習,根據每個單詞分別在兩個集合中出現的次數,計算單詞為垃圾辭彙的概率。當一封新郵件到達時,系統對信件內容進行分詞和選詞,得到一組單詞流,然後根據學習到的資訊,計算整個單詞流的概率,並最終判斷該信件是否為垃圾郵件。
因為貝葉斯分類法是利用概率來推斷給定的郵件是垃圾郵件的可能性,在實際應用中為了便於管理,系統採用了打分的方法來為垃圾郵件與正常郵件的區分設定界限。首先,為不同的可能性建立相應的分數,每封郵件是垃圾郵件的可能性就轉化為分數來表示,增強了可讀性;然後,確定一個閾值,如果郵件的分數超過了閾值,那麼該郵件就判定為垃圾郵件,反之為正常郵件。
3圖片垃圾郵件的判別技術
隨著垃圾郵件的日益複雜,其表現形式也千變萬化。垃圾郵件正由以往頗具迷惑性的url位址鏈結和文字形式逐漸演變成圖片格式。杜絕圖片垃圾郵件的關鍵在於分層處理。當分層處理的解決方案加上有效的過濾規則,用戶就會解決圖片垃圾郵件所帶來的網路資源和網路帶寬的大量浪費。而採用典型的基於內容過濾的貝葉斯演算法無法過濾此類垃圾郵件。通信協定掃描技術是防垃圾郵件技術領域的一種新型技術。此技術對於識別和阻攔圖片式的垃圾郵件起到很大的作用。
通信協定掃描技術主要針對垃圾郵件的發信行為,對發件人進行監控、阻擋,以達到減少垃圾郵件。通信協定掃描技術藉由匿名、偽造、濫發、非法的郵件行為判別,在不比對郵件內容/黑名單下,進行垃圾郵件行為解析,透過smtp聯機即時通信協定,分析判斷並即時回溯追蹤寄件者真實身份,以判斷其通訊行為,對於圖像式垃圾郵件可以高效地實現阻擋。目前,垃圾郵件作為互聯網中的一個突出安全問題日益成為我們關注的重點和研究的熱點。單靠一種技術是無法徹底解決垃圾郵件,只有將各種反垃圾郵件技術結合起來運用,研製出更好的反垃圾郵件產品,並採用法律管理手段才能有效地控制和治理垃圾郵件。
第三篇:反垃圾邮件
反垃圾邮件
自2014 年后,互联网技术飞速发展,邮件技术已经逐步成为了现代社会最重要的沟通工具之一。然而,予生俱来的是垃圾邮件对邮件用户的侵扰;到2014年末,这种侵 扰已经成为公认的最大的互联网应用威胁之一。 有许多数字让人触目惊心:每天全球产生的垃圾邮件达1000封;用户收到的邮件之中,有94%是垃圾邮件; 美国、中国是全世界最大的两个垃圾邮件生产国家和消费国;中国网民每周收到的垃圾邮件数平均达到了19.4封。 这些垃圾邮件充斥着各种非请求的商业广 告、色情与反动内容、政治敏感话题传播、甚至计算机病毒与恶意代码,给我们正常的邮件收发增加困难,使企业的网络与邮件资源被恶意浪费,甚至有可能对组织 与个人的硬件资产遭受入侵、破坏等损失。垃圾邮件最新的形式是钓鱼邮件,spammer通过传播类似银行及会员机构邮件的方式,来骗去用户的用户名和密 码,直接获取非法利益;而有些则通过恶意代码控制计算机,使网络用户的计算机变成zombie pc,利用这些pc来发送大量广告等垃圾邮件以获取商业价 值。可以说,反垃圾邮件的斗争以及到了白热化的程度。
中国的反垃圾邮件技术研究几 乎和国外同步,但产品化进程比较慢,基本上到2014年后才有初步能够应用的专业级产品与系统方案。在国际上,有两大开源社区比较权威,目前世界上大部分 垃圾邮件的核心技术都来源这两个社区,一个是著名的spamassassin,一个是,razor。而中国目前还没有形成比较成规模的反垃圾邮件技术开源 社区。在技术上,特别是产品结构上都借鉴这些著名的先行者。
说到反垃圾邮件的技术方案,一般有三种类型的解决方案。
第一种是初级的用户级客户端方案。 大部分人都认为客户端方案效果不好,这里面其实有个误区,很多说法是包含了商业利益在里面的,所以就不能够客观的评 价。客户端方案,有些人就认为是foxmail、outlook之类的邮件客户端自带的简单的黑白名单判别垃圾邮件功能,其实这是有误的。真正的客户端方 案,不仅包含这些黑白名单功能,也包括其他类型方案一样的一些手段,象实时rbl、指纹检查、信任网络、甚至包含内容过滤等技术,由于它服务的对象是“客 户端个人用户”,没有关注邮件服务器而已,然后它仍然是专业级别的反垃圾邮件防方案。关键是,需要找到专业的产品,而且这种方案在50人以下应用环境时具 有很好的经济价值,在超过50人的应用环境下,这种方案就没有其他的方案更具竞争力。代表产品是全球知名的反垃圾邮件技术公司cloudmark公司的个 人版反垃圾邮件产品。
第二类技术方案是反垃圾邮件网关方案。 这种方案是目前应用最广泛,也是应用最简便的企业级反垃圾邮件方案。这种方案是 各种反垃圾邮件技术综合到一台设备或者软件系统当中去,放在邮件服务器的前端,对进出邮件系统的所有邮件进行过滤、审查,对违反规则或者具有明显垃圾邮件 特征的邮件予以处置。 网关型的反垃圾邮件方案,其形态可以是专用硬件产品,也可能是软件形式。需要特别强调的是,传统上认为硬件产品比软件产品好,这种 认识也是有很大偏差的,需要差别的看:如果反垃圾邮件网关软件能够与邮件系统实现真正意义上的无缝结合的化,是能够大大提升系统的整体性能的,而不是象部 分商业公司宣称的那样,硬件产品一定是最好的;原因很简单: 这中间节省了两个计算环节(反垃圾邮件系统在将邮件系统解包检后,可以不用打包就可以直接转 给邮件系统接受;而邮件系统不需要先对邮件进行解包,就可以直接接受--减少动作,就意味着性能的提高)。
网关方案做为最主要的企业级反垃圾邮件方案,因各商业和研究机构的技术路线不同,主要有3种:
(1)基于经验规则和内容检查技术的技术路线。 这类反垃圾邮件网关,以内容检查为主,主要的检查手段包括关键字过滤、贝叶斯过滤、基于规则的评分系 统、邮件指纹检查、黑白名单技术、速率控制等等。需要的是提取样本、提取内容特征等信息,来检查与过滤垃圾邮件。代表的产品是梭子鱼反垃圾邮件系统。 需 要注意的是,这类产品大多数需要进行大量的内容检查计算,对产品的系统结构和硬件平台的系统资源要求比较,性能峰值不是很高,特别是部分产品是用pear 编写的,程序的限制,使得性能成为其最主要的瓶颈。 这点用户在选择时是需要关注的,选型时尽量采用高一点的型号,以应对突然的邮件高峰。
(2)智能行为识别技术路线。由于认识到基于规则与内容技术路线在性能上的局限性,有部分技术人士摈弃了内容检查,而是将产品方案的主要检查手段放在了邮 件的协议分析。 这类技术通过总结和分析垃圾邮件发送者的各种共性行为,比如用客户端群发软件发送、高频率发送、dns伪装、ip欺骗等等方法,解析出这 些“垃圾行为”的特征并形成规则,用这写规则来判别一封邮件是否合法。这类技术,同时包括了众多的邮件合规性认证机制;同时也包含了部分杀病毒等内容
层技 术。 同样需要大家注意的是,这类技术针对的是大规模的、以群发为特征的垃圾邮件,而针对单个、无规律的、甚至是合法来源发送非法内容的邮件,没有很好的 解决方案。因为它不强调内容检查,而对对垃圾邮件判定最重要的标准是“内容”非法! 但,这种技术已经能够拒绝大部分垃圾邮件了,因为绝大部分垃圾邮件确 实是通过群发的方式产生的。 这类产品的代表厂商是敏讯科技,以及来自台湾的硕奇公司反垃圾邮件产品(该公司更宣称完全运用行为识别技术来反垃圾邮件)。
(3)混合模式路线。这种技术路线强调过程化处理技术,利用过程化处理技术整合各种反垃圾邮件技术,既包括基于协议分析的智能行为识别,也包括基于规则 与内容检查的模式对比路线。反垃圾邮件网关在智能过程化处理平台的控制下,有次序的让邮件接受各个层次的合规性检查与内容检查。综合应用行为识别技术,在 协议层对tcp/ip进行分析规范发件连接行为、在smtp层对邮件从hello、auth、from、to、data等各个层次进行合规性检查,对违发 正常规则的邮件进行重点分析,对明显的群发行为予以处置。而内容检查阶段,也是严格按照“过程”来进行的,病毒查杀、用户级黑白名单、关键字、贝叶斯过 滤、指纹检查、以及其他的基于内容检查的技术。 这类网关的设计架构比较好,“过程化”的处理办法,让大量的垃圾邮件在“前端”就被过滤掉,而在内容阶段 系统的工作量非常的少,能够大幅度的提升系统的整体工作性能和垃圾处理能力。 这类产品的代表是commontouch反垃圾引擎,以及智海华程 cyanfilter反垃圾邮件引擎。 他们共同的特点是过程化处置,都拥有自己核心的反垃圾邮件引擎。coummontouch的反垃圾引擎采用实时检 查技术,轮回检查信任网络;而cyanfilter反垃圾邮件引擎则包含了中文分词、特征进化引擎技术等等,使得青莲cyanlotus反垃圾网关更具有 强大的中文垃圾能力。 另外,cloudmark公司的电信级反垃圾邮件网关也同样拥有这中能力,其基因算法与全球最大“可信任用户网络”更是无与伦比。
第三类是asp反垃圾邮件服务方案。这种方案主要针对用户数量少于500人的中小企业环境。 反垃圾邮件服务提供商首先建立一个反垃圾邮件服务中心,这 个中心的系统拥有同时向多域、多服务器提供反垃圾服务的能力。用户在购买了反垃圾邮件服务后,将自己邮件地址的mx记录指向该服务中心,该服务中心同时添 加该用户域名,这样用户的邮件在到达用户的邮件系统(不管是购买的空间的方式,还是有独立服务器)前,首先达到asp反垃圾邮件服务中心进行过滤检查,达 到净化垃圾的目的。这种方案比较经济、不受地域和部署方式的限制。 但,目前为止,国内还没有实际投入运营的反垃圾邮件asp出现。
用户,不管是个人用户还是企业级用户,在选择反垃圾邮件方案时,都需要认真考虑一下几个因素:
(1)经济性。个人用户和数量比较少的企业,可以选择采用专业客户端或者asp反垃圾邮件服务的解决方案,既节省投资也具有同样的反垃圾效果,而且免去了后期维护之类。
(2)反垃圾系统的反垃圾效果。 对反垃圾系统效果的评价一般包括垃圾邮件识别率、漏报率,同时更需要关注垃圾邮件误报率,特别是将正常邮件判别为垃圾 邮件的“假阳性”误报问题,这是反垃圾邮件系统的最关键的参考因素。我们可以容忍一天收到若干垃圾邮件(当然是数量不多的情况下),但所有人都不能忍受有 正常的邮件被错误的判定为“垃圾”而遭受“丢弃”!而评价反垃圾邮件系统反垃圾效果的方法,就是实际试用! 因为每个用户受的垃圾邮件类别是不一样 的,有的用户垃圾邮件主要是英文垃圾、有的是中文垃圾、有的是图片的、有的则是广告文字的、还有的是钓鱼类的、而有的则是以病毒垃圾为住。不同的垃圾邮件 特征,需要采用不同的反垃圾邮件产品方案:如英文垃圾多,则我们可以首选国外专业产品;如果中文垃圾多,则首先要考虑国内的,特别是有中文分词技术(由于 中、日、韩三国语言的双字节及不分词的特殊性,一般反垃圾产品能难有效应对);而对病毒垃圾多的,则可以考虑主要由杀病毒公司提供的反垃圾邮件产品。
(3)注重系统的整体性能。反垃圾邮件产品,如果性能不过关,随着业务的增长和垃圾邮件泛滥问题的日益严重,可能会有很大问题,另外性能问题有可能会影 响我们正常的邮件收发效率;由于产品在设计和硬件配置上的缺陷(特别是产品结构与设计语言的缺陷),导致邮件堵塞、溢出、正常邮件丢失、系统瘫痪等等,将 会使我们损失惨重!
(4)管理简便与灵活性。一般来讲,灵活性与简便的要求是矛盾。我们的原则是,逐步减少网管人员和用户的工作量,同时又给 予网管和用户最大限度的个性化需求。如每个用户都应该拥有自己的个性化黑白名单、自己个性化的关键字过滤策略等等,以使得我们反垃圾邮件系统更具有针对性 和效率。选择产品时,一般要考虑web管理、参数设置简单、管理维护工作量少、拥有智能(特别是有自学习能力)的产品。同时,产品的升级要及时,特别是病 毒库的升级。
综合以上的一些所述,用户在进行反垃圾邮件工作时,要全面了解各种反垃圾邮件方案与自己的实际需要想对应的程度,我们不能一 味的听**厂家或者组织宣称自己是最好的和唯一好的解决方案,最好与最合适只有我们自己说了算。 品牌和市场保有量在中国没有参考意义(大部分品牌都是通 过大量的宣传得来的,而中国用户是出名的“随大众,爱面子”),建议的做法是“试用”用实际效果说话!特殊的,在中国反垃圾,首先要把重点放在“中文”垃 圾上、图片垃圾、钓鱼垃
圾上! 同时,还要看该反垃圾方案是否具有完备的“挽回”机制,有全面的日志包括垃圾邮件日志、阻断邮件日志(大部分产品没有此功 能)、病毒邮件日志以及收发的正常邮件日志。
反垃圾邮件是一件任重道远的事业,需要我们大家的共同努力
第四篇:反垃圾邮件技术初探
反垃圾邮件技术初探
摘要:如今,电子邮件的应用已经非常广泛,给人们的工作和生活带来了很大的方便。但是垃圾邮件的泛滥也给用户带来了诸多不便,尤其是病毒类垃圾邮件已经严重威胁用户信息的安全。在本文中,笔者通过对internet存在的垃圾邮件问题进行探讨,从垃圾邮件的起因和特点出发,阐述了反垃圾邮件的技术。 关键词:垃圾邮件;技术;过滤
随着计算机互联网技术的发展,电子邮件成为人们生活、工作中不可缺少的一项互联网服务,电子邮件费用低廉、使用方便、信息量大、信息传递速度快,极大的满足了人们的需求。正是因为邮件的这些特点,使垃圾邮件泛滥,而且具有反复性、不健康性和强制性,严重干扰了人们的正常生活,因此,要对反垃圾邮件技术进行探讨。
一、垃圾邮件简介
(一)垃圾邮件的概念
垃圾邮件是指收件人没有事先提出要求或者同意接受的电子刊物、广告等具有宣传性质的电子邮件;隐藏发件人身份、标题、地址等信息的电子邮件;收件人无法拒收的电子邮件;含有虚假信息源、路由、发件人的电子邮件。总之,垃圾邮件是指和内容无关,发送给多个未明确要求该邮件的收件人的邮件,也指发送给与信件主体不相关的新闻组或列表服务器的同一信件的重复邮件。
(二)垃圾邮件发送手段
1.以图片方式代替文字内容发送。把将要传送的内容以图片的形式附入邮件中,过滤器很难识别图片文件包含的内容。
2.邮件内容、发件信息伪装。通过随机内容生成器等将收信人地址加到正文或标题中,吸引收件人查看。
3.利用受病毒感染的“僵尸网络”发送。比如说利用蠕虫病毒,将垃圾邮件发送给世界各地可被蠕虫病毒感染的机器,使被感染的电脑在机主不知情的情况下发送垃圾邮件。
4.采用“视觉战术”,采用html格式,把内容加噪,干扰反垃圾邮件系统对于邮件内容的判断,但是垃圾邮件的接受者依然可以接受垃圾邮件的原始信息。
二、反垃圾邮件技术
(一)规则过滤技术
规则过滤技术是指通过设置一些基本规则,对要识别的邮件进行评估,只有符合这些规则的一条或几条规定,就认为是垃圾邮件。这些规则主要有:
1.通过smtp通信链接频度、速率的设定,过滤垃圾邮件。垃圾邮件的发送者常常试图通过在很短一段时间内发送大量邮件来阻塞邮件服务器,所以,可通过对每个ip地址可用的带宽比例或并发smtp连接数目进行限制,限制异常的网络流量,达到限制垃圾邮件的目的,也减少服务器因为垃圾邮件耗费的能源。
2.利用邮件地址、反向域名、域名“黑白名单”、ip查询进行邮件的过滤和限制。①实时黑名单技术就是通过检查收到邮件的ip地址,与实时黑名单中的ip地址进行核对阻止垃圾邮件,同时,实时黑名单是通过dns来查找ip地址的a记录是否存在,并不需要手工维护ip地址的列表清单。②反向域名验证方法是通过启动邮件服务器的反省域名解析功能,对收到来源的ip地址采用反向的dns验证真实性,有效过滤掉来自动态ip的垃圾邮件,降低垃圾邮件的数量。
(二)图片垃圾邮件的判别技术
1.杜绝图片垃圾邮件的关键在于分层处理,分层处理的解决方案加上有效的过滤原则,可帮助用户解决图片垃圾邮件带来的网络资源和网络带宽的浪费。
2.通信协议扫描技术是针对垃圾邮件的发信行为,对发件人进行监控和阻挡,减少垃圾邮件。通过对垃圾邮件行为解析,透过smtp联机实时通信协议,对寄件者真实身份进行分析判断并适时回馈,判断其通讯行为,到图像式垃圾邮件实现高效的阻挡。
(三)基于统计的内容过滤技术
1.基于统计的内容过滤技术,是利用统计分类算法与文本分类对垃圾邮件进行检测,典型技术是贝叶斯过滤器。
2.贝叶斯过滤器的基本流程是:①在已经确定的正常邮件集和垃圾邮件集中进行学习,根据每个单词都两个集合中分别出现的次数,计算单词为垃圾词汇的概率。②当新邮件到达时,对信件内容进行系统性的分词和选词,得到一组组单词,根据在集合中学到的信息,计算整个单词流的概率,判断信件是否是垃圾邮件。
3.在实际应用中,因为贝叶斯分类法是利用概率推断邮件是否是垃圾邮件,为了方便管理,系统通过对邮件的打分确定邮件是否是垃圾邮件,为不同的概率设立不同的分数,每封邮件是否是垃圾邮件就以分数表示,确定一个阙值,查看邮件的分数,如果邮件的分数超过了阙值,邮件就是垃圾邮件,反之不是。 结语:
垃圾邮件是全球性的问题,也是一种社会现象,对于这一问题,应该采用管理和技术相结合的方式,以先进的技术手段为基础,同时以完善的法律法规和管理规范为依托,通过建立国家性的反邮件服务体系,促进邮件服务商和运营商的协调合作,推动反垃圾邮件技术的发展。
参考文献:
[1]熊应, 朱斌, 朱海云 .电子邮件智能分类系统的设计.电子学报, 2014, 29( 12)
[2]杨清, 杨岳湘, 翟国平.智能文本分类系统的研究与设计,计算机应用研究,2014,10
[3] 刘建毅, 张鹏飞, 王 极.高性能电子邮件过滤系统的设计与实现[j] . 计算机应用研究, 2014( 4) : 224- 225.
[4] 李文斌, 刘椿年, 黄佳进. 基于数据挖掘的垃圾e- mail 过滤方法[j] . 北京工业大学学报, 2014, 29( 2) : 237- 240.
第五篇:垃圾邮件与反垃圾邮件技术浅析
垃圾邮件与反垃圾邮件技术浅析
学号:
姓名:
院系:
邮件:
电话:
垃圾邮件与反垃圾邮件技术浅析
摘要:最近几年,垃圾邮件肆虐横行,危害越来越大,严重影响了正常的网络运行。本文简单地介绍了垃圾邮件的定义及垃圾邮件泛滥的原因;重点论述了当前主要的反垃圾邮件技术,最后对未来反垃圾邮件技术提出了展望。
关键词:垃圾邮件;反垃圾邮件;邮件过滤
1引言
随着全球信息化的迅猛发展,互联网络已经成为人们工作、学习和生活中不可或缺的部分,而电子邮件又是人们进行信息交流的重要手段。可是,垃圾邮件又是困扰网络用户的难题。垃圾邮件不仅消耗网络频宽,而且浪费用户的存储空间,甚至有可能成为造成社会不稳定的因素,所以我们有必要采取技术措施控制垃圾邮件的肆意蔓延。 2什么是垃圾邮件
某种程度上,对垃圾邮件的定义可以是:人们没有意愿去接收到的电子邮件都是垃圾邮件。比如:
(1)商业广告。很多公司为了宣传新的产品、新的活动等通过电子邮件的方式进行宣传。
(2)政治言论。目前会收到不少来自其他国家或者反动组织发送的这类电子邮件,这就跟垃圾的商业广告一样,销售和贩卖他们的所谓言论。
(3)蠕虫病毒邮件。越来越多的病毒通过电子邮件来迅速传播,这也的确是一条迅速而且有效的传播途径。
(4)恶意邮件。恐吓、欺骗性邮件。比如phishing,这是一种假冒网页的电子邮件,完全是一种诡计,来蒙骗用户的个人信息、账号甚至信用卡。
3垃圾邮件泛滥的原因
垃圾邮件的产生可以追溯到最开始的连锁信,随着邮件技术的发展,垃圾邮件技术也在逐步发展,要想找到彻底解决垃圾邮件问题的技术,必须从邮件传输的原理入手。 目前邮件传递的主要协议是smtp协议,该协议没有任何认证手段,因此缺省的smtp邮件服务器是所谓的openrelay(开放转发器),无论邮件来自哪里或发到哪里,邮件服务器都会予以发送。
最常见的邮件发送过程是这样:邮件的客户端使用smtp协议将邮件发送给一台smtp发送服务器,然后smtp发送服务器根据邮件的目的地址,使用smtp协议将该邮件转发给目标smtp服务器(接收服务器),接收服务器收到邮件后放入接收人的邮箱(mailbox或maildir,可能是单独的服务器,也可能是同一台机器上),最后另一个邮件客户端(接收方)使用pop3或imap协议从邮箱服务器上接收自己的邮件。整个过程中,发送方与发送服务器、发送服务器和接收服务器之间都不做认证,因此发送方可以使用互联网上任意一台smtp服务器来发送邮件,这就是open relay。
近年来由于垃圾邮件的泛滥,大部分邮件服务器关闭了open relay,在发送方与发送服务器间需要认证,来保证发送服务器发送邮件的主机的合法性,这就是增强的esmtp协议。但这并没有解决第二个环节:发送邮件器和接收邮件服务器间的合法性认证。因为不可能要求接收邮件服务器上保存所有发送邮件服务器的合法用户信息,因此发送邮件服务器无法向接收邮件服务器做认证。
目前的邮件服务器的处理方式是:如果目的地址是本邮件服务器的用户,则无需认证予以接收;如果目的地址不是本邮件服务器的用户,需要用本邮件服务器的合法用户的用户名和口令来认证(该用户可以不是该邮件的发件人)。这样,就给自动垃圾邮件发送程序提供了可能:它只要给邮件服务器发的邮件都是该邮件服务器的用户,即可发送进去。我们知道,可以随处得到一个数百万甚至上千万的email列表,使用程序自动按照邮件服务器域名发送相应的用户是很容易的,
这就导致了垃圾邮件的泛滥。
4垃圾邮件的危害
垃圾邮件可以说是互联网带给人类最具争议性的副产品,它的泛滥已经使整个互联网不堪重负,并造成以下一些危害:
——占用网络带宽,造成邮件服务器拥塞,进而降低整个网络的运行效率。
——侵犯收件人的隐私权,侵占收件人信箱空间,耗费收件人的时间、精力和金钱。有的垃圾邮件还盗用他人的电子邮件地址做发信地址,严重损害了他人的信誉。
——被黑客利用,成为助纣为虐的工具。如2014年2月份,黑客攻击雅虎等五大热门网站就是一个例子。黑客先是侵入并控制了一些高带宽的网站,集众多服务器的带宽能力,然后用数以亿万计的垃圾邮件猛烈袭击目标,造成被攻击网站网路堵塞,最终瘫痪。
——严重影响isp的服务形象。在国际上,频繁转发垃圾邮件的主机会被上级国际互联网服务提供商列入国际垃圾邮件数据库,从而导致该主机不能访问国外许多网络,而且收到垃圾邮件的用户会因为isp没有建立完善的垃圾邮件过滤机制,而转向其它isp。
——妖言惑众,骗人钱财,传播色情等内容的垃圾邮件,已经对现实社会造成了危害。
5当前主要的反垃圾邮件技术
5.1贝叶斯算法
贝叶斯算法是一种比较智能的技术,用户通过培训让反垃圾邮件产品认识什么样的邮件是垃圾邮件,什么样的邮件是正常的邮件,然后形成一个贝叶斯库。根据分析以前发生的事情频率和概率来预测将发生事情的频率和概率,判断垃圾邮件的依据就是贝叶斯库。
贝叶斯算法的优点是,垃圾邮件的判断准确性大大提高;缺点是,需要用户进行干预,判别的速度较慢。
5.2指纹识别
所谓邮件的指纹,就是邮件内容中的一些字符串的组合,又称为快照。就是从类似、但不相同的信息中,识别已经被确认为垃圾邮件的信息。反垃圾邮件产品通过确认的指纹,完成对垃圾邮件的识别。
当然,指纹检查的准确性依赖于垃圾邮件的指纹库,反垃圾邮件产品先给邮件中出现的每一个字符赋予一个数值(这个数值的确是按照特定垃圾的用词规律特点进行分类),再利用统计方法给这封邮件计算出一个综合的数值。也可以根据是否与其他多次收到的邮件相似来判定。
指纹识别技术的缺点是,要经常维护指纹库。
5.3实时黑名单列表
为了有效地拒绝来自恶意的垃圾邮件来源站点和/或被利用的垃圾邮件来源站点所发来的垃圾邮件,最直接和有效的办法就是拒绝该来源的连接。通过将确认后的垃圾邮件来源站点(无论是否是恶意与否)放入一个黑名单,然后通过发布该名单来保护邮件服务器不受到黑名单中站点的侵扰确实是一个目前对抗日益严重的垃圾邮件的行之有效的方法。
目前在黑名单技术上最流行的是实时黑名单(realtimeblackhole list,简称rbl)技术。通常该技术是通过dns方式(查询和区域传输)实现的。目前国外流行的几个主要的实时黑名单服务器都是通过dns方式提供的,如mail-abuse的rbl、rbl+等。
实时黑名单技术的优点是,减少用户的工作量和设置难度,降低一定的误报率;缺点是,有的rbl提供方提供的黑名单过于强硬。
5.4防止字典攻击
在我们平时使用邮件系统给别人发信的时候遇到过这样的情况,一不小心将收件人的地址写错了,那么这样的邮件是不可能被正确地送到目的地的,将被退回来。一些垃圾邮件的发送者就利用了邮件系统这个特点,大量地向邮件系统发送信件,没有被退回来的信件就是邮件系统当前拥有的邮件地址,这样垃圾邮件的发送者就可以很轻松地得到发送垃圾邮件的对象了。采用防止字典攻击的技术就是让邮件系统在没有真实用户存在于系统当中时不退信,这样攻击者就不能够获得有效的用户列表。
5.5邮件域名过滤
ibm开发了代号为fairuce的反垃圾邮件新技术。该技术使用网络领域的内置身份管理工具,通过分析电子邮件域名过滤并封锁垃圾邮件。fairuce把收到的邮件同其源头的ip地址相连接,在电子邮件地址、电子邮件域和发送邮件的计算机之间建立起一种联系,以确定电子邮件的合法性。ip地址是固定不变的,因此fairuce就能够识别信息是来自僵尸(zombie)计算机、机器人bot装置还是来自合法的电子邮件服务器。
6结束语
制止垃圾邮件的困扰除了采用必要的技术手段,还必须寻求法律的支持。从法律角度看,发送垃圾邮件属于言论自由的滥用,不但得不到法律的支持,相反,很多国家正积极制定相关法律来禁止垃圾邮件。另外,未来反垃圾邮件技术,在提高准确率的同时,必须同时满足以下条件:适应各种网络规模;支持用户发信认证功能;支持可游离于各种服务器之外的电子邮件过滤功能,可自动关闭中转访问功能,保证邮件服务器不被非法利用,保证正常邮件到达的稳定性和实时性。