导读:本文从邮件归档的需求和技术特性出发,介绍了一般企业邮件归档的实施要点和技术细节,并以Quest公司的Archive Manager为例,展示了归档系统为电子邮件内容管制带来的种种崭新面貌。
邮件归档的需求
如果说9-11事件、印度洋海啸让企业的CIO意识到了系统备份和异地容灾的重要性,那么安然公司的丑闻和随之推出的SOX法案使得CIO们不得不认真地对待企业敏感信息的管制和电子证据的归档。为了保护投资者的权益,美国政府立法对上市公司的电子记录完整性、保密性和可存取性三个方面提出了明确的规定。很明显,作为企业对外业务往来主要渠道之一的电子邮件,是进行监管和内容归档的首选目标。
实施电子邮件的归档,既能够在技术上提升企业邮件系统的可靠性和可用性,更能够帮助公司满足现有法律和商务方面的需求。随着企业业务的不断发展,人员的逐渐扩大,会有越来越多的历史邮件被分散的保存在服务器和客户机上。保存在客户机上的PST文件没有有效的备份和数据保护手段,一旦遗失或硬盘损坏,将产生严重的后果;同时,服务器的资源有限,不加限制的存放历史数据,将大幅度的增加企业的邮件运营成本。我们常说的电子邮件归档系统,不仅可以将日常发送和接受的邮件原封不动的做一个副本进行保存,更可以从多台电子邮件服务器上将旧电子邮件、大附件和冗余的信息提取出来,并且把它们存储在一个可以立即访问的服务器和存储设备上。这既可以提高电子邮件服务器的备份和恢复速度,并且能够节省存储空间,对于任何一个规模稍大一点的企业来说,都具有非常现实的经济意义。
很多时候,备份、恢复和归档概念是同时出现的,那么它们之间有什么区别与联系呢?实际上,文件归档与备份系统在企业中发挥着两种不同的互补的功能,备份的目的是用于高速复制和恢复数据,来减少故障、人为错误或灾难的影响;而归档技术的目标是有效地管理数据,实现数据的保留和长期的访问与检索。与传统的备份不同,归档针对的数据是不曾被修改过的原始数据,其中包括法律法规要求的全部数据,其保留期限以年甚至世纪为单位。另外,归档要保证取回数据的可用性,备份则仅是强调在遇到故障和灾难时的数据恢复。
由此可见,进行电子邮件方面的数据归档,要满足如下的四个要求:
全面性 | 一个都不能少!邮件归档要做到没有死角,组织内部的邮件收发、组织对外的邮件收发,一些由应用程序自动生成的邮件,密件抄送的邮件、发给群组的邮件,都必须被归档和保存。 |
透明性 | 实施邮件归档应该对现有的用户、系统和网络产生尽可能小的影响。通常来说,应该做到对最终用户透明,对系统没有明显的性能压力,不会造成网络带宽的严重占用。 |
可获性 | 归档数据的容量会随着时间而成倍增长,在需要的时候从TB级别的海量存储中挖掘出需要的电子邮件,正像是大海捞针一样困难。数据的可获得性,是邮件归档的难点,也是成功与否的关键要素。 |
低成本 | 海量的存储空间对硬件的需求很高,同时为了满足法律和政策的要求,归档的数据不被篡改,还需要存储设备有“一次写入,多次读出”特点以确保数据的完整性。 |
Exchange Server对邮件归档的支持接口
微软在研发Exchange服务器系列产品时,充分的考虑到了邮件归档的重要性。早在Exchange 5.5的SP1中,微软就提供了归档的设置接口。随着产品的逐步发展,归档功能更加趋于完善。
在Exchange Server 2003中,微软提供了两种级别的归档,分别称之为“Message Journaling”和“Envelope Journaling”。 Message Journaling是针对邮件的P2信头(关于P2信头的概念,读者可以参考近期杂志中Exchange传输组件大揭秘系列文章)进行归档,可以在数据库Store上面进行设置,如下图:。启用了归档的数据库中收发的邮件,都会被自动的复制到一个指定的归档邮箱中。
图一:Exchange Message Journaling
Message Journaling有一定的局限性,对于密件抄送和发送给邮件群组的邮件,Message Journaling在归档的时候可能会有所遗漏。这是由SMTP P2信头的特性所决定的。为了解决这一问题,微软又提供了基于SMTP P1信头的Envelope Journaling功能。这个功能可以在启用了Message Journaling 的基础之上,更加全面的做邮件的归档,从而满足我们之前提到邮件归档的全面性要求。Envelope Journaling需要使用Exejcfg.exe工具手工的开启,开启以后,将根据SMTP P1信头中实际的邮件投递信息做归档。
Exchange Server的邮件归档功能设置和使用都非常的简单,只需要在需要归档的邮箱数据库上配置即可,由于归档实在Exchange做邮件投递的时候在幕后完成的,客户端根本感觉不到任何的影响。可以说Exchange Server在邮件归档的全面性和透明性这两方面做得非常的到位。
Quest Archive Manager的归档解决方案
前面提到的Exchange邮件归档,历史邮件都是保存在指定的归档邮箱中的。对于大企业来说,不可能无限制的在某一个归档邮箱中保存源源不断的历史数据,Exchange的邮箱和数据库的容量也有一定的限制。同时,保存在归档邮箱中的邮件不便于检索,无法快速的搜索到需要的内容,可获得性较差。
微软并没有对这个问题在Exchange Server产品中提供一个完美的解决方案,相反,是把这个机会留给了做外围解决方案开发的软件厂商。Quest公司抓住了这个机会,及时地推出Archive Manager,凭借软件灵活的部署方式和便利的邮件检索功能,在邮件归档领域大显身手。
下图显示了Archive Manager和Exchange系统工作的方式。在部署了Archive Manager时,需要把Exchange Message Journaling的目标邮箱指定为特制的Archive Manager帐号,当Archive Manager的邮箱收到归档的邮件后,软件的邮件归档处理引擎会将信件进行记录,并把邮件正文和附件分别保存,信件正文保存在SQL Server的数据库上,附件以特定的形式保存在文件服务器上,两者之间的关联保存在SQL Server上。
图二:Archive Manager的工作原理
Archive Manager提供了非常便利的归档邮件检索功能。可以以Web界面和Outlook插件的方式进行归档邮件内容的搜索,同时,搜索的方式也非常的灵活(如图三,显示的是Archive Manager的Web界面的归档邮件检索工具:Aftermail)。
图三:Archive Manager的邮件检索界面
Archive Manager由几个不同的组件构成来完成邮件归档、存储、索引和查找界面的功能。Archive Manager的组件可以以分布式的方式部署在不同的服务器上,来达到最好的可扩展性和性能水准。Archive Manager的组件包括:
Archive Manager Data Load Service
Archive Manager的数据加载服务的主要职责是处理和导出Exchange归档邮箱中的邮件,在处理时,服务将邮件的内容转化为统一的XML格式,再设置了归档标记和安全符号后,将这些内容存储到SQL Server数据库中,对于邮件的附件,数据加载服务把它们保存到指定的文件服务器上并和SQL Server中的邮件正文记录做关联。数据加载服务还可以直接从用户的历史PST文件中读取数据并进行归档,这样可以将分散在用户处的信息集中的归档和备份,大幅度的提高了数据的安全性和管制性。
Archive Manager Directory Connector
Archive Manager提供了多种目录联接器(如Exchange 5.5的目录联接器、活动目录联接器),通过这些联接器,Archive Manager可以在归档邮件的同时关联帐号和权限的信息,并在需要阅读这些归档邮件的时候提供身份认证的机制,做到了数据的一致性和安全性。
Archive Manager Exchange Store Manager
与数据加载服务类似,Archive Manager的Exchange Store Manager工具集(ESM)支持从
异构邮件服务器和历史PST文件中导入邮件数据。值得一提的是,在数据导入过程中,并不需要在Exchange服务器上安装任何的软件,做到了对现有架构最低程度的影响。
Archive Manager Full Text Index Service
大量历史邮件的索引和搜索是归档软件必须解决的问题,在Archive Manager软件中,Quest公司充分意识到了灵活和高效的检索机制是成功地关键,开发了可以快速对归档的邮件和附件内容进行检索的服务。在SQL Server的配合下,Archive Manager的全文索引服务提供了对内容进行索引编制的功能,这样能够大幅度的提升搜索的速度;Archive Manager的全文搜索服务在索引记录的配合下,提供了多维度、复杂条件下的归档邮件快速查询功能。如图四。
图四:Archive Manager的邮件检索界面
Archive Manager Web Application
Archive Manager以后台服务的形式提供了强大的归档邮件分拣、处理和索引查询的一条龙服务,在前台,Archive Manager也毫不逊色。Quest开发了界面友好的Web应用程序来为用户和系统管理员提供操作界面。
管理员可以通过Web界面上配置Archive Manager的数据加载、邮件策略和归档安全等等选项;用户也可以通过这个界面对历史邮件进行查询。更加吸引人的是,这个Web界面可以被集成到Outlook的软件中,用户只要使用统一的程序和接口,就能够方面的管理和查询所有的历史邮件。
Archive Manager Attachment Store
能否高效、低成本的管理海量的归档数据是CIO们关注的另一个话题。Quest的Archive Manager提供了专门的附件存储管理模块,可以支持在多种存储平台上安全的保存邮件附件。Quest可以把海量的邮件附在保存在直连SCSI存储、NAS、SAN甚至低成本的ATA和SATA硬盘上,同Windows的存储管理模块结合,可以做到管理的低成本和数据安全的高度可靠性。
Archive Manager Security
很多政府法案规定,被归档的历史数据必须保存在可靠和不能够进行更改的存储介质上,同时,在软件层面的数据安全和权限控制也是非常重要的。作为这个产品的灵魂,Quest Archive Manager的安全管理堪称完善,不仅杜绝了普通用户任何未经授权的检索和更改,甚至对管理员的操作都有严格的限制和记录。
Archive Manager提供了非常方便和灵活的部署机制,在部署Archive Manager的同时,其实也是企业实施邮件数据审计、归档和内容管制的过程。在这个过程中,不仅需要在技术上完成软件的配置,同时也需要把用户的历史邮件、使用习惯进行严格的管理。
从图五我们可以看到,Archive Manager的从部署到成功运营,需要5个步骤。我们可能已经注意到,在安装之前,Archive Manager对Exchange服务器的架构并没有做太多大刀阔斧的改动,而是仅仅需要在服务器的数据库上开启邮件归档功能并设置归档到指定的邮箱即可。这一类的“绿色安装”和“轻型安装”,是Quest公司的所有Exchange外围辅助软件共有的特色,这样做降低了由系统改造和安装过多组件引起的众多风险,也便于管理员进行部署和调整。关于安装和配置邮件归档的详细步骤,读者可以参考Quest网站提供的“Pre Installation Checklist -Exchange Version 3.0”白皮书。如果读者需要了解Archive Manager的推荐硬件配置,可以参考“Server and Site Configuration Guide - Exchange 3.0”。
图五:Archive Manager的部署过程
下面我们来看一看Archive Manager的一些主要的功能。
归档邮件的查看界面,如图六:
当从Archive Manager中检索到需要查看的历史邮件,用户可以通过Web的界面直接浏览邮件的内容,在Web界面中包括了邮件头、发件人、收件人、主题、正文等等主要的邮件属性,值得一提的是,在Web界面的右上角,Archive Manager会显示一个绿色的盾牌来表示该邮件自归档后没有被更改过,如果页面显示的盾牌颜色为红色,则表示邮件可能被篡改过。
在邮件显示页面的顶端,我们可以看到一系列的选单(Tab),通过这些Tab,用户可以获得邮件正文、管理员注释、邮件头、归档记录、检索和访问记录以及标示符等重要的邮件信息。
图六:Archive Manager的邮件查看界面
Archive Manager的归档存储管理和报表功能,如图七:
由于邮件的归档是保存在SQL Server数据库中的,Archive Manager提供了Web方式的数据库管理和存储报表的界面。这项功能可以向管理员及时地提供归档内容对数据库和磁盘空间的使用情况,便于管理员了解存储空间增长的趋势以便及时地做出调整。
图七:Archive Manager的存储管理界面
在本文即将截稿的时候,笔者收到了Quest公司最新版本的Archive Manager 3.5试用版本和新功能介绍。在3.5版本中,Quest更进一步的提升了Archive Manager的安全性和可审计性。主要的特性如下:
1. 系统对所有的活动都有跟踪和记录,并且这些记录即时管理员也不能够随意的更改。
2. 采用“DNA Fingerprint”技术来保存邮件的正文和对附件进行管理,更加有效的利用了存储空间,并在需要还原邮件时更加高效。
3. 采用Single Instance Storage的方式存储邮件和附件,避免了硬盘空间的无谓浪费。
4. 把管理和日常的查询全面转移到Web平台,没有任何的客户端和额外管理工具。
5. 全面支持近线存储和WORM存储硬件,能够利用更加低价的硬件设备。
作者简介
喻勇,PMP/ITIL/MCSE/CCNP,某跨国IT咨询服务公司资深邮件系统顾问,微软TechNet特约讲师。有丰富的大型邮件系统设计、部署、管理、迁移和运营经验,对项目管理、IT服务管理和关键业务系统的运营管理亦有深入和独到的见解。他的电子邮件信箱是yy@yuyong.net,读者可以在他的网站www.yuyong.net下载Exchange相关的课程讲义。