导读:
本文从笔者实际的邮件系统管理经验出发,探讨了针对Exchange服务器和用户邮箱进行日常流量分析的重要性和实施方法。并以Quest软件的MessageStats软件为例,说明了如何通过这些流量分析和使用报告来提高邮件系统运营的可靠性,安全性、降低总体拥有成本以及对系统未来增长趋势做出准确的预测。
一个报表引发的“血案”
除了邮件服务器意外停机,还有什么情况可以让一个Exchange管理员抓狂?让我们看一个小故事先。
汤姆是一个悠闲的Exchange管理员,他管理的系统长期以来都运行的安全可靠,用户也对邮件服务非常的满意,可以说汤姆是IT部门中除了老大以外最清闲的人。忽然有一天,一切都发生了变化:
公司正在执行一次大的收购计划,老大从总部开会回来以后,就急急忙忙的找到汤姆谈话。
老大:汤姆,为了顺利完成这次收购计划,公司的邮件系统要做大的扩容计划,CIO想知道我们现在的系统负载,邮箱、组、公共文件夹的具体数量是多少?对存储系统的占用比例是多少?最近一个月的用户增长速度如何?
过惯了好日子的汤姆知道麻烦来了,公司的Exchange系统有近百台邮件服务器,统计这些东西谈何容易?!迫于老大的压力,汤姆破天荒的没有在上班的时间看NASDAQ的股票行情,而是硬着头皮在活动目录、Exchange数据库、各种历史记录中挣扎了大半天,终于把所有的数据统计出来,保存到Excel中交给老大。
过了一天,老大又找到汤姆。。。
老大:汤姆阿,上次你提供的数据相当的好,。。。我们分析了以后觉得,如果能够把目前邮箱资源的使用情况按照业务部门进行分类,可能会更加清楚地反映公司在IT资源方面的成本,你看能不能再修改一下啊?哦,对了,明天一早就要开会,你这个报告要快一点完成哦。
汤姆傻眼了,之前为了快点完工,统计的数据没有包括部门的信息,这也意味着汤姆要把前面的工作再重复一遍,同时还要做出按部门分类合计的报表。近百台服务器,几万个用户帐号,从不加班的汤姆,第一次留在了办公室开夜车。。。
第二天中午,老大跟总部开完了会,又找到两眼通红的汤姆。。。
老大:汤姆阿,这次你提供的数据相当的,恩,相当的好。。。可是你知道,新并购的公司跟我们在财务方面会独立核算一段时间,我们想知道在最近这几个月里面,我们总公司员工对外邮件收发的数量和对网络占用的比例,这样可以方便我们做网络带宽费用的分摊,哦,对了,最好还是按照部门进行分类和汇总一下。
汤姆这个时候终于体会到了“祸不单行”这句话的意思了。公司并没有专门的软件统计邮件收发数量,要拿到数据,只有把SMTP的日志导入到SQL Server里面以后进行复杂的查询,然后还要根据登陆帐号和活动目录里面的用户部门信息进行交叉索引,汤姆开始愤怒了。。。
又一个不眠之夜。。。
头儿:汤姆阿,这次你提供的数据相当的。。。恩,其实是这样,我们还希望你能够把每台服务器和路由组之间邮件发送的数量、用户向邮件组发送的数量这些内容作一个统计,最好在结合之前的内容作一个完整的报表。汤姆,你知道我们的CIO不是技术出身,你最好在报表里面多用一些直观的图表,格式尽量美观一些。。。
已经彻底抓狂的汤姆,再也忍受不了老大这些层出不穷的要求,在据理力争无效之后,他从机架里面拔出了一个刀片式服务器,一个报表引发的血案,就这样发生了。。。
流量分析和系统监控的重要性
可能很多IT管理员都或多或少的经历过刚才故事里面提到的情况。怎样区分一个“好的系统管理员”和一个“优秀的系统管理员”?好的管理员能够做出漂亮的系统设计,能够避免意外停机,能够进行性能优化;而优秀的管理员除了满足前面这些以外,还必须有能力对系统每时每刻的状态了如指掌。当被问及上面这些问题时,能够从容应对,为IT部门和上层的业务部门及时的提供准确的决策信息。
IT部门的使命就是要满足企业业务部门的需求,为提高工作效率、改善业务流程做出贡献。在信息化时代中,企业前进的步伐很快,商机和变革随时都可能出现,这对IT也提出了更高的要求。对IT来说,频繁的业务和商业变动意味着IT系统,用户需求、系统负载不再是一成不变的,要使包括电子邮件平台在内的IT系统能够满足和适应企业快速变化的节奏,必须对系统的运行状态和用户活动进行实时的监控和分析,从这些实时的数据中,掌握系统的“脉搏”,监控用户的活动,发现潜在的问题,找到可能的隐患,并为系统扩容提供可靠的依据。
大型企业在部署邮件系统的同时,往往会一起部署一套进行系统流量监控和分析的软件,为Exchange服务器环境找一个“好管家”。优秀的Exchange管理员在这位管家的协助下,能够如虎添翼,将系统的运营和维护提升到一个更高地层次。根据笔者的实际经验,对邮件系统进行状态监控和使用分析,有以下的重要意义:
l 提供精确的流量数据,为财务费用分摊提供依据。
在大企业中(特别是集团公司和合资企业),往往需要对一些例如网络、电子邮件、防火墙等等的共享IT基础设施服务(Shared IT Infrastructure Service)进行费用分摊,如果IT部门能够提供一个清晰准确的使用量报告,将大大简化费用分摊的过程,并更加精确地反映出每一个实际的业务部门或者分公司在IT方面的成本。这不仅仅有利于IT和财务部门进行费用计算,更能够帮助CIO和管理层进行预算和成本分析。
l 帮助邮件系统管理员进行容量管理
容量管理(Capacity Management)是ITIL服务提供流程中的重要子流程。及时准确的系统流量和负载数据有助于管理员对现有的系统容量和服务能力进行评估,分析和预测用户需求在未来的发展趋势,从而根据这些趋势及时地调整邮件系统的容量。容量管理是一个具有前瞻性和预测性质的工作,这些预测和分析的可靠性,是需要建立在拥有全面和长期的系统运行状况和用户流量数据的基础之上的。
l 进一步提升邮件系统的可靠性和服务级别(SLA)
Exchange有时候像一个顽皮的孩子,稍疏于管教,可能就要出一些状况。邮件系统的运行数据和流量监控软件,就像一个尽职尽责的管家,在系统出现问题之前,及时地向管理员发出警报,从而避免出现系统停机的尴尬情况。
l 有助于企业贯彻落实针对电子邮件方面的规章制度
很多企业从节约系统资源、保护公司机密信息的角度出发,会制定一些针对电子邮件使用的规章制度。例如禁止发送私人邮件、禁止内部转发垃圾邮件和连锁邮件(chain mail),不允许员工发送含有特定内容的邮件等等。在通过技术手段进行限制时,IT部门往往也会使用流量分析软件找到一些“漏网之鱼”,在特殊性况下,流量记录分析系统还能够为发现和识别某些商业间谍行为提供强有力的证据。随着SOX法案的实施和推广,企业在信息安全和使用记录追踪方面会对IT提出越来越严格的要求。
l 有助于全面准确地衡量邮件系统的TCO和ROI。
一个系统的总体拥有成本(Total Cost of Ownership, TCO)和投资回报率(Return of Investment, ROI)是企业CIO最关注的两个指标。而这两个指标往往是最难准确评估和量化的。拥有一套邮件系统日常使用情况的监控软件,将帮助IT部门从实际的数据中总结出针对“每封邮件”或者“每个用户”的实际开销,结合企业日常业务特点和运营成本,将会比较精确的计算出TCO和ROI。
总而言之,一套能够全面地监控邮件系统使用情况的软件,将极大地提高管理员的工作效率,清晰的反映出系统运行的每一个细节,能够在提高系统性能、可靠性和用户满意度的同时,为衡量TCO和及时的预测未来发展趋势作出贡献。每一个规范化运行的邮件系统,都应该配备一个这样的“管家”。
介绍一个能干的好管家:Quest MessageStats
前面我们花了不少篇幅讨论进行邮件系统使用情况监控的重要性,行胜于言,接下来,我将介绍一个我喜爱的工具,Quest公司针对Exchange系统量身定做的一套“管家”程序——MessageStats。[编者注:这个产品获得了本刊2005年的编辑选择奖。]
MessageStats(图1)是一套基于Web界面的邮件系统流量监控和报表软件,顾名思义,该软件的目标就是向管理员提供Exchange系统中各个动态和静态指标的状态。MessageStats由作为微软金牌软件开发商的美国Quest公司出品,它随Exchange同步更新,目前已经发布到5.7版,是在跨国企业的大型邮件系统中被广泛采用的管理和监控平台。作为一款优秀的Exchange Server外围辅助软件,它为管理员打开了一个了解系统宏观运行情况和每个具体对象运行参数的窗口,是Exchange管理员的得力助手,一个名符其实的“大管家”。
图1:MessageStats的界面
MessageStats可以全面地掌控整个邮件系统的情况,但是它的部署和安装却非常的简单。它由信息收集器(Gathers)、存储器(Stores)和报表生成器(Reports)组成(图2)。MessageStats可以被安装在IIS服务器上,它可以采用SQL Server或者MSDE作为数据库的存储平台,并使用ASP页面来生成报表。值得一提的是,不同于其他的系统监控软件,MessageStats不需要在被监控的Exchange Server上安装任何客户端或者Agent程序,这样极大地降低了部署的成本和周期,事实上使用MessageStats进行监控和报表对Exchange生产服务器几乎有任何的影响。(真是一个默默无闻、任劳任怨的好管家阿)。
MessageStats的工作原理其实并不神秘,它主要是读取Exchange服务器上的Message Tracking Log文件(关于Exchange Server的Message Tracking功能请参考微软知识库文章
http://support.microsoft.com/kb/246856)和其他的日志文件,并将这些日志导入到SQL Server的数据库中,供Report程序进一步的处理。Message Tracking日志中包含了服务器邮件收发的完整记录,通过对这些文件内容进行处理和分析,可以得出整个组织中邮件系统的运行状态。
图2:MessageStats的系统架构和工作原理
MessageStats通过灵活的Web页面提供了多种丰富的报表。既有供管理层察看的比较直观易懂的非技术图表(如图3),也有供技术人员进行详细分析的完整技术参数报表(如图4)。
实用的报表
在笔者日常的邮件系统管理工作中,MessageStats也是最重要的工具之一,在它众多的功能中,笔者特别推荐下面几个非常有用的报表。
1. Storage Reports
这个报表系列提供了Exchange服务器每个磁盘和其中Exchange邮件数据库文件的容量信息,同时提供了每个数据库中邮箱的数量和占用空间比例。在大型邮件系统(50台以上的邮件服务器环境)中,统计和汇总每台服务器的存储情况是非常消耗时间的“体力劳动”,一旦统计失误或者遗漏,可能导致磁盘空间紧张的问题没有及时被管理员发现,造成潜在的隐患。使用MessageStats的Storage Reports,整个邮件组织的存储和数据库情况一目了然,并且能够将结果导出到Excel文件中进行进一步的处理和筛选。
2. Mailboxes Reports
这个也是最常用的报表系列之一,它通过8个子报表全面的反映了用户邮箱的使用情况,这些报表包括:邮箱尺寸和配额、收发信数量排行榜(对,我们就是用这个报表找出频繁发送垃圾邮件的内部用户J)、发往Internet的邮件汇总报表、一段时间内每个邮箱进出邮件数量汇总报表、邮箱使用频繁程度报表、邮箱审计报表、邮件尺寸汇总报表、邮箱安全设置报表。这8个报表,几乎可以满足各种针对邮箱和邮件的追踪、监控和分析需求。
3. Distribution Lists Reports
在邮件系统中,邮件分发列表(Distribution List)是同用户一样重要的系统对象,组织中往往会存在大量的分发列表。(尤其是使用了AutoGroup程序的企业,由于普通用户可以直接创建,DL的数量更是泛滥成灾,)MessageStats的DL Reports可以有效地监控DL的使用情况,它能够提供非活动的DL列表、对DL访问的情况、最频繁被访问的DL列表等有效的数据报表,从而帮助管理员有效的控制DL的使用情况。
4. Internet Reports
Internet Reports系列报表记录了外发邮件的域名和邮件尺寸信息,能够从中获取公司邮件系统最频繁通信的外部域名清单,这有助于管理员规划和部署反垃圾邮件系统和进行外部邮件发送的审计。
举例来说,为了了解系统中用户收发邮件的数量,我们可以使用MessageState中的Mailbox Activity报表。如图5,MessageState可以根据时间、详细程度、和显示方式生成不同格式的报表,管理员也可以通过指定报表范围来进一步细化数据的内容。可以通过设置查询条件获取每服务器、每个路由组、每个部门或者指定OU的用户邮件收发情况。
图5:Mailbox Activity报表生成界面
当Mailbox Activity报表生成后(如图6),管理员可以通过图形界面非常直观的了解每个用户的邮件发送和接收数量。这个报表非常的详细,包括了用户邮件收发的尺寸和数量,并能够将原始数据导出成Excel格式进行性进一步分分析和筛选。
图6:Mailbox Activity报表的内容
作者简介
喻勇,PMP/ITIL/MCSE/CCNP,某跨国IT咨询服务公司资深邮件系统顾问,微软TechNet特约讲师。有丰富的大型邮件系统设计、部署、管理、迁移和运营经验,对项目管理、IT服务管理和关键业务系统的运营管理亦有深入和独到的见解。他的电子邮件信箱是yy@yuyong.net,读者可以在他的网站www.yuyong.net下载Exchange相关的课程讲义。