一个好的网站,除提供的内容吸引访问者以外,访问速度和稳定性亦是非常重要的,这当然与网站规划与设计、软硬件配置有关系。网站规划方面,在《中无通讯》第29期有过专题论述。对电子爱好者或DIY一族来说,或许大家对怎样使服务器更稳定地运行更感兴趣。
高档服务器稳定度达99.99%,平均一年内的当机时间不超过53分钟,而低档服务器的稳定度仅为90%,平均当机时间则高达876小时以上。要想做到百分百不当机是不可能的,但可以深入分析影响服务器稳定的关键所在,采用针对性的方法来有效提高其稳定性,使当机时间尽可能缩短。笔者创办世界网络(www.linkwan.com)和大中华印艺网(www.cgan.net),在香港和内地安装使用多台服务器,对此有深刻体会。
就笔者的经验而言,影响服务器稳定与安全之因素主要有服务器的电源供应、散热系统、服务器主板选择、软件运用等,服务器的稳定性提高也是根据实测结果进行不断改进的过程。在此总结一些服务器电源和散热、主板选用等方面的经验,供大家参考。
一、 电源供应器
各位电子爱好者都知道,电源对于电子系统来说是何等的重要。电源质量的优劣直接影响到系统的稳定和硬件的寿命,并不是简单地将220V交流变换成服务器所需低压直流这么简单。服务器电源必须能应付各种苛刻的工作环境,同时还要求常年不间断地工作。随着CPU的速度提升,硬盘容量和转速等越来越大、越快,功耗就随之升高,对电源的要求就更高了。
服务器与日常用计算机不同,通常支持多个CPU,使用多个SCSI硬盘,RAM容量一般超过2G,其功耗相对大得多就不足为奇了。比如Intel P4 3.2G CPU功耗达82W,SCSI硬盘功耗也在10W以上,加上主板和其它配件的功耗,一般的PC电源仅200W左右的功率是应付不来的。对1U机箱服务器来说,电源功率一般应达到300W,2U应达到350W,以保证供电功率足够。
实践经验告诉我们,电源功率不足或过热,是服务器经常自动重启(Reboot)的一个重要原因。其实也很容易理解,当您的CPU负荷增加、硬盘突然读写大量数据时,因负载变化造成电源电压波动是在所难免的。高品质的电源在设计时充分考虑到这些因素,出问题的可能性就少得多了。
熟悉电子制造的朋友们都知道,名牌大厂的产品设计和制造工艺对产品品质来说比较有保证。笔者使用和实测过Sirtec International Co.,Ltd生产的400W服务器电源,型号为PUA-40060-PB1。该型号内部结构设计良好,用料比较考究,有短路和过载、输入过压等保护功能,安规方面符合国际UL标准,且在摄氏40度环境下,经过4小时满载老化测试合格后才出厂。在环境温度为25度、带75%负载条件下,其MTBF(平均无故障时间)达10万小时以上。
图一:PUA-40060-PB1电源内部结构
二、 散热
服务器硬件一般放在1U、2U机箱内配合机架统一使用,在狭小的空间里有大量的硬件高速运行,且服务器一般要求24小时不间断工作,散发的热量非常大。那么,怎样才能有效降低服务器内部温度呢?
首先,服务器机箱材质就很重要。首选全铝质或者铝合金,次选铁板。颜色应漆成黑色,以利于散热。CPU散热器宜采用全铜及直接整体切割而成的,为达到最佳效果,须配合品质好的散热膏并正确地使用。
其次,风扇的选择也很重要。CPU是服务器的核心,也是“热心”(发热的中心)。Intel P4 CPU温度75℃ 及AMD CPU温度86℃是工作温度极限,高温时CPU会自动将降低工作效率。要降低CPU的温度,首先是增加传导面积,用优质的散热器,并尽量增加表面积;其次就是要降低周围环境温度;还有就是加大其周围空气对流,风扇就派用场了。
散热风扇的选用也是一门学问。高风量(CFM)散热风扇可有效降低服务器内部温度。散热风扇一般分滚珠轴承、油封轴承两种。滚珠轴承较为耐用,虽噪声略高,但服务器一般在机房中工作,通常采用无人看守远程监控,所以噪声略大也可接受。可从风扇上标明的A(电流)和W(功率)来初步判断风量,数字越大一般风量也越大。建议大家选择Delta、Sunon、Nidec、Sanyo、Y.S.Tech等名牌。近期Sanyo推出1.5万转4cm电流0.55A风量20.83CFM及24.71CFM的超强力风扇,是1U服务器散热较佳配搭。
图二:Sanyo两种超强力风扇
电源本身是服务器中一大热源。如Sirtec产的PUA-40060-PB1电源,自带2个风扇,使其工作温度不会太高。笔者试将Nidec风量15.53CFM的风扇换成Sanyo风量20.83CFM的风扇,电源温度明显降低2-3度。
对于服务器机箱散热风扇,选用风量大的风扇,效果更佳。笔者将1U机箱内原8个散热风扇更换成Sanyo 0.55A/20/83CFM风扇后,实测机箱温度由原来的33-35度,降低至26-31度,CPU温度由原来的49-57度降低到45-51度。有兴趣的读者可试一试。
最后,要合理设计风道。在安装好硬件后把机箱内的cable、电线整齐地扎好(如应用蛇皮网配合热缩套管能使机箱内部的布线更加有条理),以保证机箱内气流流通无阻。俗语云:“磨刀不误砍柴工”。要想服务器稳定工作,在这方面花点时间是值得的。
三、 主板
主板犹如人的骨架,承载着CPU、内存等重要组件的运行。如果服务器电源质量可靠,容量充足;机箱内散热良好,但仍偶尔会莫名其妙的当机,问题可能出自主板。有些主板在当机后,因有自我保护功能,必须关掉电源后再开机;更有甚者,必须清除CMOS中的记忆,才可重启。这对服务器的远程维护与管理造成严重障碍,所以选择优质的主板显得格外重要。
INTEL主板是少数通过WHQL微软WINDOWS操作系统硬件质量认证的产品,稳定性和兼容性经受考验。在性能方面,INTEL原厂服务器主板配合自己的处理器,表现优异也就不奇怪了。虽然INTEL有为稳定性而牺牲性能的传统,但服务器首要的还是追求稳定,因此推荐大家采用INTEL主板。
图三:Intel D865GBF主板
笔者的世界网络(www.linkwan.com),网页服务器选用的就是Intel D865GBF,数字库服务器选用Intel S875WP1-E主板。该网站提供速度测试、路由追踪等功能,服务两岸四地,日访问量超过10多万,多种程序和大型数据库运行2年多,未发现稳定性方面的问题。
图四: 香港 Newsbook Limited 1U 服务器柜一览
经过以上的介绍,您是否对服务器的稳定性有了更进一步的认识呢?有兴趣的可电邮至Versalam@netvigator.com,欢迎大家一起交流。笔者在测试服务器电源、风扇和机箱散热过程中,得到香港 Newsbook Limited www.newsbook.net 借出1U机箱及提供技术协助及SANYO厂香港总代理美高贸易有限公司协助供应两种新型强力风扇,在此特别致谢。
上期笔者就影响服务器稳定与安全之因素进行了探讨,主要介绍了服务器的电源供应、散热系统、主板选择。本期主要介绍一些CPU最新发展和选用服务器CPU的经验供大家参考。
一、主频不再作为CPU性能的衡量标准
众所周知CPU是服务器的心脏,一台服务器所使用的CPU基本决定其性能和档次。曾几何时我们以CPU主频(核心时脉频率)判断CPU性能的高低,Intel的CPU也以高主频策略占据了更多的市场。多年以来,Intel一直恪守着“摩尔定律”主频决定一切的原则,从MHz到GHz,工程师们最关注的就只有一件事:如何提高CPU的工作频率。
随着CPU科技的不断发展,主频已经发展到近4GHz,晶圆制程也从180纳米、130纳米、逐步转到90纳米甚至65纳米。随着主频的提升,制程的缩小,CPU发热问题也越来越突出。近期Intel放弃了开发更高主频率的CPU,转向发展双核心甚至多核心CPU,主要是大功耗电晶体所带来的散热问题未能解决,所以4GHz Pentium(P4) CPU尙未推出市场。
Intel Pentium 4 处理器
二、散热问题成主频提升瓶颈
CPU是服务器的核心,也是“热心”(发热的中心),高温时CPU会自动将工作效率降低,所以CPU的温度对于其性能至关重要。
然而解决CPU的散热问题谈何容易!试想当年的Pentium MMX 200MHz,用的只是一个小风扇。而现在的发烧友都在使用水冷、干冰制冷、甚至有些超频发烧友在使用液氮制冷,可见CPU的发热量增长是多么的大。
Prescott核心CPU的发热量走势图
随 着集成的电晶体增多,CPU的功耗和发热量都增加了。按过去的经验,通过采用新的制造工艺,可以将功耗降下来:比如从180纳米过渡到130纳米之后,Tualatin核心比Coppermine核心的功耗有了明显的下降。但130纳米到90纳米,功耗递减的规律失效了。例如旧型130纳米P 4 3.2GC Northwood 才82W,新型90纳米P4 3.2GE Prescott功耗值达到103W。
制程的缩小会减少CPU核心所占用的面积,但其他相关部件就可能会增大,而且这种减小与增大幷不是一个线性的关系。减小面积也需要降低晶片的工作电压,例如,130纳米的Hammer处理器其工作电压为1.5V,90纳米的Hammer需要在1.4V下工作,而90纳米的Prescott则只能在1.2V的电压下正常工作。一颗晶片的功耗由电路工作中产生的动态功耗以及由漏出电流造成的静态功耗构成。电压的降低意味着晶片的电晶体动态损耗会降低,但是减小面积的同时暂态泄漏电流就会增大,而且随着电晶体面积的减小,这个漏电电流会以几何级数增长。在以前的制造工艺中,漏电电流几乎可以忽略,比如在0.25纳米制程的晶片中,你几乎无法检测到漏电流的存在,但是到了90纳米时代,晶片的线宽缩小,电晶体的栅极变得越来越薄,漏出电流越来越大,所以漏电所造成的影响就已经成为电能消耗的首要因素,而同时也正是由此引发了发热过巨的大问题。
制程的缩小使得CPU核心可容纳更多的电晶体,所以Intel在提升主频的同时也增加了L2缓存(Cache)数以提升整体性能。CPU的电晶体数目骤增导致了其总功耗的增长,这是CPU发热增长的第二个原因。Prescott的核心面积比Northwood小了25平方毫米,却比后者多容纳了7000万个电晶体!多出的7000万个电晶体工作时释放的热量可想而知。4GHz的Pentium4处理器,虽然主频是顶级,但是功耗却一定不低,据说满负荷工作会达到200W!我想这才是Intel放弃4GHz处理器发布计划的原因吧。
三、双核心架构及增加缓存成新宠
Intel将CPU的架构从单核心发展到双核心,主要是因为目前CPU运算核心发展已达极致,而依靠增加主频方式导致CPU发热量大增,性能却不见得同步成长。现在各个厂商都把提升CPU性能的希望寄托了在双核心甚至是多核心上,增加缓存(Cache)也是办法之一。
谈到双核心处理器,相信不少朋友会问:双核心技术与超线程(Hyper-Threading)有何不同呢?毕竟以前Intel的P4利用超线程技术已经实现了“双核”的功用。从原理上来说,超线程技术可以让单CPU拥有处理多线程的能力,而物理上只使用一个处理器,但作业系统等软体将其识别为两个逻辑处理器。虽然支援超线程的P4能同时执行两个线程,但在执行多线程时两个逻辑处理器均只能交替工作,因此,超线程技术所带来的性能提升远不能等同于两个相同主频处理器带来的性能提升。如果要让处理器资源真正实现幷行处理模式,还需要处理器引入物理双内核设计!在作业系统看来,它是实实在在的双处理器,可以同时执行多项任务。理论上说,双核心处理器的性能几乎比单核心处理器高50%—70%。而且增加硬体核心幷不需要增加太多晶体管,也可通过削减二级缓存的容量以保持适当的电晶体规模,因此也不会带来过多的功耗负担。
双核心CPU内部结构
增加缓存也是近年来提升CPU效能的主要办法,但这样做会否增加CPU的功耗?研究发现,提高主频带来的功耗增加是以平方计算的,相比之下,增加缓存只会增加少许电压,如由1.4V提升到1.45V,电压的增加以倍数计算,容易控制。
事实上在面临散热等问题瓶颈后,Intel已逐渐加大缓存容量以增加性能。不但P4处理器L2缓存由Northwood核心的512KB提升到Prescott核心的1MB后,又推出搭配2MB版本的6系列P4,平价处理器Celeron在导入Prescott核心后,L2缓存也从原本128KB加大到256KB。Intel新近推出处理器的顶级产品P4至尊版(P4EE,P4 Extreme Editon)3.46GHz主频、1066MHz 外频,更在其中加入了2MB L3 Cache。这种以前只是在XEON处理器上拥有的技术现在也已经走入平民化玩家层次,对于一般的服务器应用应有不少帮助。过去无论是Intel还是AMD都只是把Cache缓存的重点放在了L2 Cache上,容量一再进行提升。为了凸显P4 EE的与众不同,Intel赋予它多达2MB的三级缓存,加上512KB的二级缓存,P4 EE的缓存多达2.5MB,但L3 Cache到底有什么作用? 从处理器的工作原理来看,容量较小的L2缓存在纯数学运算中是肯定要快于容量较大的L3缓存的,而L3 Cache又远大于实体记忆体的资料交换速度。我们要注意Intel在P4 EE上的L3 Cache不仅仅是容量上单纯的提升,重要的是它的运行速度是和CPU外频一样的,最大程度的保证了CPU工作时和记忆体之间的资料交换速度,保证了单周期内和二级缓存之间的延时一致的,在资料的不断调用过程中幷不会因为延时的问题造成不必要的等待和性能损耗。
四、外频提升功耗不会显著增加
CPU性能的发挥,不单要看CPU主频及Cache大小,外频的影响也很关键,因为关系到CPU与RAM、显卡等设备交换资料的速度。例如: Intel最近推出P4 3.46GHz 主频(内频)、1066MHz外频的CPU,CPU实际执行频率(内频)3.46GHz =FSB 266.7MHz ×13倍频系数,外频1066MHz = FSB 266.7MHz ×4倍速度运作。提供8.5GB/s的频宽,可充分发挥Dual DDR2 533高频宽的优势,支持新一代的PCI-Express×16图像埠(其8GB/s频宽已经超出800MHz外频的极限)。
虽然外频是如此重要,但要增加外频却比内频困难。Pentium处理器刚推出时,内外频都为66MHz,而现在P4内频 3.6GHz外频只有800MHz,可见CPU内频提升了54倍,外频只提升了12倍。外频提升困难主要是因为牵涉太多的设备,不像内频提升只考虑CPU内部的设计为主,且随着高外频出现的EMI(电磁干扰)问题,比较难以解决。Intel与AMD推出Differential Bus Clocking,取代Single End Clocking,令工作频宽更易提升。此外,AMD更引入DDR技术,其后Intel更有QDR技术,令外频在FSB 100MHz的时脉下,产生400MHz的资料传输效果。
传统外频除了难以提升频率外,在读写效率方面亦然。现在的外频在读写资料时是单向的,而新一代的周边系统如PCI-Express显示卡已经提供同时上传、下载功能,所以AMD采用扩充性高的HyperTransport技术优化外频,令CPU对外频宽大大提升,在执行效率方面也比传统外频先进,可同时进行读取和写入工作,期间不用进行切换。Intel采用PCI-Express,亦可实现先进的双向传输功能,达到16GB/s以上的频宽,满足CPU对外频的要求。
外频的增加会否增加功耗呢?从800MHz到1066MHz外频,Intel的P4 EE CPU功耗增加十分轻微。P4 EE 3.46GHz的功耗为110.7W,比P4 EE 3.4GHz的109.6W轻微增加1.1W,现在明白为何Intel刚放弃了4GHz主频而能马上推出更高外频的CPU了。
五、向65纳米制程迈进
目前Intel要确保其双核心计划能顺利实施有一个至关重要的前提——采用更先进的生产技术。多核心尽管带来了更为强大的性能,但是也同样加大了功耗。目前部分主流CPU已经使用90纳米工艺制程,但正如上文所述,功耗过高的问题未能解决,所以正加紧开发新的工艺制程,功耗过高的问题会渐渐改善。CPU的性能完全依赖于其内核晶片的电路结构,更高的性能意味着电路更加复杂精密。但如果工艺制程不改进,电晶体数量增加到8倍后,体积和功耗也增加到8倍(发热量也增到8倍),而可供散热的表面积仅增加到4倍。所以在不改变工艺制程的情况下单纯增加电晶体的数量是不可取的。Intel 65纳米工艺在单元尺寸不变的情况下,集成电晶体数目却超过了5亿个,其中1平方毫米大小的晶片上电晶体数目已经达到1000万个!决定CPU价格的主要因素是晶片的尺寸,技术的进步带来了性能的提升,但成本却可能更低。
Pentium4处理器的核心显微照片
在 开发65纳米工艺制程过程中,Intel最重视的一点就是在提高工作速度的同时降低泄漏电流以解决散热问题。为此,Intel在制造技术和电路技术方面均采取了降低泄漏电流的措施。在制造技术方面,通过采用90纳米工艺开始引进的“应变硅”核心技术而得以改善。具体而言,nMOS电晶体外形成了一层Si3N4膜,pMOS电晶体则在源极和漏极中采用了SiGe材料。由此就给电晶体沟道部分施加了拉伸应力,从而就能提高载流子的迁移率。结果,作为65纳米工艺,与不使用应变硅相比,可将工作速度提高约30%。另外,与90纳米工艺相比,65纳米工艺电晶体在工作速度相同的条件下,能够将泄漏电流减少到原来的1/4左右。 在电路技术方面,配置了一个用来切断泄漏电流流向缓存(SRAM)的开关。通过在SRAM元件与接地线之间插入nMOS开关电容器,切断空闲SRAM元件的电源。由此可将SRAM的泄漏电流降低到原来的1/3左右。
六、近期服务器CPU的选择建议
基于散热问题以及即将在2005年上市的双核心处理器进程影响,Intel已于近日正式宣布放弃4GHz Pentium(P4)处理器上市计划,并在11月1日已推出P4 EE 3.46GHz 主频,采用1066MHz外频、130纳米、内建2MB L3,而90纳米、2MB L2的Intel P4 EE则预计在2005年1季度推出。
随着制程技术的进一步提升,以双核心甚至多核心及加大L2/L3、外频及64bit来提高CPU性能,正成为当前服务器CPU发展趋势。目前准备更新服务器CPU的朋友,笔者建议仍采用价格适中的旧型130纳米P 4 3.2GC Northwood,待2005年下半年双核心65纳米制程推出如热量问题得到解决,2006年才是采用新CPU更新服务器的时候。
上期笔者主要介绍一些CPU技术的最新发展和选用服务器CPU的经验,如主频、散热、双核心、外频、功耗等等。作为服务器DIY一族,我们不仅要增进相关技术的了解,还要关注各主流CPU厂商的最新发展,在合适的时机选购性价比高的产品。
一、服务器进入DIY时代
随着互联网IT业的飞速发展,越来越多的中小企业甚至是个人用户都涉足到服务器这个熟悉而又新鲜的产品。一直以来,服务器在人们的心目中都觉得是属于专业应用的产品,是高深莫测和高端的,事实上是不是这样的呢?DO IT YOURSELF 做了就知道!
其实在外国,DIY服务器已经是司空见惯的事情了。在美国DIY服务器占市场总出货量40%。品牌服务器的高成本和缺乏灵活性的配置让大家望而却步,随着服务器技术走向普及,DIY服务器凭借可灵活采用最高性价比配
件且稳定性好,己为大众接受。
如果你所需的是一台入门级服务器,用来架设办公室局域网,做文件存储、电子邮件,或者作为一般网站、简单数字库等用途,选择单颗P4或者P4E(Prescott)CPU就足够了,搭配865/875/E7525的芯片组,挑一块能集成显卡和网卡的主板,这类配置主要考虑的尽量追求高性价比和配件能安装在1U 机架式机箱内及良好散热就行。
对于工作站的服务器,需要比较高的性能和稳定性,可考虑采用双路Nocona / Irwindale Xeon(新/最新至强)CPU,主板可选用Intel、Tyan、华硕、超微(主板芯片组决定品质) ,内存选用Corsair、Kingston、三星(分普通/ECC/RECC DDR内存) ,SATA/SCSI硬盘采用 WD、Maxtor、Seagate,电源采用Sirtec、台达等配件组装起来的,在硬件上丝毫不逊于品牌机,却在性价比方面占据绝对优势。
二、PC服务器CPU受青睐
大家都知道如IBM、HP、SUN等巨头以前对于PC服务器的表现是不屑一顾的,认为采用Intel和AMD处理器的PC服务器是低档廉价产品。自Intel成功推出性能极高的P4、Xeon和64位Itanium处理器,AMD也成功推出令业界震惊的64位Opteron处理器后,得到了广大中小企业用户的认可。最近IBM和HP争相锁定还未正式发布的AMD双核心Opteron处理器。
其实Intel Nocona Xeon和AMD Opteron处理器都是64位处理器,IBM、HP等巨头为何看好双核Opteron而不选用Intel Xeon呢?
作为全球第一款兼容x86架构的32位和64位处理器,AMD Opteron处理器建立在采用直连架构的AMD64技术的基础之上。直连架构通过将处理器、内存控制器和I/O直接连接到中央处理器,消除前端总线固有的瓶颈,从而提高系统的总体性能和效率。
随后Intel宣布了Nocona处理器(带有EM64T的新至强),其外频(FSB ×倍频系数)提升到800MHz,支持32和64位应用的EM64T内存扩展技术。同时发布的芯片组E7520/7320,定位于服务器市场。 Nocona新至强具有更大的二级缓存,更高的主频,更重要的是具有了64位处理能力,通过搭配支持流行的PCI Express和DDR2内存技术的E7525芯片组,新“Nocona”Xeon确实有了很大的进步。
在许多基于Nocona和Opteron处理器的比拼测试中,AMD的Opteron处理器在不少项目均能挫败Nocona Xeon,但在某些经过对超线程技术做了特殊优化的程序中,Nocona的表现超过Opteron。因为Nocona处理器推出时间远晚于Opteron处理器,现有主流64位操作系统并没有对Nocona处理器进行优化,而Opteron处理器己进行了优化,所以目前的64位操作系统中,Nocona处理器并未真正发挥其优越性。Nocona处理器发热量太高可能也是IBM、HP等巨头暂时看好双核Opteron的原因吧。
AMD也发布型号为152、252、852低耗电的Opteron处理器,支持1GHz hypertransport,90纳米制程及Power Now! 降低功耗技术。在手提电脑处理器市场也推出了对抗Turion技术,使Intel霸主地位也遭遇到威胁。
Intel公司最近公布了其代码为Intel Xeon MP的Potomac CPU,而且拥有8MB L3 高速缓存和1MB L2 高速缓存,主打4P与8P等级企业用服务器高阶市场。
HT(上)与Dual Core比较,可见Dual Core更有效率
三、双核心时代来临
双核心取自双自强CPU系统的概念,其实是双CPU技术的缩影。因双核心芯片技术甚至多核心芯片技术可以大大提高处理器性能,目前处理器的厂商Intel和AMD都在调整自己的双核心处理器的市场战略,会在2005年中推出各自的双核心、多核心处理器。
Intel 第二季度会提供双核心64位Smithfield的处理器,主要面向桌面电脑市场,Smithfiel主频率3.660GHz起,可惜这些产品的功耗大约为130瓦,所以要支持新CPU除了芯片组要支持以外,还需要主板的电源供应设计能够与处理器搭配。
Smithfield双核心处理器将会采用90纳米的设计工艺,L2 2M,800MHz外频兼容现有915晶片组。其每一个处理单元会采用目前的P4 “Prescott”芯片一样架构,不过这新的中央处理单元将具备仲裁逻辑功能,该功能会让两个处理器核心的总线传输得到平衡。Smithfield将支持EM64T、Virtualization、XD和加强的Intel SpeedStep技术,性能得到较大提升,但仍然是过渡期产品,等待Intel 65纳米制程的手提电脑双核心Pentium M(Yonah)、P4的双核心Presler、双核心Xeon和XeonMP推出。这些双核心处理器才会是未来主流。
AMD双核心Opteron主频1.6/1.8/2.0GHz起,90纳米制程,2M L2 高速缓存,1GHz HT,估计也会在第二季度推出。
对于双核心CPU,Intel认为AMD的设计采用单核芯片上集成内存控制器的方式,并且使用混合传输方式,这将产生问题。因为AMD使用的不是共享式缓存而是单独的内存缓存。 而Intel将开发出提供更高性能并且不会局限于某一代内存的共享式缓存架构,如内存架构改变时,无需更改 CPU。Intel在其产品规划中早已经包括多核心及双核心产品了。
2005年是双核心的开始,Intel激进地将2006年双核心处理器的市场份额计划都提高到70%以上。双核心的出现虽然是处理器市场的一次突破,但是软件编写者还需要时间掌握这类功能强大的处理器。在现有的单线程软件下测试双核心处理器,它的优势尚未发挥。
2005年将是双/多核心处理器架构发展史重要里程碑。
四、缓存决定一切
上期笔者提到Intel的“频率就是性能”的市场战术遇到前所未有的困难,取消了4GHz P4的发布计划。但显然Intel不会因开发不出更高主频的CPU而放弃市场的,他们又开始实行 “Cache is king(缓存决定一切)”的战略,其新曝光的处理器缓存越来越大。
在服务器的环境中,CPU主频不一定决定服务器主要的性能,例如由于服务器某些软件对高速缓存严重依赖,Intel公司的Xeon MP的 3.0GHz主频,采用4MB L3高速缓存能够带来更好的性能。
但是根据Intel的公开资料,Potomac处理器的Cache比目前还要大!达到了8M!其性能快约16.7%。增加缓存的代价是巨大的,不但增加了成本,降低了良品率、成品发热量都是问题,目前Intel的CPU发热量确比AMD 大。
五、服务器需要协调发展
服务器作为网络环境中的一台电脑,它需要侦听网络上其他电脑(客户机)提交的服务请求,并以此为依据提供相应的服务;服务器必须具有承担服务并保障服务质量的能力。因此DIY服务器的原则将围绕这个应用核心进行。
在DIY服务器架设过程中,不要过分注重某些部件的性能,否则容易忽视系统整体性能各方面的平衡。例如:只追求处理器频率的提升,往往忽视与之相对应的前端总线(外频)的速率以及内存的频率的提升。这样会导致系统瓶颈的产生:处理器的计算能力虽然非常出色,但是由于它与内存之间的通信渠道受前端总线频率的限制,使得服务器系统的性能无法发挥到最大。
如何平衡并提升系统各部件的性能,消除系统瓶颈,将系统的整体性能发挥到最大?提升性能有几种方式:提升处理器的主频、修改处理器架构以扩展内存寻址能力(EM64T技术)、在处理器内部集成更大的高速缓存等。此外,利用Nocona处理器所具备的DBS(按需切换技术),可以根据系统使用率的变化动态调整处理器主频和电压,以达到降低处理器平均功耗的目的。由于主频的提升、缓存的增大、前端总线频率的提高,新一代Nocona处理器的性能比前一代提高了30%。Intel最新发布了升级版64位至强Irwindale处理器。其带有增强的2M二级高速缓存,与上代Nocona版本相比,可实现18%的性能提升。
六、DIY服务器CPU的选择
DIY一台服务器,选择一颗满意的“芯”尤其重要。Intel的服务器CPU占服务器处理器市场主流,产品线非常长从Itanium(安腾)系列、Xeon(至强)系列到P4,涵盖了高中低档应用需求。尽管AMD最近推出的CPU得到HP、IBM等服务器巨头的青睐,但考虑到其他配件的搭配和技术的成熟度,Intel系列的CPU仍是DIY服务器的较佳选择。目前的主流应用是32位,从性价比来说,笔者认为目前Intel的Prescott/Northwoo处理器都是DIY服务器的首选CPU(但旧型130纳米P 4 3.2GC Northwoo快停产)。Prescott使用90纳米制造工艺,拥有1MB L2缓存和SSE3指令,目前的高端875主板支持单路CPU,它拥有高速的系统总线(外频 800MHz),基于增强型NetBurst架构Enhanced Architecture,采用了甚长管道技术,这样做可以使得频率提升更加容易。Prescott 90纳米的制造工艺能减少核心尺寸,容纳更大的缓存。L1 数据缓存的容量由8KB提升到了16KB, L2缓存的容量提升到了1MB,与CPU核心连接的总线宽度为256bit。3.4GHz Prescott的缓存带宽达到了108GB/S。最新推出的Prescott核心 P4 XE 3.73Ghz,L2更增大到2MB。与AMD提升缓存不同,Prescott的缓存容量提升与其频率的增长同步。Prescott的另外一个亮点是改进的Hyper-threading技术,有效地提升多线程的实际执行效率。
对于DIY服务器来说,Intel将推出的支持64位和超线程(HT)技术的 6xx系列P4新产品也是不错的选择,L2缓存加大到2MB,采用EM64T技术,发热量也因EIST、C1E与TM2省电技术大为降低。
第一季内推出P4 660(3.8GHz)供应市场,Intel也推出600系列的低频版本,如600,620和640供应零售市场。
EIST 运作
TM2 操作实例
七、P4和单双至强之争
服务器采用单P4 CPU作数字库时,如CPU经常出现占用率90%以上时就要考虑转用至强CPU了。
近一年多来旧至强处理器几乎没有变化,外频停留在400、533MHz、其性能差过P4,只在缓存上有一定优势而己。最近采用90纳米工艺的新至强 Nocona外频上升到800MHz、 L2缓存 1M,比旧至强性能高达35%,但是, 90纳米的工艺并没有给新至强带来凉爽,反到因为频率的提升(由2.8至3.6GHz),功耗首次冲破100W,散热也成为新至强处理器特别迫切的问题,在1U狭小的空间中解决这一难题困难重重。由于新至强处理器功耗比前代产品上升了45%,虽然引入了在手提电脑处理器上广泛使用的SpeedStep技术来调整功耗,但服务器是持续运行,要如何彻底解决新至强新一代服务器的散热 ,确是需要费一翻工夫的。
采用90纳米工艺的新至强 Nocona外频上升到800MHz、支持64位扩展计算,是其PC服务器产品线历史上最大的动作。外频的提升让新至强的总线带宽提升了一大截,而且还将32位总线扩展到64位,通过与即将发布的Windows* x64版相配合,实际的性能提升恐怕不能用一个数量级来形容了。
兼容前代至强处理器,继续通过DBS提供节能特性,并通过支持DDR2-400内存和PCI Express来提供增强的性能和灵活性。正如前面提到的,服务器整体性能的提升需要均衡发展。尽管新至强带来一些提升,但单路至强与新的P4相比,性能没提高多少。因此专业服务器厂家一直比较注重2、4、8路服务器的发展。双新至强与单个不支持HT的P4的对比起来差异就很大了。如在P4服务器上运行一个中型的商务信息网站,CPU经常都是使用率50%以上的,改为双新至强服务器,CPU使用率就降至10%以下。一般数字库程序应用在双新自强CPU平台环境会运行更快,加上双新自强CPU能比单P4 CPU整体性能有30-35%提升,由于双CPU支持“ 多线程” 能大大提 高CPU 的使用率。单CPU一次只能执行一个线程,双CPU在执行多线程数字库程序运行的速度要比单CPU的系统快上50-70% 。
对于访问量大的网站服务器,CPU性能对IIS 服务同时在线访问人数限制也至关重要。以P4 2.8G CPU 做的Web服务器可支持2000人以上同时在线,其内存最好在512M以上,1G更佳。采用双新至强2.8G CPU的Web服务器,则可支持高达3000~4000人同时在线。
综上所述,如果目前要由P4升级笔者建议应选最新双至强。
期笔者主要介绍了DIY服务器CPU的选择,及双核心等一些CPU技术的最新发展。在随后的一年里,Intel将不断推出服务器CPU的新产品,如 Dempsey(双核心Xeon),Paxville,Tulsa和Montvale(双核心Itanium)。虽然目前部分处理器具体技术参数还未正式明朗,不过双核心设计全面化是必然的了。作为服务器DIY一族,我们要时刻留意CPU发展,内存、硬盘等技术和厂商的最新动向,在合适的时机选购性价比高的产品。
内 存(RAM)
一、 DDR内存工作原理
DRAM内存晶片是PC和服务器中使用的主要存储晶片内存的速度越快,计算机的工作就越流畅。目前PC中使用的内存晶片大多数是DDR(double date rate)内存晶片,数据处理速度为每秒钟266Mbps-400Mbps。
下图所示为DDR 内存的结构和工作流程图。DDR内存能在控制时钟触发沿的上、下沿都能进行数据传输,而普通SDRAM内存只在控制时钟的下降沿进行数据传输,因此在一次控制信号过程中,DDR 内存能进行两次数据交换。这也是它相对同样实际频率的普通内存有双倍带宽的原理。
在普通内存中,存储单元(Cell)的数据容量和内存颗粒的位宽是相等的,通常为4bit、8bit或16bit;而在DDR内存中,Cell的容量是内存晶片位元宽的2倍,这就是常说的两位预取,也称为2-bit Prefetch。到了DDR2则进一步扩大为4-bit Prefetch。
二、DDR2和DDR3
随着CPU和主板晶片组的不断发展,DDR内存所能提供的频率和带宽已经捉襟见肘,比DDR速度更快的DDR2内存正逐步取代DDR成为主流配置。英特尔公司已经宣布其未来的所有晶片组将支援DDR2。
DDR2内存具有高数据速率、低功耗以及高密度特点,它的速度和带宽比DDR 内存高很多,1.8V工作电压也使得它比其上一代产品功耗低50%。
目前普及的DDR2数据传输速率为533Mbps,是DDR 266的两倍。除了在原始带宽方面的一些提高外,它还采用了多项新技术以方便系统设计提高系统的性能和功效。DDR2 4位预取架构,作为外部总线每个时钟从存储器单元阵列读/写的数据量是原来的四倍,而且其工作频率比内部总线频率快四倍。利用DDR2的片上端接(ODT)来简化DQ总线设计,以片外驱动器(OCD)校准,修正不同DRAM供应商之间的工艺差异。前置CAS和附加延迟,简化控制器设计以避免指令总线上的冲突。细间距球栅阵列(FBGA)封装,以减小系统尺寸,增加各模块之间的空气流动空间从而提高了热性能和可靠性。
最近三星研制出1066MHz的DDR 3内存,未来可能代替昂贵的DDR 2内存。DDR 3采用0.08微米制程,而DDR 2则是0.09微米。DDR 3内存将工作在1.5V的电压下,耗电量要小于DDR2内存晶片,且其数据处理速度可达1.06Gbps,内存容量达512Mb。
目前,半导体制造商们已经开始从DDR1转向DDR2了,DDR2已开始逐渐成为主流,价格逐渐走低,到今年第二季度末,其价格很有可能将会和DDR1差不多。 据市场预测,DDR3内存晶片将在2007年将成为普及产品。到2009年DDR3晶片将成占市场份额的2/3以上。
三、内存优劣判断技巧
DDR内存条主要由PCB、内存颗粒等组成。内存条的品牌虽多,不过能够生产内存颗粒的还是那么几家大厂。三星(SAMSUNG)、现代(Hynix)、英飞凌(Infi neon)等等。除内存颗粒外,我们还可以从下面几个方面来判断内存条的优劣:金手指、设计、工艺。
金手指 (插脚):内存的金手指通常有两种制造方法,电镀和化学镀。电镀金手指耐磨度和电气性能较化学镀的金手指好,电镀的薄20微米左右,不过肉眼很难看得出。电镀的金手指在末端会有一个“小辫子”(这是生产工艺造成,电镀必须要各金手指是导通的,电镀完后再分板将导通线切断)。
设计:根据JEDEC规范,DDR400内存条PCB应为6层,其中第2层为接地层,第5层为电源层,其余4层均为信号层。采用6层PCB板,有4层可以走信号线,表面布线比较宽松(同层布线),大面积覆铜设计,能降低EMI(电磁干扰)。不过为了控制成本,一些厂商通常采用折衷的办法,采用四层板,然后使用单面;或者采用六层板,双面都使用。
工艺:内存上颗粒、电阻、电容等如果焊点圆滑饱满富有光泽,那么这根内存所使用的焊锡和焊接工艺是比较好的。
四、DIY内存选择
内存从DDR到DDR2再到DDR3,技术在不断进步,且价格也差异巨大。作为DIY一族,怎样抉择?
大家都知道,CPU获得数据的途径和优先级是L1>L2>内存,CPU在L2缓存中如果没有找到需要的数据,就通过前端总线(FSB)向内存控制器发出请求继而在内存中寻找需要的数据或指令,最终通过前端总线返回给CPU,这样就存在一个内存带宽要和前端总线带宽相匹配的问题。所以选购内存的时候一定要注意频率够用就可以了。比如购买DDR内存,如果CPU是P4 3.2GC配合800Mhz外频双通道主板,那么买DDR 400的内存已经足够,不需要浪费金钱买DDR 466、DDR 500等规格。
DDR2虽然采用了大量新技术,会取代通行的标准DDR,但毕竟推出时间较短,价格昂贵。AMD就在最近宣布,尽管市场将向DDR2标准转移,但今年不准备修改当前的晶片以支援该标准。
综上所述,笔者认为DDR仍是目前服务器记忆体的首选。DDR2取代DDR只是时间问题,但因为价格高于DDR 70-80%且受CPU外频限制,效率提升并不显著,待到双核心CPU普及(双核心天价及高热量是目前的发展局限)后再选不迟。最新的DDR3即将量产,是未来主流。站在DIY的角度,目前服务器最佳配搭性价比推介新至强配DDR400记忆体和华硕 NCCH-DR主板。
硬 盘(Harddisk)
硬盘介面是硬盘与主机系统间的连接部件,作用是在硬盘缓存和主机内存之间传输数据。不同的硬盘介面决定着硬盘与电脑之间的连接速度,在整个服务器系统中,硬盘介面的优劣直接影响着程式运行快慢和系统性能好坏。
一、硬盘介面的“串列”革命
在过去的20年中,并行(Paralle)介面在占据了主导的地位。人们习惯用IDE来称呼最早出现IDE类型硬盘ATA-1,这种并行介面已经被淘汰。随着CPU时钟频率和内存带宽的不断提升,两种主要的并行总线接口技术ATA和SCSI逐渐显现出不足。对于ATA和SCSI技术,由于采用并行总线介面,传输数据和信号的总线是复用的,因此传输速率会受到一定的限制。如果要提高传输的速率,那么传输的数据和信号往往会产生干扰,从而导致错误。
在上述情况下,串列(Serial)总线接口技术就应运而生。串列总线接口技术并不是并行技术的改进,而是一种完全崭新的总线架构。同ATA和SCSI相对应的是SATA(Serial ATA)和SAS(Serial Attached SCSI)两种技术,它们克服了原先并行总线接口技术中的不足。在数据传输的过程中,数据线和信号线独立使用,并且传输的时钟频率保持独立,串列总线的传输速率可以达到并行的30倍。
二、SATA显优势
由于并行ATA的峰值传输速率有限,随着硬盘数据传输速率提高、磁盘转速更快,SATA得到广泛应用。SATA的进步不仅仅在传输性能上,还包括了功耗、安装简便性、线缆、内部散热以及驱动器配置方面带来很多的好处。这些因素可能会比数据传输速率更为重要,尤其是对于那些需要节省时间和金钱的DIY族而言。
相对于并行ATA又短又宽的笨重线缆而言,SATA串列线缆又小又细,并可以延伸至1米,使得在系统上安装设备和布线变得非常容易,采用这种线缆有效的改进了服务器内部散热,使得系统更加稳定。在电压方面,SATA使用两条数据通道分别发送和接收数据,500毫伏的电压就可以运行SATA了,这使得系统功耗有所减少。
在标准的SATA系统中,采用平均4通道的SATA主适配器时平均磁盘访问时间是14.5毫秒。磁盘读取平均最大值是47 mbps,写平均最大值是36.6 mbps。平均高峰传输速率为79.4 mbps(理论值达150 mbps)。
三、 NCQ的秘密
NCQ(Native Command Queuing,原命令队列)是被设计用于改进在日益增加的负荷情况下硬盘的性能和稳定性的技术。当用户的应用程式发送多条指令到用户的硬盘,NCQ硬盘可以优化完成这些指令的顺序,从而降低机械负荷达到提升性能的目的。
其实NCQ是属于SATA 300规范中的一条,它是一项提升硬盘性能的技术,NCQ允许设备重新排列命令,来进行更有效的数据传输。支援NCQ的系统在执行4条指令的情况(A、B、C、D),它并非按照原来指令的顺序执行,而是根据最优化的顺序执行,从演示来看只要1.25周期即可完成。不支援NCQ的系统,它是完全按照A、B、C、D指令发送的顺序执行的,需要2.75个周期才能完成。这个演示只是说明在这种情况下NCQ的优势,并不代表NCQ硬盘的性能就是2.75/1.25=2.2倍了。
因此在需要处理的任务比较繁重的应用中,比如高性能工作站、网络服务器中,NCQ可以带来更高的性能。当然,在日常的应用中,比如系统启动到文件拷贝,NCQ都能发挥一定的作用。在Seagate公布的PCMark测试数据显示,NCQ可以带来8.8-12.3%的性能提升。
NCQ是专为SATA介面的硬盘设计的,但是用户购买了NCQ硬盘无法立刻从NCQ中受益。用户还需要支援NCQ的主控制器/晶片组才能享受到NCQ所带来的优势。现在的Intel ICH6R已经提供了对于NCQ的支援,因此只要选购采用了这种ICH晶片的主板的用户就具有了支援NCQ硬盘的基本能力。
四、SCSI vs. SATA
SCSI与ATA是硬盘的两大介面类型。长期以来,两者可以说互不侵犯,和睦共处,但如今,并行ATA至SATA的转变让大家刮目相看。尤其是万转SATA硬盘出现,使SATA vs.SCSI的话题再次成为了用户争论的焦点。
是不是SCSI硬盘的可靠性更好呢?其实可靠性是与介面无关的。介面在硬盘上就是一块PCB电路板,而决定产品可靠性的更多的是那些硬盘的其他可更换的组件、如磁头、马达、轴承、伺服系统、磁头臂以及磁盘。使用与SCSI硬盘相同的组件加上ATA介面电路完全可以达到相同的可靠性级别。WD740GD硬盘就可以提供120万小时的平均无故障时间和5年质保。
SCSI硬盘目前的最高转速可达15000rpm,SATA硬盘则是10000rpm,更高的转速可以获得更高的寻址速度,这永远是高转速硬盘的优势。但15000rpm并不是市场的主流,就目前最高采用率的SCSI硬盘而言,仍以10000rpm为主,此时SATA与之相比完全不处劣势。
介面速度方面,SCSI目前最高的水平是320MB/s,SATA是150MB/s。但SCSI总线是共用的,SATA则是点对点的,这就意味着当SCSI通道内的硬盘实际带宽总和超过320MB/s时SCSI总线反而将成为瓶颈。SATA则没有这个问题。举个例子来说,5块SCSI硬盘系统的数据传输率仍然是有限的320MB/s 然而5块SATA的系统则能够达到750MB/s。
SCSI的标记命令队列(TCQ)功能是相对于PATA的绝对优势。而新一代SATA硬盘也将会支援SATA-II标准中的原命令队列(NCQ)技术。
容量与成本方面,这方面显然是SATA占优了。SATA硬盘已经达到400GB,而计划上市的SCSI硬盘只达到300GB的水平。而且SATA硬盘的价格更加便宜。除此之外,SATA硬盘还具备热插拔能力,且介面好的可伸缩性好。
五、DIY硬盘选择
众所周知,在服务器系统中,除了CPU、内存外,对系统性能制约还有硬盘,硬盘对于系统整体性能的提升起到了越来越重要的作用。综合上述各点,笔者推荐DIY族采用西部数据的“猛禽”WD740GD硬盘。
西部数据给WD740GD的官方定位是小型服务器和高性能工作站的首选。“猛禽”的盘体技术其实就是万转的SCSI技术,转速是10000RPM,平均读取速度十分惊人,最高速度达到73.4MB/s,采用SATA介面,因此不需要购买价格不菲的SCSI卡,这样算起来WD740在价格上就比较有优势。
74GB对于单硬盘系统的配置来说确实是非常实用的,或者你可以构建一个RAID 0的方案,那样你就可以获得最大的数据传输率了(当然是以CPU利用率的牺牲为代价的,在采用新双至强时可考虑)。新一代猛禽除了会跟进SATA2和NCQ两项新技术外,还会在一些关键技术上做突破,但上市时间目前不确定。
采用NCQ技术的希捷Barracuda 7200.8硬盘也是不错选择,容量高达400GB,性能可与10000rpm SATA硬盘相媲美,但需考虑主板对NCQ的支援。
希捷公司最新宣布计划推出一种新型的2.5英寸硬盘平台,这种2.5 英寸硬盘产品,将采用当前版本的光纤通道、SCSI以及串列SCSI(SAS)。采用此2.5英寸硬盘比目前3.5寸体积大为减少,耗电降低40%,是未来1U机箱最佳选择。
服务器软、硬体优化及评测方面的知识介绍,暂告一段落。相关软件推介文章大家可参阅网页:http://www.linkwan.com/gb/articles/122.htm。技术在不断进步,市场也在不断变化和发展。作为服务器DIY一族,我们要不断学习,跟上时代步伐。