1.5 数据中心基本现状
在视数据为生命的信息时代,数据中心不再是一个躲在后台的庞然大物,它已经成为IT巨头们的新一轮“信息竞赛”的战场。
在美国俄勒冈州的哥伦比亚河河畔,Google建成的用于处理每天数十亿次搜寻以及提供其他互联网服务的数据中心占地有两个足球场那么大,并且旁边还伴随着两个庞大的冷凝工厂。而今,Google甚至开始计划一项惊人的数据中心工程——“海上漂浮数据中心”,以期望完全利用海洋的能源和利用海水的温度冷却设备。
为了能够保持在业务层面与Google的竞争优势,在数据中心的建设方面,微软和Yahoo显然都不敢怠慢,它们分别在哥伦比亚河上游的韦纳奇和昆西兴建了全新的大型数据中心。此外,微软还投入巨资在全球建立了数个数据中心,其中包括爱尔兰、芝加哥和都柏林等地的大型数据中心,甚至还进军俄罗斯的西伯利亚,在伊尔库茨克建设了一个可容纳1万部服务器的数据中心。Yahoo更是在金融危机弥漫全球的时候仍准备投资1亿美元在美国内布拉斯加州设立一个数据中心。
我国著名的互联网公司腾讯(QQ),计划建设15万台服务器的超级数据中心(2007年)。
阿里巴巴公司宣布要新建5万台服务器的数据中心(2008年)。
当然,全球数据中心的扩张显然不仅仅局限在IT企业,在数据就是金钱的金融行业、在信息关乎生命的医疗行业以及与每个人都息息相关的零售等行业,都经受着信息爆炸以及业务需求带来的巨大挑战。
全球最大的零售商沃尔玛的新型数据中心的存储能力高达4PB以上(1PB=1Peta Byte=1024TB=1024×1024×1024MB),这绝对可以称得上是一个天文数字。作为拥有超过6000家门店的国际化零售连锁集团,商品信息和交易记录是必须进行存储的内容,庞大的信息量无疑对数据中心提出更高的要求。
1.5.1 困局之一:信息爆炸
信息爆炸对数据中心的挑战是多方面的。
(1)数据容量巨大。各种法规要求业务数据保存的周期长达5年以上,使得累积的数据容量需要庞大的存储设施。
(2)数据吞吐量大。这不仅要求存储设施具有极高的吞吐性能,而且要求服务器也有很高的数据和业务处理能力。
(3)数据的有效性和安全性。企业数据正成为企业赖以生存的核心,数据中心必须能够保证数据随时可以被合法访问,不能失窃、不能丢失,还要通过数据挖掘与分析支撑业务决策与创新。
可以说,信息爆炸对数据中心的挑战越来越深入和广泛。
1999年前后,人们常常会说数据爆炸了,企业的数据库已经达到GB级。现在,更大数量级的爆炸已经来临,TB级的数据库比比皆是,这与互联网的快速发展产生的大量非结构化数据息息相关。
10年前,只有大型企业对核心业务进行了信息化;而现在,企业的业务正在不断向外延扩展,并涉及产业链上下游的所有中、小企业。这些大型企业就仿佛一场龙卷风暴的核心,把所有产业链中的中、小企业都卷入这场信息化的龙卷风暴之中,被形象地称为“龙卷风效应”。
沃尔玛就是“龙卷风暴”的一个很好例子。沃尔玛的产业链遍及全球,很多中、小企业也为沃尔玛供货,并且通过信息系统与沃尔玛的供货系统相连。分布在全球的任何一家沃尔玛超市的收银员敲击一下收银机的收款键,所产生的数据并不会在沃尔玛内部终结,而是通过库存状态变化不断扩散,一直延伸到相关的供货商。像以沃尔玛为核心的这样的大型产业链,每分每秒产生的数据都非常庞大,并且这些数据根植到整个产业链中。任何全球化企业都必须跟上这样的变化,才能在这样的一个产业圈里存活。
互联网公司需要应对数据的爆炸式增长,零售业巨头带来的是龙卷风式的数据效应。其实,这样的考验在其他行业中也比比皆是。
数据的膨胀对数据中心的依赖与日俱增,“不能停机、不能宕机”是数据中心的首要要求。
的确,庞大的组织架构和分布在各地的分支机构让不同行业的企业都不得不面对信息管理方面的严峻考验。在保险行业,财务、客户、统计报表等各种数据是整个业务运转的依据,由此一来,企业对数据的依赖进而转向了对数据中心建设的更高要求。
9·11事件中双子大楼的倒塌给众多企业带来了毁灭性灾难,其中很重要的原因就在于数据中心的毁坏。在2001年9月11之后,全球兴起大规模数据中心备份和容灾的建设,进一步刺激了信息量的爆炸。
在世界变平的过程中,各行各业都在数字化,甚至还有很多潜在的信息膨胀目前还没有被预见到。即便如此,已经发生和正在发生的信息爆炸已经在改变数据中心的原有建设模式,信息架构及存储系统因此发生的巨大转变也成为影响数据中心变革的重要因素。
1.5.2 困局之二:绿色与节能
数据中心的耗电量、电费支出已经成为新的电老虎。
根据美国环保署报告,2002—2005年,数据中心的耗电量大幅增长。2005年已占全美用电量的1.2%(电费为27亿美元);数据中心耗电约占全球用电量的0.8%(电费支出为72亿美金)。
2006年,美国的数据中心累计消耗610亿度电(6108kW·h),占全美当年总耗电量的1.5%,电费约为45亿美元,超过美国所有电视机耗电量总和,约等于580万个家庭用电量。
预计到2011年,美国的数据中心将消耗1000亿度电,占全美总耗电量的2.5%,其电费将达约74亿美元。为满足数据中心耗电需求,美国需要新增10%的发电量。
全球数据中心耗电量增长同样惊人。据IDC报告,全球2005年数据中心的耗电量是全球用电量的0.8%。
国内运营电费动辄数百万元甚至上千万元的大型数据中心已不计其数,数据中心成为耗电的“无底洞”。
据某IT媒体调查,超大规模的电信级数据中心已经超越亿元的电费门槛。对于大型数据中心运营商来说,巨额的电费已经逐步超过了基础设施投入,成为数据中心运营的第二大成本。对于中、小企业级用户而言,耗能成为建造数据中心的门槛。据IDC的数据显示,中国数据中心市场的增长速度仍保持高位上行,2007年中国数据中心市场规模达到3.7亿美元,比2006年增长33.4%。
庞大的数据中心带来对能量消耗的巨大需求,也带来下列问题:
(1)资源问题。大型数据中心的能耗成本居高不下,已经在企业日益沉重的IT成本中跻身第二位。资源限制势必影响到数据中心本身的扩容,由于供电能力的制约,不仅很多地区已经无法新建功耗巨大的数据中心,甚至原有的数据中心也面临拉闸限电的危险,更无法奢谈增容扩张的问题。数据中心的耗电成本首当其冲影响到企业信息化的进程。对于数据中心来说,全球的新一轮能源危机牵动着其敏感神经,能源成本正在成为数据中心快速扩张过程中的全球性瓶颈。
(2)在“绿色”、低碳经济呼声一浪高过一浪的今天,数据中心的能耗与污染是一个现代企业无法回避的责任。成本、业务扩展、企业社会责任,是数据中心建设与运营需要解决的关键问题。虚拟化工具、自动化管理工具,这些围绕“绿色”概念而形成的技术,越来越成为数据中心流行词语。
在确保高性能的同时,将冷却散热降至最低也是数据中心实现“绿色”而必须做的,这就需要更科学、更合理的供电方式和制冷系统。全球很多大型的数据中心开始考虑把数据中心建设在具有特殊资源、水资源丰富或气候寒冷的地区,以节约散热成本。
从芯片、服务器、存储到网络设备厂商,甚至是软件厂商,都在通过更优化的设计,力图在提升产品性能的同时,推出更为节能的产品,以帮助企业数据中心实现节能降耗。
虽然目前用户在应用虚拟化时会出现管理的复杂性以及成本上升等问题,在通过刀片整合服务器的同时,也会出现供电系统无法支撑如此高密度集群环境的问题,但随着可实施、可衡量的技术及工具越来越多,2009—2012年,企业数据中心将掀起绿色工程高潮,而能源管理这样的技术和工具,也将会受到企业的青睐。
1.5.3 困局之三:业务挑战
客户关系、人力资源、生产系统、库存、物流、订单……企业业务越来越依赖于数据中心的支撑。然而,信息系统总是会出现这样或那样的故障。业务发生了变化,迅速增加或者重新部署应用,往往也是数据中心难以完成的使命。与节能环保的闪亮光环相比较,可靠而高效地承载企业业务运转,是一种实实在在的挑战。
伴随业务的扩张与信息化程度的提高,数据中心已不再只是支持单一应用、实现日常的数据存储和计算,而是需要为整个企业业务系统的正常运行提供支持和服务,成为信息化的大脑与中枢。
对以ERP系统为业务支撑的研发、制造、物流等企业来说,一旦ERP系统瘫痪,将意味着整个集团从内部行政到研发项目再到销售流程的全线塌陷。各种业务系统的发展和完善都依赖于数据中心的支撑,同时,业务部门也给数据中心提出了更高的要求。
数据中心在应对来自业务部门的挑战方面,面临相当大的压力,这与目前数据中心在架构上总体落后、灵活性差、资源动态调配能力低等情况是息息相关的。未来数据中心必须从被动的角色转变为主动服务的角色。具备灵活、动态、快速服务提供能力的新一代绿色数据中心,则是数据中心变革的未来。