[周报全文]带宽瓶颈:云应用中的短板

2012-03-23 |  作者:CNW.com.cn |  来源:独家 |  查看原文

摘要带宽,是企业部署云应用时非常容易忽略的问题。但是它的的确确在影响着云应用的质量和发展,有时甚至决定着云应用的成败。

带宽,是企业部署云应用时非常容易忽略的问题。但是它的的确确在影响着云应用的质量和发展,有时甚至决定着云应用的成败。

洲际酒店集团(InterContinental Hotels Group)在全球100个国家拥有4500家以上的连锁店。通过把存储和内部移动应用程序迁移到云中的多个数据中心,洲际酒店集团改善了用户体验并降低了运营成本。洲际酒店集团的这个举措非常成功,因此,现在他们正在把自己的订房系统迁移到云中——这个系统每天大约处理3.45亿个交易。

但是,洲际酒店集团CIO汤姆·科诺菲(Tom Conophy)称,如果集团当初不把重点放在经常被忽略的带宽上,这一切都将无从谈起。

“如果企业员工和企业用户不能足够快地访问数据,那么,这个云不过是一个白日梦。” 科诺菲说。在洲际酒店集团的云应用中,这意味着重新设计网络架构,以便分发数据库,使得数据能够迅速被访问,并且让各个数据中心保持同步。

在讨论云时,人们很容易忘记除了安全之外,它还有其他风险。事实上,已经适应局域网速度和质量的用户如果遇到性能和延迟问题,他们将会抵制这个服务。目前的许多应用程序都是相互依赖的,而如果这些应用程序必须进行远程沟通,比如数据中心与数据中心之间的沟通,那么速度减慢,甚至网络中断都是有可能发生的。此外,如果存储和备份遭遇太多的跳点,它们可能也会遭到延迟或失败。

位于俄勒冈州波特兰的独立研究公司Voke的创始人特丽莎· 兰诺维茨(Theresa Lanowitz)说,除了这些潜在的灾难性后果,在云计算战略中,许多企业尚未考虑到带宽问题。

测试云应用是关键

“大多数企业只是在单一环境,而非集成的环境中测试自己的基础设施。” 兰诺维茨说,因此他们没有办法保证应用程序、备份和存储满足规定的服务质量要求。

互联网通道中充满了视频和音频流等各种各样的通信,这些通信可能对数据库的性能产生不利的影响。此外,许多应用程序没有为云服务进行压缩,也就是压缩代码以减少传送的数据量。因此,当离开局域网的时候,这些应用程序可能会崩溃。

兰诺维茨建议在把应用程序永久性地放在云中之前,要先使用仿真工具(如思博伦通信和Ixia等公司的工具)进行测试,以便发现潜在的带宽瓶颈。像洲际酒店集团这样的公司可以仿真典型的高峰期状况。如模拟通过云应用程序进行早上退房结账的状况。

“这是个关乎该应用程序在云中能否存活的问题。你必须检查峰值时网络承受应用的能力。” 兰诺维茨说。

让合适的人员参与

企业管理协会的研究主管吉姆·弗雷(Jim Frey)同意兰诺维茨的观点。他的研究显示,IT部门并不总是让恰当的人负责预测和解决带宽瓶颈问题。经常地,熟悉网络,并且能够在发生故障之前就采取措施解决问题的人,无法参与到云存储和应用的部署过程中去。

弗雷在2011年2月发表的题为《虚拟化云的网络管理及负责人》的报告称,在接受调查的151位IT专业人员中,62%的受访者正在使用某种形式的云服务。66%的受访者在服务性能、质量监控和保证方面,依靠内部云或者虚拟化支持团队。但在许多企业中,许多负责云服务的人员来自于存储或者数据中心管理、数据中心/服务器运营和安全部门。只有54%的受访者表示,负责人中包括网络工程师和网络运营人员。这个比例低于2009年的62%。弗雷说,由于负责人员脱离网络工程,使传统的网络工程最佳实践都靠边站了,这令人感到遗憾。

弗雷在报告中称,云服务和部署虚拟服务技术通常减少了企业IT的可视性和可控制性,因此导致很难对网络进行管理。“一些虚拟网络单元应该采用和传统网络同样的监控和管理措施”。他在报告中表示,网络虚拟在最需要关注的属性之一就是带宽。

按照弗雷的观点,许多IT部门对整个通信传输的健康关注不足。例如,只有28%的受访者认为,为了监控和排除故障而收集虚拟机之间的数据包是绝对必要的。只有32%的受访者认为,为了监控和排除故障而收集有关通信的数据,也就是收集来自虚拟交换机的NetFlow信息是绝对必要的。而恰恰是这两个任务都能够让IT部门了解网络及其通道的性能如何。而拥有了这些信息,企业就会发现他们需要额外的帮助(+微信networkworldweixin),以缓解瓶颈和改善最终用户体验,这些帮助包括广域网优化控制器(W0C)和应用交付控制器等。为了防止多次复制同一个数据而引起网络阻塞,IT部门可以使用部署在私有云和公有云中的物理,或者虚拟广域网优化控制器中的重复数据删除功能。IT部门还可以在本地缓存数据,以便减少网络中来回传送的通信量。

为数据备份优化网络

位于华盛顿的International Justice Mission (IJM)公司负责信息系统的副总裁约翰·莱克斯(John Lax)认为,广域?优化控制器能够让面临带宽挑战的全球非赢利组织向云中迁移。

IJM在全球10个国家拥有500名员工和14个现场办公室。莱克斯称,许多员工承受着三项挑战:超低带宽(例如,每秒512KB)、频繁掉线的脆弱连接和昂贵的费用(例如,在乌干达一个每秒256KB的链路,每个月要花费1200美元)。

莱克斯确定边远地区的员工使用云的最佳方式就是备份。他说:“我们不希望再需要人工干预变化和跟踪磁带。每个当地办公室都已经安装Riverbed的Whitewater云存储设备,这些设备连接到IJM在弗吉尼亚州里士满的数据中心中的其他Whitewater设备上。”

一些敏感文件数据是必须进行加密、删除复制和压缩的,以便加快传送。这个数据中心的Whitewater设备还与一个Whitewater虚拟设备一起使用,以便在亚马逊的S3云服务中备份和存储文件。莱克斯称,这个设备会使通信量减少到原来的六分之一,由此会减少带宽成本,并保证更短、更准确的备份窗口。此外,如果用户意外删除一个目录,他们能够在12秒之内从内置缓存中提取这个目录,而不像以前那样需要36个小时才能从磁带中恢复。总之,IJM能够向云中备份5.5TB数据,以保证这个组织工作的安全性和完整性。

在数据中心之间实现同步

采用优化设备只是步骤之一,事实上,解决带宽瓶颈还有很长的路要走,洲际酒店集团的科诺菲就采取了一个不同的策略。同莱克斯一样,科诺菲必须设计其云网络以支持遥远地区的用户。洲际酒店集团在佐治亚州、弗吉尼亚州和加利福尼亚州有三个主要的数据中心,在迪拜、上海、新加坡和悉尼还有次级数据中心。科诺菲称,这些数据中心的位置通常比较接近用户,以便优化和加快用户体验。

虽然在没有大量投资的情况下,保持所有数据中心的数据完全同步是不可能的,但科诺菲力争要接近同步。在未来10年里,依靠包括智能手机、平板电脑和网站等各种资源的客户,每年将做500亿次交易。“我们面临的挑战是,在交易量日益增多的情况下,如何保持客人预订房间数据和用户个人简介等数据的同步。” 科诺菲说。

使用Terracotta企业套装软件,洲际酒店集团迅速并有效地同步了Java虚拟机,缓存则分布到各个数据中心。科诺菲解释说,这套软件基本上相当于是一个库,让我们的数据从主数据库转移至多个节点。采用这一方法,使得访问速度比传统方式快了50~100倍,并保持了从一个数据中心到另一个数据中心更好的索引和完整性。

查看内部

科诺菲说,有时候,企业会自己制造数据风暴。“如果一个企业把需要被频繁访问的内部数据库应用程序放在云中,就可能发生这种事情——来回传送数据可迅速增加通道的负担,并引起性能问题。”

为了避免这种情况发生,企业管理协会的弗雷建议使用一些工具描绘出应用程序的相互依赖关系,并且制定出云策略,以适应这些应用程序。当知道哪些应用程序相互依赖的指标高后,你就可以让这些应用程序相互之间位置更靠近一些,从而减少延迟。

像内部网络一样,更高的带宽有时候是解决阻塞的唯一方案。如果企业突然决定把所有的用户放在诸如谷歌应用等基于云的服务中,就需要在办公楼和远程办公室有更多的带宽。

通常,对于云相关的考虑来说,带宽都放在次要的位置。不过,分析师兰诺维茨说,现在是该改变这一现状的时候了。“失败的风险正在增加,因为现在公司的品牌形象与技术已不可分割地联系在了一起,这意味着企业不能把带宽质量控制交给外部的提供商——带宽质量控制是必须保留在企业内部的。” 兰诺维茨说。

相关文章