尽管光纤信道一直统领着储存网络领域,然而,云存储已经成为业内热门话题。下面,让我为大家介绍一下什么是云存储,以及其为啥能成为业内共同关注焦点?在2011年4月7日,星期四,也是SNW大会的最后一天,Facebook宣布将推出开放式计算工程。
结构数据与非结构数据
根据结构数据(Structureddata)与非结构数据(Unstructureddata)的对比比例估计,在一个企业中,非结构数据的比率大约为80%。非结构数据是一种由电子邮件,企业内部文件,企业新闻,博客文章以及公司网页组成的没有形成固定结构的数据,而结构数据则是在相关数据库里获取的数据源。如果你形成了一种新的数据格式,并且可以从其数据库里获取,那这就是结构数据,反之亦然。
为什么要讨论结构数据和非结构数据呢?
当数据变为结构数据时,通过光纤信道获取信号的水准才最有效。随着结构数据量的不断递增,光纤信道也变得越来越流行。在过去的10年里,光纤信道成为各大企业编写结构数据库时,最好的网络传输工具。那么,在未来发展中,光纤信道将何去何从?当然,结构数据也在逐渐走下坡路,但事实上,在经过一段萎靡期后,结构数据也会逐渐上扬。然而,诸如谷歌(Google)以及Facebook之类的搜索引擎和社交网络公司一直在探索非结构数据。其结果就是,谷歌和 Facebook公司不会采用光纤信道的方式来获取数据,当然这要除了英特尔网络应用之外,如:ERP。同时,谷歌和Facebook则需要为 Sarbaines-Oxley提供相关报告。在谷歌和Facebook的网络存储器中,典型的使用两种SATA驱动器,并且在其他单独的服务器中备份了3份所搜集的数据,这样一来,无需RAID(OFweek通信国际注:RAID是“RedundantArrayofIndependentDisk”的缩写,中文意思是独立冗余磁盘阵列。),就能解决数据冗余的问题。RAID是一种应用在结构数据中,且成本非常高的一种存储磁盘阵列。他们采用的是一种名为,ApacheHadoop的软件架构,该软件架构是谷歌通过其GFS(谷歌文件系统,GoogleFileSystem)系统所构思的,也是其开源HDFS(Hadoop分布文件系统,HadoopDistributedFileSystem)系统发展的产物。
HDFS是一种用于大型文件处理,支持多个64Mbs文件格式处理的文件系统。很显然,当用于处理文本文档时,HDFS的确有点大材小用,但当处理音频文件、图片、以及视频文件时,HDFS就能独挡一面,成为焦点。HDFS是典型与HBase以及在Google的BigTable和(或)称为Hive的数据库架构之后的其他开源模式项目相配套使用的文件处理系统。这到底是啥意思呢?随着Web2.0数据的飞速增长,Web2.0的网络用户所提供的网络数据就成为了Web1.0网站信息发布者的相关数据源,我们希望增长最快的是非结构数据。谷歌和Facebook所采用的都是带存储功能的服务器,网络数据首先被存储在其本地硬盘上,然后再通过网络附件形式,存储到其标准的网络服务器上。我们知道,搜索引擎和社交网络这些网站所使用的网络存储器都来自国产。然而,问题是,在多数企业转型向云计算和云存储模式发展的大前提下,传统数据中心是否也会朝这个方向发展,或者将被迫朝这个方向发展?
云计算和云存储
云计算和传统的网络计算的不同之处在于,传统网络计算是用户通过租赁IT设备商的网络设备,以及向设备商支付运营成本(如设备制冷、设备能耗等)的 方式,而云计算则是用户自己根据其使用需求设计、购买、安装、运维IT设备以及软件,当然包括运营成本(如设备制冷、设备能耗等)。进而,用户还控制其设 备的使用周期、设备升级以及设备的停运等运营项目。云计算和传统网络计算的最大不同点在于,在传统网络计算中,用户必须向IT设备商提供其最大网络数据源 以及最高的网络流量,而最高的网络流量是很难估算的,因为公司每天都在向前发展,不断升级与变化。
鉴于此,多家公司合租一大型网络服务器是最好的解决方案,这样既减轻了租用公司的经济压力,也提高了服务器的使用率,也让IT设备租赁公司赚取更多 的利润。云存储也采用了同样的多家公司合租服务器的商业运营模式。当谷歌对外提供7Gbs的超大容量,免费邮箱时,这个7Gbs听起来的确是超大容量,但 绝大多数个人电子邮箱用户的使用率均低于1GB。同时,其他的云存储商业运营模式将为某些企业专门量身定制合理的网络存储器(如:采用光纤信道存储的 1000GBs超大容量邮箱),当然在技术层面来讲,这也对谷歌要求非常严格,因为大企业耗费巨资使用Gmail邮件业务,谷歌必须对其网络数据安全负 责。同时,这也是一种大型企业独享的网络业务。
云架构与商业模式:谁控制数据?
用户是否会批量向云计算迁移的关键因素在于数据存储在哪里,谁控制所存储的数据,存储数据的安全性如何?通过服务器合租的运营模式,云架构已经得以 成功优化。在虚拟主机里的多数网络应用允许用户共享同一台服务器,操作系统和应用软件,构成一完整的共享存储器资源体系。如果其中一家主要公司的运营和数 据安全失控时,那么所有共享的公司也将受到威胁。许多用户,特别是早期的用户,更倾向于选用私有云,因为私有云的运营模式是其服务器等硬件设施和软件设施 均安置在自己IT机房内,但采用私有云的成本相对较高。在一家公司采用云架构的方式实现服务器合租,这也需要服务器租用公司自己控制其网络数据。如果公有 云设备商或公司诸如Amazon、Rackspace、微软以及新加入云计算大家庭的HP公司提供的云计算服务在价格和用户网络数据安全这两方面的竞争逐 日变得激烈的话,将会有更多的企业选择使用云计算,向云计算迁移。这将对用户在选用云计算、云存储、网络传输、数据库等的网络供应商时提供更多的选择,同 时也会减少用户对名牌云计算企业和存储设备供应商的需求量,但也会让用户在琳琅满目的云计算领域失去方向。
事实上,在2011年4月7日,Facebook推出了一款公开计算工程,其声称为开源网络架构的服务器是目前业内数据中心中最高等级的网络服务 器。可以说,在该网络架构中,没有名牌硬件设备,存储设备或者网络。在公有云和存储引领IT网络领域之前,云计算的市场依旧很小。
为啥会有影响?光纤信道逐日萎靡,以太网需要更高带宽
网络存储数据将不断发展。我们希望在随着越来越多的数据上传到网络,以及通过微软的SharePoint工具上传到企业内部网的数据,非架构数据能增长更快些。光纤信道的成本较高并且其只能用于结构数据。知道现在为止,谷歌也没有采用10GbE网络连接器服务器和存储器。
在谷歌的运营模式中,两台SATA驱动器也未能挣脱1GbE的束缚。这个变革就类似于应用广泛的FLASH和应用在服务器里的超高速缓存一样,或许 每个服务器处理4~12GBs指令。FLASH缓存区将为交换机设备从当前的1GbE升级到采用40Gb或者100Gb交换机提供更高上行速率的 10GbE网络时提供更快、延时更低的网络连接。公有云设备供应商将会面临这种现象。随着全球互联网的逐渐升级,将会生成越来越多的结构数据,这将造就光 纤信道继续广泛应用于结构数据领域。随着业内逐渐过渡到40Gb和 100Gb网络通信时代,特别是对于在单模光纤上能传输1公里的光收发模块,以及FCoE(OFweek通信国际 注:FCoE:FibreChanneloverEthernet,以太网光纤通道)和iSCSI(OFweek通信国际 注:iSCSI:Internet小型计算机系统接口InternetSmallComputerSystemInterface)变得更加成熟,许多当 前应用于结构数据中的新型应用将逐渐过渡到以太网连接。
进而,据我们分析,SFP+光收发模块以及成为10GbE的首选。上周,思科宣布其首台架顶式服务器以及10GbELOM选择接口都采用SFP+产 品。随着10GBASE-T逐渐发展,到2014年,SFP+将以标准的服务器连接产品的身份进入数据中心网络连接领域。这周在斯坦福据悉的 OIDA(OFweek通信国际注:OpticalelectronicsIndustryDevelopmentAssociation,光电子产业发 展协会)会议上,来自Facebook的DonnLee表示,目前升级为10GbE的最廉价方式是采用SFP+DA线缆,并且应用于谷歌和 Facebook以及云计算中的10Gb光收发器市场尚未发展成熟,因为这几家公司是从模块生产商处直接采购。随着网络存储逐渐过渡到以太网领 域,10GBASE-T的BER误码率使其在结构存储应用中丧失威力。在未来发展中,我们将通过预测服务器、交换机以及存储器直接的网络链接市场的方式, 继续关注该领域市场。