存储在线 10月30日北京消息:主题为"数据无限,管理有方,存储为体,服务为用"的日立数据中国用户大会2008今天在北京召开。会上,日立数据业务发展经理雷涛做了关于"展望引领存储发展的新兴技术–日立数据全新中端产品线AMS2000隆重面世"的演讲。
日立数据业务发展经理雷涛: 大家下午好!看来大家对日立公司新产品热情很高,先自我介绍一下,我是日立数据业务发展经理雷涛,汇报的主题是作为新的产品线的发布,主要是围绕AMS2000来做介绍。
前面讲了是引领存储技术发展的产品,可能有一些记者、老朋友都在提,作为中端存储产品,往往不是存储企业里面旗舰的产品,有哪些新的特性能放在我们的产品里面呢?是不是在忽悠我们。
客观讲,日立现在在中端做了很大的服务,可以看到在之前进入会场之前,我也听到一些合作伙伴或者是用户问了直截了当的问题,我们12TB的存储报多少钱,可以买到存储。有的同志说我想进入到会场看新存储的参数,这些答案都已经给了。
今天我们的想法是日立把一些新的产品和新的思想,日立通过对数据市场的发现,可以关注到一些IDC的报告,可以看到15K到50K的市场,这个领域是目前需求量最大的。
因此,从传统的行业里面,中端的模块化以及价值同质化很严重的情况上,我们要做变革,我们在AMS2000系列,跟传统的领域引入了新的东西进去,这些产品特性我们要着重解决哪些问题,这些问题并不是日立闭门造车考虑的。
是站在这里面对最终的用户,最终的合作伙伴了解了需求之后针对性的采用了一些新的技术。
今天主要是围绕这几个话题来讨论,首先简单介绍一下新的产品是什么样的,AMS2000包括哪些,之后是围绕两个观点讨论:第一个是这个产品能不能用,够不够用,讨论一些性能拓展的能力一系列的问题。第二个问题是简化管理、高效营运,以及成本怎么样用好。
第三块是讨论一下典型的一些应用,比如说数据库的应用、邮件的应用,还有像现在很明显的虚拟化的环境,部署了很多集成度很高的虚拟机的时候,怎么样用存储的特性来维护它们。
先看看这个新的系列产品是怎么样定义在日立整个系统架构的。上面也听了面向服务型的框架模型,这个框架模型产品本身不太重要了,怎么样去传达一种服务的概念。比如说常见的哪怕是备份操作,备份软件本身是一个产品,但是我们附加了之后就变成了服务。
从所有的产品包括中端的模块化的产品是面向了上层的应用来实时解决的。前不久我们有一个团队做研发的,沟通之后了解到每个产品的研发最终的应用联在了一起,我们微软发布Data版本之前,它的产品特性,它的Services的需求特性,以及内嵌到新一代存储的整合。
这是以服务为导向面向最终的应用的,之上我们有一个统一的接口平台,面向不同的应用。比如说文件集的服务,用非结构化数据的时候,可以采用NAS一系列的产品。有一系列数据保存和保护方案的时候,可以考虑iSCSI,以及基于保护的产品,是可以贯于下游的平台,这是我们的基础架构,代表日立最先进技术的Vmware这类的技术平台。
同样,支撑我们一半业务的是未来终端产品AMS系列。今天主要是基于AMS产品这块。
看看这是什么样的产品,这发布了很多,我们也有很多创新型的产品了。因为高端才有特性,这些直接用在中端产品里面,改变了很多行业的东西。比如说数据库的东西,引用了传统的应用领域里的数据保护等东西。
今天两个主要的两点,一个是到带宽的支持,现在可以说新发布的一系列最低档次的产品,带宽已经超过了原来同领域上游的带宽了。另外一个是控制器技术,也带来了行业里新的革新。
先看看产品特性和产品系列,这个系列的产品包括三个。2100、2300、2500,并不是用来替换到原来的200、500、1000的系列,成为一个新的全新产品线,介于高端和中端之间的产品线。另外像虚拟化技术,等不中断的技术都会集成在中端产品系列。先逐一地看一看,AMS2100,是领域里面第一款产品,主要的定向是4到8级的缓存,最大的数量可以支持500个G。
支持SATA和SAS混插,容量目前可以达到118TB。2300主机数量可以接到1000台,有的说没有这么大的服务器,这样的话是应用了虚拟的技术满足了未来大量的部署,Vmware一系列虚拟主机的应用。
第三个产品是2500,是目前中端系列最高的一块,可以激活16个前端端口,同时也可以支持SATA混插主机数量可以达到2000台,同时,也是支持了SAS和SATA混插。
所以三款产品,事实上并不是孤立的,是可以在线升级。我们讲在线升级是数据无忧的升级,无需置换原有的数据,它只是把2100的控制器换成2300的控制器,你继续可以使用以前的数据,可以保存你原有的数据优化。这是我们提到的三款产品,这三款产品没有什么质的飞跃,到底带来了哪些新的革新,就是你们的特点。
我们跟其他友商发布新产品的时候,并不是简简单单只告诉你我们的产品做了哪些东西,技术指标做了哪些东西,这并不是日立本身的东西。今天我们芯片是166兆的产品做的东西,明天是多少兆的,我们只是随着行业来做。
下面回答一些问题,这些问题首先要考量一样,中端产品是面向哪个市场,而这个市场需要什么,我需要12个TB几K的价格能买到,至于成本的东西,还是需要在一个竞争环境当中,能突出一些特性的问题。我们也关注到友商他在中端市场的份额已经超过了在企业端的市场,之所以这样,跟中国本身的经济体发展是非常相关的。
中端市场往往从我们的角度理解,也可以跟自己的业务模型、业务规模做一个匹配。中端市场率先要满足的是比高端市场成长性还要旺盛。对自己系统的扩展规模、扩展能力以及要扩展比高端的产品还要高。因此,要面对业务不断调整的时候,我会灵活的部署我的系统这是第一个特点。
其次,中端考虑的是在同样性能的环境下,我怎么样能降低我的成本,做到投资保护、能耗、人员的开销。中端不可能像一个大型企业的数据中心一样,有一个专门的数据库的管理员,DBA的管理人员、网络的管理人员、系统的管理人员,同时有存储的管理人员,在座的各位我想一个人全做了。
这样的话存储系统架构本身怎么样降低你的开销,这是中端系统要解决的问题。同样,中端不可能有全套完备的数据保护方案,不像我们大行业里面部署方案,怎么样进行系统内的建设,怎么样通过系统内本身的特性来支持数据持续的可用性。这三点是日立对中端系统产品三个重点。
要看看怎么样去满足这三个重点,第一点是要给大家回答一个问题,这个系统的性能怎么样,能不能适合不适合我的系统,目前的规模。讨论这一点,第一个观点是我看了这个系统的性能,性能是考核扩展能力的。是率先第一的需求,这里有一个具体的数字指标IOPS,还有一个是带宽,可以看到原有的产品是三到五倍,在带宽持续不减也是两到三倍的。
在这个提升的背后是有很多故事来讲的,不仅仅是用了更大的CPO,是改变了很多中端产品本身所带来的。这里有两点是最突出的,第一点是上面看到的控制器技术的核心,第二点是SAS客户端了。
讲到动态负载均衡技术,我刚来日立的时候,看到日立这边提供了一个报告是中科院写的一份对现有存储行业的存储本身结构的分析报告。定性了几大类存储产品的门槛,最基础的是控制器技术的,非智能技术。第二块是双控技术的中端存储,第三类是像一些高端的能做到技术控制的类型。
用户可以很清楚地根据这样的定义来看我是需要高端的产品,还是中端的产品。现在日立对中端做了非常革命性的变革,在传统的双控制器之下,将高端的特性引入进来。传统的双控是控制器A和控制器B对我们的数据、磁盘等会有一个共享的访问,是非对称的双核的服务。
我们下面的产品也是基于这样的技术,这个技术带来的特点是它的收获是在某一时刻,一个控制器对于下层的数据控制权是唯一的。在并发的时候,控制器A干活的时候,某一个数据在工作的时候,这个I/O是由控制器B处理,这是双核在做不同的工作。到高端为什么能实现呢?
因为高端把一个控制器分开了,无论是总线结构将前端和后端剥离开了,任何一个前端都可以访问到任何一个后端,这就不会像两个孤立的孤岛一样怎么处理。A的前端端口只能在后的端口处理问题,这大家都有排队的经验,这个技术就相当于在银行排队。你进去拿一个号,不用关心我拿的是哪个窗口。这就是高端产品的技术。
在新一代日立中端2000系列,引入了高端的技术,彻底分开来。同样我们也说了,但是每个CPU是干不一样的事情,英特尔CPU只来处理I/O的管理,只负责前端的端口,不再考虑后端的,所有后端的我们用iSCSI来处理。这是彻底不变的,这是目前业内唯一的,之前大家很多业内的同志都知道,日立的高端技术非常先进。
日立现在将这个技术引入到了AMS2000产品系列,带来的好处是显而易见的。可以看一些实际的例子,比如说前端如果有一个用户的话,可以做到前端的负载均衡。你的数据库可能做不同的数据业务,有的做报表,有的做在线的生产系统,对时间的要求是明确的。
前端的压力这个时候如果已经到了控制器所处的控制权,你从主机端享受的控制权可能只是在A上,它使用20%,但是在最前端的反应时间有10毫秒和一点点延时。这个时候控制器可以自动分担你作业的需求,同样在系统部署的时候,同样后端,这个问题是我们目前接触到的最普遍的问题。
我们做测试,用户为了简单,这样的话,所有的应用软件、数据库、Oline、日志系统等文件都放在这里,性能可想而知,性能你需要分别去处理,这样的话对后端的压力非常大。我们不同的应用跟不同的后端来绑定这些数据。
特殊的应用可能是非常活跃的,怎么样解决当后端的系统热点彻底消除,这个过程是自动化,往往在之前的时候是需要专业厂商比如说EMC、IBM专门的业务厂商去实现,这里可以自动实现。很多情况用户是不知道的,比如说我部署了虚拟环境,一个卡链路上可能有多个I/O出现,多个I/O和虚拟机从哪里出来,你也是不知道的,这个时候我们必须要有自动化的东西来控制他们。
有一些大的客户或者是企业高端用户说,这个服务我不需要,我知道我的哪个数据库最棒我就跑哪个。但是你可以把这个数据部署,你需要调整的时候能够控制,你的数据是有周期的,不可能繁忙的时候24小时占有,是不是在空闲的时候把一定的资源搬移给另外去使用,有没有自动调整的功能。通过真正的双核就可以提供处理器的负载均衡技术。 [14:15:34]
日立数据业务发展经理雷涛: 举个很形象的例子,我们IPTV的用户,为了追求成本的最大化,有单链路的连接来控制器,单链路必然要停机,然后有很多计划的操作。我要把系统更新一下等等,这个时候单链路不行了,不得以用户要配两个HENP卡,如果你用这个的话,可以完全实现迁移。
本身对于存储而言,如果用一台主机通过单HCAP卡,通过更新的时候,你存储系统是在线,他发现我的系统在做的时候可以跟另外一个后端端口去实现持续的数据访问。所以,这个系统是高端产品非常核心的技术。目前中端产品也引入了前后端的推移。
刚才说了很多控制器的概念了,第二个技术在存储行业里面,采用了SAS后端。之前沟通的时候,很多厂商也在跟我们探讨,SAS是不是选用了低层的方案替代了。大家可以关注一下,你上我们团队的网站可以看到,SAS只是接口的情况不一样。为什么我们要把iSCSI的技术换成SAS的技术,很多人都被这两个情况,大家看看使用的iSCSI是什么样的,并不是像推广的光纤一样来推广的。
在高端的产品不可避免使用iSCSI,可能会涉及到后端产品数量的问题,高端的产品可能就拔高了,低端的就串2兆环到4兆环了,这样的性能是非常有限的。而SAS技术本身像iSCSI一样是端对端的,这点看SAS将被存储厂商作为趋势,目前两大主流的磁盘厂商日立和?
都走上SAS了。SAS带来了一个显著的特点,第一点是提供了iSCSI里面不可比拟的带宽技术,存储技术最困扰客户的是后端技术昂贵,SAS带宽在2100的产品上可以达到竞争对手高端产品的效果,可以达到48G,可以消除本身环路系统带来的瓶颈。
同样,SAS对于生命周期管理而言,有非常关键的特性和优势,是数据分层。在之前我们必须要一一对硬件结构本身哪些是iSCSI的盘,那些是SAS的盘,我们将不同的数据类型,将不同价值的数据放到不同的层面上,部署的时候一个控制柜里面可能被利用。
要么买大容量的盘要么是买高性能的盘,SAS本身可以实现无缝的,部署的时候可以随意部署硬件的环境,你只需要针对数据不同的价值,分别配合你的文件卷上做配合。
除了两个关键点之外,我们革新了控制器的技术,将高端的控制器前后高端分离的技术带到了AMS2000产品系列。然后核心的磁盘产品技术,提供了高的带宽,提供了灵活的样式来满足用户的需求。第一点我们提供了存储配置方案,我在很早以前,在2001年、2002年接触到日立产品的时候发现日立有一个特点,它可以为存储做存储配置,这是什么概念。
大家做招投标的话,上网站可以看看你的钱是多少,那里面很复杂,很多人看了之后就出来了。因为有很多限定的条件,你是持续的I/O还是随机I/O的,是小的数据块还是大规模的数据块,要良好的布置一些生产系统,这些环境都是与这些息息相关的。
数据库本身就是多个I/O的结合点,数据库的文件需要高速的读写,这个时候数据库是持续的。但是你随机的I/O,在线的操作专家都知道我们会放4到8k,这不同的需求对用户本身而言做高性能的摆放,2001年的时候日立推出了可以定制化的,包括磁盘,现在所有的厂商都可以做到这一点。
日立推出了可以做多样化的配置,在同一个缓存里面可以做4K的,也可以做512K的。它可以在通用的组里面,这是高产品的特性在中端产品里面实现。中端产品很多时候是满足了企业的所有意愿,你的系统都在一个层面应用。
这么多的应用你怎么去定义你的池配置恰恰满足你的应用,如果用了存储方案可以有针对性的满足不同的应用在数据中心里面整合的方案。同样,整合到一起很关键的问题是我怎么去整合,当所有的东西都整合到一起的时候,ERP系统不希望受到业务系统的影响,同样,日立是最先提供解决方案的。这种方案可以实现存储配置的实现不仅仅是在端口的实现。
除了做不同的配置之外,大家很多数情况讲SSD,也有人问我们有没有SSD,SSD目前有没有成熟,有没有通用的标准,回写、数据的裱糊怎么实现,在这些不成熟的情况下,日立没有率先完成这样的情况,我们有驻留的情况来保证。这部分的数据是否可以常驻在内存空间里面,提高利用率。比如说一些随机在线的可能就几个LG的高性能的实现,可以采用这样的技术实现。
同样,日立采取了超大数据卷支持特定应用需求,这样的话你的I/O可以跨所有的磁盘,来访问高性能的数据。刚才我讲的这些是这个产品能不能用,我相信大家现在有答案了。换个角度问,如果大家认为这个产品不能用的举手,没有。下面回答的问题是我们怎么样去解决,这个产品好用不好用,是不是适合你用。
看到这个问题的时候,上午大家都听过讲解,你关注到IT系统投资在整个投资领域里面硬件是非常有限的,真实的数据是非常小的部分,很多是被分配的空间,很多是做快照数据保护的空间,很多是提前规划的空间。同样,在管理开销上有没有人员具备了,实施复杂的备份技术,这往往是传统的2到4倍。
这里面大家喜欢使用Windows的平台了,在新AMS2000里面,我们提供了新产品NAS的服务,输入你所需要的容量大小,就可以构建好你的存储生产系统。
像行业具备的在线数据扩展,随着业务的变化我怎么样进行新增业务,在不停机的情况下把这些新加入来。这就支持RAID扩展,原来RAID是4块盘的现在可以做成8块盘。RAID有一个问题,做在线的时候新的系统虽然是在线生成,但是做RAID重建的时候是非常耗时的。
1个TB可能需要10个小时,我们拓展新技术的时候通过RAID的方式来拓展,同样,我们也通过卷的形式来进行扩展。这个过程都是在线实施的。
同样,你没有使用的空间,我可以释放出来给其它的盘。所有的这些都是新产品特性里面在线实施的,一个简单的问题,你的文件系统的大小可以随你的弹性来设计,我需要多少就设计多少。我怎么样保持数据的移动特性。
这也是在线的功能,当我右系统写入一个LOG,需要快速地写入SAS来生成,我是不是可以迁移在我的盘上,在这个过程在不宕机的情况下,可以通过在线的操作来实施,这也是中端产品的特性。
新产品还有一个是经典配置,通过引入配置的概念,页面有什么样的概念,跟实际的部署容量所不相关。什么样的概念,你不同的应用系统它的需求量,比如说需求量是1个TB目前只占了500G,我实际的消耗是500G,用户以为他是1个TB的容量。
当真正触及到应用的时候,我这里可以加一个盘,满足你应用的需求,这就是经典配置了。
在就是能耗的问题了,大家觉得这与自己相关不大。事实上你的计算机系统,能源消耗是非常大的,你的数据中心里面,IT投入基本上占了50%。这里面存储占了35%,来看看日立是怎么解决绿色存储的问题。
有三种方法,第一是虚拟化和整合,第二在中端存储里面,第三我们引入了很多实际的方法、方式来解决,大家听过很多的技术,日立是怎么样实现的,可以降速把硬盘分离。你的数据肯定有这样的数据,做持续的数据备份,每天晚上在做,白天的时候可以通过系统脚本休息,有可能有的时候就停掉了。
大家对备份在线的时间是不要求的,但是对于配置需要是灵活的。我们的技术本身是支持无线,在在线和非在线之前有30%到70%的要求。
最后讨论一点是跟大家息息相关的,针对不同的应用,我们的中端有哪些特性能满足的。先看看虚拟化环境里面,用户很多困扰是路径切换,你不知道我虚拟机部署哪条哪路,不知道物理链路连归属是什么。通过我们分离的控制器的技术可以屏蔽掉环境的技术。
要使用虚拟化的技术,必然要考虑你能不能具备负载均衡的能力。还有像邮件,像黑莓等使数量巨量增长,这样的话满足你不断的业务压力。同时,在这个领域我们可以做一个集成,降低你的成本。
对于数据库本身的优化,根据不同的地方采用不同的脚本、不同的配置方案来满足数据库不同的应用特性。双核的控制器可以保证数据均衡,能够增强你响应的时间。
现在总结一下AMS2000产品到底满足了哪些要求,第一点是满足不同应用等级的SLAs,这一点是面向新的中端产品,肯定是整合很多应用,而不是简单部署化的应用。这个时候不同的响应时间和带宽的需求,需要产品有多样化的影响。
这是通过创新的动态技术来实现热点消除、负载均衡以及核心性的后端的SAS技术,提供了一个目前行业内其它厂商所不能提供的后端带宽支持的能力,同样,存储分层可以实施到非常精简的低成本技术在不同的介质之前实现数据库的管理。
第二个是持续增长的速度,可以满足你业务需求,第三点是数据保护。像我们标准的镜像技术之外,内嵌等等都有很多丰富的存储服务。
今天的内容就给大家汇报到这里,感谢大家跟我们一起交流新产品,谢谢大家。