亢海峰:大数据时代的智能存储

阿明 发表于:12年12月26日 14:10 [原创] 存储在线

  • 分享:
[导读]在谈到大数据时代的现状时,英特尔中国有限公司存储产品市场经理亢海峰 认为,需要尊重实践,需要找出大数据面前大家面临的关键问题,从中寻求更佳的解决之道。

重新定义的数据生命周期

什 么叫做重新定义的数据生命周期?以前大家探讨的是什么?信息生命周期. “说你有一个信息,它产生出来,你创建了这个信息,过一段时间,达到了一个价值的高峰,大家对这个信息访问都很频繁,都喜欢这个信息。然后过了一段时间, 这个信息过时用不到了,就把数据删除,这是传统的生命周期,从出生,到高潮,到低谷,到删除。” 亢海峰说道。

而现在的数据,随着数据的累积,随着时间的推移,相应的数据越来越多得到的信息就越来越多。新一轮数据量的积累之后就获得新的数据价值,称之为价值的排浪,它会呈排浪的形式逐渐从数据中挖掘出信息,这一切取决于取决于大家对于信息的理解和积累。

对于存储来讲怎么划分这种周期?“最下面的存储介质大家基本上放在磁带上需要长期的归档.或者放在磁盘库上,或者是大容量的,低成本的介质上.对性能又一定需要的数据就用高速的磁盘,性能要求再高的用闪存盘,SSD等等的数据。

可 见,数据的生命周期已经截然的改变了。今天对于数据的划分是逻辑的划分。第一,大量的不常访问的数据,通过磁盘的介质进行长期的归档。第二,这一层的数据 一定要满足不断的增长,因为没有时间去删除,更何况是要挖掘出来大家以前没有的,看不到的价值。第三以后要查询数据时就要快速读取,能不能把长期存起来的 数据迅速找到,拿到一个快速的数据层,使得实现数据挖掘的价值,从数据变成信息,从信息变成决策,影响未来的发展。

可见,存储所面临的问题和挑战,首先是数据太多,其次难以管理。第三是运营支出。最后是资源锁定利用率不高等。

在 传统的数据中心,大家看到了交易型的数据库,如何来解决这样的问题,通过网络连到了一个存储,然后为了保证这个存储的可用性,把数据备份,而后多数据中心 做实时容灾,这是非常经典的存储架构。,但是对于数据的存储方面,目前主流的四个需求已经呈现出来,第一个是重复数据删除:比如每天大家生活中最常见的发 邮件,大家会抄送给很多人,我们的邮件服务器上会有很多重复的邮件副本,这些数据也会占用大量空间 第二:实时的压缩:刚刚说两个数据中心以前产生一百兆的数据,通过千兆和万兆传出去,没有问题,如果你有5个TB的,你通过网上传输,还不如拿着硬盘坐飞 机过去来得快,因为受制于网络带宽。可不可以把数据进行压缩后再传过去,这也是一个解决的方式。

第三个是分层存储,大家谈到了在一个存储里面,这个数据是不是说一开始并不是热点的数据,后来的由于某种需求变热,而后变冷,存储的介质要求一定是不一样的,如何按照需求来移动冷热数据到对应的存储层上这也是一个存储的需求。,

第四: 是自动精简配置也将是存储的需求之一。

[责任编辑:黄辉]
大黄
以备份起家的CommVault近两年的解决方案不断向更全面的数据保护转型,并对数据管理、数据挖掘也有了一些关注。CommVault中国区技术总监蔡报永接受采访时表示CommVault将继续做一家专注做数据管理和信息管理的软件厂商。
官方微信
weixin
精彩专题更多
华为OceanStor V3系列存储系统是面向企业级应用的新一代统一存储产品。在功能、性能、效率、可靠性和易用性上都达到业界领先水平,很好的满足了大型数据库OLTP/OLAP、文件共享、云计算等各种应用下的数据存储需求。
12月15日,中国闪存联盟成立,同时IBM Flash System卓越中心正式启动
DOIT、DOSTOR、易会移动客户端播报中国存储峰会盛况。
 

公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册 | 订阅中心

Copyright © 2013 DOIT Media, All rights Reserved.