2012企业大数据状况调查报告
渠道在线 发表于:12年11月20日 11:52 [原创] 存储在线
调查背景
随着用户数据量的暴增,其数据的存储也出现高速增长。在大数据时代,当前用户IT应用出现新的变化,数据结构类型出现新的特点,结构化数据、半结构 化数据和非结构化数据并处于高速增长状态。针对这一现象,DOIT特别针对中国企业大数据状况进行此次调查,以探寻大数据背景下的中国企业数据存储及应用 的特点和趋势,也希望可以帮助企业用户能够在 2012年把握大数据业务的现状,为企业转型和业务发展提供帮助,迎接大数据给企业带来的新机遇。
2012年企业大数据状况调查问卷所涉足的用户领域和行业都比较全面,通过调查分析发现,企业所面临的大数据结构类型主要分为三类,包括结构化数 据、非结构化数据、半结构化数据;企业基础架构已经不适应大数据的发展,有待进一步更新;企业处理大数据方面存在一系列问题需要解决。
大数据类型分析
随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。大数据的数据格式包括哪些呢?这个问题,在现在看来似乎很是简单,对于大数据的定义当前也比较明确了,总的来说大数据 具备4个“V”,或者说其特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多,包括结构化、半结构化、非结构化类型。 如当前大家经常提及的网络日志、视频、图片、地理位置信息等等。第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第 四,处理速度快。1秒定律。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”—— Volume,Variety,Value,Velocity。
在统计本次调查的数据显示,54%的用户所在的公司的大数据结构类型属于结构化数据、半结构化数据与非结构化数据三者皆有,可见,用户在大数据类型方面已经呈现出类型繁多的现状。
另外,在用户看来,目前所在的公司大数据出现非结构化数据明显增多的情况占了调查样本的40%左右,而有30%的人出现所有数据类型都明显增多的情况。而结构化数据类型和半结构化数据类型都增多的情况有所放缓。