数据存储产业服务平台

如何将大数据迁移到云存储

如今,很多企业的IT管理人员都在考虑将企业数据向云中迁移,云存储逐渐成为一个热门的趋势。如果为目前的信息技术产业搭配关键词,云存储无疑是其中之一。权威技术研究和咨询公司Gartner预测,到2015年,云存储将增长89.5%,市场份额达到28.8亿美元;到2016年,共享内容并且能够实现从多个设备上并发访问内容的愿望将促使消费者将超过三分之一的数字内容存储到云中。越来越多的客户咨询有关将 50TB 左右的数据迁移至云环境的问题。从理论上来说,将数据移至云环境是一个很简单的问题,而实际上,有很多重要的问题需要提前考虑,比如:您的带宽有多少?您的数据规模有多大?您需要恢复数据吗?可接受的数据恢复时间是多长?您的云服务提供商允许您来“植入”数据吗(例如,将驱动器或设备发送给客户,由客户在本地备份其数据,然后将驱动器/设备递送给提供商)?您的云服务提供商有基于云的服务器以便您能够直接从云存储恢复数据吗?

接下来,让我们仔细分析两个计划将50TB 数据移至云端的客户案例。一个客户有一个 T1 线路,而另一个客户则有光纤 OC3 网络。

例 1:具有 T1 线路的客户

50TB 的数据,通过 1.544 Mbps,链路也称为 T1 线路)= 79124 小时或者近 3297 天

首次通过 T1 备份 50TB 数据(典型重复数据删除率为 57%)= 33549 小时或 1398 天

连续通过 T1 备份 50TB 数据(典型不间断重复数据删除率为 90%)= 8387 小时或 349 天,这代表了预计 10% 的日增量和 90% 的重复数据删除率。在这个例子中,很显然,对于云服务提供商而言,收到每日增量数据的时间并不合理。

例 2:拥有 OC3 网络的客户

50TB 数据,通过 OC3 = 788 小时或者近 32 天

首次通过 OC3 备份 50TB 数据(重复数据删除率为 57%)= 334 小时或 14 天

连续通过 OC3 备份 50TB 数据(重复数据删除率为 90%)= 84 小时或 3.5 天,重申一下,这代表了预计 10% 的日增量和 90% 的重复数据删除率。云服务提供商仍然没有在 24 小时的时间窗口内收到每天的变更数据。如果要使提供备份或归档数据的时间窗口不超过24 小时,则是一个更大的挑战。

另外,要说明的一点是,目前假设的是一个仅有最低 WAN 开销无其他网络负载的“原始”环境。但如果您使用这些线路上网、收发电子邮箱或拨打 IP 电话的话,那么,对于带宽和数据传输的时间影响不言而喻。

下表列出了基于这些相同假设细分的 10TB 数据。

类型

MB/s 计的有效带宽

有效 MB/sec,包括协议 (MB/s)

传输10 TB数据所需时间

T-1

1.54

0.17

1.82

T-3

45

5.05

23

OC-1

52

5.85

20

OC-3

156

18

6

OC-12

622

72

2

OC-24

1244

143

1

OC-48

2488

287

9.69 小时

OC-192

9952

1146

2.42 小时

OC-255

13210

1522

1.83 小时

这就是为什么我们在部署云存储前将需要考虑的问题列举出来,其实将数据写入云只是第一步而已。如果在灾难事件发生的情况下云是您公司的存储资源的一部分,那么将数据找回来特别是备份或者归档数据将更加重要。您的云服务提供商允许您向云端“植入”数据吗?您的云服务提供商有基于云的服务器以便您能够直接从云存储恢复数据吗?如果遇到灾难,您的云服务提供商会将存有您的数据的驱动器递送给您以供数据恢复吗?对这些问题的回答至关重要。

随着大规模、50TB 数据云解决方案的出现,客户该如何应对上述数学挑战?现在,我要向大家介绍针对这一问题的一个有效的解决方案。在这个案例中,客户与一家云服务提供商密切合作,该提供商能够:1) 让客户将数据“植入”云环境 2) 基于 VMware 构建其计算云以充分利用物理到虚拟 (P2V) 技术。这种类型的云解决方案具有诸多优势。

首先,向云环境“植入”数据的功能使客户能够将介质递送至云服务提供商,随后只需以在线方式即可发送变更数据。在充分利用了集成数据缩减技术(如源端重复数据删除和压缩)的情况下,这种方式显著减少了所需的带宽。

其次,一旦出现灾难,客户能够通过服务提供商的云接入口进行数据恢复。由于服务提供商运行了 VMware,客户不仅能够进行数据恢复,还能够充分利用 P2V 技术 — 在 CommVault 的案例中,我们的 Virtualize Me 功能能够自动将物理服务器恢复到虚拟机。此外,企业还应当向其云服务提供商询问他们是否能够使用工具来以多流方式将数据传至云,并最大程度利用带宽,尤其是,对于有专用 1Mbps 带宽客户。CommVault的 Simpana 9软件中引入了第三代重复数据删除技术,可以在客户端删除90% 的冗余备份和归档数据。Simpana 9 使用这种方式将客户端——磁盘——磁带中的重复数据删除扩展到整个企业,将网络中发送的数据量锐减90%,藉此有助于帮助企业显著加快将大量备份或归档数据迁移至云环境的速度。很多客户向我反馈,通过使用现代数据管理功能(如重复数据删除、压缩和多流等技术),显著缩短了他们向云环境迁移大量数据所需的时间 — 从数月缩短至数天,甚至数小时。

对于将来考虑将硬件及物理设备迁移到“云端”的客户,希望以上的建议也会使他们云存储的部署准备更加充分和周到。因为,我们相信有效规划此类实施对于将数据迁移至云和测试数据恢复目标的成功具有举足轻重的作用。

未经允许不得转载:存储在线-存储专业媒体 » 如何将大数据迁移到云存储