尽管虚拟化可支持多种存储方式,然而在部署时,很多企业同时选择把大多数数据从本地磁盘迁移到某种共享存储上。这种对共享存储的依赖或许正是虚拟化为数据中心带来的最大变革。
通过把数据存储需求从大量的未经充分利用的磁盘迁移到类似于SAN的中央设备上,虚拟存储使得企业可以整合存储资源并进行集中化管理。虚拟存储这些表面上的优点也对传统数据中心的很多方面带来了巨大的压力,尤其是在存储资源消耗的快速增长方面。
很多刚刚接触虚拟化的企业都是第一次进入共享存储领域。对于包含了SAN的虚拟化存储部署而言,系统架构管理员需要面临的挑战有很多。
虚拟存储投入上面临的挑战
对于虚拟存储部署而言,最佳方案是把所有的存储需求都从单个服务器迁移出来集中到SAN上,不过这种做法伴随着明显的成本增加。在很多SAN环境中,虚拟服务器通常都是存储资源消耗的大户。而SAN存储本身的成本已经非常高,再加上为专用连接设备所增加的投入,进一步加重了虚拟存储架构的成本因素。尤其是采用光纤架构时,光纤存储加上专用的光纤交换机和需要在每台服务器上安装的HBA卡,成本非常高。
用于提供虚拟存储能力的存储控制器也增加了初始投入,不过另一方面它可以极大地减少虚拟化安装对存储资源的消耗。考虑到这些因素,在开始部署虚拟共享存储时,需要有一大笔的前期存储设备投入。
虚拟存储及其备份
虚拟化完成了对服务器的大规模整合,同时也把数据存储需求从大量原先互不相连的独立服务器迁移到了集中的存储设备上。这种变革为数据保护策略的实施提供了更大的灵活性。尽管传统的备份和恢复策略依然可以用于虚拟架构,不过现在我们有了更为高效的模式。
简单地讲,传统的备份代理方式可以被基于SAN的备份代替。现在很多虚拟化友好的存储产品,针对集中后的数据提供了大量的数据保护选项。例如NetApp的SnapVault,提供了基于磁盘的SAN备份方案。
这种基于磁盘的备份方式监控的是磁盘上的数据块内容。在虚拟服务器架构上,这些数据块可能会横跨多台虚拟机。而SnapVault引擎会跟踪那些变化了的数据块,从而在进行保护时跳过大量没有发生改变的数据块。
相比更加简单和整合的数据保护方案,虚拟存储基于SAN备份方式最大的优点在于其极短的恢复时间。基于磁盘的备份和恢复要比从磁带上恢复某些内容快得多。
很多企业致力于把所有的数据保护工作都交给SAN存储控制器来完成,但是这并不是一种所有企业都可以引用的模式。完全基于SAN存储实现数据备份,要受到带宽、远程站点维护和现有投资等因素的限制。
集中存储的其它考虑
当然,SAN存储是昂贵的。不过某些级别的虚拟存储设备所带有的功能可以为客户节省出在存储设备本身所投入的成本。例如重复数据删除功能,SAN存储控制器监控多个磁盘上是否有相同的数据块,然后只保留重复数据块的一个实例,从而避免在多块磁盘上重复写入多次相同数据。
当整合到SAN中的虚拟机是基于同一个源创建的时候,这种情况跟重复数据删除功能可以很好地结合起来。现在多数虚拟环境部署都是基于虚拟机模板进行 的,例如从某个模板创建了10台虚拟机,在多数情况下这10台虚拟机在数据块级别上没有太大的差别。尤其是虚拟机的操作系统部分,即使打过补丁和升级过, 在其整个生命周期内也是基本相同的。
而虚拟化存储设备通过逐字比对把存储需求尽可能减少到裸数据大小。某些存储产品还提供了重复数据删除担保。NetApp是虚拟化担保方面的行业领导者,在该内容下,NetApp承诺虚拟化部署可以至少节约50%的空间。
重复数据删除功能是考虑采用哪种虚拟化存储设备时需要考虑的关键因素之一。这项功能可以帮助建立成本模型来分析哪种产品适合什么样的需求。
多数的SAN存储都带有前端控制器,它是虚拟化所需存储设备初始化投资需要考虑的一个重要方面。而在选择存储平台之前,很重要的一点是分析出实际有 多少TB的数据量。假设对虚拟存储容量需求只有3TB,那么就没有必要为了节省空间而选择带有重复数据删除功能的大型双控制器SAN存储设备。如果虚拟存 储设备的数据量在15TB以上,那么投资带有额外功能的SAN设备就非常有意义。