SSD(固态硬盘)的价格现在已经开始下降,制造商鼓吹SSD是提高数据中心性能的一个有效方法,SSD性能优于当前最快的机械硬盘,但是仅仅粗暴地用SSD替换传统硬盘并不会带来明显的改善,在这种情况下,你还会坚定地支持SSD投资吗?
SSD性能会使系统瓶颈更加明显
作为一名管理员,在转换到SSD之前,你应该会认真了解SSD性能带来的好处,依赖IO的服务器应该是SSD的最佳候选, 通过Windows性能监视器可以很快识别出服务器的瓶颈。
每个服务器都有性能瓶颈 — 系统中某一硬件比其它硬件慢,根据水桶原理,导致系统的整体性能受到影响,对于运行IO密集型应用程序的服务器来说,不用监视器我们就可以推断出硬盘是系统瓶颈,机械硬盘比系统其它组件运行得慢,但情况并不总是这样,特别是组建了高性能磁盘阵列时,往往是系统其它组件存在瓶颈,在这种情况下,如果野蛮地用 SSD替换传统机械硬盘,试图通过这种方式来提升系统整体性能,那就大错特错了,投资也纯属浪费,除非解决掉非硬盘瓶颈问题。
使用Windows性能监视器发现存储瓶颈看起来像是一个非常简单的任务,数据中心存储都是集中的,因此发现瓶颈的过程是很复杂的,例如,一个通常用于评估磁盘性能的性能计数器是平均磁盘队列长度(ADQL)计数器,微软建议这个计数器不要超过2,如果超过2意味着硬盘可能变得很慢了,但它是假设单一磁盘进行测量的,如果组织使用的是SAN存储,管理员可能无法知道实际使用了多少物理磁盘。
即使管理员有一个准确的SAN映射,ADQL计数器也可能会产生误导,假设该计数器的值为6,如果你只考虑微软的建议,保持计数器值低于2,那就会出大问题,但是,如果卷跨越了5个驱动器,你需要用磁盘队列长度除以驱动器的数量,每个驱动器的ADQL平均只有1.2左右,这样算起来实际上低于微软的建议值。
根据响应时间进行推断
因为往往很难知道多少物理驱动器被映射到一个卷,因为用平均磁盘/秒计数器进行测量更有效,这个计数器允许你监视读、写和传输操作所花的时间,响应 时间不会告诉你是否因升级到SSD而受益,但它会暗示你系统的健康状态,如果你看到的响应时间在5-10毫秒之间,则表明服务器的性能表现是非常好的,但 并不是说SSD不会改善服务器的性能,只是不会出现大的存储性能问题。
使用工具分析存储流量
如果你看到高磁盘响应时间 — 大于10毫秒 — 这表明服务器硬盘出现了瓶颈,但也有可能是网络延迟造成的,因此需要注意区别。
例如,在Windows操作系统中,Windows性能监视器有单一硬盘限制,在SAN存储环境中,不能准确地给出是否应该用SSD替换传统机械硬盘的建议,微软为存储IO使用分层方法。
在Windows IO堆栈中使用了大量的组件,可以监视最底层端口级别的性能,端口干预微端口驱动的IO操作,微端口驱动是由厂商提供的底层组件,正因为如此,Windows性能监视器是无法监视微端口级别的堆栈的。
如果你怀疑光纤通道(FC)连接是瓶颈根源,需要使用第三方解决方案,如网络分析工具来分析光纤通道通信。
分析存储流量可以帮助你确定光纤通道链路带宽是否饱和,或是否存在延迟问题,如果你确定服务器存储连接存在问题,你可以通过安装额外的主机总线适配器(HBA)来改善存储性能。
不可否认,SSD性能是要比机械硬盘要好,但并不意味着用SSD替换机械硬盘就能使系统整体性能大幅提高,除非存储连接可以与存储阵列保持同步。