云端数据I/O尚待优化
朱朋博 发表于:14年08月19日 11:20 [翻译] 存储在线
non-cloudable?虽然念起来朗朗上口但是什么是non-cloudable数据?我所理解的non-cloudable数据是指,那些可以容忍在较高延迟下访问的或者说需要被系统或程序来缓存的数据。
我决定花一些时间在我的办公室ping一下Google 、 Yahoo、Dropbox这三个网站,然后取个平均时间。以下是我得到的毫秒为单位的平均延时数据:
Google: 51
Yahoo: 63
Dropbox: 83
这些数据仅仅是从我的电脑访问网站的延时时间,不包括把需要访问的数据加入到存储路径的时间,这大概需要另外15毫秒的时间。即使不用机械硬盘换做固态硬盘最少也得需要3毫秒。
这些数据还比较保守。我们看一组最高最低访问延迟范围:
Low end latency
Google: 54/66
Yahoo: 66/78
Dropbox: 86/98
假设机械硬盘和固态硬盘在本地,从你的服务器访问到数据需要耗费的时间,要是固态硬盘大概需要5毫秒,要是6TB的企业级硬盘的话则需要10毫秒。
我们分别看一下:云与本地服务器低延迟差异和云与本地服务器高延迟差异。
Google: 6.6x/108x
Yahoo: 7.8x/132x
Dropbox: 9.8x/172x
很明显,需要快速访问和随机访问的数据在云端的表现没有本地好,除非整个文件都被缓存到了本地,但是这样的话,多个人同时写入一个文件的时候也会引起一些列问题。因为I/O性能对一些应用程序来说非常重要,所以还需要有人针对云端做一些优化。