我们被一遍遍的灌输着:为每样东西备份,并保持其离线,或保存在云中,或者至少在多个地方保存。人们有时对此引以为豪,说即使他们的办公室被烧毁,他们仍然在某处有个备份。
这就是问题,是不是?表面上看存储变得如此便宜,可以复制或者保留三分,但是为什么信息容易丢失呢?
如果用我的智能手机拍照,它将瞬间不断被复制:从手机,到Google+上传到Picasa,然后复制到Dropbox 自己的照片功能。为什么不这么做呢?对不对?Dropbox提供了2.5GB上传照片的免费空间,而Google+除了照片分辨率和视频长度外没有其它限制。
当我的智能手机操作系统进行升级时,我可能会做出另一个备份“以防万一”,备份在我的电脑上,直到我决定因电脑格式化再将其备份为止。只有当需要更多存储空间时,这种设想才真正结束,我开始意识到十多年来我所利用的备份空间本可以获得更好的利用,但因为它太便宜了,而没有购买更多。
我不是说不进行备份或者限制一定程度的冗余,因为多个备份可拯救一个企业或者可能使Pixar电影免受损坏,从这突出了一点事实,副本需要跟踪,无论是什么信息。
我感觉,敏感性信息是一个相当不错的开始,而公司有时甚至忘记此点。Allphone在无人值守的公共FTP服务器上给员工留下时间表和支付备份,而AAPT忘记了包含顾客信息的墨尔本IT服务器。
但是,什么样的信息是不敏感的,至少在备份到可用服务时该信息是不敏感的?例如,如果我正从事一项关键的IT项目,完成一年后,发现包含受版权保护的代码,如果我删除对该代码的所有引用,索赔人愿意放弃诉讼,我是否应该删除呢?
如果谷歌认为它真的不知道在街道视图抓取中所收集到的哪些数据是真实的,那么你就不能责怪该公司进行多次备份,而遗忘所保存的地方。与此相似,谷歌可能有足够的存储空间,可进行尽可能多的备份,因为进行备份是“正确的事情”。
我们推测,作为一家基于搜索引擎技术建立起来的公司,应能定位其自己的东西,这种说法对谷歌来说毫无疑问非常尴尬。但别弄错了:我认为我们大部分人并未做到更好。