数据存储产业服务平台

如何防范数据在“云”中化为乌有?

我们越来越习惯于依赖Web服务,并将这视为理所当然的事情。这其中的关键在于,我们很多人都理所当然地认为,我们上传的数据,比如今天拍摄的图片存放在某个网站上,或是我们写的博客文章等,明天依然会在网络上。这种假设在很大程度上是因为我们假设这些服务明天依然会存在。

这些网站今天能够正常访问,但是明天就有可能消失得无影无踪了。在过去几年里,我们看到了许许多多这样的例子。比如,老牌社交网站Friendster和GeoCities。前者在今年五月份为了重新设计网站删除了用户数据,而后者在2009年就关张了。

换句话说,没有任何事物是永恒的。我们托管数据的Web服务也会消失。在出现这种情况时,你需要有一个防范计划。在下面,我们将看一些案例,这些案例包括用户数据在哪个环节被遗失或有遗失风险,企业(和他们的用户)如何应对这种情况,以及采取什么措施来保护信息安全。

最终关闭的Web服务

很遗憾,我们已经看到了许多关于Web服务被关闭、出售或遗失数据的案例。

MySpace

MySpace曾经一度是人气值颇高的社交网络,但是在Facebook崛起的冲击下变得黯然失色。MySpace的缓慢死去和不成功的重生,提出了一些关于现有用户数据将怎么处理,是否应该找出一个简单的办法导出这些信息的问题。

2008年,MySpace推出了一种被称为“数据迁移创新”的功能。但是这一功能并不是为了将数据从MySpace中导出,也无法自动导入其他网站,让用户继续使用联系人信息。更糟糕的是,在MySpace的服务条款中,开发者明令禁止创建可将用户信息导出并用于其他服务的应用。但是这并没能阻止人们创建专挖MySpace墙角的工具,如Make Data Make Sense的博客导出工具。

Google视频

在谷歌于2006年收购了YouTube这后,Google视频就变得多余了。2009年,谷歌关闭了Google视频的上传新视频功能,但用户的强烈抗议使得谷歌最终没有彻底关闭所有服务,Google视频上的所有视频仍然能够手动归档。那些付费使用、下载并拥有/租用所查找到的项目的用户仍然能够访问他们以前购买的内容,那些在系统中还拥有大量资费的用户可以将他们的费用转到Google Checkout服务上(后来,谷歌宣布他们还将提供信用卡退款服务。2011年4月,谷歌宣布Google视频上的内容可以无限期保留,直至所有的剩余视频全部转移到YouTube上)。与其他被关闭的Web服务一样,问题不仅仅是上面的内容,同时还涉及到用户对该网站的投入。

Sidekick

2009年10月,由于存储着用户电子邮件、联系人信息等个人数据的服务器故障,导致大约80万名拥有Sidekick手机的T-Mobile用户的数据全部丢失。最初的报道称,这些数据被永远地丢失了,但是后来大部分数据还是被恢复了。这并不代表T-Mobile和微软(负责管理储存着Sidekick数据的服务器)受到的影响就小一些。更糟糕的是,除了与电脑同步的数据外,用户短期内根本无法恢复他们的数据。

Sidekick的数据服务一直中断到了2011年5月31日。微软在一份声明中称,T-Mobile在myT-Mobile.com上发布了一款增强型Web工具,可以轻松地将他们的个人数据,包括联系人、照片、日程表、备注、日历和浏览器书签等从危险的服务中导出至新设备、电脑或指定的电子邮件账户上。如果他们在数据中断的早期提供了一些如此方便的工具,或是作为一种例行方式,允许Sidekick用户存储他们全部数据,那么上面那一幕悲剧可能就不会发生。

博客和Web托管服务。由于博客和免费网站如今已经成为了用后即扔的服务,那么这些服务大批死亡就一点也不惊奇了。 GeoCities曾经是Web早期商业活动中的佼佼者,该服务在2009年被关闭让大量网民感到非常遗憾。虽然雅虎基本上没有采取什么措施以维持这一网站,但是大量第三方却在努力挽救GeoCities上的数据。与此同时,Windows Live Spaces也在2011年3月关闭了服务,不过用户可以选择将他们的数据迁移至WordPress上。今年5月24日,雅虎的MyBlogLog也被关闭。这次提供了一个如何将数据迁出MyBlogLog的教程。

Lala.com

对于Lala.com 的用户来说,他们面对的问题非常复杂。Lala.com在线音乐服务让用户可以较低的价格购买流媒体音乐,其在2009年12月被苹果收购。用户在 Lala.com里的资金可以转到iTunes,但是他们以前所购买的流媒体音乐将永远消失。也就是说,目前没有任何规定允许将购买的流媒体音乐进行合法的MP3下载。

Lala.com的命运带来了一个问题。那就是有多少媒体服务提供的是“租借”而不是“购买”模式,用户在什么情况下才能感觉到这些数据是他们自己的?用户又在多大程度上愿意花钱访问那些只能持续一晚上的东西?

这些问题已经有了答案,已不再是问题了,因为它们涉及到用户消费性服务特征的概念性改变,并且深受公司名声的影响。比如,几乎没有人认为亚马逊会停止服务,因此在购买Kindle电子书时就和购买年轻的歌星出的流媒体音乐一样不需要犹豫。

数据能否迁移至关重要

如果你正在决定是否使用特殊的Web服务,那么它们可以帮助你搞清楚数据是如何被处理的,以及这一服务能够提供一些挽救数据或是将信息转移至线下的办法。以下特征需要关注。

数据应使用便于下载的开放格式。网站或服务用心保护用户数据的一个最佳证据是用户能够通过服务备份他们的数据。如果没有用于下载数据备份的末端工具,那么你可能被迫要手动下载这些数据了,因此任何可以避免让你遇到这种麻烦的东西都值得关注。比如类似维基百科的Wikia.com允许你保存整个维基或个别页面为纯文本文件,用于归档或下线编辑。

有意思的是,谷歌正在向这一领域大举进军,他们最近开始测试他们的Google+社交网络。其增加的功能允许通过谷歌Checkout导出(联系人、圈内朋友等)个人数据。实际测试结果是在将数据转移至其他服务时这一功能非常有用。

由服务或第三方提供的数据工具。如果不能通过服务的Web界面直接访问数据,那么就要有能够通过服务的API为你提供数据的应用。你可能必须要独立地做一些程序设计以利用这些API。不过在做这些之前,可以先四处找一找,说不定其他人已经做好了这些工作,这些结果都可以免费使用。

Forrester首席分析师Andrew Reichman称,用户应当审视所使用的任何服务,即使服务提供商已经公布了他们的退出策略。换句话说,对于任何数据迁移性的声明都要持谨慎态度。他说:“即便在数据交换标准下,你依然会受到代表管理员或公司运营设备策略的支配。”

服务条款。如今几乎所有的服务都有服务条款,基本上涵盖了所有可以想到的服务功能。Reichman称:“仔细阅读服务等级协议、合同,以及违约时的处罚措施非常关键。在选择服务提供商前,最重要的一个步骤是制订退出策略,或是讨论一下万一用户希望退订服务或是提供商取消服务后应当如何处理。”在服务条款中越是很少详细提及,你就越应当谨慎。

Yankee集团分析师George Hamilton非常认同这一观点。他说:“在这里要提醒买方的是,要清楚服务提供商是如何保护存储的数据或使用中的数据,以及知道这些数据是如何备份的。”

服务之间要能够展开竞争:要让用户更为自由地迁移他们的数据,即便用户的判断错了也要让用户能够将他们的数据迁移走。Hamilton称:“提供商在出售他们的服务时不应当通过技术手段将用户‘套牢’在他们的服务中。”他强调行业的大趋势是朝着可以让数据相互迁移的开放标准发展。

关注各种危险苗头

如果一个服务正在被关闭,服务商可能会通知用户吗?很多时候提前发现一些事件的苗头的最佳地方并不在服务商本身。

ArchiveTeam网站列出了一份有关闭风险或正在死亡的网站名单。如果你正在使用名单中的某个网站,那么你最好考虑一个将你的数据转移到别处,至少要将这些数据在其他可靠的地方进行备份的方案。

Reichman建议关注一下服务提供商公布的一系列数据。他说:“你无法发现潜在的提供商是否有财务问题,但是你可以通过调查提供商公布的一系列财务数据发现一些问题。如果可能的话还要找一下有关这家提供商的历史资料和相关的新闻报道。即将被收购或被剥离、裁员或是进行战略调整的传言都是可能陷入麻烦的苗头。”

Reichman和Hamilton均表示,找到预警信息的机率并不大,即便是财务方面的预警信息也是一样。 Hamilton称:“遇到财务麻烦的公司通常都不会提前透露这种麻烦。你需要有前瞻性。如果他们是一家上市公司,你可以查看他们的财报。如果不是,那么你应当关注他们是否有什么新闻。如果你对他们的生存能力表示怀疑,那就首先不要选他们。”

如果工作需要或是压力迫使你进行选择,那么你很难对一个特殊的服务说不,尤其是在没有选择时。比如,虽然Facebook缺乏数据迁移性并且存在隐私问题,但是在一段时期内,我们很难放弃 Facebook——每个人都在使用它。如今,Facebook的统治地位可能会被Google+的出现和LinkedIn的成功所打破。

其他的预警信息还有:

服务质量下降。对于一个正在缓慢崩溃的服务来说,其服务中断和性能问题会越来越多,Hamilton认为,这是一个非常明显的信号。他称:“一种服务一般不会对投诉电话和电子邮件做出回应。”

第三方支持减少。拥有API的网站通常都会发展出一种第三方应用文化——如图片托管网站的图像上传应用,或是直接与服务整合在一起的应用。如果这类应用研发数量出现下降,那么这表明或者该服务商正在想方设法拓展用户基础。而如果发展速度放缓并不是因为市场饱和,而是因为优秀程序员的出走,那这绝对不是一个坏兆头。

服务条款出现调整或武断行为。许多用户放弃某一个Web服务的背后原因并不是因为这一服务面临生存威胁,而是因为服务商所做的一些事情。一个最常见的原因就是更改服务条款,这一举动会引起许多用户的不满。这一举动毫无意义,因为服务条款本身就充斥着许多费话。除非详细解释,否则任何改动的含义都不明确。如DropBox条款中写到,如果政府提出要求,他们会把存储的文件交给政府——这迫使公司增加了对后果的解释,“你的数据仍然归你所有,他们不会打乱这些数据,除非他们别无选择。”(换句话说就是“除了运营服务所需要的有限权力外,这些条款不授予我们任何有关你的数据或知识财产的权力”)

不同的人对于相同的事物容忍度不尽相同。因此那些激怒你的邻居的事情可能并不会激怒你。但是如果你听说你所使用的服务发生了这种事情,那就要留意了。此外,任何时候被要求重新确认服务条款,请仔细阅读其中被修改过的地方。

阅读服务条款

服务条款是任何服务中的一部分,你不应忽视它。因为它准确地描述出了能够用你的数据做什么,不能做什么。服务条款过于晦涩,将关键点隐藏在多个条款中没有任何益处。以下是经常出现在网站服务条款中的几个重要条款,它们会影响到我们的数据迁移。

关于第三方程序的规定。许多网站明令禁止使用未经认证的、用于下载或收集网站数据的应用,违者将中止服务。如果你离开其服务,这种威胁没有什么意义,但是如果你只是想通过这种程序定期备份一下你的数据,那么这一条款将会带来麻烦。这些规定常常代表着服务商对于数据迁移性的立场。他们可能不会出面阻止你从服务中导出数据,但是他们可能会增加这种条款为数据迁移制造障碍。

许多这方面的规定都含糊不清。如雅虎服务条款第6段J项规定,禁止 “在连接至雅虎服务时不遵守要求、程序、政策或网络规定,包括使用任何设备、软件或程序绕开我们的排除列表,”这让人很自然地认为包括了Web下载或其他类似应用。在大多数时间里,他们很难判别是否在使用这种应用,除非许多人开始使用这种应用,个人用户账户内的大量信息被下载时,服务商会试图探测这类工具并采取措施封杀它们。

忽视服务条款中关于第三方应用规定的用户将使自己置于风险之中。Hamilton称:“从法律角度上说,你正在违反服务条款或是违反版权法。如果网络下载工具经常在一个网站上使用,它们将会导致一些性能问题,或变成拒绝服务攻击。”

重新使用你的内容。一些网站的服务条款允许将你贴在自己账户内的东西可以在其他内容中重新显示。如果你看到这种条款不要惊慌,请仔细阅读它们。该条款的存在主要是为了让你贴的东西出现在宣传资料上,比如在网站首页上被循环展示或是仅仅是为了进行内部管理。

比如,谷歌的服务条款在第11.1条中规定:“您保有在服务上或透过服务提交、张贴或展示的内容中已持有的著作权及任何其他权利。通过提交、张贴或展示内容,您给予谷歌一项永久性的、不可撤销的、世界各地的、免交使用费的及非排他性的许可,以复制、改编、修改、翻译、发布、公开实施、公开展示及分发您在服务上或通过服务提交、张贴或展示的任何内容。此项许可仅以使谷歌可以展示、分发及宣传服务为目的,并可按某些服务的附加条款就该等服务撤销此项许可。” 许多服务中都保留了相似的条款。

现实/现有。这也一个包罗万象的条款,它的实际意思是,服务没有特定义务提供连续的运行时间,以保护你的数据的完整性或是让服务处于激活状态。

随意中止。最后,一些服务条款中还有一个允许他们能够随意中止你的账户的条款。如果你看到了这种条款请不要感到吃惊,这是指他们踢走那些不守规定或是消耗了大量服务资源的用户的挡箭牌。在大多数时间,你不需要担心有这种情况,但是如果你使用了非认证的工具撷取数据或为你的数据建立镜像,那么他们可能会根据这一条款将你踢走。谷歌在其服务条款第4.3条中写入了这一条,雅虎则在其服务条款的第15节中写入了这一条。在这两个案例中,这一条款还可让服务提供商根本不需要给出任何理由就关闭他们的服务。

制订退出策略

如果你对所使用的服务并未感到不安,但仍然想制订一个退出策略的话,那么以下一些要点将对你所帮助。

将所有的东西在本地留下备份十分关键。完全值得信任的存储是你自己的物理存储,因此确保所有的重要东西在本地都有备份。如果你总是很放心地将所有的东西都放在网站上,那么现在就要改掉这个习惯。Web服务应当被视为复制器,而不是储藏室。

例如,不要因为信任远程服务而将你的照片放在其中,因为服务的数据保留规定可能并不符合你的利益。最流行的图片托管服务Flickr不允许你访问上传照片的原始拷贝,除非你是付费账户。虽然Flump或FlickrEdit等工具可能无法帮助你挽救那些不允许公众访问的照片,但是它们可以帮助你从流媒体中提取照片。

另一方面,许多Gmail用户对他们将全部邮件存储在谷歌服务器上的行为并没有什么不安。由于Gmail可以通过POP3 和 IMAP方式连接,因此很容易将邮件保存在本地。用户很容易养成信任Gmail,将邮件存储在上面的习惯——这一习惯至少会持续到下一次网络大瘫痪或谷歌云计算故障时。

将服务商的数据备份在本地。如果网站允许你将你的数据备份在本地,那一定要这么做。按步骤将数据备份在本地,看一下整个过程的复杂性——如操作中要涉及多少个步骤,以及是否需要第三方工具等。

需要注意的是,操作过程可能会在事先没有提示的情况下发生变化,所以你应当经常性的或是在得知服务操作发生变化时充分检查一下操作程序。

关注引入或去除了哪些第三方应用。如果你依靠第三方应用来帮助你备份数据,那么你应当注意这些应用变动很频繁。你六个月前下载的应用就有可能已经被服务提供商所封杀,或是被替代,或是出现了新的或更高级的替代品。换句话说就是要经常关注更新并检查你的备份机制,确保它们能够正常工作。

最终的底线

大多数人对于Web服务与生俱来的最终关闭似乎并没有太多的考虑,仅仅是因为它们提供了丰厚的回报。最终关闭目前已经成为越来越不确定的问题因素,而这又是这类服务所共同面对的问题。

Web服务的经历告诉我们,任何网站都会消失,只要时间跨度够长。即便有这样的问题,大多数Web服务几乎都没有提供可以让用户轻松导出数据以离开该服务的工具。既然留住这些用户可以让服务商获得更大的既得利益,那么为什么不设置障碍呢?让用户能够轻松切换至其他竞争者那里,将会损害他们的利益。

另一方面,那些提供了数据导出工具的服务商将会获得其他方面的优势:那就是用户对他们的信任,这是其他竞争者所没有的。信任是Web世界中的货币,其价值就如同美元一样。任何Web服务要想获得长期利润就应当提供这类工具。

未经允许不得转载:存储在线-存储专业媒体 » 如何防范数据在“云”中化为乌有?