数据存储产业服务平台

专家博客 如何管理非结构化的互动数据

本文作者George Crump是Storage Switzerland的创始人,同时也是George Crump Consulting的创始人。 

非结构化数据仍在持续增长,而且增长势头似乎毫不减弱。事实证明,对这类数据制定政策和分级将是一项异常艰巨的工作。而且大部分人事后并没有回顾和分析哪些数据应保存在哪里,保存多久的时间以及如何保证它们的安全性。在当前这种紧缩时代,这项工作也很艰巨。 这些近似命令如何执行? 如果我们用互动的方式来管理数据,会怎么样?

互动数据管理会在你保存数据的同时给那些数据制定政策和赋予信息,无需使用专门的文档管理软件。正如我们在 《专家博客 云计算数据需要第三方保障》 中所说,大部分归档系统都有一个API或者使用了一个开放访问协议如WebDav。 在移动到云归档的过程中,如果你能同时设定数据集的政策会怎么样呢?

例如,当你归档一个项目时,作为归档作业的一部分,如果你能轻松设定各项参数,比如它在被永久删除之前应该在归档中保存多久的时间、它的只读或WORM状态应该保留多久的时间、该项目的副本应该保留多少份、那些副本能否分散保存、副本的数据以后是否应减少、数据是否应压缩和重复删除、数据是否需要以原始状态保存等等,那么情况会怎么样呢? 最后你或许想给该项目增加一些关键字,以便建立索引和检索。

在数据刚刚生成时便用互动的方式设置这些参数可以让数据分级和数据政策执行变得更容易。这样还可以将数据分级和保存分成更小的任务。 大规模的任务通常很难做好,但是小任务往往就可以轻松完成。

而且这还可以逐步发展成一项由用户来完成的功能。例如,我也许会在一个月之后参考包含这篇博客文章的文件,但是我想不用说一年两年,六个月之后我可能就不会那么做了。 然而我的所有数据都通过一款本地代理软件复制到了云中。许多云存储服务如Dropbox或Soonr都提供了将数据复制到云中的代理软件。 如果那些代理软件可以在我保存文件时允许我设置上述参数,我就可以让数据管理变得更轻松容易一些。

你可以在数据中心将文件的各种参数进行分类,就象保存文件一样;如果自动分级可以扩展应用到数据中心,那就可以极大地减轻存储经理的工作量。互动数据管理可以制定分类和保留政策,并自动完成某些与文件有关的工作。

未经允许不得转载:存储在线-存储专业媒体 » 专家博客 如何管理非结构化的互动数据