数据存储产业服务平台

专家博客:电子发现数据管理和统一存储目录

本文作者Christine Taylor是Taneja Group的一位分析师,她在IT和通信业拥有超过10年的经验。她曾写过大量关于技术在电子发现、合规和治理以及信息管理中作用的文章。

DOSTOR存储在线1月6日国际报道:电子发现流程现在好像已经渗透到法律诉讼事务的开始阶段。但是实际上一个成功的电子发现流程依赖于良好管理的数据所奠定的坚实基础,这也就是为什么信息管理实际上是典型的法律电子发现工作流第一阶段的原因。但是还是有一些法律专家和IT专家忽略这个基础:法律专家之所以如此是因为许多律师很少能理解企业存储架构,而IT专家之所以会如此是因为他们没有看到数据的良好管理可以给电子发现带来好处。

针对法律的电子发现以及针对治理、风险和合规(GRC)的电子发现都要求系统对电子数据要求能够有快速、准确和可靠的响应。不过,企业数据往往都放在不同的数据孤岛中,这会导致不确定的和糟糕的电子发现流程。电子发现的低水准会导致数据采集缓慢、有限而昂贵,从而影响早期分析以及文档浏览流程所需要的时间。对于急需快速响应电子发现请求的公司来说,这可不是好消息。

电子发现的数据管理没那么容易

电子发现涉及的数据不是新创建的生产数据而是旧数据。新创建的活跃数据很少会参与到电子发现活动的主题中。人力资源或法律部门可能会很快意识到需要数据保留,不过大部分电子发现请求要求旧数据已经存储在归档或备份或已经在应用程序服务器中存储过一段时间。

电子发现的数据是非结构化的,是数百个不同应用程序所产生的数据并存储在不同的地理位置。电子发现请求也可以包含结构化数据,但是数据库架构可以让数据采集变得更容易。非结构化数据则缺乏查询结构因此给数据采集带来更多的困难。非结构化数据类型包括电子邮件应用程序、文件系统、SharePoint、企业内容管理(ECM)应用程序等–所有这些都来自各个不同的厂商。此外最重要的是,存储地点不同–字面上是这样。通常的选择包括SAN(存储局域网)、NAS(网络附加存储)、基于云和服务器的存储以及用户的硬盘驱动器和便携式驱动器。所有这些不同的存储地点给诉讼、合规、风险和记录管理的查询和恢复带来了一个广泛的数据域。

比起备份或应用程序服务器,归档是更好的采集来源,但是许多公司不进行归档。备份不等于归档,但是有许多公司认为它们是一样的。备份是为了目前的业务连续运行,不是为了保存经年的拷贝数据。在备份目录上搜索、恢复和浏览相关数据很没有效率–更不用说有许多公司可能还没有办法访问旧备份。此外,一些公司将它们的应用程序服务器存储当作归档一样,放任大量的应用程序数据在生产服务器上存放很长时间。与此相反,归档是为了搜索和安全而设计的,必要的时候可以过好多年仍然可以用。

归档数据的搜索也有可能比较困难。归档是一个良好的开端,但是许多公司仍然不这么做。那些进行归档的公司有许多只是集中化归档或者只在少数关键应用上进行归档,比如电子邮件。许多人想当然地认为电子邮件是主要的电子发现目标,当然归档电子邮件也是个好计划,不过文件系统和其他应用程序(比如SharePoint)也存储相关数据而我们应该找到有效的办法从这些来源采集数据。否则,所有这些不同的应用程序、服务器、存储设备和数据类型会给数据的定位和恢复带来很大的困难。

公司仍然认为数据保留就是将电子邮件发送给保管者然后告诉保管者如何保留他们的电子邮件。即使在IT人员的帮助下法律部门可以更好地保存文件,将数据迁移到一个安全的目录仍然会产生多个数据副本,占用网络带宽,甚至可能会干扰业务上的应用程序。

繁重的网络和人员工作负荷。采集和保留分散在不同地点的数据会给网络带宽和存储资源带来沉重的负担。它还会严重影响法律和IT工作人员,使他们必须花许多无序的时间用于采集和评估大量发现的文件。即使公司使用主动式电子发现工具,比如索引编制,索引编制流程本身也是需要时间的而且会产生连续的网络开销。

统一目录

高度分散的数据环境会给电子发现的相关数据采集流程带来挑战。头痛医头脚痛医脚地搜索所有数据是非常有局限性的,而且在如今的快节奏的商业和法律环境下也是不可接受的。

应对这些问题的关键就是提供一个让大多数相应数据可以统合在一个单一的物理或虚拟目录下的方法。没有哪种方法是完美的–物理目录要求公司投资新的归档平台,虚拟目录则需要索引编制等技术而这些技术也都有各自的缺点。不过无论是哪种方法,它们都好过在互联服务器、旧备份磁带、托管硬盘驱动器上分散搜索的传统方式。

我会在后续的文章中更多的关注物理目录和虚拟目录的功能和它们之间的不同点。高性能和可靠的统一目录会让搜索和数据采集变得更加有效率和更有经济型。它们不仅是你需要的工具,你也将要求有这些技术来搜索端点存储设备以便保留和处理数据。大多数电子发现目录厂商会提供这种类型的功能或将其整合到工具中。不过我还是强烈建议你主动对最大的响应数据池(你的非结构化数据归档)进行电子发现流程。

未经允许不得转载:存储在线-存储专业媒体 » 专家博客:电子发现数据管理和统一存储目录