数据存储产业服务平台

Digital Reef新平台可为非结构化数据建索引

初创公司Digital Reef推出了一款可以为非结构化数据建立索引的内容管理平台,这款产品可以应用于电子发现、风险缓解以及存储优化等领域。

由风险投资支持的初创公司Digital Reef本周推出一款软件平台产品,这款产品可以搜索、分类、索引和管理大量非结构化数据,有助于解决电子发现和存储优化等问题。这个市场是能在当前的经济衰退环境下保持增长的少有的几个市场之一,目前的竞争非常激烈,业内厂商多达数百家。

该厂商表示,它的产品有许多独特之处,包括其独特的体系结构、在较小的空间里为各种文件和术语建立大量索引的能力、类似性引擎(similarity engine)以及可以找出内容之间关系的自动分类功能。Digital Reef的市场与业务发展副总裁Brian Giuffrida表示,这款软件平台使用了由进入系统的网关、工作路由器层和分析层等一系列系统构成的一种分级体系结构。 他说:“我可以通过在任何一个层上添加一定数量的引擎来提高性能,这种技术只有我们才有。” 他表示,还有一个因素是当索引任务失败时,工作路由器会知道这种状况并在相关设备或另一台设备上重新启动那项索引任务,而不是重新启动整个过程。

Digital Reef还可以在所有文档和其他非结构化数据中进行搜索,并且利用描述文字来建立索引。它可以分辨和重建电子邮件线程,使用模式识别技术来辨别社会保险号或者车牌号,或者利用其他源代码来查找关系。 Giuffrida表示,类似性引擎是公司最主要的知识产权,这种技术可以识别上下文信息以及近似复制。 他说:“完全复制很简单,但是近似复制就难了。”这款软件还可以按内容的不同部分的相关性顺序对它们进行排序,这样就有助于找出与相同主题相关或在某个方面具有相关性的数据。

这款软件还可以自动进行数据分类,而且无需对系统进行排列或者给它提供范例。他说:“我们创建了一个虚拟文件结构来体现组织内的所有数据,我们可以根据原始模式和内容来组织所有的内容。 我们还提出了与群组存在关系最大的术语来帮助人们了解为什么那个文件会被放到群组之中。”

其他的企业搜索和电子发现厂商表示,它们的产品和服务也有类似的功能。但是Giuffrida表示,Digital Reef的产品所提供的功能比目前市场上其他厂商的产品更为全面。 他说:“我们的索引技术的效率很高,我们不象其他厂商的技术那样需要占到原始存储容量的100%甚至200%,我们只需占用25%的容量就行了。”

几十家厂商都在最近举行的LegalTech展销会上发布了旨在帮助企业用户削减电子发现成本以及更好地处理非结构化数据的新产品或升级版产品。有些厂商承诺的产品功能似乎与Digital Reef的新产品功能类似。例如企业搜索厂商Recommind发布的新版MindServer Search就改善了相关性调整和协同搜索功能。 该公司表示,它的软件能够通过25种参数设置来改善搜索结果,还可以通过基于主题和优先权的概念搜索来对文件进行分组。

顾问公司INI Group的创始人Tony Asaro表示,虽然宏观经济趋弱以及IT开支增长放缓对于新技术厂商来说并不是好事,但是Digital Reef已经找准市场,并且提供了正确的技术。他说,群集式体系结构可以快速给大量数据建立索引,而且还可以在企业的任何一个地方搜索信息,这是一个明显的进步。

Assaro说:“许多厂商都说它们的产品能够搜索所有数据,有效给数据建立索引,拥有协同系统以及能够在不同语言和类型的文档中找出相似点,但是真正能做到的并不多。Digital Reef拥有独特的技术,似乎可以兑现它们的承诺。 鉴于电子发现、诉讼、审计和合规性需求的不断增长,Digital Reef应该有很好的发展机会。”

Digital Reef将把其软件作为版权产品或服务的方式推出。Giuffrida表示,这款软件每天可以处理3到4TB的数据的索引、准备和分类任务。 他没有透露这款软件的售价情况。Digital Reef已经拥有八家企业客户,最近在第二轮融资中又从Pilot House Ventures Group和Matrix Partners等风投公司获得了1千万美元的投资。

未经允许不得转载:存储在线-存储专业媒体 » Digital Reef新平台可为非结构化数据建索引