如今,混合云在许多新兴创新应用中发挥着核心作用,尤其是在人工智能(AI)和其他能够创造新商业价值和提高运营效率的新兴技术方面表现最为显著。据调查结果显示,2024年至2029年,中国人工智能行业的市场规模将进一步扩大,2029年市场规模将突破万亿大关。 但是,AI需要大量且高质量的数据以充分发挥自身潜力。如果没有高质量的数据,AI的输出就会变得低效或不准确。
肯睿Cloudera与Foundry的研究发现,36%的IT领导者将这一点列为首要挑战。此外,一项IDC调查显示,中国只有22%的企业可较好地定义应用人工智能的数据要求,建立初步的数据质量标准和数据质量提升机制。
为了达到这一数据质量水平,大多数业务和IT领导者都选择了混合数据管理方法,在云、本地或两者结合的环境中移动数据,将数据最有效地用于分析或投喂给AI模型。然而,仅采用混合云基础设施并不能解决这个问题。要想获得有意义的结果,并创建一个可扩展的灵活数据架构,需要采用“真正的”混合云数据管理方法。
那么,什么是“真正的”混合云呢?接下来我们将深入探讨这个问题。
重塑云端数据管理
将混合云战略提升到“真正的”混合云水平需要考虑许多方面。其中,其中几个重要因素需要重点关注。“真正的”混合云的主要特点之一是具备能够在数据中心、云和边缘作为单一平台运行的能力。虽然支持多云是正确的方向,但对于已经投资建设数据中心的企业或需要在本地保留某些数据和分析的企业来说,光凭这一点并不能获得完整的解决方案。在“真正的”混合云中,数据和工作负载可以在各个环境之间自由、多向移动。这种形式的混合云比标准的混合云更深入,覆盖了获取、仓储、机器学习等整个数据生命周期,即便数据生命周期从头到尾被分割到完全不同的环境中也不例外。
数据的形式多种多样。混合云方案之所以和处理结构化、半结构化或非结构化数据。“真正的”混合云包含能够维护和利用各种格式数据的数据存储库。而要想实现“真正的”混合云,一个必不可少的要素就是开放式数据湖仓一体架构,这种数据存储方式能够管理大量非结构化或半结构化数据,并在适当的环境中将这些数据用于分析工具或AI模型。采用湖仓一体架构可以极大地降低传统环境中随着时间的推移而积累的复杂性,从而为员工带来更加简单的体验和工作流程。
采用正确的混合云可以提高数据可见性和可访问性,进而创造业务价值。例如,肯睿Cloudera帮助Legal & General Investment Management (LGIM)公司灵活应对市场变化、发掘新机遇和加强 ESG方面的工作。经过双方的共同努力,肯睿Cloudera 帮助该公司奠定了实基,其未能利数创更的值
建立统一的数据治理方法
只有当负责人能够看到数据、理解数据并迅速了解数据的部署位置和部署方式时,才能正确利用所有数据。正确的方法之一是采取一种无论数据位于何处、处于何种状态或如何被部署到分析中,都能提供单一通用控制平面的解决方案。这也意味着“真正的”混合云能够帮助企业避免使用大量仅适用于特定环境的工具。通过一个统一的全数据视图,该混合云方案提供了更清晰的性能、资源分配和端到端的数据和分析费用全貌。“真正的”混合云固有的跨职能性也为数据治理提供了关键助力。由于数据会在混合环境中不断移动,这种方法有助于提高可见性,在数据从生成位移动需要的位时,更容对其用规并保合规。
采用“真正的”混合云方案不止是为了解决眼前的挑战,甚至不止是为了改善数据治理。数据架构一直在发生变化,并且随着时间的推移,创新的步伐只会越来越快。由此,我们可以看出“真正的”混合云的重要性,尤其是当企业开始转型,青睐于高度灵活且可扩展的自适应数据架构时。
【本文作者刘隶放,系肯睿中国Cloudera大中华区技术总监】