今年开端,“新质生产力”一词如同一场连绵的春雨,让整个科技产业浸润其中,焕发出更加蓬勃的生命力。从挥洒的甘霖之中,我们看见,“数据要素”因其显著乘数效应和创新引擎,逐渐被大众认定为发展新质生产力的核心生产要素。
落实践行数据要素,实现新质生产力的飞跃,成为当务之急的时代考题。
志当存高远,然千里之行始于足下。觅得切实可行的方案才是务实之举。在日前举行的“2024数据基础设施技术峰会”上,来自华为数据存储数据湖解决方案首席架构师郭洪星先生发表了题为“打造先进数据基础设施,加速数据要素资产化进程”的演讲,他所提出的“存算并举,前店后厂”新型基础设施架构方案,让人眼前一亮。
该方案有一个基本判断前提:如今的数据应用已经从大数据技术进化到人工智能AI技术的时代,AI大模型的快速发展,对数据产生巨大虹吸效应,缺数据将成为永恒,数据市场将成为关键的关键。
郭洪星提到:“与AI大模型发展趋势相对应,技术需求发展也必将经历缺芯 – 缺电 – 缺数据等不同的发展阶段,能否建立起愿意流通的数据市场,将成为制约AI大模型发展的核心因素。”
其次,当下数据要素流动仍面临诸多挑战:
一是数据盘不清,通常企业的数据分散在多个数据中心,有哪些数据,哪些数据可以共享,数据怎么共享,根本盘点不清楚是当前面临的首要挑战。
二是数据理不顺,数据共享出来后,把各个行业/企业的数据汇聚在一起,就面临理不顺的问题,不知道聚集了哪些数据,怎么找到相要的数据是数据要素流动面临的第二大挑战。
三是跨域数据流不动,首先是不敢流,共享后即失控,数据拥有者关心数据去那儿了?数据使用者如何自证清白?是影响数据拥有者数据共享意愿的最大障碍,其次是流不动,大量非结构化数据流动带来的网络成本开销非常大,如何实现海量数据低成本流动是需要重点解决的问题。
四是数据用不好,不知道数据有哪些,找不到想要的数据,无合适的承载平台。
因此,数据价值释放关键,需解决供得出、流得动、用得好的问题。
结合这样的判断和当前的挑战,华为给出了以八大枢纽为核心节点的全国数据一张网构建方案,提出了以存力中心为核心的“存算并举,前店后厂”新型数据基础设施架构。
面向数据要素资产化,基于专业存储打造的先进数据基础设施,通过全局统一视图、可信数据空间、数据治理框架以及存储内生安全等技术手段,确保数据要素供得出、流得动、用得好。
数据资产统一视图:针对数据盘不清,华为提供了一个贯穿数据提供方到中心,到需求方的完整网络,实现全域的数据资产一张图,让数据汇聚过程完全可视、可管、可用。在需求方则根据授权也能看到对应的数据资产,实现数据安全访问、应急访问过程中的安全缓存本地化,真正解决资产盘不清的问题。
可信数据空间:对于流不动、不敢流的问题,华为提供了一个可信的数据空间,覆盖数据供应方,中心,需求方,数据一旦进入到空间,通过数据智能合约形成整个数据的有效控制,实现全流程数据的访问控制,可以通过“4W2H”的方式来实现控制策略,避免数据一旦对外共享就变得不可控制,解决数据流不动的问题。
数据治理框架:从数据汇聚到数据分析、数据处理,到数据编目,华为提供了端到端的数据资料体系框架,支持智能数据分类、生产统一数据目录,针对不同格式/不同来源数据融合,统一数据格式,实现智能数据标签;支持数据要素智能提取,数据转化为知识;梳理数据间关系,自动生成知识图谱。同时基于40+标准算子和算子开发模板,提供北向标准API、可视化操作界面,开放生态。实现数据理得顺、用得好。
存储内生安全:通常是针对网络安全、系统安全、应用安全,存储作为数据安全的最一防,为向据全密算法、硬件芯片、操作系统、基础软件到数据全生命周期,构建了一套全流程的内生安全体系架构。基于内生安全的专业存储构建先进的存力中心,是数据资产入表的前提,是数据托管的基础。
都说磨刀不误砍柴工,实现理想,不仅要有远大目标,更要有切实可行的方案。
听雨而论道,勇立潮头的华为已率先找到了践行数据要素的破题解法,全国数据一张网构建方案已呈现出可供各行业借鉴的行动和示范。
正如郭洪星表示,携手客户和伙伴一起共同打造进存中心构建先可的数基础施,让用户像往银行里存钱一样放心托管数据。推动千行百业的数据要素服务和实践。