数据存储产业服务平台

数据消费/分析的门槛很低,这你注意到了吗?

人人都在谈论Chat GPT,谈论AIGC、大模型,7 月 13 日在京举行的“创新涌动于先”——PingCAP 用户峰会 2023上,PingCAP 创始人兼 CEO 刘奇也引用Chat GPT、AIGC作为演讲开场。

“自然语言正在成为最热门的编程语言,帮助优秀的开发者提升 10 倍以上开发效率,这也导致数据消费需求急剧增加。如此也要求数据消费与数据分析门槛,必须降到人人可用程度。” 刘奇说。

刘奇的表述让我甚至有些狐疑:Chat GPT、AIGC是否会替代PingCAP的TiDB呢?也就是说,当我们有数据分析需求的是时候,我们是求助TiDB呢?还是求助Chat GPT呢?

让Chat GPT、AIGC成为门户,这肯定不是刘奇希望看到的结果。

在Chat GPT、AIGC强势冲击下,以TiDB为首的HATP数据库的地位如何呢?

在我们的认知中,Chat GPT、AIGC代表通用,未来发展是行业数据基于Chat GPT、AIGC通用模型的再训练,所谓专属小模型,未来会是这样一种发展和演变呢?为此,在专访环节我也询问了刘奇。

“前不久我也跟一些客户做了探讨,大家都觉得AI变化实在太快,没有人很有把握未来,Chat GPT、AIGC与数据库应用的结合前景,更多是一种预测。” 刘奇说。

刘奇表示,未来发展有几个层次,一个层次是利用Chat GPT、AIGC,用自然语言问问题,生成数据分析所需要的各种SQL语句,此前这需要非常精通数据库技术,了解一些技术细节才可能实现,如今可以通过AI来实现。另外一个层次是Chat GPT、AIGC训练一个AI小模型,用于预测用户负载变化,提高数据分析的速度和性能。第三是数据库系统架构要做到AI Ready,以TIDB Serverless为例,在架构上实现了“算算分离、存存分离、存算分离”等,进一步把数据库和Chat GPT、AIGC等AI能力结合。

以算算分离为例,我们想降低成本,数据压缩是一个很有效的方法,但是数据压缩需要消耗CPU等算力资源,会影响应用的性能和表现。在TiDB新的架构中,就可以此类负载卸载(off load),利用类似spot instances的廉价算力,或者AI小模型来解决问题,实现降本增效的目的。

“TiDB现在架构的特点,已经非常适合在各个环节里面植入AI,进而提升TiDB数据分析的能力,这是我们非常大的创新。”刘奇说。

刘奇的回答,让我对TiDB最新进展有个更新的理解。

以本次PingCAP 用户峰会 2023发布的TiDB 7 系列产品为例,新产品在规模化集群稳定性、性能方面得到了大幅提升,其中在线 DDL 性能提升 10 倍以上;OOM 降低了 99%,50TB 数据导入从天缩减到小时级,数据同步输出延迟低至秒级。所谓在线DDL(Data Definition Language) 就是在线对表进行表结构的修改(却不影响其他用户对表的增删改查操作);OOM( Out Of Memory ,超出内存空间)即内存不足,这些都是数据库应用中的棘手问题。

技术能力的提升将带来的效率的提升,以及技术应用的普及。以此发布的TiDB Cloud Serverless为例,PingCAP 引入了全新的 Cloud-native Storage Engine (CSE) 架构、全新的 Key Space 以及 Resource Control 模型,实现了无需资源规划、秒级启动、0 元起步、按使用付费、极致弹性的数据库服务,产品上线后的几个月时间便吸引了 10,000 多个活跃用户。

刘奇表示:这就像消费者到5星级酒店就餐的支出,竟然比自己做的成本还要低,听上去不可思议,但这就是TiDB Cloud Serverless的价值。

此外,PingCAP携手重量级嘉宾在大会上发布了面向中国企业级用户的“平凯数据库
,该数据库基于 TiDB Open Core(开源版) 提供增强型企业级功能,提升国产化需求的收集、研发和交付速度,提供更多元的企业级服务支持方案,以更完善的国产化生态降低中国用户升级数据基础设施的成本和复杂性。

从TiDB 7到TiDB Cloud,从TiDB Cloud到Serverless,再到“平凯数据库”,TiDB的发展一步一个脚印,结合不同时期的不同特点,将产品技术、服务发挥到极致。这就是TiDB 7的商业价值和意义。

从用户的角度,应该跟上PingCAP TiDB的发展脚步,把HTAP充分结合到数据业务创新发展的进程中,至于Chat GPT、 AIGC,它可以成为这个过程中的助手和工具,但是要彻底替代HTAP,或者把HTAP排挤到底层,至少目前,还没有进展到这个程度。

只要能够解决数据创新的问题,也就是抓到耗子,究竟是黑猫,还是是白猫,其实并不是问题的关键,对吗?!

未经允许不得转载:存储在线-存储专业媒体 » 数据消费/分析的门槛很低,这你注意到了吗?