数据经济时代,世界上最具有价值的资源,不再是石油而是数据,这已是一种共识。
但是数据和石油不同,石油可以直接变现,没有使用门槛;而数据要转化为价值,除了技术,恐怕还需要一点点运气,这就像被苹果砸到的绝不只有牛顿,泡过澡的也不仅有阿基米德,但要洞悉万有引力、浮力定律,这不是普通人可以做到的!不是吗?
对于数据来说,技术很重要!从数据中台到亚马逊云科技智能湖仓架构,提供的都是技术手段。
简单看一下亚马逊云科技的智能湖仓架构,从数据湖到数据仓库,从大数据处理、日志分析到、关系数据库、非关系数据库,再到机器学习,大大小小40多种软件工具和服务,不要说使用,先把Amazon Glue、Amazon Athena、Amazon EMR、Amazon Aurora、Amazon DynamoDB、Amazon SageMaker、Amazon Redshift、Amazon ElasticSerach分别是什么搞清楚就不容易了!这还仅仅是一个开始,要想用好更是难上加难,对吗?
既然如此,为什么我们不换个认识问题的方法。很多时候,我们并不了解、掌握使用工具,但我们应该知道,使用这些工具能够给我们带来什么?
我们可以看一些典型案例。
在这个案例中,我们可以看到用智能湖仓解决了“数据孤岛问题”,接下来解决了报表的问题。
报表就是智能数仓架构的价值吗?
关于报表,这是数据仓库重点解决的问题。但数据库很大,以及跨数据库、复杂查询的时候,我们往往依靠数据仓库来解决问题。但这是狭义上的概念。
智能数仓不仅仅解决狭义上的报表,更进一步要解决包括非结构化数据的查询问题。以上TCL案例的背景是产品国际化的问题,TCL产品种类众多,消费者众多,如何透过消费者为中心的角度,对不同国家和地区用户的消费行为进行分析,这不仅需要业务系统数据的支撑,更重要的是需要依靠IoT数据的分析,很多消费者需求就隐藏在IoT数据的背后,这个报表就是广义上的,这也是智慧湖仓的意义所在。
智能湖仓更加强调从数据仓库到非结构化、半结构化数据分析,如大数据、Elasticsearch等应用场景之间,数据的自由流动,反之亦然。简单说,人尽其才、物尽其用,针对不同应用场景以及数据场景,灵活采用适合的方案,方案之间彼此打通数据,数据的自由流动。
结合5G、IoT应用的趋势,以智能数仓为基础,会带来怎样的业务变化和创新,未来值得期待,这就是智能数仓的意义,只有40多种数据产品和服务,完全可以交给专业技术人员操控和掌握!
拥抱智能数仓架构,这需要每一个企业的战略决策!