YEXP

YEXP

阿里云瑶池数据库-集云原生大成,释放AI价值

来源:互联网

数据库作为数字基础设施的根技术,历经60年的发展历程,从上世纪 50 年代的层次数据库、网状数据库,到上世纪 70 年代的关系型数据库,再到上世纪 90 年代的分析型数据库,2000 年的非关系型数据库,总体保持着10年一代的发展态势。不过在数据库发展的前50年,数据库世界的主角都是国外的IT厂商。但是自 2010年以来,国内厂商在云数据库领域逐渐大放异彩,并在分布式、HTAP、Serverless等技术方面取得了一定成绩。

随着数字经济的不断发展,人们对数字体验提出全量、全要素、全流程等数字化的新需求,这给数据库提出了新的挑战。在这样的大背景下,阿里云上周五在北京召开的瑶池数据库峰会,让我们看到在云数据库这样一条全新的赛道中,以阿里云为代表的头部云厂商,凭借其强大的先发技术优势,向着“云原生+一站式”演进,带领国产数据库实现换道超车。

峰会上,孙家广院士强调了基础软件在数字经济发展中的关键作用,并指出云计算为基础软件提供了空前的机遇与发展潜力。随着云计算创新的推进,数据库作为企业IT系统的核心组件之一,其架构也发生了重大变革。云原生架构的数据库已经成为市场的中坚力量,是企业数字化转型的核心驱动。

针对客户的业务场景需求,阿里云宣布将云原生数据库PolarDB和云原生数据仓库AnalyticDB打通融合,形成“云原生一体化”的HTAP解决方案,同时推出了全新多模云原生数据库Lindorm AI 引擎,可在数据库内集成AI 能力,对非结构化数据进行智能分析和处理,进一步提升数据价值。

瑶池数据库-云数据库2.0时代下阿里云的技术突破

云原生是Do more with less理念的产物,Do more with less就是让用户以更少的操作,实现更好的智能化效果。早期的云数据库1.0,大部分是以ECS中的自建数据库和云厂商托管的RDS数据库形态存在的,这些云数据库架构使用的是传统架构,只是运行在云基础设施上,数据库本身并没有为云做太多的改造和适配。局限于其架构,各项资源等比率的限制,其弹性范围、资源利用率都受到较大的限制。而在这个数字化的时代,云数据库1.0的形态明显不符合要求了,只有能够充分降低数据使用成本的数据库才能生存,只有生于云、长于云、基于云原生架构的数据库,才能迎得用户的青睐。

从技术层面上讲,云数据库1.0一般实现了存储计算分离和一写多读,但是CPU和内存依然强绑定,不过这种绑定对用户来说是不合理的,比如对OLAP类分析型数据库,用户使用少量CPU就可以定期同步和更新数据,但对OLTP交易型数据库来说,数据访问一般存在热点,因此少量的内存就足够了, 而CPU的需求会远高于对内存的需求。

对CPU和内存资源的解耦,是云数据库2.0最大的技术升级。针对这项技术,阿里云在2021年的SIGMOD大会上发布了题为《PolarDB Serverless: A Cloud Native Database for Disaggregated Data Centers》的论文,对于云数据库2.0的改造方案进行详细论述,PolarDB实现了内存与计算及存储的解耦,内存进一步池化,使得弹性能力呈数量级提升。这种情况下,CPU和内存资源由于池化使得使用率大幅提升,让云原生的技术价值得到充分体现。

“云原生+一站式”,平台化特性打开数据价值大门的钥匙

在大数据领域的巨头TeraData宣布退出中国市场之后,一站式的数据服务平台已成为用户最强烈的需求。对于传统数据仓库、数据湖等产品的用户来说,将大数据技术栈进行开源组件替换的难度很大,虽然Hadoop等技术社区近几年都在蓬勃发展,也发布了很多优秀的产品,但想让这些产品融合在一起共同稳定工作就不容易了,让数据在搬运,清洗,ETL等环节中不出问题恐怕要烧高香。在这种情况下想快速获取数据价值,无异于痴人说梦。为了应对这种国外巨头退出,开源组件又难以协同工作的问题,最行之有效的解决方案,就是通过一站式、平台化的数据管理与服务解决方案,弥合不同种类数据库组件与应用之间的鸿沟,让用户可以在同一个界面访问数据库。

在这种一站式数据库的解决方案上,阿里云的瑶池数据库堪称其中典范,瑶池不但将PolarDB与AnalyticDB打通融合,形成“云原生一体化”的HTAP解决方案。该方案为用户提供统一入口,内置实时同步链路,通过PolarDB和AnalyticDB数据共享,性能优化的行列转换,兼具数据处理与分析能力,为用户带来一站式的数据库使用体验。基于某游戏行业客户的真实场景测算,相比其他方案,云原生一体化HTAP解决方案以50%的成本提供了2倍性能。这也让用户在TeraData退出中国后,有了成本更低、效率更高的数据库产品可以选择。

“Lindorm”AI引擎-开启AIGC时代的智能计算

在数字时代,一切由数据驱动已经成为了主流,而这背后的原因其实是目前驱动企业向前发展的源动力,已经由之前的石油、煤碳转向了由数据驱动的供给和消费。而这其中,数据库作为供给侧,AI 作为消费侧,是数据闭环中核心的两大组成部分。

在经历了近十年的移动互联网大潮冲击之后,目前我们在电商、视频、音乐、小说等方面积累了海量数据(603138),而在海量数据的冲击下,我国的移动互联网大厂转而采用HBase等分布式开源组件处理这些大数据,从而形成了数据供给侧升级的潮流,但是HBase等组件在数据消费侧提供的查询语言不是SQL,这也造成之前可视化、报表、表盘等等应用在这种NoSQL的技术环境下完全不可用,而且机器学习(ML)等新兴的数据处理方法也鲜有与传统SQL相兼容的方案。所以在数据消费侧,传统SQL与AI两条线场景融合,形成一体化的方案,也是市场的强烈需求,业界呼唤一款能够使用SQL来完成建模的数据库产品,而瑶池旗下的云原生多模数据库Lindorm就是能解决这一痛点的解决方案。

在Lindorm内置的AI引擎中,仅用几段SQL,就能在数据库内完成模型部署和推理,省去安装部署步骤,快速搭建起一个AI应用。

数据库未来展望 - 四化渐成未来趋势

如我们前文所述在数据库领域,未来的发展方向就是将云原生数据库这一神器,持续向着技术创新的深水区推进。阿里云数据库产品事业部负责人李飞飞在峰会上表示:“四化即——"云原生化、平台化、一体化、智能化",将成为数据库技术发展的重要趋势,其中云原生代表着高可靠、高弹性、低成本、高效率;平台化代表着瑶池数据库基于云平台提供一站式数据管理与服务,提供标准的OpenAPI体系,减少业务烟囱;一体化则通过多产品一体化的体验,简化开发、管理和运维,避免数据搬迁,实现处理分析一体化、离在线一体化、集中分布一体化、多模处理一体化;智能化则代表了数据库发展的未来,引领数据库与AI深度融合,为开发者和客户提供更便捷的数据服务。

相信未来以阿里云瑶池为代表的国产数据库还将继续朝着四化的方向前行,不断提升技术优势,并在一体化、智能化等方面,继续挖掘发展空间,助力加速各行各业的数字化转型。

本文首发于微信公众号:看懂经济。文章内容属作者个人观点,不代表本站立场。投资者据此操作,风险请自担。

瑶池数据库