中国独特的商业环境和对技术自主可控的强烈需求,带来了中国数据库管理系统(以下简称为“数据库”)市场的繁荣和多样性。
虽然中国的数据库厂商在许多方面,如云生态系统的建立和云财务治理等方面,仍然落后于以亚马逊云服务、谷歌、微软和甲骨文为代表的外国厂商,但在中国独特的业务环境下,本土厂商的产品演进十分迅速,且产生了差异化优势,因此在一些应用场景中具备竞争力。
中国本土数据库具有以下几个主要技术特征。
分布式事务型数据库的采用率正在上升
分布式事务型数据库已经成为企业机构支撑核心业务系统的现实选择,它们在中国的使用增长速度要快于世界其他地区。
Gartner对分布式事务型数据库(DTDB)的定义是:可在任何分布式数据库实例节点上执行事务的数据库。这项技术的特点在于,在接受地理上分散分布的节点写入的同时,保持数据完整性和一致性,且性能合格。
在中国的移动互联网蓬勃发展过程中,实现业务敏捷性的主要阻碍是数据工作负载规模化的速度和成本。工作负载的需求增长,不仅使业务性能降低,而且,如果企业机构决定扩充资源,则还会带来额外的高昂硬件成本。使用DTDB,不仅可以支持应用的高并发和高数据吞吐量,还可以减少对由外国厂商提供的大型机硬件的依赖——这也与国家“自主可控”战略举措的目标相符。
今天,随着诸如分布式一致性共识算法和并发控制技术等大量技术创新的出现,DTDB可确保在不牺牲过多可扩展性和性能的情况下,实现数据的高度一致性。与此同时,DTDB与公有云的兼容性也正在持续提升;因此,在资源使用不断变化且难以预测的环境中,云部署将成为理想选择。
数据密集型应用场景需要超高性能数据库
在过去的三年间,新冠疫情进一步加快了网上购物、线上出行和在线教育等数字化应用场景的普及。作为所有应用的核心数据基础设施,数据库需要提供更为强大的性能,以支持全部数据密集型应用场景。
一些典型的超高性能应用场景包括:
中国的数据库厂商都在不断演进各类技术,以支持数据密集型应用场景。这些技术包括大规模并行处理(MPP)、分布式事务、内存数据处理和行列混合处理等。近年来,一批初创厂商开始快速获得关注。这些厂商将超高性能作为其核心竞争差异化优势,丰富了企业机构的选择面,但也使得市场状况变得更加复杂。
各类专业化的数据库正不断融合,成为集成各类功能的统一型数据库服务
在过去的15年间,中国企业机构采用了各类专业化的数据库,用于各类不同类型数据库的操作和分析。比如:
由于每个应用场景均有海量的数据库产品可供选择,相应地,连接这些数据库的数据管道也越建越多,导致企业机构数据和分析架构的复杂性大大增加。这一复杂性也导致了运营效率低下,获取洞察的时间被延长。为解决这一问题,中国和全球的数据库厂商都在采取行动,扩大各自产品的应用场景覆盖范围,形成了数据库功能融合的局面。这一融合趋势在多模型数据库中得以体现。这类数据库可以通过多个应用编程接口(API)来支持多种存储和持久保存数据的方式。
如图1所示,Gartner从数据类型和时间敏感性几个方面对这一趋势进行了观察研究。
图1:数据库产品的融合
好文章,需要你的鼓励
南洋理工大学研究团队开发了WorldMem框架,首次让AI拥有真正的长期记忆能力,解决了虚拟世界模拟中的一致性问题。该系统通过记忆银行存储历史场景,并使用智能检索机制,让AI能准确重现之前的场景和事件,即使间隔很长时间。实验显示在Minecraft和真实场景中都表现出色,为游戏、自动驾驶、机器人等领域带来广阔应用前景。
AWS通过升级SageMaker机器学习平台来扩展市场地位,新增观测能力、连接式编码环境和GPU集群性能管理功能。面对谷歌和微软的激烈竞争,AWS专注于为企业提供AI基础设施支撑。SageMaker新功能包括深入洞察模型性能下降原因、为开发者提供更多计算资源控制权,以及支持本地IDE连接部署。这些更新主要源于客户需求,旨在解决AI模型开发中的实际问题。
MTS AI研究团队提出RewardRanker系统,通过重排序模型和迭代自训练显著提升AI代码生成质量。该方法让13.4B参数模型超越33B大模型,在多种编程语言上表现优异,甚至在C++上超越GPT-4。通过引入困难负样本和PPO优化,系统能从多个代码候选中选出最优方案,为AI编程助手的实用化奠定基础。