中国独特的商业环境和对技术自主可控的强烈需求,带来了中国数据库管理系统(以下简称为“数据库”)市场的繁荣和多样性。
虽然中国的数据库厂商在许多方面,如云生态系统的建立和云财务治理等方面,仍然落后于以亚马逊云服务、谷歌、微软和甲骨文为代表的外国厂商,但在中国独特的业务环境下,本土厂商的产品演进十分迅速,且产生了差异化优势,因此在一些应用场景中具备竞争力。
中国本土数据库具有以下几个主要技术特征。
分布式事务型数据库的采用率正在上升
分布式事务型数据库已经成为企业机构支撑核心业务系统的现实选择,它们在中国的使用增长速度要快于世界其他地区。
Gartner对分布式事务型数据库(DTDB)的定义是:可在任何分布式数据库实例节点上执行事务的数据库。这项技术的特点在于,在接受地理上分散分布的节点写入的同时,保持数据完整性和一致性,且性能合格。
在中国的移动互联网蓬勃发展过程中,实现业务敏捷性的主要阻碍是数据工作负载规模化的速度和成本。工作负载的需求增长,不仅使业务性能降低,而且,如果企业机构决定扩充资源,则还会带来额外的高昂硬件成本。使用DTDB,不仅可以支持应用的高并发和高数据吞吐量,还可以减少对由外国厂商提供的大型机硬件的依赖——这也与国家“自主可控”战略举措的目标相符。
今天,随着诸如分布式一致性共识算法和并发控制技术等大量技术创新的出现,DTDB可确保在不牺牲过多可扩展性和性能的情况下,实现数据的高度一致性。与此同时,DTDB与公有云的兼容性也正在持续提升;因此,在资源使用不断变化且难以预测的环境中,云部署将成为理想选择。
数据密集型应用场景需要超高性能数据库
在过去的三年间,新冠疫情进一步加快了网上购物、线上出行和在线教育等数字化应用场景的普及。作为所有应用的核心数据基础设施,数据库需要提供更为强大的性能,以支持全部数据密集型应用场景。
一些典型的超高性能应用场景包括:
中国的数据库厂商都在不断演进各类技术,以支持数据密集型应用场景。这些技术包括大规模并行处理(MPP)、分布式事务、内存数据处理和行列混合处理等。近年来,一批初创厂商开始快速获得关注。这些厂商将超高性能作为其核心竞争差异化优势,丰富了企业机构的选择面,但也使得市场状况变得更加复杂。
各类专业化的数据库正不断融合,成为集成各类功能的统一型数据库服务
在过去的15年间,中国企业机构采用了各类专业化的数据库,用于各类不同类型数据库的操作和分析。比如:
由于每个应用场景均有海量的数据库产品可供选择,相应地,连接这些数据库的数据管道也越建越多,导致企业机构数据和分析架构的复杂性大大增加。这一复杂性也导致了运营效率低下,获取洞察的时间被延长。为解决这一问题,中国和全球的数据库厂商都在采取行动,扩大各自产品的应用场景覆盖范围,形成了数据库功能融合的局面。这一融合趋势在多模型数据库中得以体现。这类数据库可以通过多个应用编程接口(API)来支持多种存储和持久保存数据的方式。
如图1所示,Gartner从数据类型和时间敏感性几个方面对这一趋势进行了观察研究。
图1:数据库产品的融合

好文章,需要你的鼓励
今年是AI智能体的爆发年。聊天机器人正演进为能代表用户执行任务的自主智能体,企业持续投资智能体平台。调研显示,超半数高管表示其组织已在使用AI智能体,88%在智能体上投入过半AI预算的公司已从至少一个用例中获得投资回报。Gartner预测,到2026年40%的企业软件应用将包含智能体AI,2035年智能体AI可能驱动约30%的企业应用软件收入。企业开始将AI智能体视为员工,建立招聘培训体系。
波士顿大学团队发现当今多模态AI存在严重"偏科"问题:面对冲突的文字、视觉、听觉信息时,AI过分依赖文字而忽视真实感官内容。研究团队构建MMA-Bench测试平台,通过创造视听冲突场景暴露了主流AI模型的脆弱性,并提出模态对齐调优方法,将模型准确率从25%提升至80%,为构建更可靠的多模态AI系统提供重要突破。
谷歌的Nano Banana Pro AI模型生成的图像逼真度令人震惊,其关键在于完美模拟了手机相机的拍照特征。这些AI生成的图像具备手机拍照的典型特点:明亮平坦的曝光、较大的景深范围、略显粗糙的细节处理,甚至包含噪点。该模型还能自动添加符合情境的细节元素,如房产照片的水印等,使图像更加真实可信。这种技术进步意味着辨别AI生成内容变得更加困难。
UC伯克利研究团队发现了一种名为"双重话语"的AI攻击方法,能够通过简单的词汇替换绕过当前所有主流聊天机器人的安全防护。攻击者只需用无害词汇替换危险词汇,就能让AI在不知不觉中提供危险信息。研究揭示了现有AI安全机制的根本缺陷,迫切需要开发新的防护策略来应对这一威胁。