中国独特的商业环境和对技术自主可控的强烈需求,带来了中国数据库管理系统(以下简称为“数据库”)市场的繁荣和多样性。
虽然中国的数据库厂商在许多方面,如云生态系统的建立和云财务治理等方面,仍然落后于以亚马逊云服务、谷歌、微软和甲骨文为代表的外国厂商,但在中国独特的业务环境下,本土厂商的产品演进十分迅速,且产生了差异化优势,因此在一些应用场景中具备竞争力。
中国本土数据库具有以下几个主要技术特征。
分布式事务型数据库的采用率正在上升
分布式事务型数据库已经成为企业机构支撑核心业务系统的现实选择,它们在中国的使用增长速度要快于世界其他地区。
Gartner对分布式事务型数据库(DTDB)的定义是:可在任何分布式数据库实例节点上执行事务的数据库。这项技术的特点在于,在接受地理上分散分布的节点写入的同时,保持数据完整性和一致性,且性能合格。
在中国的移动互联网蓬勃发展过程中,实现业务敏捷性的主要阻碍是数据工作负载规模化的速度和成本。工作负载的需求增长,不仅使业务性能降低,而且,如果企业机构决定扩充资源,则还会带来额外的高昂硬件成本。使用DTDB,不仅可以支持应用的高并发和高数据吞吐量,还可以减少对由外国厂商提供的大型机硬件的依赖——这也与国家“自主可控”战略举措的目标相符。
今天,随着诸如分布式一致性共识算法和并发控制技术等大量技术创新的出现,DTDB可确保在不牺牲过多可扩展性和性能的情况下,实现数据的高度一致性。与此同时,DTDB与公有云的兼容性也正在持续提升;因此,在资源使用不断变化且难以预测的环境中,云部署将成为理想选择。
数据密集型应用场景需要超高性能数据库
在过去的三年间,新冠疫情进一步加快了网上购物、线上出行和在线教育等数字化应用场景的普及。作为所有应用的核心数据基础设施,数据库需要提供更为强大的性能,以支持全部数据密集型应用场景。
一些典型的超高性能应用场景包括:
中国的数据库厂商都在不断演进各类技术,以支持数据密集型应用场景。这些技术包括大规模并行处理(MPP)、分布式事务、内存数据处理和行列混合处理等。近年来,一批初创厂商开始快速获得关注。这些厂商将超高性能作为其核心竞争差异化优势,丰富了企业机构的选择面,但也使得市场状况变得更加复杂。
各类专业化的数据库正不断融合,成为集成各类功能的统一型数据库服务
在过去的15年间,中国企业机构采用了各类专业化的数据库,用于各类不同类型数据库的操作和分析。比如:
由于每个应用场景均有海量的数据库产品可供选择,相应地,连接这些数据库的数据管道也越建越多,导致企业机构数据和分析架构的复杂性大大增加。这一复杂性也导致了运营效率低下,获取洞察的时间被延长。为解决这一问题,中国和全球的数据库厂商都在采取行动,扩大各自产品的应用场景覆盖范围,形成了数据库功能融合的局面。这一融合趋势在多模型数据库中得以体现。这类数据库可以通过多个应用编程接口(API)来支持多种存储和持久保存数据的方式。
如图1所示,Gartner从数据类型和时间敏感性几个方面对这一趋势进行了观察研究。
图1:数据库产品的融合
好文章,需要你的鼓励
在千亿模型满天飞,MOE架构正流行的当下,一个在AI领域名不见经传的企业,贝壳找房,发布了一款32B的稠密模型,AM-Thinking- V1。在包括AIME在内的多项AI基准测试中,这款中等参数模型碾压了满血版671B DeepSeek-R1,性能与阿里刚刚发布的Qwen3-235B-A22B持平。
首尔国立大学研究团队提出了"多模态对抗组合性"(MAC)基准测试,评估预训练多模态表示(如CLIP)在理解文本与图像、视频、音频关系时的组合性弱点。研究使用大语言模型生成欺骗性文本,通过样本成功率和多样性双重指标进行评估。团队创新性地提出了多样性促进自训练方法,即使使用较小的Llama-3.1-8B模型,也能显著提高攻击成功率和多样性。实验在COCO、MSRVTT和AudioCaps数据集上验证,该方法优于现有技术,并展示了良好的跨模型迁移性,为构建更可靠的多模态系统提供了重要见解。
SridBench是首个评估人工智能模型科研插图绘制能力的基准测试,由中国科学技术大学等机构研究团队创建。该测试包含1,120个来自自然科学和计算机科学13个学科的高质量样本,并设计了六维评估标准。实验结果显示,即使是目前表现最佳的GPT-4o-image模型也仅达到基本合格水平,文本信息缺失、视觉元素不完整和科学错误是主要瓶颈。这项研究揭示了AI科研绘图能力的现状,为未来技术发展提供了方向。
ChartLens是马里兰大学与Adobe研究院合作开发的创新技术,专门解决多模态大型语言模型在图表理解中的"幻觉"问题。这项研究提出了"后验细粒度视觉归因"方法,能够将AI对图表的分析结果与图表中的具体视觉元素(如特定柱形或数据点)精确关联起来,使AI的回答变得可验证。研究团队还创建了ChartVA-Eval基准测试集,并证明他们的方法比现有技术提高了26-66%的归因准确率,为金融分析、政策制定和科学研究等领域提供了更可靠的图表理解工具。