2020年11月17日,企业级开源分布式数据库厂商PingCAP宣布完成 2.7 亿美元的D轮融资,据介绍本轮融资将用于分布式数据库关键核心技术的研发,聚焦解决方案和专业服务支持体系的不断完善,持续加大开源社区生态体系建设。
可以说PingCAP TiDB是真正第一个诞生于中国的分布式开源数据库,而且现在也走向了世界。PingCAP创始人兼CEO刘奇表示,TiDB的产品哲学,第一是低调;第二是通用型数据库。
PingCAP创始人兼CEO刘奇
TiDB因HTAP理念而生
TiDB缘起要从2012年Google发布的论文说起,其描述了Google使用的海量关系型数据库F1/Spanner解决了关系型数据库、弹性扩展以及全球分布的问题,并在生产中大规模使用,现在TiDB已经成为新一代NewSQL数据库的代表。
数据库可以说是企业的一个必需品,在数据暴涨的今天,弹性成为一个迫切需要解决的问题,但IT基础技术栈又相对分裂,对管理和运维造成难题。即保持原有的易用性,又能获取弹性伸缩的能力,就是TiDB的设计目标。
Gartner在2005年提出了HTAP(Hybrid transactional/analytical processing,在线事务处理/在线分析处理数据库)概念,HTAP 数据库需要同时支持OLTP和OLAP场景。基于创新的计算存储框架,在同一份数据上保证事务的同时支持实时分析,省去了费时的ETL过程。
TiDB就是面向HTAP的理念,其可以实现金融级别的高可用性,高速分析能力,无限的弹性伸缩能力,MySQL兼容、极低的业务改造成本。PingCAP联合创始人兼CTO黄东旭表示,我们相信云是未来,并且全面拥抱Kubernetes,不依赖特性硬件并且支持多种计算单元。
在云原生分布式数据库的路上走下去
2020年5月,TiDB推出4.0版本,在提供良好的交易处理能力前提下,创新性地引入了基于Raft算法的HTAP架构解决方案。这套架构设计成功地解决了以往困扰HTAP架构的隔离性,一致性和性能之间的矛盾,以此为基础的论文《TiDB: A Raft-based HTAP Database》被国际顶级数据库会议VLDB 2020收录,标志着该架构得到了全球学术界的认可。
TiDB可以轻松部署在任何公有云、私有云和混合云之上,极大降低用户的总体拥有成本(TCO),提升资源利用率。2020年6月,PingCAP发布TiDB Cloud产品,TiDB Cloud可以通过水平扩展,拥有近乎无限的存储容量和计算能力,使用户可以专注在自身业务的快速增长。
目前PingCAP已经拥有包括开源分布式数据库产品、解决方案与咨询、技术支持与培训认证服务,加速企业的数字化转型。
走向行业,还原数据库的本真
现如今,TiDB已被全球超过1500家企业用于线上生产环境。其中亿联银行在核心系统数据库侧分布式改造上使用TiDB,大幅度降低改造难度与风险,使业务模型和数据模型无需反向适配数据库架构,吞吐量及性能可以随在线横向透明扩展,保障业务灵活性及适配分布式核心应用,降低运维复杂度与成本。
TiDB还有一些海外客户,PayPay是日本软银与日本雅虎出资成立的一家移动支付公司,2019年软银投放大量补贴进行移动支付营销,对PayPay当时的数据库出现了瓶颈。截至2020年3月已经投产支付服务系统作为在线交易查询汇聚和电子钱包支付业务,并依赖高度弹性和扩展能力,平稳的支持了各种大促活动。
刘奇表示,开源产品在获取客户上的特点就是企业在遇到问题时会多方面寻找解决方案,这也是开源技术被发现最多的途径,而且客户现在都有多云的需求,所以在迁移上不希望做太多的改造,希望在不同的云上都有一样的体验。
未来PingCAP还将继续夯实产品、完善生态合作,助力企业及开发者简化开发,加速迭代,进一步推进云数据库服务在全球市场的覆盖,持续赋能企业数字化转型。
好文章,需要你的鼓励
TAE Technologies在最新一轮投资中获1.5亿美元,累计融资约18亿美元。公司利用 AI 技术优化融合反应堆设计,目标于 2030 年代商业化发电,谷歌等巨头均参与合作。
这项来自KU Leuven、中科大和上海Memory Tensor公司的研究探索了如何利用拼图游戏训练多模态大型语言模型的视觉推理能力。研究发现,现有模型在未经训练时表现近似随机猜测,但通过强化学习能达到近乎完美的准确率并泛化到更复杂的拼图配置。有趣的是,模型能否有效学习与是否包含明确推理过程无关,且复杂推理模式是预先存在而非突然出现的。此外,研究证明强化学习在泛化能力上优于监督微调,挑战了传统的模型训练范式。这些发现不仅揭示了AI视觉理解的机制,还为未来多模态模型研发提供了重要参考。
Nvidia 正在全球数据中心推广 AI 芯片,其最新 Blackwell 架构在 MLPerf 基准测试中获得最高性能,大幅加速下一代 AI 应用的训练与部署。
这项研究提出了LoHoVLA,一种用于长时序实体任务的统一视觉-语言-动作模型,融合了高层任务规划和低层动作控制功能。与传统方法不同,它利用单一预训练视觉语言模型同时生成语言子任务和机器人动作,并采用分层闭环控制机制增强鲁棒性。研究团队构建了包含20个长时序任务的LoHoSet数据集,实验结果显示LoHoVLA在Ravens模拟器中显著优于现有方法,展现出统一架构在实现可泛化实体智能方面的潜力。