2020年11月17日,企业级开源分布式数据库厂商PingCAP宣布完成 2.7 亿美元的D轮融资,据介绍本轮融资将用于分布式数据库关键核心技术的研发,聚焦解决方案和专业服务支持体系的不断完善,持续加大开源社区生态体系建设。
可以说PingCAP TiDB是真正第一个诞生于中国的分布式开源数据库,而且现在也走向了世界。PingCAP创始人兼CEO刘奇表示,TiDB的产品哲学,第一是低调;第二是通用型数据库。
PingCAP创始人兼CEO刘奇
TiDB因HTAP理念而生
TiDB缘起要从2012年Google发布的论文说起,其描述了Google使用的海量关系型数据库F1/Spanner解决了关系型数据库、弹性扩展以及全球分布的问题,并在生产中大规模使用,现在TiDB已经成为新一代NewSQL数据库的代表。
数据库可以说是企业的一个必需品,在数据暴涨的今天,弹性成为一个迫切需要解决的问题,但IT基础技术栈又相对分裂,对管理和运维造成难题。即保持原有的易用性,又能获取弹性伸缩的能力,就是TiDB的设计目标。
Gartner在2005年提出了HTAP(Hybrid transactional/analytical processing,在线事务处理/在线分析处理数据库)概念,HTAP 数据库需要同时支持OLTP和OLAP场景。基于创新的计算存储框架,在同一份数据上保证事务的同时支持实时分析,省去了费时的ETL过程。
TiDB就是面向HTAP的理念,其可以实现金融级别的高可用性,高速分析能力,无限的弹性伸缩能力,MySQL兼容、极低的业务改造成本。PingCAP联合创始人兼CTO黄东旭表示,我们相信云是未来,并且全面拥抱Kubernetes,不依赖特性硬件并且支持多种计算单元。
在云原生分布式数据库的路上走下去
2020年5月,TiDB推出4.0版本,在提供良好的交易处理能力前提下,创新性地引入了基于Raft算法的HTAP架构解决方案。这套架构设计成功地解决了以往困扰HTAP架构的隔离性,一致性和性能之间的矛盾,以此为基础的论文《TiDB: A Raft-based HTAP Database》被国际顶级数据库会议VLDB 2020收录,标志着该架构得到了全球学术界的认可。
TiDB可以轻松部署在任何公有云、私有云和混合云之上,极大降低用户的总体拥有成本(TCO),提升资源利用率。2020年6月,PingCAP发布TiDB Cloud产品,TiDB Cloud可以通过水平扩展,拥有近乎无限的存储容量和计算能力,使用户可以专注在自身业务的快速增长。
目前PingCAP已经拥有包括开源分布式数据库产品、解决方案与咨询、技术支持与培训认证服务,加速企业的数字化转型。
走向行业,还原数据库的本真
现如今,TiDB已被全球超过1500家企业用于线上生产环境。其中亿联银行在核心系统数据库侧分布式改造上使用TiDB,大幅度降低改造难度与风险,使业务模型和数据模型无需反向适配数据库架构,吞吐量及性能可以随在线横向透明扩展,保障业务灵活性及适配分布式核心应用,降低运维复杂度与成本。
TiDB还有一些海外客户,PayPay是日本软银与日本雅虎出资成立的一家移动支付公司,2019年软银投放大量补贴进行移动支付营销,对PayPay当时的数据库出现了瓶颈。截至2020年3月已经投产支付服务系统作为在线交易查询汇聚和电子钱包支付业务,并依赖高度弹性和扩展能力,平稳的支持了各种大促活动。
刘奇表示,开源产品在获取客户上的特点就是企业在遇到问题时会多方面寻找解决方案,这也是开源技术被发现最多的途径,而且客户现在都有多云的需求,所以在迁移上不希望做太多的改造,希望在不同的云上都有一样的体验。
未来PingCAP还将继续夯实产品、完善生态合作,助力企业及开发者简化开发,加速迭代,进一步推进云数据库服务在全球市场的覆盖,持续赋能企业数字化转型。
好文章,需要你的鼓励
研究人员意外发现,标准MOSFET晶体管可同时模拟神经元和突触行为,形成"神经突触随机存取存储器"(NSRAM)。该技术仅需一至两个晶体管即可实现传统需数十乃至数百个元件才能完成的神经信号处理,且与现有硅基制造工艺完全兼容,良率达100%。未来有望应用于边缘AI及高能效神经形态芯片,长远或可挑战GPU地位。
牛津大学提出PHYSIFORMER,一种扩散变换器模型,通过三维网格顶点轨迹直接在世界坐标空间预测刚性与弹性物体的物理运动,一次性生成全序列轨迹,超越自回归基线。
本文提出一种评估人工智能风险的新方法,借鉴生态学与演化论视角,从理论生态模型中推导出三项风险指标,涵盖种群模型与生态系统模型。研究旨在为AI治理策略提供量化工具,并对分析局限性及政策改进方向进行了深入探讨,为构建更科学的AI风险评估体系提供参考框架。
研究发现主流奖励模型对同等质量答案给出差异悬殊的分数,并提出"奖励聚类"算法通过蒙特卡洛随机失活将连续分数离散化,在不重训模型的前提下有效减少AI训练中的奖励作弊现象。