数据库是一个历史悠久的行业,PingCAP在其中的时间并不算长,刚刚过完6岁生日。PingCAP联合创始人兼CTO黄东旭说,我们是从零开始,一行一行代码写出的TiDB新一代分布式数据库,核心代码(自主可控率)达到100%。
最近PingCAP发布了TiDB 5.0版本,这对于PingCAP就像是一个生日礼物。尤其是值得一提的是,5.0版引入MPP(Massively Parallel Processing,即大规模并行处理)架构,至此TiDB成为了具备完整HTAP(混合事务 / 分析处理,Hybrid Transactional/Analytical Processing)能力的分布式数据库。
PingCAP联合创始人兼CTO黄东旭
做“省心、放心、不担心”的企业级数据库
PingCAP的创始团队认为基础软件必须是通用才能有更高的天花板,所以TiDB一开始就被定位为通用数据库,这等于为自己设定了一个很高的目标。
5年前PingCAP带着最早的TiDB产品去和客户交流,客户第一个问题就是你的产品有没有客户,很显然PingCAP最后被拒绝了,因为数据库对于企业是核心系统,没有一个企业愿意做小白鼠。
PingCAP第一个客户也是抱着死马当活马医的态度使用了TiDB,这是一家游戏公司,其当时的数据库不能满足广告投放系统的实施查询,这家公司的CTO恰巧是黄东旭的朋友,所以抱着试试的态度,TiDB也成了救活这个公司的产品。
就这样,TiDB的第一客户是靠“救命”积累的,而这个广告系统恰好是一个HTAP场景,似乎预示了TiDB的救命能力与实时性数据处理密不可分。
在之后,陆陆续续的打单中,客户对于TiDB的接受度也越来越高,但是客户大多都还是集中在互联网企业。黄东旭一次在和客户推介的过程中,客户说你们没有金融案例,你们不是企业级数据库。这也让PingCAP有了新方向,在不断打磨产品的同时,开拓了更多金融行业客户。
从救别人的命,到自己死不了,中间隔着一个煎熬的“死亡陷阱”。“TiDB已经经过了最危险的开源鸿沟,现在是个死不了的产品了。”黄东旭说。
黄东旭对于一个真正的企业级数据库定义是,一个“省心、放心、别担心”的产品。“在做公司或者产品时,永远不要总想着行业趋势怎么变,而是永远投资在那些不会变的东西上,数据库也是一样,客户一定想要一个稳定而不操心的数据库。”
TiDB 5.0核心能力的释放
TiDB早在1.0版本就实现了OLTP Scale(在线事务处理的规模化扩展),4.0版本已经实现初步的HTAP能力,5.0版本在原有HTAP引擎TiFlash的基础上引入MPP架构,提供与存储匹配的分布式计算引擎,进一步提升海量数据下的并行计算与分析能力。
通过与TiDB-Server共享SQL前端,实现解析器(Parser)和优化器的共享,TiDB 向业务提供一体化的入口,能够自动选择单机执行或MPP模式,并且将事务型和分析型的负载隔离,使得双方在高并发量压力下互不干扰。场景实测显示,在相同硬件配置和数据量下,MPP有着数倍于Greenplum的执行速度。
而且TiDB 5.0基于分布式架构,支持云原生与多云,可以弹性扩展吞吐或存储,轻松应对高并发、海量数据场景,实现一栈式数据服务。企业级用户、互联网用户、SaaS厂商和独立软件开发商都可以通过一套TiDB系统构建数字场景应用,而不必关注底层架构。
TiDB 5.0在性能方面取得了巨大的进步,通过提供聚簇索引、异步提交事务、TiFlash MPP等功能,在Sysbench和TPC-C等OLTP基准测试中,获得均值50%的性能提升。
同时,TiDB 5.0 通过优化调度过程中对 I/O、网络、CPU、内存等资源的占用,大幅减少QPS(每秒查询量)因为资源被抢占而出现的性能抖动问题,在TPC-C OLTP的基准测试中,衡量TPC-C tpmC抖动标准差的值小于等于2%。
What’s Next
TiDB 5.0已经具备完整的HTAP能力,用户业务无论是事务型还是分析型,只要一套TiDB系统就可以应对数字化转型过程中“海量、实时、在线”的业务需求。
TiDB还是一个生态友好型的数据库,TiDB 5.0集成了更丰富的大数据生态,新增Kafka连接器 、支持S3存储服务,并提供多个数据迁移、导入与共享组件,方便用户在异构环境使用 TiDB。
目前TiDB帮助金融、互联网、零售、物流、制造、公共服务等行业用户构建面向未来的数据服务平台。TiDB已在全球超过1500 家头部企业的生产环境中得到应用。
可以说TiDB 5.0是一个里程碑版本,但是这并不是终点,未来PingCAP还有自己的规。黄东旭认为,所有的基础软件都会在云基础设施的背景下被重新发明一遍,PingCAP已经准备好重新出发。
好文章,需要你的鼓励
AMD CIO的职能角色早已超越典型的CIO职务,他积极支持内部产品开发,一切交付其他部门的方案都要先经过他的体验和评判。
医学生在选择专业时,应当考虑到AI将如何改变医生的岗位形态(以及获得的薪酬待遇)。再结合专业培训所对应的大量时间投入和跨专业的高门槛,这一点就更显得至关重要。
我们拥有大量数据,有很多事情要做,然后出现了一种有趣的技术——生成式AI,给他们所有人带来的影响。这种影响是巨大的,我们在这个领域正在做着惊人的工作。