数据库是一个历史悠久的行业,PingCAP在其中的时间并不算长,刚刚过完6岁生日。PingCAP联合创始人兼CTO黄东旭说,我们是从零开始,一行一行代码写出的TiDB新一代分布式数据库,核心代码(自主可控率)达到100%。
最近PingCAP发布了TiDB 5.0版本,这对于PingCAP就像是一个生日礼物。尤其是值得一提的是,5.0版引入MPP(Massively Parallel Processing,即大规模并行处理)架构,至此TiDB成为了具备完整HTAP(混合事务 / 分析处理,Hybrid Transactional/Analytical Processing)能力的分布式数据库。
PingCAP联合创始人兼CTO黄东旭
做“省心、放心、不担心”的企业级数据库
PingCAP的创始团队认为基础软件必须是通用才能有更高的天花板,所以TiDB一开始就被定位为通用数据库,这等于为自己设定了一个很高的目标。
5年前PingCAP带着最早的TiDB产品去和客户交流,客户第一个问题就是你的产品有没有客户,很显然PingCAP最后被拒绝了,因为数据库对于企业是核心系统,没有一个企业愿意做小白鼠。
PingCAP第一个客户也是抱着死马当活马医的态度使用了TiDB,这是一家游戏公司,其当时的数据库不能满足广告投放系统的实施查询,这家公司的CTO恰巧是黄东旭的朋友,所以抱着试试的态度,TiDB也成了救活这个公司的产品。
就这样,TiDB的第一客户是靠“救命”积累的,而这个广告系统恰好是一个HTAP场景,似乎预示了TiDB的救命能力与实时性数据处理密不可分。
在之后,陆陆续续的打单中,客户对于TiDB的接受度也越来越高,但是客户大多都还是集中在互联网企业。黄东旭一次在和客户推介的过程中,客户说你们没有金融案例,你们不是企业级数据库。这也让PingCAP有了新方向,在不断打磨产品的同时,开拓了更多金融行业客户。
从救别人的命,到自己死不了,中间隔着一个煎熬的“死亡陷阱”。“TiDB已经经过了最危险的开源鸿沟,现在是个死不了的产品了。”黄东旭说。
黄东旭对于一个真正的企业级数据库定义是,一个“省心、放心、别担心”的产品。“在做公司或者产品时,永远不要总想着行业趋势怎么变,而是永远投资在那些不会变的东西上,数据库也是一样,客户一定想要一个稳定而不操心的数据库。”
TiDB 5.0核心能力的释放
TiDB早在1.0版本就实现了OLTP Scale(在线事务处理的规模化扩展),4.0版本已经实现初步的HTAP能力,5.0版本在原有HTAP引擎TiFlash的基础上引入MPP架构,提供与存储匹配的分布式计算引擎,进一步提升海量数据下的并行计算与分析能力。
通过与TiDB-Server共享SQL前端,实现解析器(Parser)和优化器的共享,TiDB 向业务提供一体化的入口,能够自动选择单机执行或MPP模式,并且将事务型和分析型的负载隔离,使得双方在高并发量压力下互不干扰。场景实测显示,在相同硬件配置和数据量下,MPP有着数倍于Greenplum的执行速度。
而且TiDB 5.0基于分布式架构,支持云原生与多云,可以弹性扩展吞吐或存储,轻松应对高并发、海量数据场景,实现一栈式数据服务。企业级用户、互联网用户、SaaS厂商和独立软件开发商都可以通过一套TiDB系统构建数字场景应用,而不必关注底层架构。
TiDB 5.0在性能方面取得了巨大的进步,通过提供聚簇索引、异步提交事务、TiFlash MPP等功能,在Sysbench和TPC-C等OLTP基准测试中,获得均值50%的性能提升。
同时,TiDB 5.0 通过优化调度过程中对 I/O、网络、CPU、内存等资源的占用,大幅减少QPS(每秒查询量)因为资源被抢占而出现的性能抖动问题,在TPC-C OLTP的基准测试中,衡量TPC-C tpmC抖动标准差的值小于等于2%。
What’s Next
TiDB 5.0已经具备完整的HTAP能力,用户业务无论是事务型还是分析型,只要一套TiDB系统就可以应对数字化转型过程中“海量、实时、在线”的业务需求。
TiDB还是一个生态友好型的数据库,TiDB 5.0集成了更丰富的大数据生态,新增Kafka连接器 、支持S3存储服务,并提供多个数据迁移、导入与共享组件,方便用户在异构环境使用 TiDB。
目前TiDB帮助金融、互联网、零售、物流、制造、公共服务等行业用户构建面向未来的数据服务平台。TiDB已在全球超过1500 家头部企业的生产环境中得到应用。
可以说TiDB 5.0是一个里程碑版本,但是这并不是终点,未来PingCAP还有自己的规。黄东旭认为,所有的基础软件都会在云基础设施的背景下被重新发明一遍,PingCAP已经准备好重新出发。
好文章,需要你的鼓励
英国宠物慈善机构PDSA数据显示,超过半数宠物主担心无法承担兽医费用。科技公司正通过AI和物联网技术解决这一市场需求。在伦敦兽医展上,多家初创公司展示了创新技术:AI for Pet利用视觉AI分析宠物眼部、皮肤等图像提供健康洞察;Sylvester.ai开发AI模型识别猫咪疼痛表情;VEA整合患者数据自动化诊断。此外,智能项圈等物联网设备可追踪宠物健康症状。这些技术有助于宠物主采取预防措施,降低兽医费用。
卡内基梅隆大学联合Adobe开发出革命性的NP-Edit技术,首次实现无需训练数据对的AI图像编辑。该技术通过视觉语言模型的语言反馈指导和分布匹配蒸馏的质量保障,让AI仅用4步就能完成传统50步的编辑任务,在保持高质量的同时大幅提升处理速度,为图像编辑技术的普及应用开辟了全新道路。
北欧国家启动统一人工智能产业计划,旨在通过合作在全球舞台上竞争,获得微软和谷歌支持。10月成立的新北欧AI中心获得350万英镑初始预算,但谷歌和微软是唯一提供资金支持的科技公司,具体金额保密。该中心将开发生成式AI系统并建设应用AI服务的系统。北欧教育部长承诺追加资金开发大型北欧语言生成AI模型。尽管资金有限,但北欧国家希望通过联合力量在AI竞赛中提升地位。
复旦大学团队突破AI人脸生成"复制粘贴"痛点,开发WithAnyone模型解决传统AI要么完全复制参考图像、要么身份差异过大的问题。通过MultiID-2M大规模数据集和创新训练策略,实现保持身份一致性的同时允许自然变化,为AI图像生成技术树立新标杆。