8月11日,记者获悉,腾讯云数据库开源产品TDSQL PG版(开源代号TBase)推出重磅升级:经过一年半的打磨,上万张表访问场景下,内存占用节省60%;查询性能提升百倍;SQL语句兼容性增强。同时,大力提升原有数据库版本在分布式场景下的易用性。
在“新时代下数据库开源生态的发展与实践”技术沙龙上,腾讯云数据库技术总监李跃森介绍,TDSQL PG版是一款具备HTAP能力、经过腾讯多年持续投入研发的数据库产品,能够提供成熟的一站式解决方案。在首次开源的10天内,Star数就上升到超过500个。开源不久,就受到了欧洲航天局、国家天文台,以及医疗健康、零售等各个行业用户的青睐。
以微信支付为例,使用TDSQL PG版,能满足微信支付单表数据轻松突破TB级海量存储的需求;腾讯云开源数据库高吞吐、高并发,自动扩容的能力,也适合微信支付的业务场景。
腾讯云自主研发的分布式数据库引擎TDSQL PG版从2019年正式开源(开源代号TBase)开始,依托社区,在经过内部业务系统的实践检验后,基本保持每月一次小型升级、每半年一次重大升级的节奏,助力众多开发者应用前沿数据库技术,推动开源社区生态不断完善。
PG中国社区主席张文升也指出:“PostgreSQL社区将和TDSQL在技术、生态、企业服务上开展更深的合作,勇于开创,为客户和企业提供更好的支持与服务。共同建设数据库开源生态。”
值得一提的是,TDSQL PG版开源只是腾讯云数据库开源的代表作之一。事实上,腾讯云数据库在开源领域持续深耕。腾讯云副总裁李纲介绍,腾讯云数据库开源已涵盖三大体系:数据库产品能力开源、产品服务工具开源、前沿研究平台能力的开源。从技术创新、到产品应用,到基础研究深化,构建完整的技术演进周期。
在产品能力开源方面,除了TDSQL PG版这种兼顾了分析型场景的数据库产品,腾讯云数据库近期还将推出企业级MySQL内核的开源项目,代号为 TXSQL,这是一款针对于大规模交易场景的企业级分布式数据库内核。多款产品的持续开源,共同为社区、行业提供完善的国产数据库产品能力体系。
此外,腾讯云数据库也在推动数据库SaaS服务工具的开源,包括可以完成90%日常自动调优、智能诊断的AI自动化运维工具,以及可以进行大规模异构数据迁移、分发、聚合的数据库迁移平台。“面对企业客户、开发者,我们希望提供的是一个成熟完整的产品,而不仅仅只是一份代码,”李纲表示。
而在基础研究领域,腾讯还开源了基础研究平台型框架,来帮助降低研究者的研究门槛,加速基础研究。据介绍,2020年,腾讯和中国人民大学合作开源的3TS—事务处理技术验证系统,沉淀了腾讯与人大在数据库核心技术方面的许多研究成果,可以提供统一的事务处理框架,帮助研究者快速构建新的并发控制算法,以及检测数据异常。
“腾讯云数据库致力于打造可持续发展的国产数据库开源生态。未来国产数据库技术发展将像飞船一样加速,腾讯数据库开源项目愿做这个进程加速器的坚实底座”,腾讯云副总裁李纲表达了腾讯云数据库在开源生态上的投入和决心。
开源是腾讯坚持的长期价值之一。腾讯 2010 年起就确立了拥抱开放的战略,并一直秉承重数量、更重品质的态度发展开源。在自主开源方面,截至目前,腾讯共对外开源超过130个优质项目,项目覆盖了云原生、大数据、人工智能、数据库等多个技术领域,代码贡献者超过2000人,开源项目star总数超过37万个。
在社区贡献方面,腾讯云在KVM社区已贡献超过170个patch,超过20个技术特性,其中8个被评为KVM年度核心突破,贡献国内排名第一,同时连续四年登上KVM开源贡献榜,成为国内唯一取得这一成就的云服务商。
开源的本质是以技术开放促进技术创新。数据库开源社区平台汇聚了众多开发力量,推动了开源数据库在云时代实现更多的技术创新和突破。未来,腾讯云数据库的开源建设和治理将继续秉承重量、更重品质的理念,打造可持续发展的国产数据库开源生态。
好文章,需要你的鼓励
IBM Spyre加速器将于本月晚些时候正式推出,为z17大型机、LinuxONE 5和Power11系统等企业级硬件的AI能力提供显著提升。该加速器基于定制芯片的PCIe卡,配备32个独立加速器核心,专为处理AI工作负载需求而设计。系统最多可配置48张Spyre卡,支持多模型AI处理,包括生成式AI和大语言模型,主要应用于金融交易欺诈检测等关键业务场景。
加拿大女王大学研究团队首次对开源AI生态系统进行端到端许可证合规审计,发现35.5%的AI模型在集成到应用时存在许可证违规。他们开发的LicenseRec系统能自动检测冲突并修复86.4%的违规问题,揭示了AI供应链中系统性的"许可证漂移"现象及其法律风险。
意大利初创公司Ganiga开发了AI驱动的智能垃圾分拣机器人Hoooly,能自动识别并分类垃圾和可回收物。该公司产品包括机器人垃圾桶、智能盖子和废物追踪软件,旨在解决全球塑料回收率不足10%的问题。2024年公司收入50万美元,已向谷歌和多个机场销售超120台设备,计划融资300万美元并拓展美国市场。
这项由剑桥大学、清华大学和伊利诺伊大学合作的研究首次将扩散大语言模型引入语音识别领域,开发出Whisper-LLaDA系统。该系统具备双向理解能力,能够同时考虑语音的前后文信息,在LibriSpeech数据集上实现了12.3%的错误率相对改进,同时在大多数配置下提供了更快的推理速度,为语音识别技术开辟了新的发展方向。