诞生于上世纪60年代的数据库,现如今已是每一个企业的必要技术。随着企业业务的不断发展,对于数据库也提出了众多新需求,像敏捷性、弹性等等,这也驱动了数据库技术的进一步发展。
“数据库正在经历一场划时代的体验式变革。”PingCAP创始人兼CEO刘奇在PingCAP DevCon 2021上说道,新一代云数据库在资源扩展能力、自动伸缩、可管理、自服务方面正发生变革。
PingCAP创始人兼CEO刘奇
“开源、简化、融合”已经成为新的技术潮流,新一代云数据库逐渐成为企业应用的主流。今年PingCAP DevCon上,PingCAP发布了云原生混沌工程平台Chaos Mesh® 2.0版本,以及面向企业用户的Ti-Star计划,持续通过开放的技术生态实现对企业的赋能,释放开源的创新力量。
相信开放的力量
由于对开放的相信,对开源社区的信仰。刘奇认为,TiDB不是PingCAP的产品,而是所有开发者、用户、DBA(数据库管理员)和运维工程师的共同"作品"。
因为开放的社区有着极大的延展能力,可能会以各种方式贡献力量,甚至是社会价值。就如同危地马拉一所大学的教授和学生通过 PingCAP在GitHub创立的Chaos Mesh®开源项目,构建了一个分布式系统,实时显示世界各地的新冠疫苗接种的统计信息。
PingCAP创立的开源项目在GitHub上总计有超过41600个star,1400多位贡献者,遍布全球几十个国家。PingCAP在CNCF2019-2020年,贡献度排名中位列中国企业第一,全球排名第六。
到今天为止,基于开源社区,PingCAP已经形成了全球数据库的人才生态圈,第一环是PingCAP数百人的研发团队,专注于TiDB的内核研发,以及社区的联合开发;第二环是数以千计的开发者,包括1400多位贡献者,以及众多知名高校和科研机构;第三环是用户和合作伙伴,上万名DBA和运维工程师,他们把各自的场景重新带回开源社区。
PingCAP在会上发布了Chaos Mesh® 2.0版本,2.0版提升了整体易用性,让更多人能够很轻松地给系统注入各种各样的故障,进一步提升自动化的能力,同时降低整个测试的成本,提供更多的故障注入类型。
真实场景是最好的架构师
目前TiDB横跨了OLTP和OLAP,进一步提供完整的HTAP能力。在大数据领域,TiDB实现了与Spark、Flink、Presto等大数据技术栈的广泛融合。
PingCAP高级副总裁朱巍表示,TiDB可以很好的支撑企业数字化转型两大方向:业务敏捷化和数据实时消费洞察。
TiDB既支持在线横向扩展,又能非常高效的支持数据实时分析,并且兼容现有的大数据、技术生态,降低了技术栈的复杂性。非常重要的一点是TiDB HTAP解决方案的特点是行存与列存分开,可以完全隔离OLTP和OLAP的资源,在实时分析时不会影响TiDB的联机交易性能。
今天,TiDB产品、解决方案已经广泛地应用在各行各业,像金融、物流、零售、电商等行业,推动技术创新,为业务赋能。
会上PingCAP还发布了Ti-Star计划,通过“混合生态”助力用户旅程的成功,在接触和使用、深化应用、团队建设、实践推广等环节,由PingCAP提供原厂的深度支持和持续互动。
从本地到云,创新从未停止
2020年 6月,PingCAP在海外区域推出了TiDB Cloud全托管TiDB服务。这也是基于用户的三大需求所产生,第一,业务需求,希望业务更加可用,在不同区域之间进行数据复制;第二,业务全球化需求,在全球多个地区提供服务,并且满足数据的合规;第三,最大化利用云计算基础设施,目前TiDB Cloud在海外已经支持AWS和GCP。
PingCAP国际业务负责人申砾指出,过去一年中,TiDB Cloud持续演进功能,尤其是以云原生的方式在数据访问安全和弹性运维方面进行增强,大大提升了用户的安全访问能力以及业务连续性。
今年5月,TiDB Cloud在海外区域,正式对全球用户开放。TiDB Cloud建立了更加敏捷的迭代方式,一方面,云原生的新特性可以更快上线;另一方面,TiDB Cloud紧跟TiDB的内核功能,让用户既可以享受最新版数据库内核的功能,而且不用自己去升级系统。
针对安全合规,PingCAP已经建立了一套科学有效且符合国际标准的信息安全管理体系,全面满足国内外客户的需求,提高信息安全风险的管控能力,让用户可以无忧地使用TiDB Cloud。
同时,TiDB Cloud宣布第三季度支持全球多区域的数据同步,第四季度为个人开发者提供免费的 TiDB Cloud集群。
好文章,需要你的鼓励
这项由加州大学圣地亚哥分校和微软研究院合作开发的REAL框架,通过程序分析反馈训练大型语言模型生成高质量代码。与传统方法不同,REAL采用强化学习将代码安全性和可维护性作为奖励信号,不依赖人工标注或特定规则。研究在多个数据集上的实验表明,REAL在保证功能正确性的同时显著提高了代码质量,有效解决了"即兴编程"中的安全漏洞和维护性问题,为AI辅助编程提供了新的范式。
加州大学伯克利分校与Meta FAIR研究团队开发了"Self-Challenging"框架,让大语言模型通过自己创建和解决任务来提升能力。该方法引入创新的"Code-as-Task"格式,包含指令、验证函数、示例解决方案和失败案例,确保生成的任务既可行又有挑战性。在工具计算、网页浏览、零售服务和航班预订四种环境测试中,仅使用自生成训练数据,Llama-3.1-8B模型性能提升了两倍多,证明AI可以通过自我挑战实现有效学习,减少对人类标注的依赖。
南洋理工大学与SenseTime Research合作提出了PoseFuse3D-KI,一种创新的人体中心关键帧插值框架。该方法将3D人体模型信息融入扩散过程,解决了现有技术在处理复杂人体动作时产生扭曲结果的问题。研究团队开发了专门的SMPL-X编码器直接从3D空间提取几何信息,并设计了融合网络将3D线索与2D姿态无缝整合。他们还构建了CHKI-Video数据集,包含2,614个视频片段及完整的人体标注。实验结果显示,PoseFuse3D-KI在PSNR上提升9%,LPIPS减少38%,显著超越现有方法。
这项研究提出了LongGuide算法,解决了大型语言模型在长文本生成任务中的局限性。研究团队发现,仅依靠上下文学习无法使模型充分掌握文本的语言和格式特性。LongGuide通过自动生成两种指导原则:度量指导原则和输出约束指导原则,显著提升了模型性能。在七种长文本生成任务中,该方法使开源和闭源模型的ROUGE-L评分平均提高约6%。LongGuide具有通用性强、易于学习、成本效益高等优点,为提升AI长文本生成能力提供了新方向。