至顶网CIO与应用频道 10月10日 北京消息:随着DT时代的到来,企业对数据的依赖程度与日俱增,数据保护早已成为企业的一门必修课。只有拥有先知先觉的防范意识和充分的技术准备,才能“覆巢之下,亦有完卵”。在日前云栖大会的“企业级数据库最佳实践”专场,灾备相关议题也备受关注。本文结合阿里巴巴数据库团队在会上的分享,详细介绍如何使用数据库云产品组合,搭建符合自身企业发展阶段的灾备方案。
数据是企业重要的生产资料,一旦发生数据丢失,企业就会陷入困境:客户资料、技术文件、财务账目等客户、交易、生产数据可能被破坏得面目全非。概括起来,数据丢失分三个层次:
为了应对数据丢失造成的损失,必须对数据进行灾备保护,并且企业信息化程度越高,相关的数据灾备恢复措施就越重要。
1.企业级数据库灾备体系
1.1.灾备定义
灾备是指容灾+备份:
1.2.灾备痛点
(1)备份痛点
(2)容灾痛点
1.3.落地方案
企业级数据库灾备体系要以业务需求为导向,基于多种因素考量选择:RPO,RTO,成本,扩展性。还需要覆盖数据库灾备的各种需求:灾备环境搭建、灾备数据同步、灾备监控告警、灾备演练、灾备切换、数据校验及修复等。
2.企业级数据库灾备核心产品
阿里云产品经多轮迭代具备比较完善的灾备能力,使用以下核心产品可帮助企业应对不同场景及需求的数据库灾备方案设计。
在灾备场景下,建议可搭配阿里云其他产品,例如DRDS、OSS,这些产品经阿里内外部验证,均具有较高可靠性并可在灾备场景下灵活应用。
3.典型应用场景
3.1.实时备份
当用户对数据备份要求较高时,比如需要连续实时备份,且备份过程中不影响业务运行,此时可购置阿里云数据库备份DBS服务,实现数据库的热备份,DBS可实现数据实时增量备份、精确到秒级的数据恢复能力。解决方案架构示例如下:
架构设计说明:
3.2.异地多活
无论弹性容灾上云、容灾双活/多活,还是两地三中心,用户都可以在企业级数据库灾备体系中找到解决方案,接下来以异地多活场景为例介绍解决方案。在用户业务多点写入场景下,如何具备数据级异地双活,如何支持一键切换至另一个机房,实现灵活的弹上弹下和未来的线性扩展。
部署架构
4.新产品:数据库备份DBS
数据库备份DBS作为数据库上云备份通道,与对象存储OSS构建云数据库备份解决方案,仅需5分钟即可实现秒级RPO(Recovery Point Objective恢复点目标,通俗理解是当数据库故障时,允许丢失多长时间数据,RPO越小越好)的实时备份。
数据库备份DBS提供备份服务,在整个备份过程是无锁的,不会阻塞数据库上业务请求;用户可以选择整个实例备份,也可以选择只备份一张表;一旦发生误操作情况时,用户都可以通过DBS进行任意时间点恢复,将整个实例或一张表的数据恢复到误操作前1秒;DBS提供多种规格,可以满足几百MB到几百GB的数据库备份。
目前,数据库备份DBS提供的备份系统时刻被海量用户验证,产品不仅拥有实时备份、秒级RPO的能力,同时还具备表级恢复能力,帮助用户只恢复有价值的数据,RTO可降到分钟级。
值得一提的是,实时备份经历了历年双11的考验,接下来,数据库恢复DBS将会提供在线查询能力,用户无需等待数据恢复过程,备份任务完成后在查询窗口上可以通过SQL立刻查询备份数据,用户还可以将查询结果导出Excel、Word等通用格式,用于数据分析,也可以生成Insert、Replace语句,用于数据订正。
好文章,需要你的鼓励
科技泡沫并非世界末日,从经济角度看,泡沫是押注过大导致供过于求。AI泡沫问题复杂在于AI软件开发节奏与数据中心建设周期的时间错配。甲骨文关联数据中心获180亿美元信贷,Meta承诺三年内投入6000亿美元基础设施。麦肯锡调查显示企业虽广泛使用AI但规模有限,多数仍持观望态度。微软CEO表示更担心数据中心空间不足而非芯片短缺,电力需求成为新瓶颈。
香港中文大学研究团队开发的Search-R3系统成功解决了大语言模型推理与搜索分离的问题,通过两阶段训练让AI在深度思考过程中直接生成搜索向量。该系统在多个领域测试中显著超越现有方法,特别是启用推理后性能提升明显,为AI系统设计提供了推理与搜索统一的新范式,展现了从专门化向通用化发展的重要方向。
Goodfire.ai研究人员首次发现AI语言模型中记忆和推理功能通过完全独立的神经通路运作。研究显示,移除记忆通路后,模型丧失97%的训练数据复述能力,但逻辑推理能力几乎完全保留。令人意外的是,算术运算与记忆共享神经通路而非推理通路,这可能解释了AI模型在数学方面的困难。该技术未来有望用于移除版权内容或敏感信息而不损害模型核心功能。
这项由ETH苏黎世等机构发表的突破性研究首次系统性揭示了优化器选择对AI模型量化性能的重大影响。研究团队发现传统的异常值理论完全失效,并开发了革命性的ABC分解框架来准确预测量化后性能。实验证明Shampoo优化器在量化场景下表现最优,该发现为AI模型的实际部署提供了重要指导,有望让AI技术在资源受限设备上发挥更大作用。