云原生是企业采用云技术促进数字化转型的关键原则之一。随着容器、Kubernetes的部署不断增加和云采用的不断深入,特别是混合云的部署,开发人员的认知负担越来越重。基础设施环境日益复杂且难以管理,无法满足产品或软件开发团队、人工智能(AI)/机器学习(ML)工程师(ModelOps)或提示工程师对敏捷的需求,例如可扩展性、灵活性以及对标准和操作流程、合规和安全要求的环境变化的适应性。基础设施平台工程被视为一门新学科,它的出现是为了应对系统设计和底层混合基础设施日益增加的复杂性。在所有注重改善开发人员体验的云原生开发模式中,这是一种尤为有效的方法。
尽管基础设施平台工程被定义为一种有效的实践,可帮助基础设施和运营(I&O)领导者从平台角度更高效地管理底层混合基础设施和运营,但传统的I&O部门和I&O领导者仍面临挑战。I&O领导者可采用以下三个关键成功因素(见图1)以确保基础设施平台满足企业机构需求,并反映最终用户的优先事项。
图1:利用基础设施平台工程管理云原生平台的三个关键成功因素
将基础设施平台工程原则与基础设施用户的需求相对应
Gartner将平台定义为“一种可服务或赋能其他产品与服务的产品”。平台的范围应反映最终用户的需求,对任何平台的衡量最终都是以其为满足最终用户(例如开发人员或产品团队)以及整个企业的重要需求做出的贡献程度为标准的。这一标准同样适用于作为I&O和业务线关键基础设施平台其一的云原生平台。
多数大型企业都将云原生基础设施引入了云原生平台建设,尤其是在扩展到混合云环境时。然而,传统的云原生平台管理方式更多是以架构和领导力驱动,而并非由开发人员的开发体验和数字生产力驱动。
根据混合云中的云原生平台目标,优先纳入基础设施平台工程原则。企业将关键基础设施平台工程原则集成到混合云中的云原生平台中,这些原则与特定的用户需求目标相一致,具体如下:
采用以产品为导向的管理方法
当云原生被认定为是多数大型企业采用云技术的关键原则时,越来越多的内部开发团队开始向云原生应用架构转型(如微服务架构、服务网格)。这种云原生应用架构要求底层基础设施和平台具备前所未有的可扩展性、灵活性和可编程性,从而缩短部署时间并提高可扩展性,更好地支持数字化转型。
然而,当企业扩展到混合云并高度依赖Kubernetes时,平台工程团队就面临着架构挑战和(来自产品或开发团队)对于混合云场景的复杂需求。传统的管理方式使管理复杂需求和底层的复杂基础设施成为挑战。以产品为导向的管理方法是云原生平台成功扩展到混合云的关键。
与传统的开发和运营实践相比,敏捷交付实践的生产率更高,能交付更高质量的数字产品,并能更稳定地满足客户需求。
明确角色和职责
基础设施平台工程团队可以利用部署组件的内置设计特性来实现产品团队或开发人员所需的关键可复用功能。对于建立合理的自主性和提高开发人员生产率来说,明确界定平台和产品团队之间的职责分工非常重要。
基础设施平台工程团队的管理职责和云原生平台的常见功能如图2所示。
图2:支持云原生平台的基础设施平台团队的管理职责
好文章,需要你的鼓励
在“PEC 2025 AI创新者大会暨第二届提示工程峰会”上,一场以“AIGC创作新范式——双脑智能时代:心智驱动的生产力变革”为主题的分论坛,成为现场最具张力的对话空间。
人民大学团队开发了Search-o1框架,让AI在推理时能像侦探一样边查资料边思考。系统通过检测不确定性词汇自动触发搜索,并用知识精炼模块从海量资料中提取关键信息无缝融入推理过程。在博士级科学问题测试中,该系统整体准确率达63.6%,在物理和生物领域甚至超越人类专家水平,为AI推理能力带来突破性提升。
Linux Mint团队计划加快发布周期,在未来几个月推出两个新版本。LMDE 7代号"Gigi"基于Debian 13开发,将包含libAdapta库以支持Gtk4应用的主题功能。新版本将停止提供32位版本支持。同时Cinnamon桌面的Wayland支持持续改进,在菜单、状态小程序和键盘输入处理方面表现更佳,有望成为完整支持Wayland的重要桌面环境之一。
Anthropic研究团队开发的REINFORCE++算法通过采用全局优势标准化解决了AI训练中的"过度拟合"问题。该算法摒弃了传统PPO方法中昂贵的价值网络组件,用统一评价标准替代针对单个问题的局部基准,有效避免了"奖励破解"现象。实验显示,REINFORCE++在处理新问题时表现更稳定,特别是在长文本推理和工具集成场景中展现出优异的泛化能力,为开发更实用可靠的AI系统提供了新思路。