云原生是企业采用云技术促进数字化转型的关键原则之一。随着容器、Kubernetes的部署不断增加和云采用的不断深入,特别是混合云的部署,开发人员的认知负担越来越重。基础设施环境日益复杂且难以管理,无法满足产品或软件开发团队、人工智能(AI)/机器学习(ML)工程师(ModelOps)或提示工程师对敏捷的需求,例如可扩展性、灵活性以及对标准和操作流程、合规和安全要求的环境变化的适应性。基础设施平台工程被视为一门新学科,它的出现是为了应对系统设计和底层混合基础设施日益增加的复杂性。在所有注重改善开发人员体验的云原生开发模式中,这是一种尤为有效的方法。
尽管基础设施平台工程被定义为一种有效的实践,可帮助基础设施和运营(I&O)领导者从平台角度更高效地管理底层混合基础设施和运营,但传统的I&O部门和I&O领导者仍面临挑战。I&O领导者可采用以下三个关键成功因素(见图1)以确保基础设施平台满足企业机构需求,并反映最终用户的优先事项。
图1:利用基础设施平台工程管理云原生平台的三个关键成功因素

将基础设施平台工程原则与基础设施用户的需求相对应
Gartner将平台定义为“一种可服务或赋能其他产品与服务的产品”。平台的范围应反映最终用户的需求,对任何平台的衡量最终都是以其为满足最终用户(例如开发人员或产品团队)以及整个企业的重要需求做出的贡献程度为标准的。这一标准同样适用于作为I&O和业务线关键基础设施平台其一的云原生平台。
多数大型企业都将云原生基础设施引入了云原生平台建设,尤其是在扩展到混合云环境时。然而,传统的云原生平台管理方式更多是以架构和领导力驱动,而并非由开发人员的开发体验和数字生产力驱动。
根据混合云中的云原生平台目标,优先纳入基础设施平台工程原则。企业将关键基础设施平台工程原则集成到混合云中的云原生平台中,这些原则与特定的用户需求目标相一致,具体如下:
采用以产品为导向的管理方法
当云原生被认定为是多数大型企业采用云技术的关键原则时,越来越多的内部开发团队开始向云原生应用架构转型(如微服务架构、服务网格)。这种云原生应用架构要求底层基础设施和平台具备前所未有的可扩展性、灵活性和可编程性,从而缩短部署时间并提高可扩展性,更好地支持数字化转型。
然而,当企业扩展到混合云并高度依赖Kubernetes时,平台工程团队就面临着架构挑战和(来自产品或开发团队)对于混合云场景的复杂需求。传统的管理方式使管理复杂需求和底层的复杂基础设施成为挑战。以产品为导向的管理方法是云原生平台成功扩展到混合云的关键。
与传统的开发和运营实践相比,敏捷交付实践的生产率更高,能交付更高质量的数字产品,并能更稳定地满足客户需求。
明确角色和职责
基础设施平台工程团队可以利用部署组件的内置设计特性来实现产品团队或开发人员所需的关键可复用功能。对于建立合理的自主性和提高开发人员生产率来说,明确界定平台和产品团队之间的职责分工非常重要。
基础设施平台工程团队的管理职责和云原生平台的常见功能如图2所示。
图2:支持云原生平台的基础设施平台团队的管理职责

好文章,需要你的鼓励
阿里云CEO吴泳铭在财报电话会议上表示,AI需求增长如此迅猛,以至于服务器部署速度无法跟上客户需求。公司正在对GPU进行配给制,优先满足使用全套阿里云服务的客户需求。过去12个月,阿里巴巴在AI相关基础设施上投入1200亿元人民币,预计三年预算可能超过当前的3800亿元。阿里云智能集团季度营收达56亿美元,同比增长34%。
这项由中国人民大学联合腾讯开发的LaSeR技术,发现了AI在生成答案最后一刻会无意中透露对答案质量的评估。通过观察这个"最后一词效应",研究人员开发出了一种让AI高效进行自我评估的方法,在几乎不增加计算成本的情况下,大幅提升了AI的自我验证能力,为构建更可信的AI系统开辟了新路径。
OpenAI为ChatGPT推出"购物研究"新功能,恰逢假期购物季。该功能面向免费和付费用户开放,支持移动端和网页版。用户询问购物问题时,ChatGPT会提供个性化购物助手服务,通过一系列问题帮助用户筛选价格、用途和功能偏好。该功能基于专为购物任务优化的GPT-5 mini版本,从优质网络资源获取产品信息。OpenAI计划推出即时结账功能,允许用户直接在ChatGPT内购买商品。
新加坡南洋理工大学团队开发的NEO模型颠覆了传统视觉语言AI的设计思路,从模块化拼接转向原生统一架构。仅用3.9亿图文配对数据就实现了与大型模块化系统相媲美的性能,证明了端到端训练的有效性,为AI系统设计开辟了新路径。