你是否听说过不用开发人员或管理员的任何努力,云端应用程序性能可以自动优化的童话故事?太多人认为这是现实,而不是童话。
人们把这种混乱归咎于早期云计算的炒作,而“弹性”经常被描述为与云性能有关的东西。虽然弹性确实可以通过配置服务器进行扩展,或者也许自动使用无服务器计算技术,但弹性概念本身并不能保证应用程序运行良好。
弹性的现实不符合这个童话故事,其中有三个原因:
首先,性能问题通常与应用程序本身的设计,开发,以及部署有关。性能不佳的应用程序不会受益于更快的虚拟处理器或更多的虚拟处理器,这在某些程度上可能被人认可。
因此,在设计和构建应用程序时,将其性能考虑到其中。
第二,可能花更多的成本却得到回报很少。虽然企业可以从云平台的虚拟硬件和服务获得未优化软件的边缘性能优势,但事实上,企业将最终在云服务方面花更多的成本来获得最低的性能回报。
公共云可以提供自动扩展和自动配置服务,如果应用程序性能是一个问题,它可能会诱使企业使用它们。但是把它们打开就意味着企业已经把控制权转移到了云计算提供商来试图解决应用程序内在的性能问题。在许多情况下,企业将向云提供商支付费用。由于使用自动扩展和自动配置服务,一些客户端收到意想不到的巨大的云端帐单。
第三,企业可能会忘记安全和治理,如果不正确,这是性能杀手。例如,如果企业根据政府法规对所有内容进行加密,则可能降低其25%的性能,而几年前则是50%。精心设计应用程序的开发人员将考虑到如何首先管理数据的加密开销,以使加密价格实现最小化。
因此不是简单地将性能问题转变为云提供商。相反,企业必须进行设计,开发和测试工作才能获得最佳性能。
当企业将应用程序“升级和移动”到云端时,请务必在将应用程序移动到云端之前考虑如何解决系统性能问题。这是唯一的办法。
好文章,需要你的鼓励
在2025年KubeCon/CloudNativeCon北美大会上,云原生开发社区正努力超越AI炒作,理性应对人工智能带来的风险与机遇。随着开发者和运营人员广泛使用AI工具构建AI驱动的应用功能,平台工程迎来复兴。CNCF推出Kubernetes AI认证合规程序,为AI工作负载在Kubernetes上的部署设定开放标准。会议展示了网络基础设施层优化、AI辅助开发安全性提升以及AI SRE改善可观测性工作流等创新成果。
维吉尼亚理工学院研究团队对58个大语言模型在单细胞生物学领域的应用进行了全面调查,将模型分为基础、文本桥接、空间多模态、表观遗传和智能代理五大类,涵盖细胞注释、轨迹预测、药物反应等八项核心任务。研究基于40多个公开数据集,建立了包含生物学理解、可解释性等十个维度的评估体系,为这个快速发展的交叉领域提供了首个系统性分析框架。
DeepL作为欧洲AI领域的代表企业,正将业务拓展至翻译之外,推出面向企业的AI代理DeepL Agent。CEO库蒂洛夫斯基认为,虽然在日常翻译场景面临更多竞争,但在关键业务级别的企业翻译需求中,DeepL凭借高精度、质量控制和合规性仍具优势。他对欧盟AI法案表示担忧,认为过度监管可能阻碍创新,使欧洲在全球AI竞争中落后。
西湖大学王欢教授团队联合国际研究机构,针对AI推理模型内存消耗过大的问题,开发了RLKV技术框架。该技术通过强化学习识别推理模型中的关键"推理头",实现20-50%的内存缩减同时保持推理性能。研究发现推理头与检索头功能不同,前者负责维持逻辑连贯性。实验验证了技术在多个数学推理和编程任务中的有效性,为推理模型的大规模应用提供了现实可行的解决方案。