云服务正从传统的基础设施即服务(laaS)向先进的平台即服务(PaaS)演变,这推动着基础设施领域发生根本性转变,而用于处理人工智能(AI)、机器学习(ML)和大数据的新型基础设施的出现,进一步加速了这一转型。基于云的现代基础设施和运营模式的发展迅速,传统的基础设施和运营(I&O)团队难以紧跟其步伐。
这一演变简化了管理和运营,因为公有云底层云平台上的常规任务现在通常由云服务提供商(CSP)处理。此外,这些常规任务也可以通过先进的软件和AI技术实现自动化。不过,CSP采用的是责任分担模式。尽管他们承担了常规IT任务,但剩余的工作比以往任何时候都更加复杂,企业机构仍需要负责以下关键任务:
与本地数据中心部署对员工的技能要求相比,成功实施云端部署所需的技能有所不同。因此,许多企业机构在上云过程中很快就面临人才,技能和文化方面的缺口。2024年Gartner标志性I&O领导者调研显示,培养熟练的必要技能并确保充分的可用资源是未来12个月内I&O领导者面临的前两大挑战(见图1)。

图1:未来12个月内IT基础设施和运营职能将面临的主要挑战
I&O领导者应采用以下三个建议,提高员工技能,应对向云环境迁移的挑战。
实施技术和非技术差距分析
I&O领导者可参考Gartner IT人才云技能象限(见图2),分析技能差距,明确需要云专家技能的核心领域。

图2:IT人才云技能象限示例
在明确专家技能方面的关键差距后,应确定成功使用公有云IaaS或PaaS所需的技术和技能。除技术型技能外,通常还需要关注与DevOps相关的非技术型技能,例如保持持续交付和改进的文化。
通过多方位的云学习,弥补云技能差距
I&O领导者必须加强现有技能或人才库的管理和发展。由于外部招聘竞争激烈,I&O领导者应优先考虑扩大内部培训计划的规模,制定多方位的培训计划,以弥补云技能差距。例如:
利用CSP的专业服务或托管服务
企业云计算技能缺口的问题非常普遍,以至于形成了公有云IT转型服务(PCITS)这一新市场,以解决这一问题。
云部署的性质意味着,即使在使用托管服务提供商(MSP)或云服务提供商(CSP)的专业服务时,I&O部门仍将发挥关键作用,并对服务质量负责。例如I&O部门将帮助完成云采用方所需的全套服务,并管理合作伙伴关系。
因此,在选择使用专业服务或托管服务时,应围绕保留关键技能(如整体架构技能、云成本管理技能和供应商管理技能)制定策略。此外,还要密切关注知识传授和可交付成果样本,以确保团队在项目完成后具备取得成功的能力。I&O部门应制定成功衡量标准,以在项目完成后衡量服务质量和业务是否正常运转。
好文章,需要你的鼓励
Lumen Technologies对美国网络的数据中心和云连接进行重大升级,在16个高连接城市的70多个第三方数据中心提供高达400Gbps以太网和IP服务。该光纤网络支持客户按需开通服务,几分钟内完成带宽配置,最高可扩展至400Gbps且按使用量付费。升级后的网络能够轻松连接数据中心和云接入点,扩展企业应用,并应对AI和数据密集型需求波动。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
RtBrick研究警告,运营商面临AI和流媒体服务带宽需求"压倒性"风险。调查显示87%运营商预期客户将要求更高宽带速度,但81%承认现有架构无法应对下一波AI和流媒体流量。84%反映客户期望已超越网络能力。尽管91%愿意投资分解式网络,95%计划五年内部署,但仅2%正在实施。主要障碍包括领导层缺乏决策支持、运营转型复杂性和专业技能短缺。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。