Gartner公司预测,到2027年,70%采用生成式人工智能(生成式AI)的企业将把可持续发展和数字主权作为选择公有云生成式AI服务的首要标准。
Gartner研究副总裁Sid Nag表示:“云技术因其规模和共享服务模式而成为大规模提供生成式AI应用以及开发通用基础模型的首选。但企业机构要想将生成式AI投入到运营中,就必须解决某些方面的问题,例如数字主权(控制数据存储位置和操作执行位置的能力)和可持续发展问题。”
数字主权在公有云决策中的作用
基础模型(FM)和大语言模型(LLM)是生成式AI功能的核心,其发展正在推动生成式AI功能和用例的快速持续演进。使用生成式AI的企业将面临监管方面的巨大挑战,LLM中所包含的数据以及使用这些FM和LLM的应用等都将受到监管。
Nag表示:“由于企业机构要将他们的云业务扩展到各个地点和用例,专业云提供商将成为许多企业云架构的重要考虑因素。数字主权将推动对云提供商的需求,但这些云提供商必须做到无论在哪个地区都能满足不断变化且特有的主权业务要求。”
可持续发展在公有云决策中的作用
鉴于所需基础设施的规模,企业机构若要部署生成式AI服务,就需要使用公有云,同时还必须要求云提供商解决与可持续发展相关的非技术性问题。
投资者、客户、监管机构和政府所施加的可持续发展压力迫使企业机构为实现其环境可持续发展目标而管理和优化自身的IT碳排放。他们将引入新的流程、功能和工具来监控和管理部署在云端的生成式AI工作负载的能耗和碳排放。
Nag表示:“云计算因能够提供可扩展的基础设施、赋能环保实践和实现高成本效益的资源管理,而在推进可持续发展和生成式AI业务应用方面发挥着举足轻重的作用。因此,大多数IT领导人在全面采用生成式AI时,都会依靠云平台支持其可持续发展历程。”
好文章,需要你的鼓励
Lumen Technologies对美国网络的数据中心和云连接进行重大升级,在16个高连接城市的70多个第三方数据中心提供高达400Gbps以太网和IP服务。该光纤网络支持客户按需开通服务,几分钟内完成带宽配置,最高可扩展至400Gbps且按使用量付费。升级后的网络能够轻松连接数据中心和云接入点,扩展企业应用,并应对AI和数据密集型需求波动。
阿里巴巴团队提出FantasyTalking2,通过创新的多专家协作框架TLPO解决音频驱动人像动画中动作自然度、唇同步和视觉质量的优化冲突问题。该方法构建智能评委Talking-Critic和41万样本数据集,训练三个专业模块分别优化不同维度,再通过时间步-层级自适应融合实现协调。实验显示全面超越现有技术,用户评价提升超12%。
RtBrick研究警告,运营商面临AI和流媒体服务带宽需求"压倒性"风险。调查显示87%运营商预期客户将要求更高宽带速度,但81%承认现有架构无法应对下一波AI和流媒体流量。84%反映客户期望已超越网络能力。尽管91%愿意投资分解式网络,95%计划五年内部署,但仅2%正在实施。主要障碍包括领导层缺乏决策支持、运营转型复杂性和专业技能短缺。
UC Berkeley团队提出XQUANT技术,通过存储输入激活X而非传统KV缓存来突破AI推理的内存瓶颈。该方法能将内存使用量减少至1/7.7,升级版XQUANT-CL更可实现12.5倍节省,同时几乎不影响模型性能。研究针对现代AI模型特点进行优化,为在有限硬件资源下运行更强大AI模型提供了新思路。