根据Gartner的统计,2023年全球基础设施即服务(IaaS)市场增长至1400亿美元,较2022年的1200亿美元增长了16.2%。亚马逊在2023年继续位居IaaS市场第一,微软、谷歌、阿里巴巴和华为紧随其后。
Gartner研究副总裁Sid Nag表示:“由于超大规模云提供商希望推进主权、道德、隐私和可持续性相关产品的发展等原因,云技术继续成为推动业务变革的主要驱动力。这应该会继续推动该市场在未来成倍增长,并且生成式人工智能(GenAI)投资也会在2024年及以后促进此类产品的发展。”
排名前五的IaaS提供商在2023年占据了82%的市场份额。亚马逊以546亿美元的收入和39%的市场份额继续领跑全球IaaS市场,微软以23%的市场份额紧随其后(见表一)。谷歌在2023年增长了 26.3%,以8.2%的市场份额排在第三位。阿里巴巴以 7.9%的市场份额稳居第四。
表一、2022-2023年全球IaaS公有云服务市场份额(单位:百万美元)
Nag 表示:“由于头部超大规模云提供商在GenAI的趋势下继续发展其IaaS产品,软件即服务(SaaS)、平台即服务(PaaS)等其他领域也应该会有所增长。这些领域都会随着IaaS水涨船高。”
GenAI已开始对云市场的增长产生影响,但2023年人工智能(AI)驱动的增长很小。
Nag表示:“云是实现GenAI必不可少的基础和可扩展基础设施。开始受到GenAI影响的领域包括IaaS(AI模型训练正在消耗IaaS资源)和SaaS(GenAI功能已开始包含在SaaS应用中)等。公有云市场的容量需求已因此而快速增加,并且这一趋势将持续到2028年。短期内,AI驱动的收入增长相对于整个公有云市场的体量来说将会很小。”
好文章,需要你的鼓励
东北大学与快手科技联合研发的UNITE系统为多模态信息检索带来突破性进展。这项发表于2025年5月的研究首次系统分析了模态特定数据如何影响检索性能,并提出创新的模态感知掩码对比学习技术,有效解决不同模态间的竞争关系。UNITE能同时处理文本、图像、视频及其组合,在40多项测试中超越现有方法,即使与参数规模更大的模型相比也表现出色。研究发现视频-文本对在通用检索中表现优异,而文本-文本和文本-图像对对指令遵循任务至关重要,为未来多模态系统研究提供了宝贵指南。
这篇研究论文揭示了多模态大语言模型(MLLMs)存在严重的模态偏差问题,即模型过度依赖文本信息而忽视图像等其他模态。研究团队通过理论分析和实验证明,这种偏差主要源于三个因素:数据集不平衡、模态骨干能力不对称以及训练目标设计不当。他们提出了系统的研究路线图和解决方案,包括增强视觉模态在数据集中的贡献、改变模型关注点和应用偏好优化策略。未来研究方向则包括开发更客观的评估指标、探索更多模态组合中的偏差问题以及应用可解释AI技术深入分析偏差机制。
ComfyMind是香港科技大学研究团队开发的一个协作式AI系统,旨在解决当前开源通用生成系统面临的稳定性和规划挑战。该系统基于ComfyUI平台,引入了两项关键创新:语义工作流接口(SWI)和带本地反馈执行的搜索树规划机制。SWI将低级节点图抽象为语义函数,而搜索树规划将生成过程视为分层决策任务。实验表明,ComfyMind在ComfyBench、GenEval和Reason-Edit三个基准测试中均大幅超越开源基线,并达到与GPT-Image-1相当的性能,为开源通用生成AI开辟了新路径。
这项研究介绍了一种名为"热带注意力"的新型注意力机制,专为解决神经网络在组合算法推理中的困境而设计。传统注意力机制使用softmax函数产生平滑的概率分布,无法精确捕捉组合算法所需的锐利决策边界。