企业高管们今年将在数字化转型上投入大量资金,这将有助于推动全球IT整体支出增长8.4%,到2021年底达到4.1万亿美元。
市场研究公司Gartner今年1月的最新预测称,由于疫情几乎成为所有主要行业数字化转型的催化剂,因此今年IT支出将达到3.9万亿美元。因为疫情导致的各种支出削减,使得全球技术支出在2020年收缩了2.2%。
Gartner表示,2021年IT支出的主要增长动力来自传统IT以外的业务部门所进行的新数字化业务项目,使得业务部门成为收入成本或者商品销售成本的来源。
Gartner表示,今年所有主要的IT支出领域都将实现正增长,其中设备支出增长14%,企业软件支出增长10.8%,而这主要是因为企业组织现在专注于为员工提供更舒适、创新和高效的远程工作环境。
Gartner杰出研究副总裁John-David Lovelock表示,IT的角色不再仅仅是支撑企业运营,相反,IT现在“完全参与到业务价值交付中”,他说。
Lovelock补充说:“这不仅让IT的角色从后台转移到业务部门,而且资金来源也从被维持、监控、和削减的多余开销,转变为推动收入的因素。”
Gartner表示,企业越来越关注员工体验和幸福感,这推动了在社交软件和协作平台以及人力资本管理软件等领域的投资。此外,大型企业的CIO们正在专注于完成他们的数字业务计划,以增强价值主张。
Lovelock解释说:“去年,疫情下IT支出情况呈现‘下意识的反应’,为了让员工几周内就可以切换成远程办公模式。随着工作模式的多样化,CIO们将专注于利用IT支出实现创新,而不仅仅是完成任务。”
Gartner还预测,随着后疫情时代经济逐渐复苏,各个国家、垂直行业和IT部门也将呈现很大的差异。Gartner预计银行业、保险业和证券业的支出将更接近疫情前的水平。相比之下,零售业和运输业要到2023年才会恢复常态。
Gartner称,在北美和西欧,疫苗推出速度更快,到2021年底这些地区的经济将将恢复正常,但是拉丁美洲要到2024年才能复苏。与此同时,中国已经开始复苏,IT支出现已经超过2019年的水平。
好文章,需要你的鼓励
这项研究提出了HoPE(混合位置编码),一种针对视觉语言模型的新型位置编码技术,专门解决长视频理解的挑战。传统位置编码技术在处理长视频时表现不佳,HoPE通过两个创新解决了这一问题:混合频率分配策略(为空间信息分配高频,时间维度使用零频率)和动态时间缩放机制(根据视频速度灵活调整时间编码)。实验证明,HoPE在长视频理解和检索任务上分别提升了8.35%和22.23%,为AI更准确理解长视频内容开辟了新途径。
东京大学研究团队推出MangaVQA基准和MangaLMM模型,专门用于评估和提升AI对日本漫画的理解能力。MangaVQA由526个高质量手动创建的问答对组成,用于评估AI系统对漫画内容的深入理解;MangaOCR则专注于漫画页内文本识别。基于这两个基准,研究团队从开源多模态模型Qwen2.5-VL微调出MangaLMM,能同时处理文本识别和内容理解任务。实验显示,即使是GPT-4o等顶尖商业模型在处理漫画的独特复杂性时也面临挑战,而专门训练的MangaLMM表现出色。
这项研究由ISTA和谷歌研究院联合开发的"影响力蒸馏"方法,通过利用二阶信息为训练样本分配最优权重,实现了大语言模型训练数据的高效选择。该方法在数学上有坚实理论支持,并创新性地引入"地标"近似技术,仅需计算少量样本的精确影响力,再高效传播到其他样本,大幅降低计算成本。实验证明,该方法在多种模型和任务上均优于或匹配现有技术,同时实现了高达3.5倍的速度提升,为大模型训练开辟了更高效的路径。
来自哈佛大学等顶尖学府的研究团队在这篇论文中挑战了传统观念,认为Token压缩不仅仅是提高AI模型运行效率的工具,更应成为生成式AI模型设计的核心原则。研究表明,精心设计的Token压缩策略可以促进多模态深度整合、减轻AI"幻觉"问题、增强处理长序列输入的能力,并提高训练稳定性。论文详细分析了现有方法的局限性,并提出了算法创新、强化学习指导和硬件协同设计等未来研究方向。