埃森哲(纽交所代码:ACN)最新发布的《技术展望2022》报告指出,扩展现实(XR)、区块链、数字孪生和边缘计算等多种技术的发展,为塑造企业级元宇宙奠定基础。这一趋势将创造全新的交互体验,进一步推动数字世界和现实世界的融合,改变未来十年人们的生活和企业发展。
埃森哲连续第二十二年发布《技术展望》报告,今年的主题为“多元宇宙,融合共治:重塑新商业格局的技术与体验”。报告指出,元宇宙正在改变互联网的运作模式,一些具有远见的企业已开始着力打造虚拟和现实融合空间,建立更为无缝、紧密的连接,并借助新一代计算机开启行业变革。为帮助企业更好地把握机遇,埃森哲宣布成立元宇宙事业部,与行业领军者共同塑造新商业格局。
埃森哲技术服务全球总裁兼首席技术官杜保洛(Paul Daugherty)表示:“我们把元宇宙视为在多个维度上不断演变和扩展的连续统一体。下一代互联网已然到来,这将推动新一轮数字化转型浪潮,改变人们的生活和工作方式。随着现实生活和数字生活的融合度加深,企业将跨越技术和平台开展运营协作,探索客户体验场景。在新赛道上,企业需要肩负起责任,更前瞻性地考虑并应对信任、可持续、多元化、安全、隐私等多重挑战。”
埃森哲调研了全球4,600多名业务和信息技术高级管理者,其中包括150多名中国企业高管。在现阶段,近九成(89%)的受访中国企业高管认为,元宇宙会对其企业产生积极的影响。有60%的中国高管表示,元宇宙会带来的变化将是突破性的。
埃森哲《技术展望2022》报告揭示了企业需要关注的四大重要趋势,它们将帮助企业破立并举,稳步迈向未来:
未来网络:融入元宇宙。如今,企业依赖现有的互联网规则,各类网站和应用(apps)纷繁零散,平台之间数据难以整合共享,元宇宙和Web3将改变这一局面。元宇宙将构建一个恒定的三维环境,允许人们在数字和物理空间中自由“穿梭”。有九成的中国企业高管认为,未来的数字平台应打造统一的用户体验,实现客户数据跨平台和空间的共享协作。
编码世界:个性化星球。随着5G、环境计算、增强现实和智能材料等新兴技术和产业发展速度加快,更多物理世界可以通过编码接入数字世界。这些数字化的实体环境不仅会重塑人们与周遭的交互方式,更会深刻影响人们感知、回应、掌控事物的方式。有88%的中国企业高管认为,领军企业将加强人们在虚拟世界中的真实感官体验,使人们可以在数字世界和现实世界间持续、无缝地切换。
虚实共生:合成但真诚。通过人工智能技术合成的数据将能够更为客观地反映现实世界,支持更多的业务场景。企业和消费者将更关注人工智能的诚信度和公平性。在虚拟与真实共生共建的情况下,除了合成内容和算法,企业更要从品牌整体考虑,注重真实性的影响。有92%的中国高管表示,其所在企业高度重视验证数据来源和人工智能应用的真实性和正当性。
无限算力:开启新希望。随着新一代计算机的发展突破,各行各业的企业均有望突破计算极限。量子计算和生物计算将攻克曾经受制于成本高昂、效率低下或无法计算的难题。当天堑变通途,企业的竞争优势、价值创造以及合作方式将发生颠覆性变化。有88%的中国高管相信,新一代计算机将支持其实现长期、可持续增长的目标。
报告指出,商业环境将彻底改变,积极拥抱变化的领军企业将发挥头雁作用,面向客户、员工与合作伙伴开展新的战略,塑造新的竞争格局。例如,数字孪生技术是元宇宙的重要基石,玛氏(Mars)与微软及埃森哲合作,运用数字孪生大幅提高生产效率、减少材料浪费,并从订单到交付的各个环节支持员工进行实时决策。玛氏正将这一技术推广到产品研发,通过数字技术模拟气候、突发干扰和其他变量因素,强化从原产地到消费者的全链条追溯体系。埃森哲自身也是企业级元宇宙的积极探索者,公司创建了“Nth Floor”,让全球各地员工在任何时间都可以进入这一虚拟空间参加入职培训,开展沉浸式学习,和其他同事“见面聊天”。
好文章,需要你的鼓励
这篇研究提出了OThink-R1,一种创新的大型推理模型,能够像人类一样在快速直觉思维和慢速深度推理之间自动切换。研究者发现,现有推理模型即使面对简单问题也会生成冗长的推理过程,导致计算资源浪费。通过分析推理轨迹并使用LLM评判员区分冗余和必要推理,OThink-R1能根据问题复杂度动态调整思考深度。实验表明,该方法平均减少了23.4%的生成文本量,同时保持或提高了准确率,代表了向更高效、更人性化AI推理系统迈出的重要一步。
这项研究提出了SHARE,一种新型文本到SQL修正框架,它利用三个小型语言模型(SLM)协同工作,实现高效精准的SQL错误修正。SHARE首先通过基础行动模型将SQL转换为行动轨迹,再经过模式增强模型和逻辑优化模型的层次化精细化修正。研究团队还创新性地提出了层次化自演化训练策略,大大提高了训练数据效率。实验结果表明,SHARE在多个基准测试上显著提升了SQL生成准确率,计算成本仅为传统方法的十分之一,并展现出强大的泛化能力,适用于各种生成器模型和SQL方言。
这项由香港大学和南京大学等机构研究人员联合开发的双专家一致性模型(DCM)解决了高质量视频生成中的效率难题。研究团队发现扩散模型蒸馏过程中存在优化冲突:早期阶段负责语义布局与运动,后期阶段关注细节精修,两者学习动态差异显著。DCM创新性地将这两个任务分配给不同的专家模型,通过参数高效的实现方式,使模型仅需4步即可生成接近50步原始模型质量的视频,大幅提升生成速度,为实用化AI视频创作铺平道路。
这项研究介绍了QARI-OCR,一种基于Qwen2-VL-2B-Instruct模型微调的阿拉伯文字识别系统。研究团队通过三阶段合成数据训练,成功解决了阿拉伯文字识别中的主要挑战:曲线连笔特性、上下文变化的字母形状和发音符号。QARI v0.2模型创下了0.061的字符错误率和0.160的单词错误率,超越了现有开源解决方案,为阿拉伯文化遗产的数字化保存提供了重要工具。