至顶网CIO与应用频道 11月06日 北京消息:全球领先的信息技术研究和顾问公司Gartner的年度首席信息官调查显示,相比全球同行,亚太区首席信息官采用物联网(IoT)、人工智能(AI)与会话式界面(conversational interfaces)等颠覆性技术的比例更高。
43%的亚太区首席信息官表示他们已经部署或在短期内计划部署物联网技术(全球比例为37%);37%已经部署或在短期内计划部署人工智能技术(全球比例为25%)。28%的亚太区首席信息官已经投资于会话式界面(全球比例为21%);20%已经投资于虚拟现实(VR)与增强现实(AR)(全球比例为17%);13%已经采用区块链(blockchain)或分布式账本技术(distributed ledger technology)(全球比例为9%)。
Gartner副总裁兼杰出分析师Andy Rowsell-Jones表示:“许多非常成功且具有创业精神的数字化企业以及成熟的制造业、金融服务、矿业、政府机关与高等教育机构都在亚太地区,这推动了该地区技术普及曲线的攀升。”
在澳大利亚召开的Gartner Symposium/ITxpo峰会期间,Gartner分析师展示了“2018年Gartner首席信息官议程调查(2018 Gartner CIO Agenda Survey)”的结果。全球共3160位首席信息官(包括来自亚太区17个国家与地区的537位首席信息官)参与了调查,相当于大约3.4万亿美元收入/公共部门预算与490亿美元IT支出。
不断变化的首席信息官角色
调查显示,95%的首席信息官预计其工作将会因数字化而发生改变或经历重组。由于世界级IT交付已经实现,首席信息官们为其付出的时间将越来越少。受访者认为,首席信息官角色最重要的两大转变将会是成为变革领导者,以及承担更多、更广泛的职责。首席信息官们的工作将不可避免从传统的服务交付延伸至其他业务领域,如创新管理与人才发展等。
Rowsell-Jones先生表示:“首席信息官的工作性质已经从交付高管转变为IT业务主管,即从控制成本与设计流程转变为提高收入与利用数据。领导者们正在快速扩展其数字化业务,对于不愿落后的首席信息官而言,今年余下的时间以及2018年将成为决定性时刻。”
调查结果显示,亚太区首席信息官越来越多地承担起传统IT业务之外的责任,但这一比例仍显著低于全球同行。负责数字化转型的亚太区首席信息官比例为44%(全球为55%);负责创新的比例为37%(全球为54%);负责企业变革的比例为17%(全球为28%)。
Rowsell-Jones先生认为:“尤其需要指出的是,在亚太一些地区,首席信息官很难被授权去跳出有限的IT领域采取行动。尽管如此,这也并不意味着他们应当抛开推动深远企业变革的责任。”
企业IT预算增长
调查结果显示,亚太区首席信息官预计其预算将增长5.1%,高于全球3%的均值。
Rowsell-Jones先生表示:“今年,由于各企业进行数字化转型,整个亚太区的IT预算增长非常强劲。”
调查结果显示,在亚太地区,首席信息官正走在从数字试验(digital experimentation)到数字扩展(digital scaling)的道路上。但是,在进行早期数字试验及试点与已经实现数字扩展的首席信息官之间,存在着一堵高墙。只有15%的首席信息官实现了数字扩展,3%的首席信息官已经处于收获与优化其数字化战略的阶段,这个比例与全球同行保持一致。
42%的亚太首席信息官认为,发展数字化战略的主要障碍是企业文化(全球比例为46%)。紧随其后的是人才短缺(24%)与资源短缺(19%)。
Rowsell-Jones先生认为:“首席信息官必须确定当前存在的文化行为以及未来愿景。为此,他们必须识别现有的文化优势,并将文化变革作为‘新的篇章’,而非大规模全面调整,以尊重员工所做的贡献,并邀请他们共同踏上这段旅程。”
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。