ZD至顶网CIO与应用频道 11月24日 北京消息:12月8日,由中国经济体制改革研究会产业改革与企业发展委员会为指导,至顶网和工业4.0协会联合主办“第二届中国制造千人会”将在上海龙之梦大酒店隆重举办。
本届大会以“新技术·新工业·新商业”为主题,聚焦制造业的转型升级和商业、技术创新热点话题,展望行业未来发展趋势。汇聚上千名制造业专家学者、企业运营负责人、制造企业信息化负责人、产品开发设计负责人、互联网从业者、制造业投资人、智能硬件创业者等。
纵观全球制造业,第四次工业革命正在到来,欧美等发达国家提出“再工业化”,重新把制造业作为经济发展之本。中国制造业也迎来前所未有的发展机遇,从《中国制造2025》,到供给侧改革,中国制造业的创新与发展,正成为事关下一个经济增长阶段的重要命题。
正是如此,中国制造业既要在企业内部迎接新数字工业革命的浪潮,推动大数据互联网技术的融合和技术创新;又要在激烈竞争的市场环境中,探索新的商业机会,并借助资本市场的力量实现弯道超车。
在这一场年度盛会上,来自上海自贸区管委会、上海市经信委副主任、国家体改委,上海外高桥集团等领导;企业代表徐工信息技术股份有限公司、三个爸爸空气净化器、京东商城、LKK洛可可等相关负责人;技术代表西门子、SAP、微软、IBM、百度云等高管将从产学研多维度的展示制造行业的新变化与创新。
同时中国制造千人会也将持续传递制造业可借力的最新技术手段,用启发性的商业思维,帮助中国制造业拓展基于互联网的传播能力,提升产品设计能力,最终实现制造业的创新与升级。在此,我们诚邀您参加“第二届中国制造千人会”,期待与您共同见证活动盛况。欲了解更多详情,欢迎访问大会官方网站www.mic1000.com。
好文章,需要你的鼓励
这项来自苹果公司的研究揭示了视频大语言模型评测的两大关键问题:许多测试问题不看视频就能回答正确,且打乱视频帧顺序后模型表现几乎不变。研究提出VBenchComp框架,将视频问题分为四类:语言模型可回答型、语义型、时序型和其他类型,发现在主流评测中高达70%的问题实际上未测试真正的视频理解能力。通过重新评估现有模型,研究团队证明单一总分可能掩盖关键能力差距,并提出了更高效的评测方法,为未来视频AI评测提供了新方向。
这篇来自KAIST AI研究团队的论文提出了"差分信息分布"(DID)这一创新概念,为理解直接偏好优化(DPO)提供全新视角。研究证明,当偏好数据编码了从参考策略到目标策略所需的差分信息时,DPO中的对数比率奖励形式是唯一最优的。通过分析DID熵,研究解释了对数似然位移现象,并发现高熵DID有利于通用指令跟随,而低熵DID适合知识密集型问答。这一框架统一了对DPO目标、偏好数据结构和策略行为的理解,为语言模型对齐提供理论支持。
VidText是一个全新的视频文本理解基准,解决了现有评估体系的关键缺口。它涵盖多种现实场景和多语言内容,提出三层评估框架(视频级、片段级、实例级),并配对感知与推理任务。对18个先进多模态模型的测试显示,即使最佳表现的Gemini 1.5 Pro也仅达46.8%平均分,远低于人类水平。研究揭示输入分辨率、OCR能力等内在因素和辅助信息、思维链推理等外部因素对性能有显著影响,为未来视频文本理解研究提供了方向。
ZeroGUI是一项突破性研究,实现了零人工成本下的GUI代理自动化在线学习。由上海人工智能实验室和清华大学等机构联合开发,这一框架利用视觉-语言模型自动生成训练任务并提供奖励反馈,使AI助手能够自主学习操作各种图形界面。通过两阶段强化学习策略,ZeroGUI显著提升了代理性能,在OSWorld环境中使UI-TARS和Aguvis模型分别获得14%和63%的相对改进。该研究彻底消除了传统方法对昂贵人工标注的依赖,为GUI代理技术的大规模应用铺平了道路。