11月7日,华为全联接大会(HUAWEI CONNECT)2022中国站在深圳拉开帷幕。为解决企业在AI落地时面临的挑战,促进释放AI生产力,华为云在“一切皆服务”的基础上不断夯实基础能力,围绕大模型与求解器技术发布四项全新AI服务。
天筹AI求解器智能建模工具,低代码助力提升建模效率:求解器能够解决优化决策问题,帮助企业提升效率。以港口龙头企业天津港为例,基于华为云天筹AI求解器,天津港实现了人、港机、车、船、货的最优调度与高效协同,港口作业计划耗时从24小时缩短到10分钟,船舶在港时间缩短7%,大幅度地提升了港口运转效率和作业效率。但求解器应用门槛高,需要懂业务、懂运筹学、懂编程的专家将业务语言转化成数学模型,进而转化成编程语言。为帮助企业快速进行智能建模,华为云推出天筹AI求解器智能建模工具,将建模和模型维护过程智能化,简化开发人员的建模工作,大幅压缩原本需要数月的建模时间,将求解器建模速度提高30倍。华为云降低了企业应用求解器的门槛。
华为云盘古气象大模型,为行业数字化插上AI气象分析的翅膀:极端天气会带来巨大的生命和财产损失。华为云盘古气象大模型能够秒级预测未来7天全球天气情况,相比传统预报算法,速度提升1000倍、精度提升20%。今年8月,盘古气象大模型预测台风“马鞍”的轨迹和登陆时间,准确率达90%,远超行业平均水平。在海外,华为云为印尼打造了“国家海洋人工智能平台”,助力预测海洋灾害,保障航行安全。此外,华为云AI for Meteorology还可以用于农业、航空、航天等领域。
华为云盘古矿山大模型,让AI推动矿山安全高效作业,沉淀专家经验:为了解决AI在煤矿行业落地难、门槛高等问题,华为云打造了全栈性能领先的盘古矿山大模型。只需导入海量无标注的矿山场景数据进行预训练,盘古矿山大模型即可进行无监督自主学习,仅一个大模型就能覆盖煤矿的采、掘、机、运、通等业务流程下的1000多个细分场景。华为云AI for Mine让AI应用在煤矿普及更容易。例如,在主运场景中,基于盘古矿山大模型的AI主运智能监测系统能够精准识别大块煤、锚杆等异常情况,异物识别准确率达98%。此外,相较于人工巡检,盘古矿山大模型实现了全时段巡检,帮助工作人员及时地发现问题,避免因漏检造成的安全事故,缩短停机时间,同时提升井下巡检人员的工作效率。
华为云盘古OCR大模型,一个模型覆盖通用文字识别场景:OCR技术是人工智能的基础之一,能够对结构多变、种类多样、来源丰富的非结构化数据进行识别与提取。传统的OCR厂商通常从特定的应用切入,陆续发展出卡证识别、票据识别、文档识别、表格识别、车牌识别、智能扫码等一系列细分OCR能力,通过组合的方式服务于各个行业。行业中每产生一个的新的识别场景,都需要在标注后才能训练一个新的模型。这使得OCR服务的开发、维护成本居高不下。华为云发布盘古OCR大模型,通过独有的对比学习与掩膜图像建模相融合的自监督学习方法,学习并充分利用大规模的无标签数据,实现一个模型覆盖多个领域的全部通用文字识别场景,并将标注工作量降低90%。此外,盘古OCR大模型在11项经典数据集测试中取得显著的精度提升,而且与原本领先的文字识别算法相比,盘古OCR大模型的精度平均提升5%以上。
人工智能产业已成为新一轮科技革命和产业变革的核心驱动力,推动中国经济实现高质量发展,并深刻影响人民生活和社会进步。华为云将持续创新,加速千行百业智能化进程。
好文章,需要你的鼓励
腾讯今日开源混元MT系列语言模型,专门针对翻译任务进行优化。该系列包含四个模型,其中两个旗舰模型均拥有70亿参数。腾讯使用四个不同数据集进行初始训练,并采用强化学习进行优化。在WMT25基准测试中,混元MT在31个语言对中的30个表现优于谷歌翻译,某些情况下得分高出65%,同时也超越了GPT-4.1和Claude 4 Sonnet等模型。
腾讯ARC实验室推出AudioStory系统,首次实现AI根据复杂指令创作完整长篇音频故事。该系统结合大语言模型的叙事推理能力与音频生成技术,通过交错式推理生成、解耦桥接机制和渐进式训练,能够将复杂指令分解为连续音频场景并保持整体连贯性。在AudioStory-10K基准测试中表现优异,为AI音频创作开辟新方向。
今年是Frontiers Health十周年。在pharmaphorum播客的Frontiers Health限定系列中,网络编辑Nicole Raleigh采访了Startup Health总裁兼联合创始人Unity Stoakes。Stoakes在科技、科学和设计交汇领域深耕30多年,致力于变革全球健康。他认为,Frontiers Health通过精心选择的空间促进有意义的网络建设,利用网络效应推进创新力量,让企业家共同构建并带来改变,从而有益地影响全球人类福祉。
Meta与特拉维夫大学联合研发的VideoJAM技术,通过让AI同时学习外观和运动信息,显著解决了当前视频生成模型中动作不连贯、违反物理定律的核心问题。该技术仅需添加两个线性层就能大幅提升运动质量,在多项测试中超越包括Sora在内的商业模型,为AI视频生成的实用化应用奠定了重要基础。