7月22日,第三届华为云AI院长峰会在贵安召开。峰会上,多位中国工程院院士、中国科学院院士,以及来自国内近30所顶尖高校的60余名院长、教授、专家汇聚一堂,共同探讨人工智能发展的新趋势及新挑战,促进人工智能创新思想、技术、产业、应用、人才的集聚和落地。
华为云AI院长峰会嘉宾合影
推动人工智能产学研的创新发展
中国科学院院士、清华大学人工智能研究院名誉院长张钹表示:“人工智能的发展处于初期阶段,科研工作者需要充分利用知识、数据、算法、算力这四个要素,建立可解释和鲁棒的人工智能理论,发展可控、可信、可靠、可扩展的人工智能技术,探索出一条适合人工智能的全新发展道路,以此推动人工智能的教学、科研和产业的健康发展”。
中国工程院院士、鹏城实验室主任、北京大学博雅讲席教授高文在“AI for Science的机遇与布局”主题报告中指出,科技创新是人类进步的动力源(6.87 -2.55%,诊股)泉。目前,“AI+遥感”“AI+天文”“AI+生命组学”是鹏城实验室AI for Science研究的三大重点布局方向,有着可观的机遇前景。以生物与医药细分领域为例,科研工作者可以通过AI进行计算、分析,并给出药物、饮食方面的建议,降低或延缓人类的患病速度,提高人们的生活质量。
华为公司董事、科学家咨询委员会主任徐文伟表示:“为推动AI的行业规模化应用,在科学研究层面需加强预训练大模型的布局、延伸模型的泛化能力、推动可解释性的研究。在企业驱动层面,应当鼓励人工智能相关培训进入企业,通过实际案例提高相关人员的人工智能素养,创造良好的协同环境。华为云把AI技术和应用经验化、云化,让更多企业像使用水电一样使用全球领先的数字技术,促进AI高效地走进企业。
一切皆服务 华为云持续打造AI领域三大利器
华为云提出并践行“一切皆服务”战略。在“技术即服务”层面,华为云推出三大AI根技术,通过持续淬炼底层技术,让AI开发生产线ModelArts性能更优,让千行百业AI开发门槛更低,让AI与行业更好地结合,加速人工智能在行业的落地和规模应用。
华为云CTO张宇昕表示:“为加快人工智能工业化开发和落地,华为云打造了盘古预训练大模型和知识计算解决方案,目前已经在工业、城市、能源、金融、气象等多个行业落地。今年6月,华为云进一步打通数据治理生产线DataArts和AI开发生产线ModelArts,构建了可以发挥数据价值、加速企业敏捷创新的数智融合平台,赋能数据和AI开发进入现代化生产阶段”。
华为云人工智能领域首席科学家、IEEE Fellow、国际欧亚科学院院士田奇在会上介绍了盘古大模型的最新成果和重要升级,分享了支撑大模型产业落地关键路径。田奇表示,华为云盘古预训练大模型在推动伙伴和客户实现人工智能工业化开发的同时,自身也在不断迭代成长。今年,华为云全新推出盘古Graph大模型,目前已在工艺优化、时序预测、智能分析等业务场景得到实践与验证。
例如,在焦化领域,更为可靠、高效、准确的“配煤师数字助手”正在助力加速煤焦化产业升级。基于盘古Graph大模型,华为云为鞍钢集团打造智慧配煤解决方案,帮助解决智能化提升动力不足的问题。如今,操作人员只需要在系统中输入配炼焦炭的四种原料成分相关比例,系统就能自动计算焦炭中的成焦质量,配煤仅耗费1~2分钟,质量预测准确率达到95%,在确保焦炭质量的前提下,平均配煤成本下降超过5元。以年产量200万吨焦炭为例,企业可节省成本上千万元。
助力校企交流 共促产学研深度融合
华为云积极与学术界进行思想碰撞,和多位知名教授、学者携手开展科研项目并取得较大成果。
会上,来自中国科学技术大学、西北工业大学、浙江大学、苏州大学、北京语言大学五个高校的教师团队获颁“优秀创新合作团队”。
其中,中国科学技术大学陈恩红教授与华为云在“领域知识图谱构建与应用技术”方面进行深度合作,围绕知识抽取、建模、表征及应用,构建业界领先的行业知识图谱技术;北京语言大学团队的荀恩东教授与华为云展开关于《阿拉伯语NLP技术》的合作,联合研发阿拉伯语NLP基础能力,对华为云在阿拉伯语NLP领域关键竞争力方面具备重要价值;西北工业大学团队谢磊教授与华为云展开关于《鲁棒性语音识别》的合作,针对语音识别领域噪音和口音两个挑战问题取得技术突破,大幅提升了华为云语音识别引擎在真实场景下识别准确率;苏州大学张民教授与华为云展开关于《NLP基础技术》的合作,针对语法分析、信息抽取等多个NLP基础技术取得技术突破,提升了华为云在NLP基础技术方面技术积累;浙江大学庄越挺教授与华为云展开关于《基于大规模互联网数据下的多模态预训练技术》的合作,联合研发多模态理解预训练大模型LOUPE,在多项下游任务中超越业界标杆算法,提升华为云在多模态领域的关键竞争力。
此外,五名高校老师获得“AI名师奖”,分别为中国科学技术大学周文罡、上海交通大学张娅、哈尔滨工业大学丁效、浙江大学赵洲、浙江大学汤斯亮。
人工智能技术的应用全方面推动了人类发展的进程,人工智能生态的繁荣影响产业竞争格局。华为云创建人工智能产学研对话平台,将继续与各高校一同持续创新、合作共赢,以更普适性的方式助力科技人才的培养,携手共创更美好的数字未来。
好文章,需要你的鼓励
这项研究介绍了VisCoder,一个经过专门微调的大语言模型,用于生成可执行的Python可视化代码。研究团队创建了包含20万样本的VisCode-200K数据集,结合了可执行代码示例和多轮修正对话。在PandasPlotBench基准测试中,VisCoder显著优于同等规模的开源模型,甚至在某些方面超越了GPT-4o-mini。研究还引入了自我调试评估模式,证明了反馈驱动学习对提高代码可执行性和视觉准确性的重要性。
这项研究提出了"适应再连续学习"(ACL)框架,一种创新的方法解决预训练模型在连续学习中的稳定性-可塑性困境。通过在学习新任务前先对模型进行适应性调整,ACL使模型既能更好地学习新知识(提高可塑性),又能保留已有知识(维持稳定性)。实验证明,该框架能显著提升各种连续学习方法的性能,为解决人工智能系统中的"灾难性遗忘"问题提供了有效途径。
这篇研究首次关注了CLIP模型文本编码器的对抗鲁棒性问题,提出了LEAF方法(Levenshtein高效对抗性微调)来增强文本编码器的稳健性。实验表明,LEAF显著提高了模型在面对文本扰动时的性能,在AG-News数据集上将对抗准确率从44.5%提升至63.3%。当集成到Stable Diffusion等文本到图像生成模型中时,LEAF显著提高了对抗噪声下的生成质量;在多模态检索任务中,它平均提高了10个百分点的召回率。此外,LEAF还增强了模型的可解释性,使文本嵌入的反演更加准确。
BenchHub是由韩国KAIST和Yonsei大学研究团队开发的统一评估平台,整合了38个基准中的30万个问题,按技能、学科和目标类型进行精细分类。研究显示现有评估基准存在领域分布偏差,而BenchHub通过自动分类系统和用户友好界面,让用户能根据特定需求筛选评估数据。实验证明模型在不同领域的排名差异巨大,强调了定制化评估的重要性。该平台支持多语言扩展和领域特化,为研究人员和开发者提供了灵活评估大语言模型的强大工具。