ZD至顶网CIO与应用频道 03月20日 北京消息:3月19日,第10届UEC杯世界电脑围棋大会决赛今日在东京落幕,腾讯AI Lab(人工智能实验室)研发的围棋人工智能程序“绝艺”(Fine Art)首次参加比赛便一路过关斩将,力压日本的DeepZenGo、法国的Crazy Stone,斩获冠军,取得了本次比赛的冠军。
绝艺决胜局
UEC杯2007年始于日本,是最具传统和权威的计算机围棋大赛,每年邀请各国高水平AI齐聚东京比赛,促进相关学术及科技的交流。本届UEC杯共有来自中国、日本、韩国、美国、法国等国家的30个围棋AI参赛,是历届UEC比赛参赛“棋手”水平最高的一次。
比赛现场
据了解, “绝艺”英文名FineArt,名出唐朝诗人杜牧的《重送绝句》——绝艺如君天下少,闲人似我世间无。由腾讯AI Lab团队自主研发而成,涵盖了人工智能最热门的研究领域——深度学习和强化学习。“绝艺”的学习主要包括人类棋谱数据库和机器自对弈,它的算法基于策略网络与价值网络两大核心,并创新性地大幅提升了价值网络的精度,使其大局观表现更好。
UEC 3月18日循环积分赛结果
腾讯云发力AI,促使人工智能技术落地
“绝艺”问鼎世界冠军并非偶然,只是腾讯人工智能战略的一个体现,早在2016年5月,腾讯云在中国大数据产业峰会的展台上就展示了人工智能、互联网金融、互联网医疗、云存储和流媒体等技术应用,将AI发展划入战略日程。随后,在7月5日的腾讯"云+未来"峰会上,腾讯云正式宣布推出一站式数据分析与挖掘服务平台--数智方略,将腾讯大数据能力全面开放,覆盖基础平台、通用数据应用及行业解决方案在内的40余个产品及服务。
2016年12月26日,腾讯云宣布向全球企业正式提供7项AI云服务,包括人脸检测、五官定位、人脸比对与验证、人脸检索、图片标签、身份证OCR识别、名片OCR识别,宣告着腾讯云正式跻身世界人工智能“战场”。
腾讯公司董事会主席兼首席执行官马化腾曾表示,未来互联网行业就是用人工智能在云端处理大数据。而紧握AI,在面对竞争日益激烈的云计算市场,腾讯找到了赢得云端这场战争的一件新“武器”。
“绝艺”冠绝天下,冠军基因铸就冠军级服务能力
不仅如此,开发围棋AI的意义并不局限于围棋领域,“‘绝艺’背后‘精准决策’的AI能力,其应用前景非常广阔,如无人驾驶、量化金融、辅助医疗等。如果AI从围棋AI进化到不完美对称博弈系统,也就是能处理现实中更常见的不确定性问题时,想象空间非常巨大。”腾讯公司副总裁、AILab负责人姚星表示。
从团队角度看来,研发“绝艺”促使团队过去几年在AI算法研究、大规模计算平台以及工程能力得到一次检阅,并对深度学习和强化学习等AI热门研究领域有了很多有价值的探索与创新。另一方面,“绝艺”给了研发团队向更广阔AI领域积极进军的信心,随着腾讯对AI的研究不断深入,AI在其他领域的更多可能将被逐渐挖掘。
凭借QQ、微信等社交矩阵产生的大数据,结合腾讯18年的互联网服务和海量数据运营经验,腾讯云拥有亿万级别的服务能力。同时,腾讯人工智能云服务的推出,经过长时间的实践积累和磨砺,由内而外进行延展,可靠性更高。
在云计算、大数据及腾讯系优质资源的交互融合下,腾讯云给企业带来的附加值是巨大的。此次“绝艺”夺冠,也意味着腾讯云将为行业提供世界冠军级别的工人智能服务,为合作伙伴提供更多发展可能。
好文章,需要你的鼓励
这项研究由浙江大学、复旦大学等机构联合完成,提出了ReVisual-R1模型,通过创新的三阶段训练方法显著提升了多模态大语言模型的推理能力。研究发现优化的纯文本冷启动训练、解决强化学习中的梯度停滞问题、以及分阶段训练策略是关键因素。ReVisual-R1在各类推理基准测试中超越了现有开源模型,甚至在某些任务上超过了商业模型,为多模态推理研究开辟了新途径。
这项研究提出了一种名为"批评式微调"的创新方法,证明仅使用一个问题的批评数据就能显著提升大语言模型的推理能力。研究团队对Qwen和Llama系列模型进行实验,发现这种方法在数学和逻辑推理任务上都取得了显著提升,平均提高15-16个百分点,而且只需要强化学习方法1/20的计算资源。这种简单高效的方法为释放预训练模型的潜在推理能力提供了新途径。
新加坡国立大学研究团队开发了名为IEAP的图像编辑框架,它通过将复杂编辑指令分解为简单原子操作序列解决了当前AI图像编辑的核心难题。研究发现当前模型在处理不改变图像布局的简单编辑时表现出色,但在需要改变图像结构时效果差。IEAP框架定义了五种基本操作,并利用思维链推理技术智能分解用户指令,实验证明其性能显著超越现有方法,尤其在处理复杂多步骤编辑时。
Character AI的研究者开发出TalkingMachines系统,通过自回归扩散模型实现实时音频驱动视频生成。研究将预训练视频模型转变为能进行FaceTime风格对话的虚拟形象系统。核心创新包括:将18B参数的图像到视频DiT模型改造为音频驱动系统、通过蒸馏实现无错误累积的无限长视频生成、优化工程设计降低延迟。系统可让多种风格的虚拟角色与人进行自然对话,嘴型与语音同步,为实时数字人交互技术开辟了新可能。