至顶网CIO与应用频道 07月20日 北京消息:7月19日,中国大数据算法大赛京东赛区——京东JDATA算法大赛决赛正式打响,从4801支参赛队伍,5182名选手中脱颖而出、历时3个月鏖战入围前十的10支队伍,经过一下午的激烈角逐,最终Trident团队斩获大赛冠军,独得50万大奖,朵拉公波鲁、DANT分获亚军和季军,分别获得10万和5万奖金。
据了解,本次大赛是由京东联合中国信息通信研究院、联通大数据有限公司、中国高等教育学会、中关村加一战略新兴产业人才发展中心共同举办。大赛不仅在吸引和培养技术型人才,激发算法创新,深挖数据价值方面发挥了重要价值,更积极推动了大数据的商业应用落地,以创新的技术驱动零售行业发展,为消费者提供更优的购买体验。
(与会嘉宾启动决赛)
本届赛题:如期而至—用户购买时间预测,是基于京东的真实业务场景提炼而出的,比如,如何按时、精准的向消费者推荐日常生活所需的米面等热销品?或者如何向新手父母推荐婴儿用品?选手利用脱敏后的数据,建立数据模型,在尽量贴近真实电商业务环境下进行比赛,优秀创新的算法可以通过预测用户复购时间,帮助京东选择在合适的时间向用户进行购买提醒,并通过合适的渠道触达用户,比如短信提醒、app通知等,提升精准营销场景中的智能推荐效果。高质量的竞赛数据和基于真实业务场景提炼而出的优质赛题,是大赛独特魅力所在,成为算法走向商业化实践,真正发挥价值的有效渠道。
挖掘优秀的算法人才,也是比赛的重要目标之一。据悉,京东非常重视算法人才,通过上届比赛已经引入了数十位算法专家,他们在京东不同的工作岗位上崭露头角,很多人才已经成为了所在部门的技术中坚力量。此外,优秀赛事成果也对京东的实际业务产生了积极地影响。通过对首届京东JDATA算法大赛中实现商用的优秀代码进行分析与筛选,自2017年6月监控至2017年10月,品类模型准确率和召回率较原有模型均有所提升,其中准确率平均提升近30%,召回率平均提升近20%;同时大赛的优秀代码,还为线上模型提供了商品维度模型的构建思路,商品维度模型的准确率也都达到了60%左右;商用方面,模型上线至今,应用于平板电视、冰箱、洗衣机等品类的模型,GMV提升效果非常明显。
本次大赛还采用了京东自主研发的JDATA智汇平台,基于英特尔至强可扩展处理器,进行了人工智能方面的优化,性能有显著提升。
京东透露,未来还将持续举办算法大赛,实现比赛和业务、人才引进之间的有效联动,JDATA智汇平台,就是京东未来持续对外输出算法能力,赋能行业与算法爱好者,打造技术影响力的重要渠道;京东将与合作伙伴一道,利用JDATA智汇平台,引入更多高水平算法比赛,为中国大数据、算法、人工智能领域挖掘出更多更好的优秀人才。同时,京东将以中国电商领域最完整、最精准、价值链最长的数据,持续为大数据、算法等新技术提供大量的实际应用场景,通过算法的迭代优化,让数据更有价值,实现消费者购物体验的提升,让“想你所需”真正成为可能,同时以成熟落地的技术应用为行业、为合作伙伴赋能,让更多消费者感受到大数据算法带来的便利。
好文章,需要你的鼓励
RiOSWorld是一项开创性研究,评估多模态计算机使用代理在真实环境中的安全风险。由上海人工智能实验室团队开发的这个基准测试包含492个风险任务,涵盖网页浏览、社交媒体、操作系统等多种应用场景。研究将风险分为环境源和用户源两大类,通过风险目标意图和完成两个维度进行评估。对十个代表性MLLM代理的测试结果表明,当前代理在风险目标意图上的不安全率高达84.93%,在风险目标完成上达59.64%,揭示了AI代理在计算机使用安全性方面存在的严重隐患,为未来可信AI系统的开发提供了重要参考。
牛津大学林元泽及其国际合作团队开发的IllumiCraft是一种创新的视频重光照技术,它首次将几何和光照引导统一到一个扩散模型中。通过同时处理HDR环境图、合成重光照帧和3D点轨迹,该技术能生成与用户提示一致的时间连贯视频。研究团队还构建了包含20,170个视频对的高质量数据集,实验表明IllumiCraft在视觉质量、提示对齐和时间一致性方面显著优于现有方法,开创了可控视频生成的新可能。
中国人民大学物理学院研究团队开发了HTSC-2025,这是一个专为AI预测超导临界温度而设计的常压高温超导体基准数据集。该数据集包含140个样本,涵盖了2023-2025年基于BCS理论预测的超导材料,平均Tc为27.3K,最高达160K。研究不仅提供了公开的评估框架,还总结了提高超导温度的物理策略,如空穴掺杂和轻元素引入。该基准已在GitHub开源,为AI驱动的超导材料发现提供了重要支持。
MBZUAI研究团队开发了FinChain,这是金融领域首个可验证的符号化思维链推理基准测试。该基准涵盖12个金融领域的54个主题,每个主题包含5个不同难度的参数化模板,配有可执行的Python代码验证每一步推理。研究者还提出了ChainEval评估指标,同时评估最终答案正确性和中间推理步骤一致性。对30个大语言模型的测试表明,即使最先进模型在处理复杂金融推理时仍有很大提升空间,且模型规模是决定推理能力的关键因素。