至顶网CIO与应用频道 07月20日 北京消息:7月19日,中国大数据算法大赛京东赛区——京东JDATA算法大赛决赛正式打响,从4801支参赛队伍,5182名选手中脱颖而出、历时3个月鏖战入围前十的10支队伍,经过一下午的激烈角逐,最终Trident团队斩获大赛冠军,独得50万大奖,朵拉公波鲁、DANT分获亚军和季军,分别获得10万和5万奖金。
据了解,本次大赛是由京东联合中国信息通信研究院、联通大数据有限公司、中国高等教育学会、中关村加一战略新兴产业人才发展中心共同举办。大赛不仅在吸引和培养技术型人才,激发算法创新,深挖数据价值方面发挥了重要价值,更积极推动了大数据的商业应用落地,以创新的技术驱动零售行业发展,为消费者提供更优的购买体验。
(与会嘉宾启动决赛)
本届赛题:如期而至—用户购买时间预测,是基于京东的真实业务场景提炼而出的,比如,如何按时、精准的向消费者推荐日常生活所需的米面等热销品?或者如何向新手父母推荐婴儿用品?选手利用脱敏后的数据,建立数据模型,在尽量贴近真实电商业务环境下进行比赛,优秀创新的算法可以通过预测用户复购时间,帮助京东选择在合适的时间向用户进行购买提醒,并通过合适的渠道触达用户,比如短信提醒、app通知等,提升精准营销场景中的智能推荐效果。高质量的竞赛数据和基于真实业务场景提炼而出的优质赛题,是大赛独特魅力所在,成为算法走向商业化实践,真正发挥价值的有效渠道。
挖掘优秀的算法人才,也是比赛的重要目标之一。据悉,京东非常重视算法人才,通过上届比赛已经引入了数十位算法专家,他们在京东不同的工作岗位上崭露头角,很多人才已经成为了所在部门的技术中坚力量。此外,优秀赛事成果也对京东的实际业务产生了积极地影响。通过对首届京东JDATA算法大赛中实现商用的优秀代码进行分析与筛选,自2017年6月监控至2017年10月,品类模型准确率和召回率较原有模型均有所提升,其中准确率平均提升近30%,召回率平均提升近20%;同时大赛的优秀代码,还为线上模型提供了商品维度模型的构建思路,商品维度模型的准确率也都达到了60%左右;商用方面,模型上线至今,应用于平板电视、冰箱、洗衣机等品类的模型,GMV提升效果非常明显。
本次大赛还采用了京东自主研发的JDATA智汇平台,基于英特尔至强可扩展处理器,进行了人工智能方面的优化,性能有显著提升。
京东透露,未来还将持续举办算法大赛,实现比赛和业务、人才引进之间的有效联动,JDATA智汇平台,就是京东未来持续对外输出算法能力,赋能行业与算法爱好者,打造技术影响力的重要渠道;京东将与合作伙伴一道,利用JDATA智汇平台,引入更多高水平算法比赛,为中国大数据、算法、人工智能领域挖掘出更多更好的优秀人才。同时,京东将以中国电商领域最完整、最精准、价值链最长的数据,持续为大数据、算法等新技术提供大量的实际应用场景,通过算法的迭代优化,让数据更有价值,实现消费者购物体验的提升,让“想你所需”真正成为可能,同时以成熟落地的技术应用为行业、为合作伙伴赋能,让更多消费者感受到大数据算法带来的便利。
好文章,需要你的鼓励
苏州大学研究团队提出"语境降噪训练"新方法,通过"综合梯度分数"识别长文本中的关键信息,在训练时强化重要内容、抑制干扰噪音。该技术让80亿参数的开源模型在长文本任务上达到GPT-4o水平,训练效率比传统方法高出40多倍。研究解决了AI处理长文档时容易被无关信息干扰的核心问题,为文档分析、法律研究等应用提供重要突破。
在Cloudera的“价值观”中,企业智能化的根基可以被概括为两个字:“源”与“治”——让数据有源,智能可治。
清华大学团队首次揭示了困扰AI训练领域超过两年的"幽灵故障"根本原因:Flash Attention在BF16精度下训练时会因数字舍入偏差与低秩矩阵结构的交互作用导致训练崩溃。研究团队通过深入分析发现问题源于注意力权重为1时的系统性舍入误差累积,并提出了动态最大值调整的解决方案,成功稳定了训练过程。这项研究不仅解决了实际工程问题,更为分析类似数值稳定性挑战提供了重要方法论。