在线学习 关键字列表
卡内基梅隆大学研究团队让AI智能体越用越聪明:PANDO系统如何在不增加算力的情况下超越同类方案

卡内基梅隆大学研究团队让AI智能体越用越聪明:PANDO系统如何在不增加算力的情况下超越同类方案

卡内基梅隆大学提出PANDO框架,通过在线技能蒸馏让网页AI智能体随任务积累越来越高效,在VWA测试中以更少代币实现更高成功率。

独立研究者开发的"小模型大压缩"系统:不靠超级AI,一台普通电脑也能超越顶级压缩工具

独立研究者开发的"小模型大压缩"系统:不靠超级AI,一台普通电脑也能超越顶级压缩工具

StateSMix是一个完全自包含的无损压缩系统,核心是一个仅有约12万参数、从零开始在线训练的Mamba状态空间模型,配合稀疏N元语法逻辑偏置和范围算术编码,无需预训练权重或GPU。在10MB以内的英文文本上,它超越了顶级传统压缩工具xz,最大领先幅度达8.7%,展现了微型在线神经网络在序列预测和压缩任务上的实际竞争力。

微软研究院突破:让AI在现实世界中越用越聪明的"在线体验学习法"

微软研究院突破:让AI在现实世界中越用越聪明的"在线体验学习法"

微软研究院提出"在线体验学习"方法,让AI模型能像人类一样在实际使用中持续学习改进。该方法通过两个阶段实现:从真实互动中提取经验知识,然后将知识融入模型参数。实验显示模型在文字游戏中的成功率显著提升,同时推理效率也大幅改善。这项研究为AI从静态学习向动态适应的转变提供了重要技术路径。

普林斯顿大学团队揭秘:AI智能体如何通过聊天自动变聪明

普林斯顿大学团队揭秘:AI智能体如何通过聊天自动变聪明

普林斯顿大学团队开发了OpenClaw-RL系统,让AI智能体能够在正常聊天过程中自动学习和改进。该系统巧妙地将用户回复、程序执行结果等"下一状态信号"转化为学习资源,采用二元强化学习和后见之明蒸馏两种互补方法,让AI既能从简单的满意度反馈中学习,也能从具体建议中提取深度指导。实验显示,个人助手的个性化能力提升超过4倍,专业任务性能也显著改善。

赋能线上学习,新华三大学荣获“博奥——最佳生态平台应用奖”

赋能线上学习,新华三大学荣获“博奥——最佳生态平台应用奖”

为了应对疫情带来的挑战,响应新华三集团“融绘数字未来,共享美好生活”的愿景和“以客户需求为导向”的文化价值观,顺应2020年中国在线教育领域里的新基建创新应用政策和新华三在该领域的业务方向,新华三大学开始探索构建在线教育体系