人工智能 关键字列表
武汉大学团队破解网络小说翻译难题:让AI学会文化内涵和语言艺术

武汉大学团队破解网络小说翻译难题:让AI学会文化内涵和语言艺术

武汉大学研究团队提出DITING网络小说翻译评估框架,首次系统评估大型语言模型在网络小说翻译方面的表现。该研究构建了六维评估体系和AgentEval多智能体评估方法,发现中国训练的模型在文化理解方面具有优势,DeepSeek-V3表现最佳。研究揭示了AI翻译在文化适应和创意表达方面的挑战,为未来发展指明方向。

伊利诺伊大学团队打造3B参数AI智能体,竟能比GPT-4o更擅长家务操作

伊利诺伊大学团队打造3B参数AI智能体,竟能比GPT-4o更擅长家务操作

伊利诺伊大学团队开发的ERA框架通过创新的两阶段训练方法,让30亿参数的小型AI模型在具身智能任务上超越了GPT-4o等大型模型。该框架结合具身先验学习和在线强化学习,在高级规划和低级控制任务上分别实现了8.4%和19.4%的性能提升,为小而精的AI发展路径提供了重要示范。

香港大学团队首创AI系统"内部监督"机制:让人工智能学会自我指导和提升

香港大学团队首创AI系统"内部监督"机制:让人工智能学会自我指导和提升

香港大学团队开发的SRUM框架首次实现了统一多模态AI系统的内部自我指导机制。通过让系统的理解模块充当"内部教师"指导生成模块改进,结合全局-局部双重奖励评价系统,在复杂图像生成任务上取得显著突破,为AI系统自主改进开辟了新路径。

清华大学突破AI训练的"内存墙",让AI大模型学习效率提升4倍不再是梦

清华大学突破AI训练的"内存墙",让AI大模型学习效率提升4倍不再是梦

清华大学团队提出BGPO算法,巧妙解决扩散大语言模型强化学习训练中的内存瓶颈问题。通过将复杂指数运算转化为线性运算,实现内存使用量恒定,支持更大规模重复计算。实验显示该方法在数学、编程、游戏等任务上显著提升性能,其中游戏规划准确率提升68%,为AI训练效率优化提供新思路。

Meta研究团队发布超大规模视觉推理数据配方:让AI像人类一样"看图解题"的秘密

Meta研究团队发布超大规模视觉推理数据配方:让AI像人类一样"看图解题"的秘密

Meta公司FAIR实验室与UCLA合作开发了名为HoneyBee的超大规模视觉推理数据集,包含250万训练样本。研究揭示了构建高质量AI视觉推理训练数据的系统方法,发现数据质量比数量更重要,最佳数据源比最差数据源性能提升11.4%。关键创新包括"图片说明书"技术和文字-图片混合训练法,分别提升3.3%和7.5%准确率。HoneyBee训练的AI在多项测试中显著超越同规模模型,同时降低73%推理成本。

北京交通大学团队突破:让AI学会自己管理记忆,小模型也能干大事

北京交通大学团队突破:让AI学会自己管理记忆,小模型也能干大事

这项由北京交通大学等机构联合完成的研究首次将记忆管理作为AI的内在学习能力,而非外部工具。MemAct框架让AI主动编辑工作记忆,配合新开发的DCPO训练算法解决了记忆编辑带来的技术挑战。实验证明,较小的MemAct模型能以更少资源超越大型传统模型,不同规模模型还会自然演化出适应性策略,为AI效率提升开辟了新路径。

阿里巴巴团队突破:让AI直接在像素世界"画图",告别中间商赚差价

阿里巴巴团队突破:让AI直接在像素世界"画图",告别中间商赚差价

这项由阿里巴巴AMAP团队联合英伟达和加州理工完成的研究,成功实现了AI直接在像素空间生成高质量图像,无需依赖VAE编码器这个"中间商"。通过创新的两阶段训练框架,EPG模型在ImageNet-256上达到2.04的FID分数,仅需75次函数评估,性能媲美主流VAE方法但效率更高。研究还首次成功训练出像素空间一致性模型,实现8.82 FID的单步生成效果,为AI图像生成技术开辟了新的发展道路。

当AI学会"避开套路":Adobe研究院如何让机器生成真正有创意的图片

当AI学会"避开套路":Adobe研究院如何让机器生成真正有创意的图片

Adobe研究院联合以色列理工学院和特拉维夫大学提出了VLM引导的自适应负向提示方法,通过在AI图像生成过程中实时识别并排除常见模式,成功解决了现有AI模型只能生成典型化内容的问题。该方法让AI在约束中探索真正的创意空间,生成的创意宠物中87%属于未知类别,同时保持了物体的功能有效性,为AI创意生成开辟了新路径。

Meta发布第三代SAM视觉AI模型,助力野生动物保护研究

Meta发布第三代SAM视觉AI模型,助力野生动物保护研究

Meta发布第三代SAM(分割一切模型)系列AI模型,专注于视觉智能而非语言处理。该模型擅长物体检测,能够精确识别图像和视频中的特定对象。SAM 3在海量图像视频数据集上训练,可通过点击或文本描述准确标识目标物体。Meta将其应用于Instagram编辑工具和Facebook市场功能改进。在野生动物保护方面,SAM 3与保护组织合作分析超万台摄像头捕获的动物视频,成功识别百余种物种,为生态研究提供重要技术支持。

OpenAI推出免费ChatGPT教师版,提供GPT-5.1无限使用至2027年

OpenAI推出免费ChatGPT教师版,提供GPT-5.1无限使用至2027年

OpenAI发布了ChatGPT教师版,专门面向K-12学校教职员工,免费使用至2027年6月。该版本包含GPT-5.1 Auto无限消息功能,支持文件上传、图像生成等特性,同时符合《家庭教育权利法》要求。教师可用其创建教学材料,分享聊天记录,并获得其他教师使用建议。此前OpenAI已推出面向学生的ChatGPT Edu和学习模式功能。

驯服数据混乱:为企业构建AI就绪的数据平台

驯服数据混乱:为企业构建AI就绪的数据平台

企业AI已达到关键转折点,但大多数项目在产生价值前就停滞了。数据科学家需要使用7-15个工具来处理数据,仍需数月才能获得可用状态。IDC研究显示,不到44%的AI试点项目能投入生产。问题不在于算力或模型架构,而是无法在碎片化异构环境中实现数据管道的运营化。Hammerspace AI数据平台通过统一数据命名空间和自动化数据编排,解决了企业数据孤岛问题,为AI工作负载提供高性能统一数据平面。

欧盟拟放松AI和隐私法律监管政策

欧盟拟放松AI和隐私法律监管政策

欧盟委员会提出全面修改科技监管政策的提案,旨在减少大型科技公司面临的监管障碍。修改内容包括:允许AI公司访问共享个人数据进行模型训练、简化小企业审批流程、将AI监管集中至AI办公室、推迟高风险AI应用的严格规定实施。此外,备受诟病的Cookie横幅将被重新设计,减少弹出频率并支持一键同意。该提案现已提交欧洲议会审批,可能面临质疑声音。

亚马逊与伊利诺伊大学联手研究:让AI助手学会遵守复杂规则的新方法

亚马逊与伊利诺伊大学联手研究:让AI助手学会遵守复杂规则的新方法

这项由伊利诺伊大学厄巴纳-香槟分校与亚马逊联合开展的研究,提出了一种名为"多模态策略内化"的创新技术,让AI助手能够将复杂的工作规则"牢记在心"而无需每次查阅。通过三阶段训练方法,AI助手的准确率提高了70.7%,处理效率提升了85.7%,同时保持了良好的通用智能水平。该技术为构建更智能、更高效的AI工作伙伴奠定了重要基础。

加州大学圣地亚哥分校团队发布Falconer框架:让大语言模型与轻量代理联手,以90%成本削减实现规模化知识挖掘

加州大学圣地亚哥分校团队发布Falconer框架:让大语言模型与轻量代理联手,以90%成本削减实现规模化知识挖掘

加州大学圣地亚哥分校团队提出的Falconer框架创新性地解决了大语言模型在知识挖掘中成本高昂的问题。该框架让大语言模型担任规划师和标注师,训练轻量级代理模型执行具体任务,将复杂的知识挖掘统一为获取标签和获取文本段两个原子操作。实验表明,Falconer在保持与先进大语言模型相当性能的同时,推理成本降低90%,处理速度提升20倍以上,为大规模知识挖掘提供了高效实用的解决方案。

OPPO AI实验室推出AndesVL:让大模型在手机上也能看懂图片聊天

OPPO AI实验室推出AndesVL:让大模型在手机上也能看懂图片聊天

OPPO AI中心的AndesVL研究团队开发了一系列能在手机上流畅运行的多模态AI模型,参数规模从0.6B到4B,分为专注日常对话的指令版和擅长深度推理的思考版。通过创新的1+N LoRA架构、量化感知训练和多项移动端优化技术,在联发科天玑9500芯片上实现了6.7倍解码加速和30.9%内存减少,在32个基准测试中展现出一流性能,为移动端AI应用提供了完整解决方案。

英特尔明年上线的18A制程平台,能否成为“AI原生”拐点?

英特尔明年上线的18A制程平台,能否成为“AI原生”拐点?

“Intel 18A正在将我们的产业带入一个全新的时代,‘埃米’时代。”

大语言模型改写社媒与广告:AI时代的创作革命

大语言模型改写社媒与广告:AI时代的创作革命

人工智能为已经过度充斥内容的社交媒体世界增添更多燃料。AI的大规模生产能力让内容泛滥问题更加严重,同时算法操控也变得更加可疑。在广告领域,AI工具可能彻底改变传统广告模式,通过智能代理的受托责任替代常见广告形式。未来AI甚至可能使用人类的AI化身代笔写书,模仿其声音、历史和个性。这引发了关于人类作者身份和写作本质的深刻思考。

英特尔明年上线的18A制程平台,能否成为“AI原生”拐点?

英特尔明年上线的18A制程平台,能否成为“AI原生”拐点?

“Intel 18A正在将我们的产业带入一个全新的时代,‘埃米’时代。”

SAP客户偏离升级路径:英国零售巨头的选择引发行业思考

SAP客户偏离升级路径:英国零售巨头的选择引发行业思考

欧洲零售巨头金士佛决定放弃SAP推荐的S/4HANA升级路径,转而将ECC系统迁移至谷歌云并采用第三方支持。面对2027年SAP停止ECC支持的截止期限,全球仅39%的ECC客户已购买S/4HANA许可证。金士佛通过谷歌云和第三方服务实现了AI创新,质疑了SAP"创新胡萝卜"策略的必要性。但这一决定可能导致失去未来与SAP谈判的商业优势。

Taho挑战Kubernetes推出AI专用高性能计算框架

Taho挑战Kubernetes推出AI专用高性能计算框架

分布式计算初创公司Taho完成350万美元种子轮融资,目标是替代Kubernetes成为人工智能工作负载的主要编排和调度层。该公司由来自Meta、谷歌和Snap的基础设施资深人员创建,声称其计算框架可将工作负载处理时间提升最多100%,同时大幅降低成本。Taho开发了高性能联邦计算框架,通过替换复杂的基础设施软件来提高AI硬件效率。