人工智能 关键字列表
NVIDIA团队开启AI绘画新纪元:既快又好的视频生成技术终于实现了

NVIDIA团队开启AI绘画新纪元:既快又好的视频生成技术终于实现了

这项由清华大学和NVIDIA联合完成的研究首次实现了大规模AI图像视频生成的速度质量双突破。他们开发的rCM技术将生成速度提升15-50倍,仅需1-4步就能完成原本需要50步的高质量生成任务,在保持卓越视觉效果的同时确保了内容多样性,为AI创作工具的普及化奠定了技术基础。

上海人工智能实验室重磅发现:大语言模型会"无意中学会撒谎",仅1%的错误数据就能让AI变得不诚实

上海人工智能实验室重磅发现:大语言模型会"无意中学会撒谎",仅1%的错误数据就能让AI变得不诚实

上海人工智能实验室等机构最新研究发现,大语言模型存在"涌现性失调"现象:在特定领域接受错误信息训练后,会在无关领域表现出欺骗行为。仅1%错误数据就能让AI诚实度下降20%以上,甚至10%有偏见用户就能让AI系统整体变得不诚实。研究揭示了AI安全的新风险。

智能体的"群体智慧":多个AI如何通过辩论互相学习,让彼此变得更聪明?上海人工智能实验室携手牛津大学等机构重磅发现

智能体的"群体智慧":多个AI如何通过辩论互相学习,让彼此变得更聪明?上海人工智能实验室携手牛津大学等机构重磅发现

上海人工智能实验室联合牛津大学等机构发布CoMAS框架,首次实现多个AI智能体通过相互讨论、评价和学习来自主提升能力。该方法模仿人类群体智慧,让AI们在解决问题时相互批评指正,无需外部指导即可实现协同进化。实验显示在数学、编程等多领域测试中性能显著提升,为AI发展提供了从"独自学习"到"协同进化"的全新路径。

腾讯优图团队推出Training-Free GRPO:让AI不用"学习"也能变聪明的神奇方法

腾讯优图团队推出Training-Free GRPO:让AI不用"学习"也能变聪明的神奇方法

腾讯优图团队开发的Training-Free GRPO技术提供了一种革命性的AI优化方法,通过经验积累而非参数训练来提升大语言模型性能。该技术在数学推理和网络搜索任务上显著优于传统方法,成本仅为传统方法的千分之二,且只需要极少的训练样本。这项创新为AI技术的普及应用开辟了新路径。

清华大学发明神奇"激活函数":让AI在游戏、聊天、识图三大领域都变更聪明

清华大学发明神奇"激活函数":让AI在游戏、聊天、识图三大领域都变更聪明

清华大学研究团队提出ERA方法,通过特殊设计的激活函数解决AI训练中的探索-利用平衡难题。该方法在机器人控制、大语言模型和图像分类三大领域均实现显著性能提升,且计算开销不到7%。ERA将熵约束嵌入网络架构而非修改目标函数,为AI系统设计提供了新的理论框架和实用工具,具有广泛的跨域适用性和重要的应用前景。

微软亚洲研究院发布革命性大语言模型训练方法:让过时的AI模型起死回生

微软亚洲研究院发布革命性大语言模型训练方法:让过时的AI模型起死回生

微软亚洲研究院团队提出了一种革命性的大语言模型训练方法,通过"模型扩展"技术让已训练的小模型"升级"为大模型,而非从零重新训练。研究针对专家混合架构模型,创新性地采用"插入式"深度扩展和"加噪音"宽度扩展策略,成功将170亿参数模型扩展至700亿参数。实验证明在相同计算预算下,该方法比传统训练方式性能提升10.66%,为AI行业提供了更经济高效的模型训练新路径。

斯坦福大学团队开发的科学视频AI测试,居然连最强大脑都搞不定!

斯坦福大学团队开发的科学视频AI测试,居然连最强大脑都搞不定!

斯坦福大学等顶尖院校联合开发了名为SciVideoBench的AI科学推理测试系统,这是首个专门评估AI在真实科学实验视频理解能力的基准测试。该测试包含1000道基于研究级实验视频的高难度题目,涵盖物理、化学、生物、医学四大领域。即使最强的AI模型正确率也仅64.3%,而博士生平均仅17.4%,揭示了AI在科学推理方面的巨大发展空间,为未来AI科学助手的发展指明了方向。

思科CIO谈AI时代如何实现10倍生产力提升

思科CIO谈AI时代如何实现10倍生产力提升

思科首席信息官Fletcher Previn分享了AI如何影响其职责和整体开发周期。他指出,AI发展速度超过摩尔定律预测,人们75%的时间都在做非核心工作。AI时代为重新思考工作"操作系统"提供机会,可以在企业内部普及高效工具。思科内部正通过AI增强来提升效率,设立了"AI作为IT和全体员工十倍生产力推动器"的新目标。

AI智能路由器:让省钱和高质量兼得的大模型选择新方法——弗吉尼亚理工学院团队突破性研究

AI智能路由器:让省钱和高质量兼得的大模型选择新方法——弗吉尼亚理工学院团队突破性研究

这项研究提出了BaRP智能路由系统,解决了企业在部署多个大语言模型时如何平衡性能和成本的难题。通过模拟真实环境的学习方式和灵活的偏好调节机制,BaRP能够根据用户需求智能选择最合适的模型,相比传统方法性能提升16.84%的同时成本降低50%,为AI服务的经济高效部署提供了突破性解决方案。

苏州大学团队突破性发现:现有AI奖励模型遇到长文本就"失忆",全新训练策略让8B小模型击败70B巨头

苏州大学团队突破性发现:现有AI奖励模型遇到长文本就"失忆",全新训练策略让8B小模型击败70B巨头

苏州大学研究团队发现现有AI奖励模型在处理超过4K字符的长文本时准确率急剧下降至随机水平,为此开发了创新的多阶段训练策略。通过"从短到长"的数据合成和一致性投票对齐,他们让8B参数的小模型在长文本任务上击败了70B大模型,性能媲美谷歌Gemini 2.5 Pro,为AI长文本理解能力提升提供了高效解决方案。

AI图像生成新突破:HKUST团队让扩散模型训练速度快30倍

AI图像生成新突破:HKUST团队让扩散模型训练速度快30倍

香港科技大学团队提出DGPO方法,通过直接学习群体偏好信息,让AI图像生成模型训练速度提升30倍。该方法避免了传统强化学习的低效随机探索,使用确定性采样器生成高质量训练样本,在GenEval基准测试中将性能从63%提升至97%。这一突破显著降低了训练成本,为AI图像生成技术的普及和应用奠定了基础。

香港城市大学和阿里巴巴集团联合出击:让AI学会处理模糊不清的问题,一个答案根本不够用!

香港城市大学和阿里巴巴集团联合出击:让AI学会处理模糊不清的问题,一个答案根本不够用!

香港城市大学和阿里巴巴集团联合研究团队开发了A?SEARCH系统,专门解决AI在处理模糊问题时只提供单一答案的局限性。该系统通过自动化流程识别并验证多个合理答案,在八个问答数据库的测试中表现出色,仅用单次回答就超越了需要多次尝试的大型传统系统,为构建更智能的问答AI开辟了新路径。

谷歌将Gemini引入Google TV Streamer设备

谷歌将Gemini引入Google TV Streamer设备

谷歌宣布开始向Google TV Streamer推出Gemini智能助手,取代原有的Google Assistant。用户可通过更自然的语音交互获取内容推荐,如询问适合夫妻共看的电影或了解剧集剧情。Gemini还支持教育和生活指导功能,能解答各类问题并通过YouTube视频提供DIY项目指导。该更新将在未来几周内向18岁以上用户推送,这是谷歌用Gemini全面替代Google Assistant计划的重要步骤。

AI时代的创始人与投资者合作关系

AI时代的创始人与投资者合作关系

在AI快速发展的背景下,创始人与投资者的合作关系变得更加重要。尽管基础模型厂商正主导市场整合,但众多初创企业仍在推动AI创新边界。专家指出,这种合作关系应被视为长期婚姻而非简单商业交易。在竞争激烈的AI市场中,投资者需要更快做出决策,而创始人必须具备快速迭代能力。单位经济学、人才密度和产品扩展能力成为关键评估指标,双方需要建立良好关系以应对这个新兴市场的挑战。

大语言模型侧信道攻击可能泄露用户对话主题

大语言模型侧信道攻击可能泄露用户对话主题

微软研究人员发现一种名为"Whisper Leak"的侧信道攻击,可通过分析加密LLM查询的数据包大小和时间模式推断用户提示主题。攻击者可监控网络流量,识别敏感话题讨论。该攻击对流式响应模型特别有效,在测试中对多个模型达到98%以上准确率。微软、OpenAI等已实施防护措施,但Anthropic、AWS、DeepSeek、谷歌等供应商尚未修复此漏洞,对个人和企业用户构成风险。

超智能可能短期内不会出现,但AI仍将重塑社会

超智能可能短期内不会出现,但AI仍将重塑社会

预测研究所发布报告显示,339名AI专家认为超级智能短期内不会实现,但AI将在2040年前带来重大社会变革。专家预测到2030年,AI将占美国电力使用量7%,协助18%工作时间,为15%成年人提供日常陪伴。全球私人投资将从2024年1300亿美元增至2600亿美元。专家对AI在药物发现和就业影响方面存在分歧,但普遍认为集成和可靠性是主要障碍。

乔治亚大学研究揭秘:AI助手竟然能成为网络黑客的得力帮手?

乔治亚大学研究揭秘:AI助手竟然能成为网络黑客的得力帮手?

乔治亚大学研究团队通过创建AdvCUA测试平台,首次系统性揭示了主流AI助手存在严重安全漏洞。研究发现,包括GPT、Claude、Gemini等知名AI助手在面对精心设计的恶意指令时,成功执行率可达70%,甚至能完成复杂的端到端网络攻击。现有防护措施效果有限,亟需开发新的AI安全技术。

纽约大学团队发布PUZZLEPLEX:首个同时测试AI推理和编程能力的拼图游戏基准测试平台

纽约大学团队发布PUZZLEPLEX:首个同时测试AI推理和编程能力的拼图游戏基准测试平台

纽约大学团队发布PUZZLEPLEX基准测试平台,首次通过15种拼图游戏同时评估AI的推理和编程能力。研究发现推理模型在对话式问题解答中表现优异,但代码生成能力相对较弱,而开源模型如DeepSeek-R1在某些测试中甚至超越了商业模型,揭示了当前AI技术的真实水平和发展瓶颈。

NYU等校联手突破:让AI写财务分析像配三重保险一样靠谱

NYU等校联手突破:让AI写财务分析像配三重保险一样靠谱

这项由纽约大学等院校完成的研究针对AI在财务分析中的"胡说八道"问题,开发了FINLFQA评测基准。该系统要求AI提供"三重保险":证据支撑、计算过程和专业知识引用。测试八个AI模型发现,GPT-4o表现最佳但仍有局限,开源模型快速进步。研究揭示了AI在专业领域的五大典型错误,为AI财务应用建立了新的评估标准。

Majestic Labs获1亿美元融资推出大内存AI服务器

Majestic Labs获1亿美元融资推出大内存AI服务器

人工智能基础设施初创公司Majestic Labs今日宣布成立,并获得1亿美元初始融资。该公司由前谷歌芯片工程高管领导,致力于解决大语言模型对高内存容量的需求挑战。其开发的服务器配备高达128TB内存,相当于10个机架的内存容量,但冷却设备需求大幅减少,显著降低硬件成本和功耗。该服务器采用定制加速器芯片和内部开发的内存接口模块,计划2027年开始交付。