人工智能 关键字列表
浙江大学提出全新AI代理评测框架:让机器人自己出题考自己,开启智能评估新时代

浙江大学提出全新AI代理评测框架:让机器人自己出题考自己,开启智能评估新时代

浙江大学研究团队提出Graph2Eval框架,这是首个基于知识图谱的AI代理自动化评测系统。该框架通过知识图谱持续生成新测试任务,解决传统固定数据集评估的局限性。框架支持文档理解和网页交互两类任务,构建了包含1319个任务的测试集。实验验证显示该方法能有效区分不同AI系统能力,为AI代理评估开辟新路径。

斯坦福和SambaNova团队携手打造"AI语言模型的超级笔记本":让机器像人类一样积累经验和智慧

斯坦福和SambaNova团队携手打造"AI语言模型的超级笔记本":让机器像人类一样积累经验和智慧

斯坦福大学与SambaNova公司联合研发的ACE框架,通过模拟人类学习方式,让AI系统能够像维护笔记本一样积累经验。该技术采用三角色分工机制,在智能体和金融分析等任务中实现显著性能提升,同时大幅降低计算成本,为构建真正自适应的AI系统开辟了新路径。

哥本哈根大学重磅发现:AI大模型正在让我们的知识世界变得越来越单调

哥本哈根大学重磅发现:AI大模型正在让我们的知识世界变得越来越单调

哥本哈根大学领导的国际研究团队首次系统性揭示了大型语言模型的知识单调化问题。通过测试27个AI模型和155个话题,研究发现AI的知识多样性远低于基础的网络搜索,且较大模型反而表现更差。研究还发现检索增强生成技术能改善这一问题,但存在文化偏见,英语世界观点占主导地位。

香港科技大学团队突破:让AI在思考时也能"反省",推理准确率大幅提升

香港科技大学团队突破:让AI在思考时也能"反省",推理准确率大幅提升

香港科技大学团队开发的SRGen技术让AI学会在推理过程中的关键时刻进行自我反思和纠错。该方法通过监测AI的不确定性,在关键决策点暂停并优化选择,避免早期错误的累积放大。在多项数学推理测试中,SRGen将AI准确率提升了6-16个百分点,计算开销仅增加50%,为构建更可靠的AI推理系统提供了新思路。

NVIDIA联手多所顶尖大学发现:AI需要"从小"就学推理,后期恶补根本没用

NVIDIA联手多所顶尖大学发现:AI需要"从小"就学推理,后期恶补根本没用

NVIDIA联合多所顶尖大学首次系统研究了大语言模型学习推理能力的最佳时机,发现从预训练阶段就加入推理数据的AI模型,最终在专家级推理任务上比后期才学推理的模型表现好19%。研究揭示了一个重要原则:预训练阶段需要多样化数据建立基础,微调阶段则需要高质量数据精细调整,单纯后期恶补推理训练无法达到最佳效果。

亚马逊股价大涨,AWS云业务增长加速

亚马逊股价大涨,AWS云业务增长加速

亚马逊股价在盘后交易中暴涨超12%,业绩轻松超越分析师预期。公司每股收益1.95美元,大幅超出1.57美元预期;营收1801.7亿美元,同比增长13%。AWS云业务表现亮眼,季度营收330亿美元,同比增长20%,创近年来最强增长。CEO贾西表示AWS增长速度达到2022年以来最快水平,主要得益于AI资源需求激增。公司将2025年资本支出预期从1180亿美元上调至1250亿美元,用于AI数据中心建设。

Microsoft 365 商业客户无处躲避 Copilot 功能扩张

Microsoft 365 商业客户无处躲避 Copilot 功能扩张

微软正将Copilot AI功能集成到Microsoft 365伴侣应用中,包括人员、文件和日历三个任务栏工具。这些轻量级应用仅面向企业和商业客户,将于10月底开始自动安装。Copilot将基于组织数据提供上下文感知的提示和摘要功能。人员应用可显示近期沟通记录,文件应用支持文档摘要和数据分析,日历应用将提供会议摘要。目前人员和文件功能已上线,日历功能即将推出。

Google Chrome推出AI操作按钮对抗AI浏览器

Google Chrome推出AI操作按钮对抗AI浏览器

谷歌Chrome在新标签页添加了两个AI功能按钮,直接访问Nano Banana图像生成和Deep Search深度搜索功能。这些AI操作芯片位于搜索框下方,让用户无需输入ChatGPT即可使用谷歌AI工具。Nano Banana按钮可通过文本提示或上传图片生成图像,Deep Search按钮提供网页搜索和深度报告功能。目前该功能仍在Chrome Canary版本中测试,尚未完全稳定,但预计将快速改进以应对AI浏览器竞争。

美国能源部联手Nvidia、AMD与Oracle打造四台强大AI超级计算机

美国能源部联手Nvidia、AMD与Oracle打造四台强大AI超级计算机

美国能源部宣布与AMD、英伟达和甲骨文建立战略合作关系,将在两个国家实验室建造四台强大的AI超级计算机。AMD与HPE合作为主权AI工厂超算项目提供技术支持,包括Lux和Discovery两台系统。英伟达与甲骨文合作打造能源部迄今最大的AI系统Solstice和Equinox,其中Solstice将配备10万个英伟达Blackwell GPU。这些项目旨在巩固美国在人工智能和高性能计算领域的领导地位。

面向未来的AI芯片技术发展之路

面向未来的AI芯片技术发展之路

随着人工智能快速重塑各行各业,AI专用硬件成为关键基础设施。英伟达在AI硬件革命中领先地位突出,市值超越苹果和微软。专家指出,AI芯片设计面临功耗、散热和成本挑战。低电压运行、定制电路设计和高效散热技术是解决方案。摩尔定律虽放缓,但通过封装创新、光学计算等新维度仍有发展空间。未来趋向定制化、低功耗芯片设计。

亚马逊云服务为Zoox自动驾驶出租车提供强大支撑

亚马逊云服务为Zoox自动驾驶出租车提供强大支撑

亚马逊收购的Zoox公司开始在拉斯维加斯等城市提供自动驾驶出租车服务。这些无人驾驶车辆依托AWS云基础设施进行机器学习模型训练和测试。每辆车可产生4TB/小时数据,通过专用传输终端上传至云端进行大规模仿真分析。AWS提供弹性Kubernetes服务、高速网络适配器等技术支持,使模型训练时间从数周缩短至数小时,推动自动驾驶技术持续改进。

三星HBM内存收入创新高,AI热潮推动业绩飞升

三星HBM内存收入创新高,AI热潮推动业绩飞升

三星第三季度营收达86.1万亿韩元,同比增长8.9%,营业利润122万亿韩元,同比增长32.6%。设备解决方案部门营收331万亿韩元,同比增长13%,主要受HBM3E销售增长和服务器SSD需求推动。相比之下,SK海力士虽然营收较三星低26%,但利润高出80%,主要得益于更多HBM芯片销售。三星正专注于缩小与SK海力士在HBM技术上的差距。

多家Linux厂商拥抱Ubuntu和Snap包格式

多家Linux厂商拥抱Ubuntu和Snap包格式

在Ubuntu峰会上,多家Linux相关厂商展示了对Ubuntu的支持,并提供官方Snap软件包。DreamWorks动画、Proton VPN等公司分享了与Canonical合作的经验,强调Snap包装格式简化了软件分发。Google、Nvidia、高通等厂商也与Canonical在AI工作负载、智能机器人、IoT平台等领域深度合作。尽管网络上对Ubuntu和Snap存在争议,但Ubuntu仍是Linux世界的事实标准,拥有庞大用户基础。

凯捷与西门子联手打造AI工业技术解决方案

凯捷与西门子联手打造AI工业技术解决方案

西门子和凯捷宣布合作开发基于人工智能的产品工程、制造和运营技术,旨在将工业设备与数字技术连接,实现"智能制造"。两家公司将结合西门子的工业软件、自动化和电气化产品与凯捷的工程专业知识,专注于16个高影响力领域,提升生产效率、上市时间、质量和可持续性,主要针对航空航天、汽车和生命科学等行业。

科世达、德华安顾人寿、宝洁和汇丰银行荣获2025红帽亚太创新奖

10月31日,全球领先的企业级开源解决方案提供商红帽宣布了2025红帽亚太创新奖中国区获奖企业名单。

Sony AI推出SoundReactor:让AI实时从画面生成身临其境的立体声音效

Sony AI推出SoundReactor:让AI实时从画面生成身临其境的立体声音效

Sony AI开发出SoundReactor框架,首次实现逐帧在线视频转音频生成,无需预知未来画面即可实时生成高质量立体声音效。该技术采用因果解码器和扩散头设计,在游戏视频测试中表现出色,延迟仅26.3毫秒,为实时内容创作、游戏世界生成和互动应用开辟新可能。

英伟达与诺基亚联手开创AI驱动6G通信平台

英伟达与诺基亚联手开创AI驱动6G通信平台

英伟达和诺基亚宣布战略合作,将英伟达AI驱动的无线接入网产品集成到诺基亚RAN产品组合中,助力运营商在英伟达平台上部署AI原生5G Advanced和6G网络。双方将推出AI-RAN系统,提升网络性能和效率,为生成式AI和智能体AI应用提供无缝体验。英伟达将投资10亿美元并推出6G就绪的ARC-Pro计算平台,试验预计2026年开始。

哥伦比亚大学突破性发现:AI系统为何会在"自我改进"中迷失方向

哥伦比亚大学突破性发现:AI系统为何会在"自我改进"中迷失方向

这项由哥伦比亚大学研究团队完成的突破性研究首次揭示了AI系统自我改进中的"效用-学习张力"问题:系统追求更好性能时会增加复杂度,但过高复杂度会破坏学习能力。研究建立了学习边界定理,提出双门控制机制,为AI安全自我改进提供了理论基础和实用方案,对确保AI技术长期安全发展具有重要意义。

不再重复历史:Reactive AI公司提出事件驱动聊天机器人,让对话成本从天价变为白菜价

不再重复历史:Reactive AI公司提出事件驱动聊天机器人,让对话成本从天价变为白菜价

这项由Reactive AI公司Adam Filipek主导的研究提出了反应式变换器(RxT),通过事件驱动架构和固定大小记忆系统,将传统聊天机器人的对话成本从平方级降为线性级,使长期对话成本降低99%以上,同时实现恒定响应速度。实验证明即使12M参数的RxT也显著优于22M传统模型,为高效对话AI开辟新路径。

斯坦福大学突破性研究:让AI看懂时间序列数据就像医生读心电图一样简单

斯坦福大学突破性研究:让AI看懂时间序列数据就像医生读心电图一样简单

这项研究首次实现了让AI同时理解文字和时间序列数据的技术突破,开发出OpenTSLM模型family,能够像医生一样综合分析病历文字和心电图等检查数据。实验显示即使10亿参数的小模型也能超越2000亿参数的GPT-4o,在睡眠分期任务中准确率达69.9%。五位心脏病专家评估认为AI推理92.9%正确,标志着多模态医疗AI的重要进展。