人工智能 关键字列表
北京航空航天大学团队打造AI助手:用聊天方式理解和创建3D模型

北京航空航天大学团队打造AI助手:用聊天方式理解和创建3D模型

北京航空航天大学团队开发的MeshLLM系统实现了大语言模型与3D建模的创新融合,用户可通过自然对话创建和理解3D模型。该系统采用原始网格分解策略,将训练数据扩展至150万样本,比传统方法增加近50倍。通过渐进式训练和多任务学习,MeshLLM在生成质量和理解能力上显著超越现有方法,为3D内容创作和人机交互开辟了新途径。

Meta首次破解AI推理模型的"幻觉"难题:让机器既会思考又能说真话

Meta首次破解AI推理模型的"幻觉"难题:让机器既会思考又能说真话

Meta FAIR实验室研究团队发现推理型AI模型虽然逻辑能力强,但在事实表达上容易产生幻觉。他们创新性地设计了包含准确性、详细性、相关性三维评价的训练体系,通过在线强化学习让AI模型既会深度思考又能准确表达事实。实验显示新方法将事实准确率提升23个百分点,同时增加23%的信息详细度,为构建更可信赖的AI系统提供了切实可行的解决方案。

东华师范大学团队突破:34M轻量级模型挑战632M巨型AI,在图像分割任务中实现逆袭

东华师范大学团队突破:34M轻量级模型挑战632M巨型AI,在图像分割任务中实现逆袭

东华师范大学团队提出MLLMSeg框架,仅用34M参数的轻量级模型在图像分割任务中超越了632M参数的传统SAM模型。该方法通过创新的DSFF特征融合模块,充分挖掘多模态大语言模型视觉编码器的潜力,将细节特征与语义特征完美结合,在RefCOCO等标准数据集上取得领先性能,为移动设备部署和实际应用提供了高效解决方案。

InfiX.ai发布InfiAlign:用12%训练数据追平顶级AI模型,让机器"小体量大智慧"的数据精选秘籍

InfiX.ai发布InfiAlign:用12%训练数据追平顶级AI模型,让机器"小体量大智慧"的数据精选秘籍

InfiX.ai和香港理工大学联合发布的InfiAlign框架,通过多维数据筛选和两阶段课程学习,仅用12%训练数据就达到顶级模型性能。该框架发现回答长度与问题难度正相关,创新性地用长度作为难度指标,结合多样性采样和质量过滤,实现了数据效率的巨大提升。在数学推理等任务中表现优异,为资源有限的机构提供了经济高效的AI模型训练方案。

南加州大学和Salesforce联手推出CoAct-1:让电脑助手不再只会点击鼠标,还能写代码干活

南加州大学和Salesforce联手推出CoAct-1:让电脑助手不再只会点击鼠标,还能写代码干活

南加州大学和Salesforce联合推出CoAct-1多智能体系统,通过结合传统界面操作与代码执行能力,实现了计算机任务自动化的重大突破。该系统在OSWorld基准测试中达到60.76%的成功率,平均完成任务步数减少至10.15步,显著优于现有方法,为人机交互带来新范式。

华东理工大学团队突破AI智能体识别难题:多轮对话让机器像人一样"边看边想"

华东理工大学团队突破AI智能体识别难题:多轮对话让机器像人一样"边看边想"

华东理工大学团队提出I2CR框架,通过"文字优先、视觉辅助"的多轮反思机制解决多模态实体链接难题。该框架模仿人类认知过程,先用文字信息判断,再通过内部一致性检查和跨模态验证,必要时引入OCR、图像描述等视觉线索进行迭代优化。在三大数据集上准确率分别提升3.2%、5.1%、1.6%,达到业界最佳性能。

SiMa.ai发布新一代物理AI系统级芯片正式投产

SiMa.ai发布新一代物理AI系统级芯片正式投产

人工智能芯片初创公司SiMa Technologies宣布其第二代系统级芯片平台MLSoC Modalix正式出货,专为多模态物理AI工作负载设计。该芯片可嵌入机器人、工业设备和车辆等设备中,支持运行大语言模型、卷积神经网络等多种AI算法。芯片采用低功耗设计,能在边缘设备上直接处理传感器数据并运行AI模型,无需依赖云端处理,有效降低延迟。

Ai2发布开源AI模型,让机器人在3D空间"规划"动作

Ai2发布开源AI模型,让机器人在3D空间"规划"动作

西雅图AI研究机构Ai2发布MolmoAct 7B,这是首个动作推理模型,能让机器人在执行任务前进行"思考"和规划。该模型可将自然语言指令转化为3D空间中的运动轨迹,通过1800万样本在256个H100芯片上训练完成。在SimPLER基准测试中达到72.1%的任务成功率,超越了谷歌、微软等公司的同类模型。

曾经的小型研究实验室如何助力英伟达成为万亿美元公司

曾经的小型研究实验室如何助力英伟达成为万亿美元公司

2009年,比尔·戴利加入英伟达研究实验室时,该实验室仅有约12名员工,专注于计算机图形学中的光线追踪技术。如今这个实验室已发展至400多人,帮助英伟达从90年代的游戏GPU初创公司转型为价值4万亿美元的AI巨头。目前实验室重点开发机器人和AI技术,部分研究成果已应用于产品中。英伟达在周一发布了面向机器人开发者的新AI模型、库和基础设施,展现了从物理AI到机器人领域的技术进展。

VS Code发布聊天检查点功能预防AI对话失误

VS Code发布聊天检查点功能预防AI对话失误

微软VS Code 1.103版本推出GitHub Copilot聊天检查点功能,允许开发者在AI聊天互动出现问题时恢复到之前的状态。新版本还包括MCP服务器工具选择器改进、GPT-5支持、AI使用统计、Git工作树支持等功能。尽管VS Code持续强化AI功能,但根据最新StackOverflow调查显示,仍有76.2%的专业开发者使用VS Code,较去年上升2.2%,远超其他编辑器。

AI道德部署实战指南:CIO如何平衡创新与责任

AI道德部署实战指南:CIO如何平衡创新与责任

企业面临着通过AI创造价值的巨大压力,但CIO等IT领导者必须考虑技术的伦理使用和风险管理。忽视这一环节将面临信任和公平性问题,甚至严重损失。随着AI法规不断出台,企业面临罚款和诉讼风险。缓解风险需要定义AI伦理框架,确保统一应用。AI伦理应基于公平、透明、问责和隐私四大原则。企业可借鉴现有框架构建治理体系,需要持续审计和更新。成功实施需要C级高管支持和全员参与。

英伟达将Blackwell GPU引入企业数据中心

英伟达将Blackwell GPU引入企业数据中心

英伟达宣布将RTX Pro 6000 Blackwell服务器版GPU引入标准企业服务器,使更多企业能够使用Blackwell技术处理AI和传统工作负载。思科、戴尔、惠普企业、联想等厂商将在其2U企业服务器系统中提供该GPU。新系统采用x86架构、风冷设计,相比仅使用CPU的系统,性能提升45倍,能效提高18倍,可将数百台CPU系统整合为少量RTX Pro服务器。

首尔AI数据公司Datumo获1550万美元融资,挑战Scale AI

首尔AI数据公司Datumo获1550万美元融资,挑战Scale AI

据麦肯锡报告,多数企业认为自己尚未完全准备好安全负责地使用生成式AI。首尔AI数据标注公司Datumo现专注帮助企业构建更安全的AI系统,提供无需技术专长的测试、监控和改进工具。该公司周一宣布完成1550万美元融资,投资方包括Salesforce Ventures等,累计融资约2800万美元。公司已服务三星、LG、现代等300多家客户。

英伟达为最小工作站GPU配备Blackwell架构

英伟达为最小工作站GPU配备Blackwell架构

Nvidia在温哥华Siggraph大会上发布了两款小型Blackwell GPU:RTX Pro 4000 SFF和RTX Pro 2000,功耗仅70瓦。RTX 4000 SFF配备8960个CUDA核心,光线追踪性能提升1.7倍,AI性能提升2.5倍,搭载24GB GDDR7显存。RTX Pro 2000拥有4352个CUDA核心,3D建模性能提升1.6倍。两款产品将由戴尔、惠普、联想等厂商集成到OEM系统中。

阿里巴巴推出DeepPHY:首个专门测试AI视觉模型物理推理能力的综合评估平台

阿里巴巴推出DeepPHY:首个专门测试AI视觉模型物理推理能力的综合评估平台

阿里巴巴团队推出DeepPHY,这是首个专门评估AI视觉语言模型物理推理能力的综合平台。通过六个不同难度的物理环境测试,研究发现即使最先进的AI模型在物理推理任务中表现也远低于人类,成功率普遍不足30%。更关键的是,AI模型虽能准确描述物理现象,却无法将描述性知识转化为有效控制行为,暴露了当前AI技术在动态物理环境中的根本缺陷。

亚利桑那州立大学突破性研究:AI能否真正理解幸福?

亚利桑那州立大学突破性研究:AI能否真正理解幸福?

这项由亚利桑那州立大学研究团队完成的开创性研究,首次系统评估了大型语言模型解释幸福概念的能力。研究构建了包含43880个解释的大规模数据集,采用创新的"AI评判员"框架进行评估。结果显示:大型模型显著优于小型模型,专家解释比普通解释更具挑战性,身体健康概念最易解释而社会健康概念最难。通过微调训练,小型模型的表现可大幅提升,甚至在特定任务上超越更大规模的模型,为AI在健康咨询领域的应用提供了重要参考。

大型多模态AI能否主动识别错误信息?吉林大学团队首创评估框架揭示惊人真相

大型多模态AI能否主动识别错误信息?吉林大学团队首创评估框架揭示惊人真相

吉林大学研究团队开发ISEval框架,系统评估10个先进多模态AI模型的输入审查能力。研究发现即使是GPT-4o等顶级模型,主动错误检测率也仅4.71%,普遍存在被动接受错误信息的问题。AI在逻辑错误识别方面相对较强,但对语法错误和条件冲突识别能力极弱。面对图文冲突,大型模型展现动态调整能力,小模型则固守文字偏好。

当AI成为隐私保护神:德州大学团队让大语言模型变身个人信息清理专家

当AI成为隐私保护神:德州大学团队让大语言模型变身个人信息清理专家

德州大学研究团队开发的PRvL系统成功将大语言模型应用于个人信息保护,实现了99.4%的识别准确率和极低的隐私泄露风险。该系统支持多种模型架构和训练策略,具备跨语言处理能力,完全开源可本地部署,为医疗、法律、金融等敏感领域提供了实用的隐私保护解决方案。

AI面试官原来也有偏见:华盛顿大学揭秘语言习惯如何影响求职成功率

AI面试官原来也有偏见:华盛顿大学揭秘语言习惯如何影响求职成功率

华盛顿大学研究团队发现AI面试系统存在语言偏见,会因求职者使用谦逊表达而给出更低评分,平均相差25.6%。这种偏见可能系统性歧视女性等群体,因为她们更倾向于使用谦逊语言。研究开发了三种去偏见方法,最有效的技术调整方案能减少65.8%的偏见,为构建更公平的AI招聘系统提供了解决方案。

Roblox公司让AI实时翻译说话变成可能:语音边听边翻译的突破性技术

Roblox公司让AI实时翻译说话变成可能:语音边听边翻译的突破性技术

Roblox公司开发出REINA技术,实现语音边听边翻译的突破。该技术基于信息论原理,通过智能判断何时获得足够信息来决定翻译时机,避免传统方法需要等待完整句子的延迟问题。在13万小时开源数据训练下,REINA在多语言实时翻译任务中相比现有方法提升21%,为跨语言实时交流带来新突破。