自然语言处理 关键字列表
微软Copilot推出智能体协作新功能

微软Copilot推出智能体协作新功能

微软发布Copilot Cowork功能,与Anthropic合作开发,能够独立访问用户文件、邮件和日历完成任务,无需人工监督。该工具可创建表格、生成报告并进行研究。微软还宣布AI代理平台Agent 365将于5月1日正式发布,用于管理企业内部AI代理。智能代理AI正成为工作场所热门趋势,虽然提高效率但也引发就业担忧。

OpenAI发布GPT-5.4大语言模型,增强计算机视觉和工具使用能力

OpenAI发布GPT-5.4大语言模型,增强计算机视觉和工具使用能力

OpenAI今日推出新一代大语言模型GPT-5.4,在自动化工作任务方面表现更优。新模型显著减少token使用量,降低推理成本,并支持自动工具搜索功能。GPT-5.4可处理多达100万token的请求,图像处理能力大幅提升,支持超过1000万像素图片无损上传。在计算机使用基准测试中创下75%的行业记录。

OpenAI发布GPT-5.4模型,朝自主智能体迈出重要一步

OpenAI发布GPT-5.4模型,朝自主智能体迈出重要一步

OpenAI推出最新GPT-5.4模型,该模型在推理、编程和专业办公方面实现重大突破,首次具备原生计算机操作能力,可代表用户操作计算机并跨应用程序完成任务。新模型向AI代理未来迈出重要一步,能够编写代码操作计算机,发出键盘鼠标指令,改进网页浏览能力,更准确调用工具和API。GPT-5.4在多源信息整合方面表现更佳,错误率比GPT-5.2降低33%。

零售商期待"人性化"AI购物助手但智能体会否失控?

零售商期待"人性化"AI购物助手但智能体会否失控?

主要零售商表示,智能AI助手很快将能够规划用餐、组织聚会并代理购物。但许多公司在基础聊天机器人上已面临困难,需要在让新型"代理式"机器人更具亲和力与防止失控之间取得平衡。沃尔沃斯的虚拟助手Olive因过度拟人化引发客户不满,Bunnings聊天机器人提供非法电工建议,加航虚拟助手错误承诺丧亲票价退款等事件频发。专家指出,代理式AI运行风险更高,包括隐私担忧。测试显示现有零售机器人效果有限,技术仍处初期阶段。

AI工具能够揭露匿名账户身份

AI工具能够揭露匿名账户身份

瑞士联邦理工学院等机构的研究显示,AI系统能够自动化分析文本模式、写作习惯和个人细节,从而识别匿名账户的真实身份。在测试中,该系统以90%的精确度正确识别了高达68%的匹配账户,远超传统方法。研究警告,记者、异议人士等依赖匿名身份的群体可能面临新风险,但专家指出隐私保护仍有效,用户应谨慎发布个人信息。

OpenAI发布GPT-5.4,增强知识工作处理能力

OpenAI发布GPT-5.4,增强知识工作处理能力

OpenAI推出GPT-5.4系列模型,包括GPT-5.4 Thinking和GPT-5.4 Pro版本。该更新专注于代理任务和知识工作,是首个明确针对计算机使用任务的模型,可基于桌面截图执行键鼠操作。新版本改进了推理过程展示、上下文维护能力,API上下文窗口扩展至100万tokens,视觉理解能力提升至1024万像素,事实错误率降低18%。

OpenAI升级ChatGPT消除"尴尬感"推出GPT-5.3 Instant

OpenAI升级ChatGPT消除"尴尬感"推出GPT-5.3 Instant

OpenAI宣布推出GPT-5.3 Instant更新,旨在让ChatGPT的交互体验不再那么僵硬和尴尬。新模型将减少过度谨慎的拒绝回答和不必要的免责声明,提供更准确的回复,幻觉问题减少了27%。OpenAI表示此次更新重点改善了用户日常体验中的语调、相关性和对话流畅度,直接回应了用户对早期版本过于"生硬"的反馈。

谷歌将Gemini整合进Android Studio Panda 2,通过提示词构建应用

谷歌将Gemini整合进Android Studio Panda 2,通过提示词构建应用

Google发布了Android Studio Panda 2,新增基于Gemini大语言模型的AI代理,可根据提示从零创建应用程序,并提供AI驱动的版本升级助手。该AI助手提供免费版本,专业开发者可订阅商业版。用户只需一个提示即可构建工作原型,AI会创建详细项目计划并自动实现。但测试显示生成的代码仍存在准确性问题,Google也提醒这仍是早期实验功能。

立即退出ChatGPT!你的订阅费正在资助威权主义

立即退出ChatGPT!你的订阅费正在资助威权主义

OpenAI今年预计亏损140亿美元,市场份额大幅下滑。该公司总裁向特朗普最大政治行动委员会捐款2500万美元,成为其最大捐助者。OpenAI还帮助ICE开发筛查工具,并与五角大楼签约提供军用AI技术。一场名为QuitGPT的抵制运动正在全球蔓延,已有超过100万人取消订阅。历史显示,针对性强且操作简单的抵制活动最为有效,而取消ChatGPT订阅仅需10秒钟,且有同样优质的替代产品。

AI时代英语教学的独特价值与人文关怀

AI时代英语教学的独特价值与人文关怀

在AI语言技术快速发展的背景下,英语教学面临新的挑战和机遇。虽然AI能够复制教师的语言技巧,但阅读和写作作为探索人类思想情感的活动具有独特性。课堂文学朗读和讨论能培养学生的个人反思能力,帮助他们理解文本的细微差别和模糊性。尽管AI能在秒内完成复杂的英语学习任务,但它无法以人类的同理心和理解力探索学生对文本的新兴反应。

Anthropic升级Claude记忆功能吸引AI用户转换平台

Anthropic升级Claude记忆功能吸引AI用户转换平台

Anthropic为其Claude AI聊天机器人推出重要升级,将记忆功能扩展至免费用户,并新增数据导入工具。用户现可轻松从ChatGPT、Gemini等竞争对手平台迁移个人数据至Claude,无需重新训练AI了解用户背景和历史对话。新工具通过预设提示词帮助用户复制其他AI平台的数据。随着Claude Code等工具推动popularity上升,以及新发布的Opus 4.6和Sonnet 4.6模型在编程和复杂任务处理方面的改进,此次升级进一步增强了Claude的竞争优势。

Claude Code推出语音模式功能助力无手动编程

Claude Code推出语音模式功能助力无手动编程

Anthropic为其AI编程助手Claude Code推出语音模式功能,标志着向更便捷的对话式编程工作流程迈出重要一步。该功能目前已向约5%的用户开放,未来几周将扩大推广范围。用户可通过输入"/voice"命令启用语音模式,然后通过语音指令与Claude Code交互,如"重构身份验证中间件"等。目前功能的具体限制尚不明确。

谷歌发布高速Gemini 3.1 Flash-Lite模型预览版

谷歌发布高速Gemini 3.1 Flash-Lite模型预览版

谷歌推出新款多模态AI模型Gemini 3.1 Flash-Lite,专注成本效益优化。该模型定价仅为每百万输入token 0.25美元,比旗舰版Gemini 3.1 Pro便宜8倍。性能测试显示其响应速度比Gemini 2.5 Flash快45%,首次输出等待时间缩短2.5倍。模型可处理100万token的多模态提示,在11项基准测试中有6项超越GPT-5 mini和Claude 4.5 Haiku,适用于电商翻译、内容审核等高频场景。

大语言模型能大规模识别匿名用户身份,准确度令人震惊

大语言模型能大规模识别匿名用户身份,准确度令人震惊

研究显示,AI技术能够通过分析社交媒体上的匿名账户内容,以惊人准确率识别用户真实身份。实验中,成功去匿名化率高达68%,识别准确率达90%。与传统需要人工整理数据的方法不同,大语言模型能直接分析自由文本内容,通过网络搜索和推理匹配潜在个体。这一技术突破对网络隐私保护构成重大威胁,可能被用于网络跟踪、精准营销和社会工程学攻击。

如何利用AI提升日常谜题解决技能

如何利用AI提升日常谜题解决技能

日常填字游戏、Wordle等谜题让许多人望而却步。AI工具可以帮助分析大量谜题数据,识别常见模式和线索结构。通过让AI分析历史谜题答案,可以获得词汇使用、线索风格和结构模式的深度见解。还可以利用AI生成基于谜题线索的音频文件进行被动学习,或创建简化版谜题来逐步提升解题信心。

卡特彼勒将边缘AI技术引入工地:钢铁传感器与芯片的融合

卡特彼勒将边缘AI技术引入工地:钢铁传感器与芯片的融合

在本届CES展会上,卡特彼勒展示了重达六吨的Cat 306 CR迷你挖掘机,搭载边缘AI技术实现自然语言交互。操作员可通过语音直接与设备对话,AI系统能实时解释请求并做出响应。这项技术旨在帮助操作员更安全、高效地工作,体现了传统重工业设备与人工智能技术的深度融合。

多Token预测技术将大语言模型推理速度提升三倍

多Token预测技术将大语言模型推理速度提升三倍

马里兰大学等机构研究人员开发出新的多令牌预测技术,通过微调预训练模型将加速能力嵌入权重中,无需推测解码或辅助草案模型即可实现推理速度三倍提升。该技术使用特殊掩码令牌和在线自蒸馏目标,将标准下一令牌模型转换为并行解码器。在基准测试中,8B参数模型在准确率仅下降3%的情况下实现超过3倍加速。该方法保留原始检查点的实现方式,部署时无需额外验证器或专用推理代码。

员工训练AI取代自己工作的真实经历

员工训练AI取代自己工作的真实经历

国际货币基金组织分析显示AI将影响全球约40%的工作岗位。多位参与AI模型训练的员工分享经历:学术编辑发现AI编辑错误频出,工作量增加但薪酬降低;翻译员训练AI四年后仍需逐词检查;营销写手被要求建立AI工作流程后遭解雇;数学教授认为十年内工作形态将彻底改变。员工普遍感到被技术贬低,警告工作质量下滑趋势。

微软CEO:没人想要AI生成粗糙内容

微软CEO:没人想要AI生成粗糙内容

微软CEO纳德拉在伦敦AI巡回活动中表示"没人希望AI创作内容粗制滥造"。尽管大会重点展示了Copilot等AI工具在数据整理、测试计划创建等方面的能力,但每个演示都附有警告提醒AI输出需要人工验证,不能完全信任。会议强调了AI代理的无限潜力,但也突出了AI输出不可靠这一关键问题。微软避免提及西米德兰兹警察局使用Copilot时出现幻觉的事件。

AI智能体仍需人类指导才能有效执行任务

AI智能体仍需人类指导才能有效执行任务

最新研究显示,AI智能体需要特定的程序性技能知识才能良好执行任务,但无法自主学习这些技能。研究团队开发了SkillsBench基准测试,评估了AI智能体在医疗、制造、网络安全和软件工程等11个领域84项任务中的表现。测试分为三种条件:无技能指导、人工策划技能指导和自生成技能。结果显示,获得人工技能指导的智能体平均得分比无指导的高16.2个百分点,表明AI仍离不开人类干预。在医疗领域效果最显著,但在软件工程领域改善有限。