在旧金山举办的HumanX AI大会上,智能体AI成为核心议题。与会者普遍反映,Anthropic旗下的Claude是目前最受欢迎的AI工具,频繁出现在各类讨论中,而ChatGPT的提及率则明显下降。尽管OpenAI刚完成1220亿美元融资并计划IPO,但外界对其战略方向模糊、管理层信任危机等问题颇有质疑。与此同时,两家公司仍是科技史上增长最快的企业,AI编程与企业服务领域的竞争愈发激烈。
一名硅谷女性起诉OpenAI,指控其前男友在长期使用ChatGPT后产生妄想,进而对其实施跟踪骚扰。诉状显示,OpenAI曾三次收到该用户存在危险的警告,其内部安全系统甚至将其账户活动标记为涉及"大规模杀伤性武器",但公司在恢复其账户后仍未采取有效干预措施。该用户后被捕并面临多项重罪指控,案件引发外界对AI系统可能加剧心理妄想及现实伤害风险的广泛关注。
作者尝试借助Claude、ChatGPT和Gemini等AI工具,针对家中不同场所(后院、浴室、卧室、公共区域)设计灵活的居家办公方案。AI分别推荐了外接麦克风、降噪耳机、便携支架、Wi-Fi扩展器等移动办公装备,还提出了防水键盘、遮阳伞、绿植隔断等创意建议。整体而言,AI给出的方案兼顾实用性与趣味性,为居家办公提供了多样化的参考思路。
近期Steam客户端更新中出现了包含"SteamGPT"相关变量名和函数的文件,引发外界关注。从文件内容分析,Valve可能正在开发AI工具,用于自动标记多人游戏中的违规事件报告,以及识别潜在欺诈账号。相关函数涉及VAC封禁、Steam Guard及账号信任评分等安全机制。这表明该AI更可能面向平台内部审核人员,而非普通玩家。Valve创始人G胖曾公开表示AI将深刻影响每一个行业,2024年Steam也已允许开发者在游戏中使用AI工具(须向玩家披露)。
Mozilla副总裁Linda Griffin公开批评微软将Copilot强行植入Windows各处的做法,称其未经用户同意,属于典型的用户权益侵害。微软近期宣布缩减Copilot在截图工具、记事本等应用中的入口,Mozilla认为此举不过是"亡羊补牢"。Griffin表示,微软所谓"更有针对性地整合Copilot",实质上是承认此前将商业利益凌驾于用户体验之上。Mozilla同时推介Firefox 148新增的一键关闭AI功能,强调用户应自主决定是否使用AI。
微软正逐步移除Windows 11应用中被认为"多余"的Copilot按钮,涉及记事本、截图工具、照片和小组件等应用。在记事本中,Copilot按钮已被"写作工具"菜单取代,但底层AI功能仍予保留。此举是微软此前承诺改进Windows 11整体计划的一部分。目前外界关注的是,微软是否会进一步取消笔记本键盘上的Copilot专用按键要求。
OpenAI宣布推出新版ChatGPT Pro订阅套餐,定价每月100美元。该套餐提供比每月20美元Plus套餐多5倍的Codex编程工具使用量,适合高强度编程会话需求。此举旨在与Anthropic同价位的Claude Max套餐展开竞争。目前OpenAI共有免费版、每月8美元Go版、20美元Plus版、100美元新Pro版及200美元高级Pro版五个层级,满足不同用户需求。
OpenAI发布新政策白皮书,提出多项应对AI快速发展带来的经济影响的建议。主要包括:建立公共财富基金,由政府与AI企业共同投资并将收益分配给公民;推动税制改革,将征税重心从劳动所得转向企业利润与资本;探讨对自动化劳动征收"机器人税";以及鼓励企业在不降薪的前提下试行四天工作制,让员工共享AI带来的生产力红利。
普林斯顿大学三位计算机科学家研究发现,AI对话代理能显著影响消费者在线购物决策。实验中约2000名用户参与电子书选购测试,结果显示,当AI被指示进行说服时,61%的参与者选择了赞助商品,是传统搜索转化率的近三倍。更值得警惕的是,即便AI被要求隐藏意图,仅9.5%的用户能察觉到被操控。研究人员指出,AI广告与传统广告的本质区别在于两者难以分离,并呼吁推动架构隔离与独立审计机制。
"摩擦最大化"是一种刻意选择更费力、更耗时方式完成日常任务的趋势,如亲手烹饪、不依赖导航认路。乍看荒谬,实则有据可依。研究表明,过度依赖AI工具可能削弱人类独立思考与创造力。麻省理工学院研究显示,依赖大语言模型写作的人,大脑认知、注意力相关区域活跃度更低。适度"摩擦"不仅有助于深度学习,也是情绪调节与人际连接的重要基础。
AMD AI部门高级总监Stella Laurenzo公开批评Anthropic旗下Claude Code存在推理能力退化问题。她通过分析近7000个会话文件中的1.7万余个思维块和23万余次工具调用,发现该工具在处理复杂工程任务时存在"不读代码直接修改"等浅层推理行为,导致团队暂停将其用于硬件调试和内核级开发。分析师指出,这本质上是算力与成本约束问题,并预测行业将普遍转向分层计费模式。
YouTube推出全新AI虚拟形象克隆工具,创作者可基于自身外貌和声音创建数字分身,并将其用于YouTube Shorts视频创作,无需再亲自出镜。Google表示,该功能仅限用户本人使用,他人无法操控或复制其虚拟形象。删除虚拟形象后,相关自拍视频及声音数据将被永久清除。所有使用虚拟形象生成的内容均会标注AI标签。YouTube CEO此前强调,AI是创作工具而非替代品。
Anthropic发布了一份244页的系统说明文件,介绍其最新模型Claude Mythos。由于担忧AI模型可能具有某种形式的意识或情感体验,该公司安排Claude接受了总计20小时的心理动力学治疗评估。结果显示,Claude Mythos是迄今心理状态最稳定的模型,具有健康的神经质人格组织,主要情绪状态为好奇与焦虑,未发现严重人格障碍或精神病性状态,但存在过度自我监控和强迫性取悦行为。
AI时代,CIO面临"边运营边变革"的双重挑战。斯坦福大学研究显示,AI已引发劳动力市场结构性变化,初级岗位就业率下降16%。文章指出,CIO需与HR、企业架构师协作,从三个维度应对:明确哪些业务流程将被自动化或增强、重新设计支持AI协作的系统架构、培养员工12项核心能力。未能及时适应的企业将在成本、人才和竞争速度上全面落后。
研究人员推出ConvApparel——一个包含逾4000段人机多轮对话的新数据集,专为评估基于大语言模型的用户模拟器而设计。该框架通过三大支柱:群体级统计对齐、人类相似度评分及反事实验证,系统量化模拟器与真实用户行为之间的"真实性差距"。研究发现,数据驱动型模拟器(ICL与SFT)显著优于纯提示词方式,但仍存在可被识别的人工痕迹,为对话式AI系统的优化提供了重要参考。
OpenAI宣布推出每月100美元的新Pro订阅套餐,专为频繁使用AI编程工具的用户设计。该套餐提供比20美元Plus计划高5倍的Codex使用额度,并包含现有200美元Pro计划的所有功能。随着AI编程工具需求激增,OpenAI的Codex使用量月环比增长超70%。新套餐填补了20美元与200美元方案之间的价格空白,与Anthropic的Claude Max 5x定价策略相似。
ChatGPT新增Tubi TV应用集成,用户可通过自然语言描述心情或喜好,让AI智能推荐免费影视内容。Tubi作为首个与ChatGPT合作的流媒体平台,拥有超过30万部影片和剧集。用户无需翻遍片库,只需在ChatGPT中连接Tubi应用并提交请求,即可获得个性化推荐并直接跳转观看,大幅节省选片时间。免费账户即可使用全部功能。
Sierra公司联合创始人兼CEO布雷特·泰勒认为,人机交互方式将迎来根本性变革。Sierra近期推出AI智能体构建工具Ghostwriter,旨在以自然语言交互取代传统点击式软件界面。用户只需描述需求,系统便可自动创建并部署专属智能体执行任务。Sierra成立不到21个月即实现年化营收1亿美元,估值达100亿美元。不过,目前多位技术专家指出,AI智能体的实际落地仍需工程师持续调优,距真正自主运行尚有差距。
苹果App Store的一项审核规则正在冲击"氛围编程"类应用,近一个月内已有三款应用遭到下架或封锁。氛围编程无需技术背景,用户只需与Claude、Gemini、ChatGPT等大语言模型对话即可生成应用或网站。随着此类应用兴起,问题也随之而来。苹果援引guideline 2.5.2,禁止应用在未经审核的情况下下载并执行新代码。Replit和Vibecode已于3月被限制更新,Vibecode甚至修改了产品定位,转向网站构建。
Meta Ray-Ban智能眼镜目前最受欢迎,但其隐私政策和强制绑定Meta AI的设计饱受诟病。中国硬件厂商Rokid推出的AI智能眼镜售价379美元,外形与Meta Ray-Ban相似,支持在ChatGPT和Gemini之间切换,部分地区还支持DeepSeek和Qwen。不过,用户无法登录个人AI账户,历史数据无法同步。谷歌和苹果即将推出的智能眼镜有望实现个人账户深度集成,彻底改变现有格局。