Adobe今日宣布将旗下三款热门应用Photoshop、Adobe Express和Acrobat免费集成到ChatGPT中。用户可通过自然语言指令操作这些软件,如"Photoshop,更换我图片的背景"。此举将为Adobe带来显著的分发优势,因为ChatGPT拥有超过8亿周活跃用户。三款应用已面向全球用户开放,支持多种编辑和PDF处理功能。
Anthropic推出Claude Code的Slack集成功能,让开发者能直接在聊天线程中委托编程任务。这项测试功能于周一以研究预览版形式发布,基于现有Slack集成增加了完整工作流自动化。开发者现在可以标记@Claude启动完整编程会话,Claude会分析消息确定合适的代码库,在线程中发布进度更新并分享审查链接。这反映了行业趋势:AI编程助手正从IDE迁移到团队协作工具中。
雅虎在其体育应用中推出了名为"比赛解析"的新功能,利用AI模型自动生成比赛快照。该功能包含三个核心部分:比赛摘要、重要比赛片段流和后续问题提示。AI模型不仅挖掘统计数据,还试图理解比赛的情感层面和人文故事。雅虎计划结合自身记者团队和用户反馈来训练系统,使其更好地理解体育比赛中真正重要的内容。未来该功能将扩展到其他体育项目,并可能提供个性化定制服务。
中兴通讯首席发展官崔丽在经济学人影响力AI创新亚洲2025峰会上分享了智能体AI战略愿景。她强调组织应从机械化向有机化转型,在不确定性中寻求稳定,保持敏捷适应变化。数字化和智能化转型需要长期投资,AI建立在数字和网络基础之上。在关键环节需要人机协同,大模型存在固有风险,而人类具备社会智能和道德判断。智能体AI正在重塑人才战略,未来最重要的三类人才是AI专家、AI高级用户和超越AI的高阶思维人才。
研究显示,主流AI大语言模型普遍存在性别偏见问题。开发者Cookie发现,当她更换头像为白人男性后,AI对其量子算法工作的质疑明显减少。多项研究证实,由于训练数据存在偏见,AI模型会对女性用户产生刻板印象,如假设技术岗位由男性担任。专家指出,虽然AI公司正在努力解决偏见问题,但用户需认识到这些模型本质上是文本预测机器。
OpenAI为ChatGPT推出"购物研究"新功能,恰逢假期购物季。该功能面向免费和付费用户开放,支持移动端和网页版。用户询问购物问题时,ChatGPT会提供个性化购物助手服务,通过一系列问题帮助用户筛选价格、用途和功能偏好。该功能基于专为购物任务优化的GPT-5 mini版本,从优质网络资源获取产品信息。OpenAI计划推出即时结账功能,允许用户直接在ChatGPT内购买商品。
微软推出首个智能体小语言模型Fara-7B,专为"计算机使用"任务设计,能够控制鼠标和键盘完成各种操作。该模型仅有70亿参数,可在个人电脑上本地运行,无需联网或向云端传输数据,有效提升隐私保护和响应速度。Fara-7B能够通过视觉感知网站内容,执行在线购物、信息搜索和地图测距等任务,性能可媲美更大规模的模型系统。
Anthropic周一发布了旗舰模型Opus 4.5,这是4.5系列的最后一个模型。新版本在编程、工具使用和问题解决等基准测试中表现出色,是首个在SWE-Bench验证测试中得分超过80%的模型。同时推出Claude for Chrome和Claude for Excel产品,分别面向不同用户群体。Opus 4.5还改进了长文本处理的内存管理,支持付费用户的"无限聊天"功能,并针对智能体应用场景进行了优化,将与OpenAI的GPT 5.1和谷歌的Gemini 3展开竞争。
研究人员开发出更有效的方法从大型语言模型中提取记忆内容,可帮助解决监管担忧和版权纠纷。该技术名为RECAP,通过智能反馈循环迭代提取特定内容,包含突破模型拒绝回应的组件。在基准测试中,RECAP在文本提取方面比现有最佳方法提升78%,能从《哈利波特》首部小说中提取约3000段文字。这项研究有助于提高AI模型透明度。
微软开发总监Scott Hanselman在Ignite大会上宣布开源Zork I-III游戏源代码,采用MIT许可证发布。Zork是游戏史上的里程碑作品,这款文字冒险游戏允许玩家使用自然语言与游戏互动。该游戏最初为PDP-10计算机开发,后被分为三部分以适配当时的个人电脑。微软此举旨在为学生、教师和开发者提供历史重要代码,供学习研究使用。
OpenAI宣布ChatGPT群聊功能正式向全球所有用户开放,涵盖免费版、Go版、Plus版和Pro版计划。该功能允许最多20人在共享对话中与ChatGPT协作,用于规划旅行、共同撰写文档、解决争议或进行研究。用户个人设置和记忆保持私密,ChatGPT能智能判断何时参与对话。这标志着OpenAI将ChatGPT从简单聊天机器人转变为社交协作平台的重要步骤。
维基百科编辑团队发布了一份识别AI写作的公开指南,成为目前最有效的AI文本检测资源。该指南基于2023年启动的"AI清理项目",通过分析大量编辑内容总结出AI写作的特征模式:过度强调主题重要性、使用"关键时刻"等通用表述、详述次要媒体报道以凸显重要性、频繁使用模糊的重要性声明如"强调意义"等现在分词结构,以及倾向于使用"风景如画"等营销化语言。这些特征深植于AI模型训练方式中,难以完全消除。
OpenAI发布了ChatGPT教师版,专门面向K-12学校教职员工,免费使用至2027年6月。该版本包含GPT-5.1 Auto无限消息功能,支持文件上传、图像生成等特性,同时符合《家庭教育权利法》要求。教师可用其创建教学材料,分享聊天记录,并获得其他教师使用建议。此前OpenAI已推出面向学生的ChatGPT Edu和学习模式功能。
人工智能为已经过度充斥内容的社交媒体世界增添更多燃料。AI的大规模生产能力让内容泛滥问题更加严重,同时算法操控也变得更加可疑。在广告领域,AI工具可能彻底改变传统广告模式,通过智能代理的受托责任替代常见广告形式。未来AI甚至可能使用人类的AI化身代笔写书,模仿其声音、历史和个性。这引发了关于人类作者身份和写作本质的深刻思考。
本文介绍了提示工程领域的新技术"协作提示",该技术能让AI从传统的单轮快速回答模式转向多轮协作对话模式。文章提供了短版和长版两种协作提示模板,解释了AI通常不具备协作性的原因,并通过实例对比展示了协作提示的效果。研究表明,这种方法能够帮助用户获得更深入、更实质性的AI回答,特别适用于复杂问题的探索和解决。
OpenAI宣布推出GPT-5的首个重大升级版本GPT-5.1,包含Instant和Thinking两个变体。新模型在对话风格上更加自然温暖,具备自适应推理能力,能根据问题复杂度调整思考深度。GPT-5.1提供八种个性化对话模式供用户选择,减少专业术语使用,提升易理解性。该升级旨在解决GPT-5发布后用户反馈的不足,将逐步向订阅用户推出。
谷歌Gemini深度研究工具现已升级,可访问Gmail、Drive和Chat等应用获取数据来回答研究问题。该功能基于Gemini 2.5 Pro,采用多步骤流程进行深度分析。用户需授权后,系统可访问Google Workspace中的相关数据以提升研究效果。谷歌确认连接应用的信息不会用于改进AI模型,但会有人工审核员审查部分数据。专家对该功能评价不一,有人质疑其仅能产生"研究外观"而非真正研究。
谷歌地图将集成Gemini人工智能技术,旨在将其升级为一个"全知型副驾驶"助手。这一整合将大幅提升地图服务的智能化水平,为用户提供更加个性化和全面的导航体验。通过AI技术的加持,谷歌地图有望在路线规划、地点推荐和实时信息服务等方面实现重大突破。
虽然ChatGPT等AI工具正在快速改变世界,但它们并非无所不知的神谕。ChatGPT擅长"令人信服的错误",经常提供有偏见、过时或完全错误的答案。在健康诊断、心理健康、紧急安全决策、个人财务规划、机密数据处理、违法行为、学术作弊、实时信息监控、赌博预测、法律文件起草和艺术创作等11个关键领域,用户应避免完全依赖ChatGPT,而应寻求专业人士帮助。
数十年来,命令行界面一直是IT管理的基石,但智能代理AI技术正在颠覆这一模式。通过自然语言指令,IT专业人员可以直接向AI代理下达任务,无需掌握复杂的命令语法。尽管CLI在精确控制、性能和资源效率方面仍有优势,但随着AI工具日趋成熟、学习成本降低,智能代理有望成为常规管理任务的默认解决方案,传统命令行技能可能逐渐过时。