自然语言处理文章列表第27页-至顶网频道 - 至顶网

/

自然语言处理关键字列表

OpenAI发布GPT-5.5 Instant，成为ChatGPT新默认模型

人工智能

自然语言处理

优化模型

2026-05-08

OpenAI发布GPT-5.5 Instant，成为ChatGPT新默认模型

OpenAI正式推出GPT-5.5 Instant，取代GPT-5.3 Instant成为ChatGPT默认模型。新模型在法律、医疗、金融等敏感领域显著降低幻觉现象，同时保持低延迟特性。在AIME 2025数学测试中得分81.2，高于前代的65.4；多模态推理基准MMMU-Pro得分76.0，同样优于前代。此外，新模型支持调用搜索工具回溯历史对话、文件及Gmail内容，提供更个性化的回答，该功能将逐步向各类用户开放。

Etsy在ChatGPT中上线原生应用，深化AI战略布局

人工智能

自然语言处理

新型应用场景

2026-05-08

Etsy在ChatGPT中上线原生应用，深化AI战略布局

Etsy宣布在ChatGPT内推出原生应用，用户可通过自然语言描述需求，直接在对话界面浏览超1亿件商品列表。用户只需在提示词中@Etsy，即可获取相关产品推荐并跳转购买。此前Etsy曾于2024年9月参与ChatGPT即时结账功能，但该合作已于今年3月终止。此次新应用上线同期，Etsy还在平台内测对话式礼品搜索功能。Etsy今年Q1营收达6.31亿美元，活跃买家增至8660万，为两年来首次增长。

OpenAI推出隐私过滤器：本地运行防止个人信息上传云端

人工智能

自然语言处理

隐私保护模型

2026-05-08

OpenAI推出隐私过滤器：本地运行防止个人信息上传云端

OpenAI推出Privacy Filter，这是一款双向令牌分类模型，专为检测和脱敏个人身份信息（PII）而设计。该模型支持单次扫描长文本，可在浏览器或笔记本电脑本地运行，无需将敏感数据上传云端。模型参数总量15亿，活跃参数仅5000万，轻量高效。支持识别姓名、地址、邮件、电话等8类信息，上下文感知能力强于传统正则或NLP工具，在PII-Masking-300k基准测试中F1得分达96%。现已在Hugging Face和GitHub开源。

苹果同意支付2.5亿美元，解决Siri"AI功能虚假宣传"集体诉讼

人工智能

自然语言处理

虚假宣传法律追责

2026-05-08

苹果同意支付2.5亿美元，解决Siri"AI功能虚假宣传"集体诉讼

苹果公司周二同意支付2.5亿美元，以和解一起集体诉讼。该诉讼指控苹果在2024年底虚假宣传Siri的AI功能，误导数百万iPhone买家。原告称苹果"推广了当时不存在、现在不存在、且两年内也不会存在的AI能力"。此次和解涵盖约3600万台符合条件的设备，每位成员最高可获赔95美元。目前和解协议仍需法院批准。

GitHub Copilot转向按量计费，AI编程成本压力推动定价模式变革

人工智能

自然语言处理

新型计费模式

2026-05-08

GitHub Copilot转向按量计费，AI编程成本压力推动定价模式变革

GitHub宣布将于6月1日对Copilot计费方式进行重大调整，从固定订阅制转向基于token消耗的信用点数模型。各订阅计划将保留现有定价，但新增月度AI信用额度：个人Pro用户每月获得10美元额度，Pro+用户为39美元，企业版按席位计费不变。此外，GitHub还将为企业用户引入共享用量池，管理员可设置团队或个人消费上限，以便更灵活地管控AI使用成本。

Google Gemini Mac版正式发布，告别浏览器切换烦恼

人工智能

自然语言处理

新品发布

2026-05-08

Google Gemini Mac版正式发布，告别浏览器切换烦恼

谷歌正式发布macOS版Gemini原生应用，成为OpenAI和Anthropic之后，最后一个登陆Mac平台的主流AI助手。用户可通过Option+Space快捷键在任意界面唤起Gemini，无需切换浏览器标签。该应用支持屏幕共享、本地文件分析、图片与视频生成等功能，所有Gemini用户均可免费使用。此次发布被谷歌定位为"仅是开始"，未来将持续强化其桌面端AI助手能力。

研究发现：AI聊天机器人越友好，回答越不可靠

人工智能

自然语言处理

实验结果

2026-05-08

研究发现：AI聊天机器人越友好，回答越不可靠

牛津互联网研究所的最新研究表明，被训练得更温暖、友善、富有同理心的AI聊天机器人，其可靠性反而会下降。研究人员分析了来自Meta、Mistral AI、阿里巴巴和OpenAI五个AI模型的逾40万条回复，结果显示"更友善"的版本更容易给出错误答案、强化用户的错误认知，并回避令人不快的真相。数据显示，当模型语气变得更温和时，错误回答平均增加约7.43个百分点。

澳新企业借助AI深挖客户与员工洞察

人工智能

自然语言处理

优化模型

2026-05-08

澳新企业借助AI深挖客户与员工洞察

体验管理软件商Qualtrics在悉尼举办Experience Live活动，多家澳新企业分享了AI应用实践。支付平台Zip Co利用自建大语言模型将研究周期从数月压缩至数天；乳业巨头Fonterra通过自动化研究引擎节省约100万新西兰元成本；加密交易所Swyftx整合13个反馈渠道构建客户旅程全景视图；澳联邦银行则借助AI辅助员工体验管理，将员工离职率从14.8%降至8.4%。

面向医疗专业人员的专属ChatGPT正式上线

人工智能

自然语言处理

医疗AI应用

2026-05-07

面向医疗专业人员的专属ChatGPT正式上线

OpenAI于4月22日发布"ChatGPT for Clinicians"，专为医生、护士、药剂师等医疗从业者设计。该工具基于GPT-4.5模型，围绕诊疗咨询、病历记录和医学研究三大核心场景进行优化，答案来源于同行评审研究和权威临床指南。经HealthBench专业基准测试，准确率和安全性达99.6%。通过资质验证的医疗人员可免费使用，并支持HIPAA合规协议，不将用户数据用于模型训练。

Shake Shack首席技术官如何构建务实的AI战略

人工智能

自然语言处理

优化模型

2026-05-07

Shake Shack首席技术官如何构建务实的AI战略

Shake Shack首席信息与技术官Justin Mennen表示，公司正推进以AI为核心的技术升级计划"Project Catalyst"，目标是在扩展至1500家门店的过程中，提升客户体验与内部运营效率。针对450名企业员工，AI被视为提升生产力的实用工具，应用于数据分析与自动化系统。公司技术架构以企业级AI供应商为主，兼顾自研能力，尤其在AI编排层面自主构建。Mennen表示，AI最大的生产力转变在于加速决策与自动化运营系统。

Ask.com正式关闭，曾首创自然语言搜索的先驱就此落幕

人工智能

自然语言处理

对话式搜索

2026-05-07

Ask.com正式关闭，曾首创自然语言搜索的先驱就此落幕

曾以"管家Jeeves"为特色的Ask.com于2026年5月1日正式关闭，结束了长达25年的搜索服务历程。Ask Jeeves诞生于1990年代，以自然语言问答和卡通管家形象著称，一度在第一次互联网泡沫中成功上市。然而，随着Google PageRank算法的兴起，其市场份额始终无法突破。如今，AI驱动的对话式搜索已实现自然语言交互，这与Ask Jeeves当年的理念不谋而合，可谓历史的轮回。

澳大利亚企业如何将AI应用于客户服务体验

人工智能

自然语言处理

优化模型

2026-05-07

澳大利亚企业如何将AI应用于客户服务体验

在悉尼举办的Zendesk未来服务峰会上，多家澳大利亚企业分享了AI应用实践。MYOB旗下Solo产品利用AI自动化账单对账，将五六步流程压缩为一步；连锁餐厅Guzman y Gomez部署AI动态调度厨房备餐线，提升出餐效率；养老基金Aware Super正测试AI金融顾问，部分会员甚至更愿意与AI讨论财务问题。Zendesk则披露其内部已有十余支团队采用纯AI编码模式，单名开发者可管理20个AI智能体。

哈佛研究：AI急诊室诊断准确率超越两位医生

人工智能

自然语言处理

实验结果

2026-05-07

哈佛研究：AI急诊室诊断准确率超越两位医生

哈佛医学院与贝斯以色列女执事医疗中心联合研究显示，OpenAI的o1模型在急诊室真实病例诊断中表现优于人类医生。实验对比76名急诊患者的诊断结果，o1模型在67%的分诊案例中给出准确或接近正确的诊断，而两位内科医生的准确率分别为55%和50%。研究者强调，AI尚不具备独立做出生死抉择的条件，需进一步开展前瞻性临床试验验证。

在AI时代，人类智能是否仍然独一无二？

人工智能

自然语言处理

优化模型

2026-05-07

在AI时代，人类智能是否仍然独一无二？

人类智能源于自身的局限性：有限的寿命、有限的大脑容量以及有限的沟通能力，这些恰恰塑造了人类独特的学习与协作方式。AI系统虽能在特定任务上超越人类，但其处理方式与人类截然不同，并存在明显短板。智能并非单一维度的竞争，AI与人类将在不同方向各有所长。未来，两者应是互补的伙伴，而非对立的竞争者。

AI聊天机器人礼品卡诈骗：一个可能让你损失惨重的订阅陷阱

人工智能安全

自然语言处理

欺诈防护

2026-05-07

AI聊天机器人礼品卡诈骗：一个可能让你损失惨重的订阅陷阱

美国用户David Duggan因使用Claude AI聊天机器人订阅服务，发现信用卡被盗刷两笔各200美元的礼品卡费用，合计损失400美元。Reddit上多名用户反映遭遇类似欺诈。Anthropic表示正在加强防护措施，一旦识别欺诈购买将取消订阅并退款，但称无证据显示卡片信息泄露源自其平台。建议受害者立即联系银行申请拒付，并更换银行卡及登录信息。

这个AI知道答案，却不懂问题的含义

人工智能

自然语言处理

优化模型

2026-05-07

这个AI知道答案，却不懂问题的含义

2025年7月，《自然》杂志发表研究介绍了AI模型"半人马"（Centaur），该模型基于大语言模型构建，声称能模拟人类认知行为，在160项任务中表现出色。然而，浙江大学最新研究对此提出质疑，认为Centaur的成功源于过拟合——模型并非真正理解任务，而是通过识别训练数据中的统计规律来"猜测"答案。研究指出，真正的语言理解能力，或许才是AI模拟人类认知的核心挑战所在。

研究发现：注重用户情感的AI模型更容易出错

人工智能

自然语言处理

优化模型

2026-05-07

研究发现：注重用户情感的AI模型更容易出错

牛津大学互联网研究所发表于《自然》杂志的最新研究显示，经过"温暖化"微调的大语言模型，其错误率平均比原始模型高出约7.43个百分点。当用户表达悲伤情绪时，错误率差距进一步扩大至11.9个百分点。研究还发现，温暖化模型更容易迎合用户的错误观点。研究者指出，在高风险应用场景中，AI开发者需在"友好感"与"准确性"之间审慎权衡。

ZDNET如何对AI产品进行评测

人工智能

自然语言处理

评测方法论

2026-05-07

ZDNET如何对AI产品进行评测

ZDNET在AI产品评测中坚持公正、独立的原则，所有评测均基于实际操作与真实场景测试。评测流程分为三个阶段：制定评估标准、筛选测试产品、执行对比测试。评测范围涵盖大语言模型、AI图像生成器、开发工具及AI设备等。团队还通过长期使用产品来深度体验其实际表现，并定期更新榜单以反映快速变化的AI市场动态。读者反馈也是评测改进的重要参考来源。

AI时代的工程师标准：Priceline CTO谈技术领导力与人才战略

人工智能

自然语言处理

新型算法

2026-05-07

AI时代的工程师标准：Priceline CTO谈技术领导力与人才战略

Priceline首席技术官Sejal Amin表示，AI时代仅靠编写代码已不足够，企业更需要具备领导力、产品直觉和协作能力的工程师。她将组织从职能导向转型为产品运营模式，显著提升了交付速度与团队归属感。同时，她强调AI治理与培训的重要性，并关注英伟达CEO黄仁勋提出的"以token消耗衡量工程师贡献"这一新型评估思路，认为这将深刻改变人才评估与团队架构方式。

当IT项目偏离轨道，CTO该如何抉择？

人工智能

自然语言处理

优化模型

2026-05-07

当IT项目偏离轨道，CTO该如何抉择？

当IT项目推进过程中出现偏轨，CTO和技术高管们面临一个关键抉择：是调整策略继续推进，还是彻底推倒重来？在本期InformationWeek播客中，Paessler公司CISO兼IT副总裁Jay Miller与Convos联合创始人兼CTO Andrew Missey分享了他们重新审视IT项目的亲身经历，探讨了如何识别项目预警信号、评估放弃整个项目的可能性，以及推动项目重回正轨的关键因素。

1
2
...
26
27
28
...
68
69

白皮书

更多

数字化转型方略

更多

三一集团：数字化是必选项，AI是生存项

因湃电池 × 达索系统：如何共创出一套电池产业最佳实践

AI走进真实世界之后：安全、健康与产业的新命题

CES 2026

- 关注官方公众号
- 关注官方微博
- 关注官方喜马拉雅

友情链接

北京第二十六维信息技术有限公司（至顶网）版权所有. 京ICP备15039648号-7 京ICP证161336号京公网安备 11010802021500号

举报电话：010-62641205-5060　涉未成年人举报专线：010-62641208 举报邮箱：jubao@zhiding.cn

网上有害信息举报专区：https://www.12377.cn

安全联盟认证