大语言模型文章列表第6页-至顶网频道

2025-04-21

OpenAI 新推理 AI 模型幻觉问题更严重

OpenAI 最新推出的 o3 和 o4-mini 推理 AI 模型虽然在编程和数学等任务上表现出色，但幻觉率却远高于以往模型，引发了对准确性的严重担忧，亟待进一步研究。

人工智能大语言模型优化模型

人工智能

大语言模型

2025-04-18

Together AI 的增强功能使得 AI 微调更快更便捷

Together AI 最新升级其微调平台，支持浏览器零代码操作、直接偏好优化、续接先前训练任务并调整消息权重，同时新定价更低廉，旨在简化AI模型持续迭代。

Google 在 Cloud Next 2025 的 AI 创新：CIO 需要了解的事项

人工智能

大语言模型

2025-04-17

Google 在 Cloud Next 2025 的 AI 创新：CIO 需要了解的事项

在 Cloud Next 2025 上，Google 公布一系列 AI 更新，包括新 TPU 芯片、专业化 LLM 及开放代理框架，助力企业降低集成复杂度和成本，实现 AI 部署、扩展及管理。

人工智能

大语言模型

成本优化

2025-04-15

OpenAI 转变重点：GPT-4.1 优先关注编程与成本效率

OpenAI 推出了 GPT-4.1 系列，专注提升编程效率、扩展长文本处理能力与指令执行准确性，同时大幅降低成本，为企业和开发者提供更灵活的 AI 工具。

人工智能

大语言模型

智能体开发平台

2025-04-10

Google 推出企业级 AI 智能体开发套件，助力快速原型开发和部署

Google 发布了新的智能代理开发工具包 (ADK) 和相关功能，简化了基于 Gemini 模型的多代理系统创建过程。ADK 支持 Model Context Protocol，可帮助企业快速构建、部署和管理 AI 代理。同时推出的还有 Agent Engine 和 Agent Garden，为企业提供了更全面的代理开发和管理解决方案。这些新工具旨在增强企业对 AI 代理的控制和安全性。

Nvidia 新型 Llama-3.1 Nemotron Ultra 以一半参数量超越 DeepSeek R1

人工智能

大语言模型

架构优化

2025-04-09

Nvidia 新型 Llama-3.1 Nemotron Ultra 以一半参数量超越 DeepSeek R1

英伟达发布了基于 Meta 旧版 Llama-3.1 的全新开源大语言模型 Llama-3.1-Nemotron-Ultra-253B。该模型在多项第三方基准测试中表现出色，尽管参数量仅为 DeepSeek R1 的一半，但在许多任务上都超越了这个强大的竞争对手。新模型支持高级推理、指令跟随和 AI 助手工作流，采用了创新架构和针对性后训练来优化性能。

人工智能

大语言模型

模型效率优化

2025-04-08

Gemini "正在以非常棒的方式融合在一起"，谷歌在发布2.5 Pro后表示

Google 在生成式 AI 领域起步较晚，但近期 Gemini 发展迅速。最新发布的 Gemini 2.5 Pro (实验版)在基准测试和用户体验方面均有显著提升，有望挑战 ChatGPT 的主导地位。Google 表示，这得益于长期投资的成果开始发挥作用。新版本在推理能力、性能效率等方面都有进步，但在技术细节透明度方面仍有待改进。

人工智能安全

大语言模型

网络威胁

2025-04-08

思科：微调后的大语言模型成为威胁放大器——恶意行为可能性增加22倍

思科最新研究表明，经过微调的大语言模型正在重塑网络攻击格局。这些模型可以自动化侦察、身份模仿和实时检测规避，加速大规模社会工程攻击。一些专门用于攻击的模型月租低至75美元。研究还发现，微调过程会削弱模型的安全控制，使其更容易被利用。这迫使安全领导者必须重新制定防御策略，将大语言模型视为新的攻击面来加以防护。

人工智能

大语言模型

开源AI

2025-04-07

扎克伯格：Meta最新Llama模型将开源AI推向领导地位

Meta发布了Llama 4系列大型语言模型，包括适合单GPU运行的Scout和媲美GPT-4o的Maverick，均拥有170亿参数。更强大的Behemoth模型仍在开发中，将拥有2880亿活跃参数。这些模型采用专家混合系统技术，在性能、效率和安全性方面均有显著提升，体现了Meta推动开源AI成为行业领先力量的战略。

人工智能

大语言模型

透明度监管

2025-04-05

Google 发布 Gemini 模型的速度快于其 AI 安全报告

Google 近期加快了 AI 模型的发布节奏，推出了业界领先的 Gemini 2.5 Pro 和 Gemini 2.0 Flash。然而，公司尚未发布这些新模型的安全报告，引发了对透明度的担忧。Google 表示正在权衡快速迭代和获取反馈的方式，承诺未来会发布更多文档，但专家认为这种做法可能会树立不良先例。

人工智能

大语言模型

模型优化

2025-04-01

Google 新实验性 Gemini 2.5 模型向免费用户开放

Google 推出最新的 Gemini 2.5 Pro (实验版) AI 模型，并以罕见的速度向免费用户开放。该模型支持模拟推理，提高了准确性，并在 LMSYS 聊天机器人竞技场排行榜上名列前茅。免费用户可在网页上试用，但有使用限制，无法上传文件，且有未明确的token和使用次数限制。

人工智能

大语言模型

市场整合

2025-04-01

大语言模型供应商面临"淘汰"危机，资本支出现实带来严峻考验

Gartner 预测，大语言模型 (LLM) 提供商市场即将进入"灭绝"阶段。在竞争激烈的环境下，巨额资本投入成为主要挑战。预计到 2025 年，全球生成式 AI 支出将达到 6440 亿美元，较 2024 年增长 76%。专家认为，LLM 市场将经历类似云计算市场的整合，最终可能只剩少数几家主导者。

人工智能

大语言模型

模型创新

2025-04-01

OpenAI 将发布自 2019 年以来首个"开放权重"模型

OpenAI计划今年晚些时候向开发者社区发布一个"开放权重"模型，这是该公司自2019年以来的首次尝试。新模型将具备推理能力，类似于现有的o3-mini模型。这一战略转变旨在应对来自竞争对手的压力，同时为开发者提供更多定制和使用灵活性。虽然不完全开源，但这种方式可能有助于OpenAI在保持技术领先的同时，满足市场对更开放AI发展的需求。

Databricks 与 Anthropic、Palantir 达成企业 AI 合作

人工智能

大语言模型

模型优化

2025-03-31

Databricks 与 Anthropic、Palantir 达成企业 AI 合作

Databricks 与 Palantir 签署合作协议，开发出更优的大语言模型微调方法，并与 Anthropic 达成为期五年的战略联盟，将 Claude 大语言模型整合到其数据湖平台中。此次合作将为企业客户提供更强大的 AI 能力，包括军工级安全性、高效的模型训练以及全面的数据治理，助力企业打造专属 AI 应用。

Google Gemini 2.5 成为最新对标 DeepSeek R1 的模型

人工智能

大语言模型

推理优化

2025-03-27

Google Gemini 2.5 成为最新对标 DeepSeek R1 的模型

Google 发布新一代 AI 模型 Gemini 2.5，在 LMArena 评测中位居榜首。该模型采用递归分析方法提供输出，在推理、科学、数学和代码生成等方面表现出色。目前已向付费高级用户开放使用，并将在 2025 年投入 750 亿美元用于 AI 开发，以争夺未来万亿规模的 AI 市场。

人工智能

大语言模型

技术变革

2025-03-24

"渐进，然后突然"：AI 对就业岗位的冲击是否正在遵循这一模式？

AI 正在迅速改变我们的工作方式，无论是通过自动化任务、作为副驾驶还是生成文本、图像和软件。虽然目前尚未出现大规模的劳动力替代，但多项研究预测未来几年内 40% 的全球就业岗位可能面临 AI 自动化的冲击。这可能是暴风雨来临前的宁静。

人工智能

大语言模型

效率优化

2025-03-20

腾讯放缓 GPU 部署步伐，从更少的加速器中榨取更多性能

腾讯放缓了GPU部署速度，原因是DeepSeek技术的突破使得现有GPU的生产力大幅提升。公司预计2025年资本支出将占收入的"低teens百分比"，远低于微软和亚马逊的支出。腾讯强调效率和GPU服务器的高效利用，认为这不会影响技术开发的最终效果。公司计划在微信中加入AI驱动的搜索、语言输入和内容生成功能，并考虑引入智能AI服务。

人工智能

大语言模型

模型创新

2025-03-13

谷歌推出全新可及的轻量级 Gemma 3 系列模型

Google 发布新一代轻量级开源大语言模型 Gemma 3，提供多种参数规模选择，可在单个 GPU 上运行。该模型基于 Gemini 技术，性能优异，具备多模态能力和大上下文窗口。同时推出 ShieldGemma 2 用于图像安全检查，为开发者提供更多 AI 应用开发选择。

人工智能

大语言模型

模型优化

2025-03-12

专家链模型 (CoE)：一个提高效率和准确性的低成本大语言模型框架

专家链（CoE）是一种新型大语言模型框架，通过顺序激活专门化的模型元素来提高资源效率和推理任务准确性。与传统方法相比，CoE允许专家元素相互传递中间结果，逐步建立推理链，从而在推理密集型应用中实现更高效的计算和更好的用户体验，同时大幅降低企业运行大型语言模型的成本。

人工智能

大语言模型

模型优化

2025-03-10

微软据报道开发出可与 OpenAI、Anthropic 模型媲美的大语言模型系列

微软公司据报道已开发出一系列大型语言模型，可与 OpenAI 和 Anthropic 的算法相媲美。这个名为 MAI 的 LLM 系列可能使用了微软内部开发的 AI 芯片 Maia 100。测试结果显示，MAI 在性能上具有竞争力，可能用于支持微软的 Copilot AI 助手系列。此举或将减少微软对 OpenAI 的依赖，同时公司也在开发专注于推理任务的第二个 LLM 系列。

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: