大语言模型 关键字列表
报告:OpenAI 有望通过 400 亿美元新融资使估值翻倍至 3400 亿美元

报告:OpenAI 有望通过 400 亿美元新融资使估值翻倍至 3400 亿美元

OpenAI正寻求400亿美元新一轮融资,估值或达3400亿美元。软银可能领投150-250亿美元,并协助寻找其他投资者。这笔资金将用于支持亏损业务运营和建设AI数据中心网络,以应对来自竞争对手的挑战,推动AI技术进步。

Mistral 和 Ai2 发布新的开源大语言模型

Mistral 和 Ai2 发布新的开源大语言模型

Mistral AI 和艾伦人工智能研究所发布了新的开源大语言模型。Mistral Small 3 拥有 240 亿参数,可在某些 MacBook 上运行。AI2 的 Tülu 3 405B 是基于 Meta 的 Llama 3.1 405B 模型改进而来。两个模型都声称在各自类别中处于领先地位,并以开源许可发布。

Alibaba 发布 Qwen 2.5-Max AI 模型,称性能超越 DeepSeek-V3

Alibaba 发布 Qwen 2.5-Max AI 模型,称性能超越 DeepSeek-V3

阿里云发布最新大语言模型 Qwen 2.5-Max,声称性能超越当前最强 AI 模型。该模型采用专家混合架构,经过 20 万亿 token 预训练和后续强化学习,在多项基准测试中超越 DeepSeek-V3 等模型。Qwen 2.5-Max 目前通过阿里云 API 提供服务,但尚未开源。

OpenAI 推出 ChatGPT Gov 加速政府部门采用 AI

OpenAI 推出 ChatGPT Gov 加速政府部门采用 AI

OpenAI 推出专为政府机构定制的 ChatGPT Gov 版本,通过 Azure 云平台提供更高安全标准的服务环境。该版本保留了 ChatGPT Enterprise 的核心功能,同时确保政府数据的安全性和隐私保护,目前已获得多个联邦机构的采用,体现了 OpenAI 深化与美国政府合作的战略意图。

Galileo 发布新平台用于评估 AI 代理系统

Galileo 发布新平台用于评估 AI 代理系统

Galileo 发布了 Agentic Evaluations 平台,用于评估基于大语言模型的 AI 代理性能。该平台提供全生命周期框架,支持系统级和步骤级评估,帮助开发者快速定位inefficiencies和错误。平台使用专有的 LLM-as-a-Judge 指标,支持 LangGraph 和 CrewAI 框架,现已向所有 Galileo 用户开放。

Databricks 完成 100 亿美元融资轮并筹集 52.5 亿美元债务融资

Databricks 完成 100 亿美元融资轮并筹集 52.5 亿美元债务融资

Databricks公司完成了创纪录的100亿美元融资轮和52.5亿美元债务融资。这笔资金将用于开发新的AI产品、进行收购和扩展国际业务。公司CEO表示,此次融资将加深与Meta在AI领域的合作,特别是在大型语言模型方面。Databricks计划最早在2025年下半年上市。

商汤推出“日日新”融合大模型,勇夺“双冠王”

商汤推出“日日新”融合大模型,勇夺“双冠王”

商汤“日日新”融合大模型性能上文理兼修,在SuperCLUE年度评测中,文科成绩以81.8分位列全球第一,超越OpenAI的o1模型;理科成绩夺得金牌,其中计算维度以78.2分位列国内第一。

2025年值得关注的5大生成式AI趋势

2025年值得关注的5大生成式AI趋势

随着生成式AI逐渐成为企业应用的核心,它将显著提升运营效率、推动创新,并重塑组织与技术的交互方式。本文梳理了2025年5大关键趋势,包括AI优先的应用开发、服务即软件模式、语音实时交互、生成式用户界面,以及企业级AI代理的深度集成。这些趋势将为企业带来机遇与挑战,需要决策者深入了解并提前布局。

Anthropic 据报道正以 600 亿美元估值融资高达 20 亿美元

Anthropic 据报道正以 600 亿美元估值融资高达 20 亿美元

据报道,人工智能公司 Anthropic 正寻求融资 20 亿美元,估值或达 600 亿美元,是去年估值的三倍多。该公司开发的 Claude 大语言模型在性能测试中表现出色,年化经常性收入达 8.75 亿美元。此轮融资或将支持更先进模型的开发,并应对基础设施成本上升的挑战。

AI 工作同事来临:技术巨头争霸 2025

AI 工作同事来临:技术巨头争霸 2025

OpenAI创始人Sam Altman预测,到2025年AGI(通用人工智能)将实现,AI将加入劳动力大军,彻底改变企业运作方式。然而,这一大胆预测引发争议。虽然AGI短期内难以实现,但AI确实将以各种形式融入工作场景。微软、Salesforce等巨头凭借数据和用户优势占据有利地位,OpenAI则专注于提升AI推理能力。未来企业需要重视员工AI培训,以适应这场科技变革。

生成式 AI 和大语言模型即将实现近乎无限内存带来的惊人可能性

生成式 AI 和大语言模型即将实现近乎无限内存带来的惊人可能性

本文探讨了生成式 AI 和大语言模型 (LLMs) 即将实现的近乎无限记忆能力这一重大突破。通过新的架构设计,AI 系统将能够存储和检索几乎无限量的对话历史,实现持续性的上下文理解和个性化交互。这项技术将彻底改变 AI 的应用方式,但同时也带来了隐私保护等方面的挑战。

基于Gemini!Waymo提出端到端自动驾驶多模态模型EMMA!

基于Gemini!Waymo提出端到端自动驾驶多模态模型EMMA!

我们介绍了EMMA,一个端到端的自动驾驶多模态模型。基于多模态大型语言模型的基础,EMMA直接将原始相机传感器数据映射到各种特定于驾驶的输出中,包括规划器轨迹、感知对象和道路图元素。EMMA通过将所有非传感器输入(例如导航指令和自我车辆状态)和输出(例如轨迹和3D位置)表示为自然语言文本,最大化了预训练大型语言模型的世界知识效用。

比GPT-4强100倍!OpenAI将在12月发布新模型—猎户座

比GPT-4强100倍!OpenAI将在12月发布新模型—猎户座

专业社区关注大语言模型(LLM)如微软&OpenAI、百度文心一言、讯飞星火的发展。OpenAI计划推出性能远超GPT-4的Orion模型,但首席执行官Sam Altman否认相关消息。网友质疑Sam的辟谣,认为Orion项目的存在已被暗示。微软可能在Azure云上提供Orion服务。Sam的推文和ChatGPT-o1的解读进一步加深了Orion即将发布的猜测。

LangGraph,知多少?

LangGraph,知多少?

LangGraph是LangChain生态系统的新框架,专为构建基于大语言模型的有状态、多代理应用程序而设计。它支持循环流程,提供精细的控制能力,具备持久性特性,并能与人类协作。LangGraph适用于个人助理、AI教师、软件用户体验优化、空间计算和构建智能操作系统等多种场景。

18款用于客户服务的生成式人工智能工具

18款用于客户服务的生成式人工智能工具

生成式人工智能在企业中的一个突出用例就是客户服务和支持。大多数读者可能都曾作为客户经历过与传统自动客服系统打交道的沮丧。但这种情况正在发生变化,这要归功于时下强大的大型语言模型和自然语言聊天机器人。虽然有报告显示,我们在处理复杂或敏感的咨询时仍然更愿意与人类交谈,但在提供简单的帮助时,机器人的能力已经越来越强了。

温布尔登网球公开赛为粉丝提供了哪些生成式AI体验

温布尔登网球公开赛为粉丝提供了哪些生成式AI体验

过去30多年来,AELTC一直与IBM合作。作为其主要技术合作伙伴,蓝色巨人也将此作为最新技术的展示良机,每年都会增添新的内容与形式。而在2024年这转折性的一年,闪亮登场的自然是技术界的绝对明星、当今时代的至高母题——生成式AI。

代码吟游诗人:Claude 3.5 Sonnet 如何奏响 AI 应用的全新乐章?

代码吟游诗人:Claude 3.5 Sonnet 如何奏响 AI 应用的全新乐章?

当我们还在惊叹于 ChatGPT 引发的 AI 应用热潮时,技术迭代的巨轮却从未停止转动。Anthropic 新近推出的 Claude 3.5 Sonnet,如同一位技艺精湛的“代码吟游诗人”,以其在代码生成、视觉处理和推理能力方面的显著提升,再次将我们带到了 AI 应用的新疆域。

Google 据报道向 OpenAI 竞争对手 Anthropic 投资超 10 亿美元

Google 据报道向 OpenAI 竞争对手 Anthropic 投资超 10 亿美元

谷歌正在向人工智能公司Anthropic追加投资超10亿美元,总投资额已达30亿美元。Anthropic还将从其他投资者筹集20亿美元,估值可能达到600亿美元。该公司开发的Claude大语言模型在某些任务上据称优于GPT-4,并计划进一步提升模型能力和基础设施,以应对不断增长的需求。

2025 年 AI 预测:没有 AGI,但会出现"杀手级应用"

2025 年 AI 预测:没有 AGI,但会出现"杀手级应用"

本文是2025年AI预测系列的第一篇。尽管AGI和技术奇点引发了广泛讨论,但作者认为2025年不会出现AGI。相反,大型语言模型将找到其"杀手级应用"。文章分析了当前AI技术的局限性,预测2025年将出现更多专用AI解决方案,提高生产力并在某些领域超越人类表现,但这并不等同于AGI。作者呼吁关注AI的实际风险和机遇,而非陷入AGI争论。

人工智能教父:大语言模型并不是简单的词汇预测机器,具有理解能力,还有主观体验

人工智能教父:大语言模型并不是简单的词汇预测机器,具有理解能力,还有主观体验

大语言模型并不是简单的词汇预测机器,这些模型实际上具有理解它们所生成内容的能力。如果大语言模型只是简单地基于统计概率来预测下一个词汇,那么它们不可能在处理复杂问题时表现出色。