性能优化 关键字列表
Voltron Data力推AMD,为GPU加速SQL注入新动力

Voltron Data力推AMD,为GPU加速SQL注入新动力

Voltron Data宣布其加速SQL引擎Theseus将支持AMD Instinct GPU,这标志着英伟达CUDA护城河正在变浅。Theseus使用GPU加速SQL查询,能高速处理大量数据。随着企业寻求利用AI,快速处理大量数据变得越来越重要。AMD投入大量资源构建开源软件栈以缩小与英伟达的差距,最新版本基于AMD的hipDF库。早期基准测试显示AMD平台性能表现良好,生产支持预计今年底推出。

GSO:用于评估SWE-Agent的挑战性软件优化任务基准

GSO:用于评估SWE-Agent的挑战性软件优化任务基准

这篇论文介绍了GSO(Global Software Optimization),一个用于评估大语言模型在软件性能优化任务中能力的基准测试。研究团队从真实代码库中提取了102个优化任务,涵盖10个代码库和多种编程语言。实验结果显示,即使最先进的AI编程助手在这些任务上的成功率也低于5%,表明软件优化对当前模型仍是巨大挑战。研究分析了失败模式,包括低级语言处理困难、懒惰优化策略和瓶颈定位不准确等问题,为未来研究提供了明确方向。

OpenAI 表示 GPT-4.1 模型现已在 ChatGPT 中上线

OpenAI 表示 GPT-4.1 模型现已在 ChatGPT 中上线

OpenAI 按用户需求在 ChatGPT 推出全新 GPT-4.1 及其 mini 与 nano 版本,专注提升编程、指令理解与长文本处理能力,免费及付费用户均可体验。

MediaTek 推出高端新品:Kompanio Ultra 和 Dimensity 9400+

MediaTek 推出高端新品:Kompanio Ultra 和 Dimensity 9400+

联发科最近发布了新款高端芯片 Kompanio Ultra 和天玑 9400+,进一步完善其产品线。Kompanio Ultra 为 Chromebook 带来全新性能水平,天玑 9400+ 则在天玑 9400 基础上小幅提升。这些产品强化了联发科在智能手机和 Chromebook 市场的竞争力,同时展示了公司在 AI 和高性能计算领域的持续发力。

中国燕融将 KVCache 集成到文件系统以加速 AI 推理

中国燕融将 KVCache 集成到文件系统以加速 AI 推理

中国存储软件供应商燕融科技将KVCache整合到其文件系统中,显著提升了KV缓存命中率和长上下文处理能力,降低了AI推理成本。通过在GPU服务器集群中部署分布式内存层存储元数据,燕融的YRCloudFile系统实现了高并发查询吞吐量,为推理工作负载带来了明显的性能提升。测试结果显示,该技术在首个令牌生成时间和并发查询支持方面均有数倍的改进。

Google 推出第七代 Ironwood TPU 芯片,借助 AI 进行性能对比

Google 推出第七代 Ironwood TPU 芯片,借助 AI 进行性能对比

Google宣布第七代张量处理单元(TPU)芯片即将向云客户开放租用,可提供256或9216芯片的集群。新一代TPU在内存带宽、算力和能效方面都有显著提升,专为大语言模型推理设计,每个芯片具有192GB高带宽内存。Google称9216芯片集群的AI算力可达42.5 exaFLOPS,远超现有超级计算机。

联发科发布新芯片,使 Chromebook 具备 AI 助手运行能力

联发科发布新芯片,使 Chromebook 具备 AI 助手运行能力

MediaTek 推出新一代 Kompanio Ultra 芯片,专为 Chromebook 设计。这款芯片不仅提升了性能和电池续航,更重要的是增强了生成式 AI 能力,使得价格亲民的 ChromeOS 笔记本电脑也能运行先进的 AI 助手。MediaTek 与 Google 密切合作,确保新芯片能充分发挥 Chromebook Plus 设备的下一代 AI 功能。

Nvidia 新推出的工具让本地 AI 计算变得轻而易举

Nvidia 新推出的工具让本地 AI 计算变得轻而易举

Nvidia 推出全新 AI 工具套件 NIM 微服务,让拥有 RTX 显卡的用户能够在本地轻松运行 AI 模型。这套工具支持文本、图像和代码生成等多种功能,不仅可以节省长期使用成本,还能确保数据安全性。该举措体现了 AI 本地化运算的发展趋势,也展示了 Nvidia 在 AI 领域的领导地位。

AMD 发布第五代 Epyc 嵌入式处理器,面向网络、存储和工业边缘领域

AMD 发布第五代 Epyc 嵌入式处理器,面向网络、存储和工业边缘领域

AMD 发布第五代 Epyc 嵌入式处理器,采用 Zen 5 架构,专为网络、存储和工业边缘计算优化。新处理器在性能、能效和嵌入式特性方面均有提升,可支持高达 192 核心,内存容量达 6TB,并提供 7 年产品制造支持。多家行业合作伙伴已开始采用这一新产品。

Meta 通过 eBPF 技术实现服务器计算效率提升 20%

Meta 通过 eBPF 技术实现服务器计算效率提升 20%

Meta公司通过使用基于eBPF的Strobelight性能分析套件,成功将其主要服务的CPU使用率降低20%。这一成果不仅大幅减少了服务器需求,还展示了eBPF在系统优化和效率提升方面的巨大潜力。eBPF作为一种创新技术,正在revolutionizing操作系统内核级编程,为企业带来显著的性能提升和成本节约。

M3 Ultra GPU 性能对比 M4 Max:究竟快多少?

M3 Ultra GPU 性能对比 M4 Max:究竟快多少?

Apple 最新推出的 M3 Ultra 芯片 GPU 性能表现出色,比 M4 Max 快 38%,比上一代 M2 Ultra 快 16%。在 Metal 测试中得分高达 259668。CPU 性能方面,M3 Ultra 多核性能小幅领先 M4 Max 8%。新款 Mac Studio 已开启预订,将于 3 月 12 日正式发售。

OpenAI 的 GPT-4.5 AI 模型向更多 ChatGPT 用户开放

OpenAI 的 GPT-4.5 AI 模型向更多 ChatGPT 用户开放

OpenAI 已开始向其 ChatGPT Plus 用户推出最新的 AI 模型 GPT-4.5。OpenAI 在 X 平台上发布的一系列帖子中表示,此次推出将持续“1-3 天”,并预计速率限制会有所变化。

PEAK:AIO AI 数据服务器性能峰值达到 120 GBps

PEAK:AIO AI 数据服务器性能峰值达到 120 GBps

PEAK:AIO推出了一款新的2RU 1.5 PB AI 数据服务器产品,使用戴尔硬件,数据传输速率达到120 GBps。PEAK:AIO是一家专注于人工智能的英国存储初创公司,提供基于第三方硬件的软件定义存储,密切管理和控制以降低延迟并提高吞吐量。其2RU服务器已为中型GPU集群提供40 GBps的传输速率,现可实现三倍的速度。

ChatGPT 4.5 震撼发布:更大、更智能,但也更贵

ChatGPT 4.5 震撼发布:更大、更智能,但也更贵

OpenAI 最近推出了 GPT-4.5,这款新模型在准确性测试中表现优于之前的版本,能够更好地理解细微差别。尽管面临 GPU 短缺的挑战,OpenAI 仍然致力于将这一模型推向市场,并计划在未来推出更先进的推理能力模型。

新型 AI 文本扩散模型突破速度瓶颈,从噪声中提取文字

新型 AI 文本扩散模型突破速度瓶颈,从噪声中提取文字

Inception Labs 于周四发布了 Mercury Coder,这是一种新的 AI 语言模型,利用扩散技术比传统模型更快地生成文本。与逐字生成文本的传统模型(如 ChatGPT)不同,基于扩散的模型(如 Mercury)能够同时生成完整的响应,并将其从最初的遮蔽状态逐步精炼为连贯的文本。

Inception 从秘密研发中推出新型 AI 模型

Inception 从秘密研发中推出新型 AI 模型

Inception是一家位于帕洛阿尔托的新公司,由斯坦福大学计算机科学教授Stefano Ermon创立,声称开发了一种基于“扩散”技术的新型AI模型,称为扩散基础的大型语言模型(DLM)。目前备受关注的生成AI模型大致可分为两类:大型语言模型(LLMs)和扩散模型。Inception的模型结合了传统LLMs的功能,如代码生成和问答,但性能显著更快,计算成本更低。

Qualcomm 和诺基亚贝尔实验室展示多供应商 AI 模型如何在无线网络中协同工作

Qualcomm 和诺基亚贝尔实验室展示多供应商 AI 模型如何在无线网络中协同工作

高通和诺基亚贝尔实验室成功展示了多厂商AI模型在无线网络中的互操作性。通过序列学习技术,他们实现了编码器和解码器模型的无缝协作,提高了网络效率和用户体验。这项突破性成果为AI在无线通信领域的应用开辟了新的可能性,有望显著提升网络容量、可靠性和能源效率。

GenAI 时代的计算引擎策略

GenAI 时代的计算引擎策略

随着生成式人工智能和 GPU 加速 AI 训练与推理的兴起,数据中心仍需关注 CPU 的重要性。现代化 CPU 不仅可以提升传统工作负载性能,还能帮助企业为昂贵的 AI 基础设施投资节省成本。高性能 CPU 可以显著提升 AI 推理和训练效率,同时在某些场景下直接运行 AI 算法。企业应考虑采用单插槽服务器等创新方案,以优化数据中心架构。

英特尔推出搭载性能核心的至强 6 处理器,AI 处理性能提升两倍

英特尔推出搭载性能核心的至强 6 处理器,AI 处理性能提升两倍

Intel 发布新一代 Xeon 6 处理器,采用性能核心设计,大幅提升数据中心工作负载性能,AI 处理性能最高提升 2 倍。新处理器还集成了 vRAN Boost 技术,可将无线接入网络处理能力提升至 2.4 倍。此次发布对 Intel 重塑市场地位至关重要,公司希望通过技术创新和美国芯片法案支持,重振昔日辉煌。

Voltron Data 与埃森哲合作,解决 AI 领域最棘手的难题之一

Voltron Data 与埃森哲合作,解决 AI 领域最棘手的难题之一

Voltron Data 与埃森哲建立战略合作,推出 GPU 加速分析引擎 Theseus,旨在解决 AI 数据处理的瓶颈问题。该技术能以更快速度处理海量数据,显著提升 AI 项目效率,降低基础设施成本。这一合作将帮助企业应对 AI 带来的数据处理挑战,为金融、零售等行业带来巨大价值。