性能优化文章列表第1页-至顶网频道

2025-12-05

AWS发布Graviton5定制CPU，为云工作负载带来强劲性能

亚马逊云服务发布下一代定制芯片Graviton5，相比前代产品计算性能提升25%，同时保持高能效。新芯片配备五倍大容量L3缓存，网络带宽提升15%，存储带宽提升20%。基于Graviton5的M9g实例提供192核心密度，结合Nitro隔离引擎确保数学级安全保障。多家企业客户测试显示性能显著提升。

如何使用现有基础设施让数据做好AI准备

Hammerspace通过现有NVMe存储最大化GPU使用率。随着AI计算在混合云和多云环境中扩展，基础设施团队面临着加速洞察时间同时最大化GPU投资的压力。Hammerspace Tier 0将GPU服务器集群内的本地NVMe存储转换为超高速共享存储层，性能比传统网络存储提升10倍，减少检查点时间，提高GPU使用率，改善推理响应时间，无需额外存储系统，节省数百万美元成本。

当YOLO遇见团队合作：以色列科技学院让AI"分工协作"，目标检测准确率再创新高

以色列理工学院研究团队提出了一种将专家混合模型融入YOLOv9目标检测的创新方法。该方法让多个专门化的YOLOv9-T专家分工协作，通过智能路由器动态选择最适合的专家处理不同类型图像。实验显示，在COCO数据集上平均精度提升超过10%，在VisDrone数据集上提升近30%，证明了"分工合作"比单一模型更有效，为AI视觉系统提供了新思路。

Hammerspace凭借标准软件在IO500性能测试中实现突破

Hammerspace在IO500基准测试中取得突破，其标准Linux加NFS系统软件实现了HPC级性能，无需专有并行文件系统的复杂性。在SC25的10节点生产环境测试中排名第18位，这是NFS系统有史以来最快的结果。该公司使用标准Linux、上游NFSv4.2客户端和商用NVMe闪存实现了总分85.23的成绩，证明HPC级性能不再需要专有客户端或特殊文件系统。

AWS声称其DWDM转发器技术在云服务商中属首创

亚马逊云服务AWS声称成为首家成功开发并部署自研密集波分复用DWDM转发器技术的云服务商，可同时应用于城域网和长途网络。新版DWDM转发器相比前代产品带宽提升73%，功耗降低35%，故障率减半。该技术支持400公里城域连接和数千公里长途连接，为客户提供更快数据传输速度和更佳应用性能，同时保持成本不变。

Hammerspace发布v5.2数据平台软件，通过更快的元数据读取、更好的数据放置和扩展性优化提升AI数据访问性能。新版本IO500总分提升33.7%，总带宽翻倍，IOR-Hard-Read测试提升超800%。增加了Tier 0亲和性功能，支持GPU服务器本地存储访问，减少集群内网络流量。新增Oracle云支持、Kerberos认证和标签化NFS，提供更细粒度的访问控制。该软件将于12月正式发布。

人工智能

芯片技术

性能优化

2025-11-17

AMD双轮驱动：路线图与资金互促，收入持续提升

AMD首席执行官苏姿丰在纽约金融分析师日活动中表示，公司已准备好迎接AI浪潮并获得传统企业计算市场更多份额。AMD预计未来3-5年数据中心AI收入复合年增长率将超过80%，服务器CPU收入份额超过50%。公司2025年预期收入约340亿美元，其中数据中心业务160亿美元。MI400系列GPU采用2纳米工艺，Helios机架系统将提供强劲算力支持。

存储技术

对象存储

性能优化

2025-11-17

Quantum推出ActiveScale部分对象恢复功能显著提升磁带检索速度

Quantum为其ActiveScale磁带后端推出范围恢复功能，显著提升部分对象检索速度。客户现在只需恢复大型对象中所需的特定字节范围，而非重新激活整个文件，大幅缩短检索时间。软件更新还将小对象从冷存储或磁带层的读取性能提升五倍以上。这些更新使基于磁带的归档系统能够作为响应迅速、可查询的数据湖运行，专为AI、分析和高性能计算工作负载设计。

数据库技术

超融合基础设施

性能优化

2025-11-07

戴尔PowerFlex与Regatta数据库组合突破传统数据库局限性

戴尔白皮书评估显示，在PowerFlex系统上运行的Regatta数据库能够有效解决传统数据库在分片、复杂性、成本、性能和扩展性方面的固有限制。测试结果表明，事务处理达到近百万IOPS，分析工作负载中五个计算密集型查询展现线性可扩展性，流数据处理成功摄入十亿行数据，单个Kafka客户端的行插入速率超过每秒百万行。

人工智能

张量处理单元

性能优化

2025-11-07

谷歌Ironwood TPU对英伟达构成超预期威胁

谷歌最新一代Ironwood TPU v7加速器即将上市，在性能上已接近英伟达Blackwell GPU水平。每颗TPU提供4.6 petaFLOPS的FP8性能，配备192GB HBM3e内存。谷歌真正优势在于规模化能力，TPU pod最多可容纳9216颗芯片，理论上可扩展至40万颗加速器。采用3D环面拓扑和光学电路交换技术，在大规模计算集群方面具有独特优势。

人工智能

分布式计算

性能优化

2025-11-06

Perplexity展示如何在老旧GPU和AWS网络上高效运行大型AI模型

AI搜索提供商Perplexity开发了新的软件优化技术，让万亿参数大模型能在老旧、便宜的硬件上高效运行，包括使用亚马逊专有的弹性网络适配器。这项创新解决了大规模专家混合模型面临的内存和网络延迟挑战。研究显示，相比单节点配置，优化后的核心程序在多节点部署中实现了显著性能提升，使企业能更长时间利用现有硬件，或使用折扣云实例运行下一代前沿模型。

编程语言

性能优化

启动加速

2025-11-05

Python引入延迟导入机制显著提升程序启动速度

Python通过PEP 810提案正式引入惰性导入功能，允许程序延迟加载导入库直到实际需要时才执行，而非在启动时全部加载。该提案由指导委员会成员Pablo Salgado于10月3日提出并于11月3日获批。新功能采用选择性加入方式，保持向后兼容性的同时解决了社区长期面临的启动时间过长问题，标准化了当前分散的自定义解决方案。

WEKA携手英伟达BlueField-4 DPU推出NeuralMesh AI文件系统

人工智能

存储技术

性能优化

2025-10-31

WEKA携手英伟达BlueField-4 DPU推出NeuralMesh AI文件系统

WEKA的NeuralMesh高性能AI文件系统软件将在英伟达即将推出的BlueField-4 DPU上运行，实现完全无需x86控制处理器的闪存JBOD架构。BlueField-4 DPU配备Grace CPU和ConnectX-9网络，处理能力比BlueField-3提升6倍，支持800Gbps吞吐量。与传统CPU附加存储系统相比，该解决方案在智能AI工作流中可实现超过100倍的令牌/瓦特效率提升，为下一代AI工厂提供基础存储支持。

人工智能

注意力机制

性能优化

2025-10-23

新加坡国立大学提出SparseD：让AI文本生成速度提升50%的神奇加速器

新加坡国立大学研究团队开发出SparseD技术，针对扩散语言模型的注意力机制进行优化。通过发现并利用注意力头的个性化模式、跨步骤的模式稳定性以及早期生成阶段的关键性，实现了在保持文本质量的同时将生成速度提升最多50%，为长文本AI应用提供了重要技术突破。

人工智能

GPU计算

性能优化

2025-10-22

软件推动AI帕累托前沿超越硬件

英伟达CEO黄仁勋在GTC 2025大会上展示了AI推理吞吐量与响应时间之间的帕累托前沿曲线。数据显示，从Hopper H200到Blackwell B200系统，通过硬件升级和软件优化，性能提升达25倍。值得注意的是，在AI领域，硬件性能提升约2倍，而软件优化可带来额外5倍提升。英伟达在数周内通过软件优化实现了过去需要两年才能达到的5倍性能提升，证明软件在AI性能提升中发挥着更关键的作用。

Anthropic发布Claude Haiku 4.5：三分之一成本实现前沿模型性能

人工智能

自然语言处理

性能优化

2025-10-16

Anthropic发布Claude Haiku 4.5：三分之一成本实现前沿模型性能

Anthropic发布了Claude Haiku 4.5小型AI语言模型，性能接近五个月前的前沿模型Claude Sonnet 4，但成本降低三分之二，速度提升一倍以上。该模型在SWE-bench编程测试中得分73.3%，与Sonnet 4的72.7%相当。API定价为每百万输入令牌1美元，输出令牌5美元，远低于其他大型模型。新模型专为实时低延迟任务设计，可与Sonnet 4.5协同工作处理复杂编程任务。

人工智能

并行文件系统

性能优化

2025-10-16

高性能"孤儿"DAOS与Enakta Labs的复兴之路

DAOS是英特尔Optane时代的并行文件系统产品，现已被英特尔抛弃。Enakta Labs等DAOS基金会成员正在重新激活这一高性能系统。DAOS曾在2023年IO500测试中获得1.3TBps带宽的顶级成绩。作为开源并行文件系统，DAOS需要与Storage Scale、Lustre等成熟产品竞争。Enakta Labs正在商业化DAOS，推出基于其的Enakta数据平台产品，支持S3、SMB、NFS和PyTorch。该公司认为DAOS凭借卓越性能和开源特性，有望在新兴云服务商中获得采用。

Meta和Oracle采用英伟达Spectrum-X：以太网进入大型AI工厂时代

人工智能

网络技术

性能优化

2025-10-14

Meta和Oracle采用英伟达Spectrum-X：以太网进入大型AI工厂时代

在今年的开放计算项目峰会上，英伟达宣布Meta和Oracle将采用其Spectrum-X以太网平台，这是专为AI工作负载打造的系统，可将数百万GPU连接成统一架构。该平台专门为大规模AI工作负载设计，声称网络性能比传统以太网提升1.6倍。Meta将其集成到开放交换系统中，Oracle则用它构建千兆级AI工厂，标志着网络已成为AI时代的新操作系统。

人工智能

存储技术

性能优化

2025-10-10

忘记训练，在AI推理阶段寻找杀手级应用

大多数企业不会训练自己的AI模型，而是专注于将AI应用到生产环境和推理阶段。核心任务包括数据微调和管理。关键技术包括检索增强生成、向量数据库、AI提示重用和副驾驶功能，让用户能用自然语言查询企业信息。由于GPU硬件更新速度快且成本高昂，企业更倾向于租用云端GPU容量。真正的AI价值在于推理阶段快速整理数据并优化现有模型。

人工智能

芯片制造

性能优化

2025-10-10

英特尔发布Panther Lake笔记本处理器，预览288核服务器芯片

英特尔今日发布基于最新18A制造工艺的Panther Lake笔记本处理器系列，将在亚利桑那州新建的Fab 52工厂生产。该系列包含三款系统级芯片，最高配置拥有16核CPU和12核GPU。新处理器采用四芯片设计，集成神经处理单元，每秒可执行50万亿次运算。相比上代产品，CPU和GPU性能提升50%，能耗降低10%。英特尔还预览了即将推出的Clearwater Forest服务器处理器系列，最高配置288个E核心。

2025 re:Invent ：亚马逊云科技把Agentic AI生态梳理明白了

电子竞技瞬息万变，Team Liquid的“数据+AI”制胜秘籍

中国移动呼和浩特数据中心：只有高效存力先行，AI才能跑出全力

从“支撑工具”到“智能中枢”，AI原生ERP进化

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点: