中国"凌光"超级计算机在第67届TOP500排行榜中以2.198 exaflops的HPL成绩登顶,超越美国El Capitan约20%,成为自2017年神威太湖之光以来首个领跑全球的中国系统。凌光部署于深圳国家超算中心,采用国产灵昆平台、LX2处理器、灵启互联及麒麟操作系统。此次榜单全球算力总和达18.74 exaflops,较半年前提升约25%,目前已有五台E级超算投入运行。
NVIDIA在ISC大会上推出多款面向科学研究的AI软件,包括DAQIRI高性能网络库、ALCHEMI NIM微服务及即将推出的cuPhoton参考代码。这些工具将原本需要数小时乃至数天的CPU计算转化为实时GPU加速流水线。cuPhoton可将天文FITS数据处理速度提升14900倍;ALCHEMI支持化学与材料发现,Lila Sciences借助其实现材料筛选提速50倍;DAQIRI则助力CERN实时分析通常被丢弃的99%以上的碰撞数据。
Nvidia在ISC High Performance 2026大会上正式推出Vera Rubin平台,集成Vera CPU、Rubin GPU、NVLink-C2C互连及软件栈,构成机架级超级计算机。单机架支持144块GPU,可提供超7 exaflops AI算力及5 petaflops FP64双精度计算性能,内存带宽较上代Blackwell提升2.8倍。德国莱布尼茨超算中心、美国NERSC及洛斯阿拉莫斯国家实验室已宣布基于该平台部署新一代超算系统。
戴尔发布PowerEdge XE8812高端服务器,采用英伟达Vera Rubin NVL4架构,每机架最高支持144块GPU,是"戴尔AI工厂with英伟达"解决方案的核心。该服务器采用液冷设计,内存容量较上代提升50%,支持大型AI模型和HPC仿真全内存运行。戴尔表示,随着AI基础设施投资预计在2026年同比增长44%,该平台旨在满足企业级AI规模化部署需求。
高性能计算(HPC)与AI正加速融合,推动药物研发、气候建模等领域快速发展,但一个关键问题被忽视:如何信任AI在这些环境中产生的输出结果?HPC强调数值严谨性与可重复性,而AI本质上具有统计随机性,两者结合带来信任挑战。随着AI深度嵌入HPC工作流,验证能力正成为核心竞争力——尤其在医疗、金融、能源等高风险领域。模型漂移、数据质量、持续监控等问题表明,验证必须贯穿模型全生命周期。未来,能提供可信验证框架的HPC服务商将赢得市场先机。
墨尔本正凭借主权AI算力、超大规模数据中心扩张及密集的国际研究会议,构建起独特的研究创新生态。澳大利亚最大的高校AI超级计算机MAVERIC已在莫纳什大学落地,专为医疗研究、材料科学等数据密集型领域设计。与此同时,CDC、NEXTDC等机构正在墨尔本持续投入,预计本地主权数字容量将超800兆瓦。多所顶尖高校与188家AI企业聚集于此,使墨尔本成为亚太地区最具整合性的AI研究枢纽之一。
这项由普林斯顿大学计算机科学系主导的研究发表于2026年3月的arXiv平台,展示了如何用不到10美元的成本让AI代码助手自动生成高性能强化学习环境,实现了从1.5倍到22,320倍的惊人速度提升,彻底改变了传统需要专业工程师数月优化的现状,为强化学习研究的民主化和效率提升开辟了新道路。
英伟达将在下周的GTC大会上展示其200亿美元收购Groq后的技术整合成果。Groq的数据流架构擅长高延迟敏感场景,可实现每秒500-1000个token的生成速度,远超GPU架构。会议还将发布Rubin GPU详细信息,该芯片提供288GB HBM4内存和22TB/s带宽,性能比Blackwell提升5倍。此外,英伟达standalone Vera CPU、下一代Kyber机架系统以及机器人技术平台Isaac GR00T也将成为重点。
联想Yoga Pro 9i 16 Aura版凭借Core Ultra 9处理器和RTX 5050显卡的强力组合,为创作者和生产力用户提供出色性能。该机配备16英寸2.8K OLED触摸屏,显示效果极佳,支持100% sRGB和94% Adobe RGB色域。机身厚度仅0.75英寸,重4.52磅,散热设计出色,运行时保持安静。售价1950美元,性价比突出,是创作者的理想选择。
AI和机器学习推动高性能计算爆发式增长,计算密度从过去的每机架10-20千瓦飙升至100千瓦甚至200千瓦,传统空气冷却系统已无法应对。混合冷却成为最实用的解决方案。绿地新建数据中心可从零开始设计,融入创新热回收系统和液冷技术,实现最优布局和可扩展性,但建设周期长、成本高。棕地改造成本降低30-50%,部署更快,但受现有基础设施限制。混合策略将高密度液冷集群与传统空冷系统分区管理,在保证运营连续性的同时为未来转型做好准备。
英伟达在新一代Rubin GPU中采用FP64模拟技术,通过软件模拟在CUDA库中实现高达200 teraFLOPS的FP64矩阵性能,比硬件性能提升4.4倍。该技术基于Ozaki方案,将FP64运算分解为多个INT8操作。然而AMD质疑其准确性和IEEE合规性,认为在实际科学仿真中表现不佳。FP64模拟仅适用于矩阵密集型应用,对60-70%的HPC工作负载效果有限,且存在内存消耗增加等问题。
英伟达与制药巨头礼来制药宣布合作,将在未来五年内投资高达10亿美元建立研究实验室,推进AI辅助药物发现的基础模型开发。该合作实验室位于旧金山湾区,将使用英伟达的BioNeMo软件平台和Vera Rubin加速器,汇集礼来的顶尖生物学家、化学家与英伟达的软件工程师共同工作。实验室将创建AI软件与机器人硬件全天候对话的环境,大幅提升科学家生产力。除药物发现外,还将探索AI在临床开发、制造和商业运营中的应用。
尽管多名Lustre高级工程师从DDN离职成立咨询公司Lustre Collective,DDN仍坚持其基于Lustre的EXAScaler平行文件系统的核心地位。DDN表示,EXAScaler与对象存储软件Infinia是互补而非竞争关系。EXAScaler在高性能计算和AI训练中表现优异,速度比市场其他产品快17倍,是Google Managed Lustre服务的基础。Infinia专注于AI管道的数据管理,两者在统一控制平面下协同工作。
AMD与HPE宣布扩大合作,共同开发下一代开放式可扩展人工智能基础设施。HPE将成为首批采用AMD Helios机架规模AI架构的系统供应商,该架构整合了AMD EPYC处理器、Instinct GPU、Pensando网络技术和ROCm开源软件栈。Helios平台每机架可提供2.9 exaFLOPS的FP4性能,采用开放机架宽设计标准,旨在简化大规模AI集群部署。HPE计划2026年全球推出该解决方案。
联想第二财季营收204.5亿美元,同比增长14.6%。AI相关收入占总营收30%,达61.4亿美元,较去年同期翻倍增长。然而基础设施解决方案集团(ISG)尽管收入增长23.7%至40.9亿美元,仍亏损3200万美元。云服务商业务虽增长21%但利润微薄,企业市场表现更佳。十年来ISG累计销售超840亿美元却总计亏损19.5亿美元,反映出AI和HPC市场高需求但低盈利的困境。
并行文件系统在高性能计算中至关重要,为数千个计算节点提供高聚合I/O带宽和低延迟访问。系统分为分条型和非分条型:非分条型在单节点存储文件,元数据负担较轻;分条型将文件分片存储到不同节点,需维护分条映射信息。Dell Project Lightning项目通过专有客户端驱动实现极致并行性能。
英伟达第三季度营收达570亿美元,其中数据中心业务贡献510亿美元,同比增长66%。CEO黄仁勋表示,AI推理需求因预训练、后训练和推理能力的进步而呈指数级增长。NVLink AI网络基础设施业务增长162%,营收82亿美元。公司专注于功耗比优化以降低数据中心运营成本。尽管中国市场受地缘政治影响,但英伟达致力于在全球AI计算领域保持领导地位。
本周在圣路易斯举办的SC25超级计算大会上,多家科技巨头发布了面向AI热潮的高性能计算产品。英伟达推出Apollo物理仿真AI模型和两套基于Grace-Blackwell架构的RIKEN超级计算机。戴尔发布AMD Instinct驱动的XE9785服务器和英特尔R770AP服务器,以及两款新交换机。法国与AMD合作建设首台百亿亿次超级计算机Alice Recoque,预算6.4亿美元,将成为欧洲第二台百亿亿次系统。
分布式计算初创公司Taho完成350万美元种子轮融资,目标是替代Kubernetes成为人工智能工作负载的主要编排和调度层。该公司由来自Meta、谷歌和Snap的基础设施资深人员创建,声称其计算框架可将工作负载处理时间提升最多100%,同时大幅降低成本。Taho开发了高性能联邦计算框架,通过替换复杂的基础设施软件来提高AI硬件效率。
VDURA数据平台第12版本通过扩展元数据计算、添加系统级快照功能和支持叠瓦磁记录硬盘来降低每TB成本。新版本引入弹性元数据引擎,可动态扩展元数据节点,将元数据操作性能提升最多20倍。快照功能支持即时的节省空间的数据集时点副本。SMR硬盘支持通过智能写入放置引擎,在不影响吞吐量的情况下每机架增加25-30%容量。