是德科技高级副总裁兼通信解决方案事业部总裁Kailash Narayanan现场指出,算力固然重要,但如果能耗过高,技术的实用性将大打折扣,因此,所有的高速、高性能计算,都必须在极低的功耗下实现,这是AI等技术能否大规模落地的核心前提。
正如是德科技高级副总裁兼通信解决方案事业部总裁Kailash Narayanan现场指出,算力固然重要,但如果能耗过高,技术的实用性将大打折扣,因此,所有的高速、高性能计算,都必须在极低的功耗下实现,这是AI等技术能否大规模落地的核心前提。
Graid公司专注于英伟达GPU驱动的RAID卡技术,推出包括企业级和工作站版本在内的SupremeRAID产品线。该公司2024年营收翻倍,出货约5000张卡片,预计2025年增长60%。产品路线图涵盖桌面简化版、AI版本、HPC版本等五个组件,支持NVMe RAID并提供企业级数据保护。AI版本支持GPUDirect直接传输,HPC版本针对BeeGFS等环境优化。
VAST Data将为Doudna超级计算机提供专注于AI的存储系统,与IBM Storage Scale共同承担存储任务。Doudna是NERSC-10超级计算机,由劳伦斯伯克利国家实验室运营,计算性能比前代系统提升10倍,存储性能提升5倍。该系统采用双存储架构:VAST Data的AIOS负责AI工作负载,IBM Storage Scale处理传统HPC需求。这标志着VAST成功进入HPC并行文件系统领域的重要突破。
VDURA公司完成重大转型,将自己定位为与DDN、VAST Data和WEKA并列的AI和HPC高性能存储解决方案提供商。该公司全面改造了原有PanFS软件,推出基于微服务架构的VDP数据平台,结合并行文件系统的稳定性能与对象存储的弹性和成本效益。新平台采用统一命名空间和单一控制平面,支持分层闪存-磁盘架构。在美国联邦项目竞标中,VDURA凭借优异的性能和TCO击败竞争对手,证明了其在AI/HPC存储基础设施领域的竞争实力。
PCI特殊兴趣小组(PCI-SIG)正式发布PCIe 7.0规范,带宽再次翻倍达到128 GTps原始传输速率,在x16通道配置下可实现高达512 GBps双向带宽。相比2022年发布的PCIe 6.0的256 GBps,性能提升一倍。该技术主要面向800 Gbps以太网适配器、高性能计算和机器学习等高吞吐量应用。同时,PCI-SIG首次推出基于光纤链路的PCIe标准,并已开始PCIe 8.0规范的前期研发工作。
Sandia国家实验室与SpiNNcloud合作推出的SpiNNaker2类脑超级计算机,依靠48芯片高并行架构及高速SRAM/DRAM通信,无需GPU或内置存储,适用于国防及前沿计算任务。
Atos 正在重组,法国政府已确认以4.1亿欧元收购其 Eviden 子公司先进计算业务(不含 Vision AI 部分),该业务涵盖 HPC、量子计算及 AI 部门,预计2025年营收约8亿欧元,此举将为 Atos 提供急需流动资金。
这项研究提出了一种加速TarFlow图像生成模型采样过程的方法。研究人员发现TarFlow中的块具有不同重要性:少数块在图像生成中起主要作用,而其他块贡献较小;有些块对初始值敏感,其他块则相对稳健。基于此,他们提出了收敛排名指标(CRM)和初始猜测指标(IGM),并开发了高斯-赛德尔-雅可比迭代方法。实验表明,该方法在四种TarFlow模型上实现了2.51-5.32倍的加速,同时保持图像质量。这一技术为高效AI图像生成提供了重要解决方案。
该文探讨企业如何利用超级计算推动 AI 项目落地。HPE 高性能计算及 AI 基础设施负责人表示,密集计算、扩展架构与液冷技术正助力大规模数据中心建设,亚太区增长迅猛,但高投入、能耗和人才短缺仍是严峻考验。
文章阐述了数据中心由传统向多样化转型,着重介绍了Intel Xeon 6 CPU采用P核与E核双架构,在AI、高性能计算及云边端场景中实现高效节能的创新应用。
本文比较了谷歌“铁木” TPU Pod 与传统HPC系统(如“El Capitan”和“Aurora”)在性能和成本上的表现。文章指出,尽管设计目标不同,但美国能源部通过优惠合作,实现了更优的性价比,而谷歌的比较存在误导。
Rescale是一家数字工程平台公司,刚获得1.15亿美元D轮融资,用于开发AI驱动的工程工具。该公司通过"AI物理学"技术将传统需要数天的模拟计算缩短至秒级,已吸引包括贝佐斯、奥特曼等知名投资者支持。Rescale源于创始人在波音787研发中遇到的计算资源挑战,现已服务通用汽车等企业客户。
随着 AI 应用的加速发展,企业面临着超越原始计算能力的瓶颈。AMD 提供智能高效的定制计算解决方案,从数据中心 AI 训练到企业自动化,帮助组织无缝部署和扩展计算基础设施。通过现代化数据中心、开源软件栈 ROCm 以及全面的硬件产品组合,AMD 正在推动 AI 创新发展,为企业提供最佳性能和效率的解决方案。
AMD 发布第五代 Epyc 嵌入式处理器,采用 Zen 5 架构,专为网络、存储和工业边缘计算优化。新处理器在性能、能效和嵌入式特性方面均有提升,可支持高达 192 核心,内存容量达 6TB,并提供 7 年产品制造支持。多家行业合作伙伴已开始采用这一新产品。
VDURA是一家高性能计算和人工智能并行文件系统存储供应商,最近在其V5000硬件架构平台上增加了一个高容量全闪存存储节点。V5000于三个月前推出,配备了中央瘦型(1RU)控制节点,控制混合闪存+磁盘存储节点。新推出的全闪存F节点是一个1RU服务器机箱,最多可容纳12个128 TB NVMe QLC SSD,提供1.536 PB的原始容量。VDURA的首席执行官Ken Claffey表示,AI工作负载需要持续的高性能和可靠性,因此V5000不仅能达到最高速度,还能在硬件故障的情况下保持这些速度。
VDURA 将在即将举行的能源高性能计算会议上展示其新一代数据平台。该平台旨在通过更快的数据处理、更高的数据持久性和更易用的混合环境,加速能源行业创新。VDURA 的混合架构结合了 HDD 和 SSD 的优势,为能源公司提供了优化运营成本和工作负载速度的解决方案。
微软推出 Copilot+ PC 标准,要求配备高性能 NPU,引发 AI PC 市场格局变化。英伟达虽在数据中心 AI 领域占主导,但在 PC 端面临挑战。文章分析了英伟达的 AI PC 策略、NPU 与 GPU 的竞争关系,以及未来 GPU 可能在 Copilot+ 功能中发挥作用的前景。
DDN获得3亿美元投资,计划将其在超级计算领域的领先优势转化为AI存储解决方案。该公司正在调整其高性能计算产品线以适应AI工作负载的需求,并承诺将于2月20日发布重大公告。这笔投资反映了AI基础设施市场的快速增长和投资热潮。
Panmnesia 开发的 GPU 内存扩展方案荣获 CES 创新奖。该技术通过 CXL 技术将外部内存快速接入 GPU 统一虚拟内存空间,有效解决大规模 AI 训练中 GPU 内存不足的问题,显著降低 AI 基础设施成本。该方案比传统方法延迟更低,引起了 AI 数据中心行业的广泛关注。