近日,英伟达GTC China 2018大会在苏州召开,众多业界权威专家及从业者参与了本次活动,并就深度学习与AI领域的多个话题展开了深入交流。作为数字化解决方案领导者,新华三出席了本次大会并展示了适用于AI和深度学习工作负载的GPU服务器产品。大会上,英伟达表示包括新华三在内的中国领先的服务器制造商将推出一系列基于NVIDIA 最新发布的NVIDIA T4 GPU 的服务器,T4 基于全新 TuringTM 架构,采用多精度Turing Tensor Core和全新RT Core,与加速的容器化软件堆栈相结合,提供规模空前的性能。

人工智能的突破式进展正在拓展全新的市场空间,同时也在为传统行业业务创新与重塑创造新的变革机遇。据国际权威咨询机构IDC报告显示,2018年全球“认知和人工智能系统”的支出预计将超过240亿美元,到2020年将超过776亿美元,年复合增长率超过37.3%。具备出色并行计算性能的GPU正在成为运载AI应用的绝佳平台。大会上,新华三展示了最新的适用于AI工作负载的计算系统——H3C UniServer R5200 G3服务器以及HPE Apollo 6500 Gen10系统。

H3C UniServer R5200G3服务器是针对人工智能和高性能计算领域定制开发的新一代GPU服务器,采用标准的4U机架式服务器,最大可配置10颗双宽GPU或20颗单宽GPU,拥有超强的计算能力,同时针对GPU计算特点优化设计了CPU/GPU通信链路,可以帮助用户获得最佳性能体验。
HPE Apollo 6500 Gen10系统拥有8个GPU,能够为GPU密集型工作负载提供高达125 TFLOPs2的单精度计算。这一平台专为加速计算而构建,PCIe和NVLINK GPU互连,可灵活应对各种要求。
新华三集团工业标准服务器产品部总经理刘宏程表示:“新华三在服务器领域拥有多年的产品设计与研发经验,曾多次引领计算架构的创新与变革。英伟达同样正以前沿的技术、产品拓展人工智能计算性能边界。在AI迈入成熟商用的新时代,新华三将与英伟达携手创新,共同加速人工智能与深度学习底层硬件架构的创新突破,以算力升级优化AI应用体验,让更智能的未来世界加速到来。”
关于新华三
新华三集团(简称新华三)是业界领先的数字化解决方案领导者,致力于成为帮助客户业务创新、数字化转型最可信赖的合作伙伴。新华三拥有计算、存储、网络、安全等完整的数字化基础设施提供能力,能够提供云计算、大数据、大互联、大安全、大安防、物联网、边缘计算、人工智能、区块链等全面的数字化解决方案。同时,新华三也是HPE®品牌的服务器、存储和技术服务的中国独家提供商。
好文章,需要你的鼓励
CPU架构讨论常聚焦于不同指令集的竞争,但实际上在单一系统中使用多种CPU架构已成常态。x86、Arm和RISC-V各有优劣,AI技术的兴起更推动了对性能功耗比的极致需求。当前x86仍主导PC和服务器市场,Arm凭借庞大生态系统在移动和嵌入式领域领先,RISC-V作为开源架构展现巨大潜力。未来芯片设计将更多采用异构计算,多种架构协同工作成为趋势。
KAIST AI团队通过深入分析视频生成AI的内部机制,发现了负责交互理解的关键层,并开发出MATRIX框架来专门优化这些层。该技术通过语义定位对齐和语义传播对齐两个组件,显著提升了AI对"谁对谁做了什么"的理解能力,在交互准确性上提升约30%,为AI视频生成的实用化应用奠定了重要基础。
Vast Data与云计算公司CoreWeave签署了价值11.7亿美元的多年期软件许可协议,这标志着AI基础设施存储市场的重要转折点。该协议涵盖Vast Data的通用存储层及高级数据平台服务,将帮助CoreWeave提供更全面的AI服务。业内专家认为,随着AI集群规模不断扩大,存储系统在AI基础设施中的占比可能从目前的1.9%提升至3-5%,未来五年全球AI存储市场规模将达到900亿至2000亿美元。
乔治亚理工学院和微软研究团队提出了NorMuon优化器,通过结合Muon的正交化技术与神经元级自适应学习率,在1.1B参数模型上实现了21.74%的训练效率提升。该方法同时保持了Muon的内存优势,相比Adam节省约50%内存使用量,并开发了高效的FSDP2分布式实现,为大规模AI模型训练提供了实用的优化方案。