至顶网CIO与应用频道 08月25日 北京消息:随着通信和互联网产业的快速发展,FPGA作为高性能计算加速器在大数据、深度学习、图像视频处理、基因计算、金融分析和加解密等众多领域得到广泛应用,市场空间巨大。
传统FPGA开发模式存在无法解决的问题:开发者需花费大量费用和人力调试专用硬件环境、加速部件、购买开发工具license、搭建开发和测试环境等,通常这些投资属于一次性支出,导致开发成本高,集成难度大;FPGA开发环境封闭,无法有效利用业界先进的经验和成熟IP,开发效率和质量难以保证,加速功能交付周期长;由于缺少专业技术团队支持,开发者门槛较高,运维成本高,限制了FPGA广泛应用。
图1 华为FPGA加速云服务器实现“硬用”高效上云
如图1所示,华为推出全新一代FPGA加速云服务器,解决传统FPGA方案一系列痛点问题,提供面向多个行业应用的开发套件,大幅提升开发效率,保证软件质量,支持一键式申请开发资源“按需取用”,最大程度保护用户投资,实现FPGA加速业务的快速交付、快速部署和弹性伸缩。极高性价比、全套工具链、丰富IP应用,以及灵活多样的合作模式,使得华为FPGA加速云服务器成为同类中的翘楚。
厚积薄发,十五年磨一剑
如图2所示,华为作为业界领先的解决方案和云服务提供商,在过去的十五年间,充分利用FPGA技术构建差异化竞争力,在电信领域采用专有硬件实现与业务深度融合,提供业界最佳性价比的软硬件一体机;在NFV领域率先发布软硬件解耦云化架构,通过FPGA实现网络协议加解密和压缩的硬件加速,用户面性能提升2~5倍;在云场景下,华为FPGA硬件加速在图片分类、视频编解码、5G无线仿真和算法加速等领域已得到广泛商用。
图2华为推动FPGA产业发展成功实践
极致高性价比,一览众山小
华为FPGA加速云服务器硬件平台单物理节点包含8片Xilinx 16nm Virtex UltraScale Plus VU9P FPGA,如图3所示,每片FPGA含约250万逻辑单元、约6800个DSP、外挂64G Bytes@2133Mhz的 DDR4。FPGA通过PCIe Gen3X16接口和CPU连接,速率可达100Gbps,任意两片FPGA之间通过光互联网络连接,速率高达200Gbps,满足大量数据流传输,可为机器学习等大型加速应用提供更低的时延。
图3 华为FPGA加速云服务器硬件架构图
更丰富IP,开发更简,上线更快
在提供硬件开发套件(HDK)和软件开发套件(SDK)的基础上,华为首次把十多年积累的FPGA行业开发工具放到云端,为云上开发者提供专业逻辑设计组件、仿真平台和系列自动化平台及脚本,简化云上开发流程,降低用户使用门槛,真正做到一键式FPGA开发环境,让FPGA开发更便捷。
华为提供多年积累的丰富IP库,覆盖媒体、AI、网络处理和大数据等核心应用,用户直接通过华为云Marketplace选择使用,快速构建和部署基于FPGA硬件加速器的应用,实现所想即所得的加速组件服务。
合作模式灵活多样,与伙伴共赢成长
华为致力于提供从硬件、工具链和云OS全面技术支持,定制合作模式以充分发挥合作伙伴商业优势。目前华为联合30多家合作伙伴推出FPGA云加速服务解决方案已覆盖基因测序、视频编解码、金融风控、人工智能、图片处理和大数据分析等领域,面向更多行业提供高性价比可重构加速解决方案。
更多期待,请继续关注华为FPGA加速云服务器“硬用上云”专题报道。
FACS链接:http://www.hwclouds.com/product/facs.html
好文章,需要你的鼓励
AI颠覆预计将在2026年持续,推动企业适应不断演进的技术并扩大规模。国际奥委会、Moderna和Sportradar的领导者在纽约路透社峰会上分享了他们的AI策略。讨论焦点包括自建AI与购买第三方资源的选择,AI在内部流程优化和外部产品开发中的应用,以及小型模型在日常应用中的潜力。专家建议,企业应将AI建设融入企业文化,以创新而非成本节约为驱动力。
字节跳动等机构联合发布GAR技术,让AI能同时理解图像的全局和局部信息,实现对多个区域间复杂关系的准确分析。该技术通过RoI对齐特征重放方法,在保持全局视野的同时提取精确细节,在多项测试中表现出色,甚至在某些指标上超越了体积更大的模型,为AI视觉理解能力带来重要突破。
Spotify在新西兰测试推出AI提示播放列表功能,用户可通过文字描述需求让AI根据指令和听歌历史生成个性化播放列表。该功能允许用户设置定期刷新,相当于创建可控制算法的每周发现播放列表。这是Spotify赋予用户更多控制权努力的一部分,此前其AI DJ功能也增加了语音提示选项,反映了各平台让用户更好控制算法推荐的趋势。
Inclusion AI团队推出首个开源万亿参数思维模型Ring-1T,通过IcePop、C3PO++和ASystem三项核心技术突破,解决了超大规模强化学习训练的稳定性和效率难题。该模型在AIME-2025获得93.4分,IMO-2025达到银牌水平,CodeForces获得2088分,展现出卓越的数学推理和编程能力,为AI推理能力发展树立了新的里程碑。