近日,英伟达GTC China 2018大会在苏州召开,众多业界权威专家及从业者参与了本次活动,并就深度学习与AI领域的多个话题展开了深入交流。作为数字化解决方案领导者,新华三出席了本次大会并展示了适用于AI和深度学习工作负载的GPU服务器产品。大会上,英伟达表示包括新华三在内的中国领先的服务器制造商将推出一系列基于NVIDIA 最新发布的NVIDIA T4 GPU 的服务器,T4 基于全新 TuringTM 架构,采用多精度Turing Tensor Core和全新RT Core,与加速的容器化软件堆栈相结合,提供规模空前的性能。
人工智能的突破式进展正在拓展全新的市场空间,同时也在为传统行业业务创新与重塑创造新的变革机遇。据国际权威咨询机构IDC报告显示,2018年全球“认知和人工智能系统”的支出预计将超过240亿美元,到2020年将超过776亿美元,年复合增长率超过37.3%。具备出色并行计算性能的GPU正在成为运载AI应用的绝佳平台。大会上,新华三展示了最新的适用于AI工作负载的计算系统——H3C UniServer R5200 G3服务器以及HPE Apollo 6500 Gen10系统。
H3C UniServer R5200G3服务器是针对人工智能和高性能计算领域定制开发的新一代GPU服务器,采用标准的4U机架式服务器,最大可配置10颗双宽GPU或20颗单宽GPU,拥有超强的计算能力,同时针对GPU计算特点优化设计了CPU/GPU通信链路,可以帮助用户获得最佳性能体验。
HPE Apollo 6500 Gen10系统拥有8个GPU,能够为GPU密集型工作负载提供高达125 TFLOPs2的单精度计算。这一平台专为加速计算而构建,PCIe和NVLINK GPU互连,可灵活应对各种要求。
新华三集团工业标准服务器产品部总经理刘宏程表示:“新华三在服务器领域拥有多年的产品设计与研发经验,曾多次引领计算架构的创新与变革。英伟达同样正以前沿的技术、产品拓展人工智能计算性能边界。在AI迈入成熟商用的新时代,新华三将与英伟达携手创新,共同加速人工智能与深度学习底层硬件架构的创新突破,以算力升级优化AI应用体验,让更智能的未来世界加速到来。”
关于新华三
新华三集团(简称新华三)是业界领先的数字化解决方案领导者,致力于成为帮助客户业务创新、数字化转型最可信赖的合作伙伴。新华三拥有计算、存储、网络、安全等完整的数字化基础设施提供能力,能够提供云计算、大数据、大互联、大安全、大安防、物联网、边缘计算、人工智能、区块链等全面的数字化解决方案。同时,新华三也是HPE®品牌的服务器、存储和技术服务的中国独家提供商。
好文章,需要你的鼓励
这篇研究论文介绍了"Speechless",一种创新方法,可以在不使用实际语音数据的情况下训练语音指令模型,特别适用于越南语等低资源语言。研究团队通过将文本指令转换为语义表示,绕过了对高质量文本转语音(TTS)系统的依赖。该方法分三个阶段:首先训练量化器将语音转为语义标记;然后训练Speechless模型将文本转为这些标记;最后用生成的合成数据微调大型语言模型。实验表明,该方法在越南语ASR任务中表现出色,为低资源语言的语音助手开发提供了经济高效的解决方案。
《Transformer Copilot》论文提出了一种革命性的大语言模型微调框架,通过系统记录和利用模型训练过程中的"错误日志"来提升推理性能。研究团队受人类学习者记录和反思错误的启发,设计了一个"副驾驶"模型来辅助原始"驾驶员"模型,通过学习错误模式并在推理时校正输出。这一方法在12个基准测试上使模型性能提升高达34.5%,同时保持计算开销最小,展现了强大的可扩展性和可迁移性,为大语言模型的优化提供了全新思路。
德克萨斯大学Austin分校的研究团队提出了RIPT-VLA,一种创新的视觉-语言-动作模型后训练范式。该方法通过让AI模型与环境互动并仅接收简单的成功/失败反馈来学习,无需复杂的奖励函数或价值模型。实验证明,RIPT-VLA能显著提升现有模型性能,在轻量级QueST模型上平均提升21.2%,将大型OpenVLA-OFT模型推至97.5%的前所未有成功率。最令人惊叹的是,仅用一个示范样本,它就能将几乎不可用的模型在15次迭代内从4%提升至97%的成功率,展现出卓越的数据效率和适应能力。
北京大学与华为诺亚方舟实验室研究团队共同开发了TIME基准,这是首个专为评估大语言模型在真实世界场景中的时间推理能力而设计的多层级基准。该研究提出了三个层级的时间推理框架,包含11个细粒度任务,并构建了涵盖38,522个问答对的数据集,针对知识密集型信息、快速变化的事件动态和社交互动中的复杂时间依赖性三大现实挑战。实验结果表明,即使是先进模型在构建时间线和理解复杂时间关系方面仍面临显著挑战,而测试时扩展技术可明显提升时间逻辑推理能力。