数人云联合清华OCP实验室共建深度学习平台

数人云与清华大学交叉信息研究院开放计算项目实验室（OCP实验室）合作共建深度学习平台，平台通过数人云操作系统实现GPU资源共享，利用Docker技术交付深度学习的运行环境，让深度学习项目组师生可以更加灵活地使用GPU资源，解决深度学习环境部署繁琐的问题。

ZD至顶网CIO与应用频道 11月14日北京消息：近日，数人云与清华大学交叉信息研究院开放计算项目实验室（OCP实验室）合作共建深度学习平台，该平台通过数人云操作系统实现GPU资源共享，利用Docker技术交付深度学习的运行环境，让深度学习项目组师生可以更加灵活地使用GPU资源，并解决深度学习环境部署繁琐的问题。

深度学习算法的计算性能依赖强大的GPU计算能力，为了尽可能提高GPU资源利用率，数人云利用Mesos将GPU资源汇聚成资源池实现资源共享，并借用Docker交付深度学习的运行环境。

深度学习平台利用nvidia-docker ( https://github.com/NVIDIA/nvidia-docker )容器化深度学习组件，同时，借助数人云搭建GPU集群，共享GPU资源。最终，为用户提供了可一条命令部署深度学习环境的平台。

NVIDIA GPU，平行计算平台CUDA与Docker 的集成

（图片来源https://github.com/NVIDIA/nvidia-docker/wiki）

在节点内部，数人云利用nvidia-docker帮助容器内部的程序调用外面主机上的CUDA Driver。CUDA Driver及GPU Driver安装在外部Host上，CUDA Toolkit，及其它深度学习组件及用户应用程序运行在Docker容器中。这样既能快速配置环境，又保证了HOST不受用户应用程序污染。

在Docker容器中运行caffe device_query –gpu all的结果

数人云打造的GPU集群，将深度学习的任务分配到服务器上，采用分布式计算方法，极大程度上提高了GPU的资源利用率。

2015年6月，Facebook资助清华大学交叉信息研究院，成立中国唯一的一家OCP实验室，自2015年9月开始，数人云和清华大学交叉信息研究院助理院长徐葳博士合作在OCP实验室开展数据中心方面的相关研究工作。今年3月，数人云联合清华大学OCP实验室完成“百万并发”压力测试，数人云通过10台OCP服务器成功承载了百万并发HTTP请求，并进行了广泛的性能测试。

来源：业界供稿

0赞

好文章，需要你的鼓励

数人云联合清华OCP实验室共建深度学习平台

来源：业界供稿

2016

11/14

18:10

分享

点赞

张凌赫同款AI眼镜震撼亮相：联想AI眼镜M1售价998元起，V1开启预售

联想发布天禧个人超级智能体3.5版本：AI看世界、AI翻译海量AI热门应用全面升级

当轻薄与智能融入日常，联想正在讲述新的终端故事

联想moto X70 Air正式发布：以极致轻薄重塑轻薄AI手机新体验

科世达、德华安顾人寿、宝洁和汇丰银行荣获2025红帽亚太创新奖

联想集团荣获拉姆·查兰管理实践奖 以AI原生组织“破局”开源降本提效

英伟达与诺基亚联手开创AI驱动6G通信平台

智能座舱的“理想”样本背后，为什么需要一朵AI云?

ChatGPT不是万能的：11个不应该依赖AI的重要领域

核能能否成为推动全球AI发展的能源伙伴？

Blue Energy计划建设燃气转核能数据中心电厂

AI公平性：如何让人工智能真正服务社区

戴尔新服务器采用优化冷却和Open Compute Project

OCP China Day 2023：数据中心基础设施创新分论坛在京举行

OCP China Day 2023：五大社区齐聚 加速开源开放创新与落地

OCP China Day 2023开幕在即 | AIGC引爆巨量算力需求，揭秘数据中心破局之道

META PLATFORMS迎来新成员：专为驱动人工智能而生

OCP发布Caliptra新硬件信任标准 强化边缘和机密计算安全性

更高效更快捷 OCP China Day 2022开放计算创新论坛举行

针对OCP中数据存储面临的挑战，西部数据给出这样的答案

OCP China Day 2022：开放计算，推动数据中心可持续发展

希捷亮相OCP China Day 2022，与生态伙伴共话绿色存储之道

如果您非常迫切的想了解IT领域最新产品与技术信息，那么订阅至顶网技术邮件将是您的最佳途径之一

从“支撑工具”到“智能中枢”，AI原生ERP进化

阿里要用AI将云计算重做一遍

PEC 2025 AI创新者大会

用AI，在数字身份验证风暴中心重构信任坐标

关注官方公众号

关注官方微博

关注官方喜马拉雅

友情链接

业界热点:

联想集团荣获拉姆·查兰管理实践奖以AI原生组织“破局”开源降本提效

OCP China Day 2023：五大社区齐聚加速开源开放创新与落地

OCP发布Caliptra新硬件信任标准强化边缘和机密计算安全性