首页
注册
登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请
登录
V2EX
›
zweibright
›
全部回复第 1 页 / 共 1 页
回复总数
2
3 天前
回复了
jingyijun
创建的主题
›
程序员
›
实验室 GPU 集群管理经验分享与问题探讨,求建议
1 、conda 环境小文件多,可先缓存到本地硬盘,加载时不从共享存储系统读取,速度应该会快很多。思路参考:
https://docs.tacc.utexas.edu/tutorials/managingio/#python
,没有具体实测过,但觉得思路可行。
2 、slurm 我们也好像没遇到残留问题,真有残留可以试试 slurm 的后处理功能,即作业退出时清除容器
3 、slurm 调度 docker ,root 权限不好管理,要加入 docker 组啥的,不知大家一般咋搞?
关于
·
帮助文档
·
博客
·
API
·
FAQ
·
实用小工具
·
1070 人在线
最高记录 6679
·
Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 12ms ·
UTC 22:51
·
PVG 06:51
·
LAX 14:51
·
JFK 17:51
Developed with
CodeLauncher
♥ Do have faith in what you're doing.