V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 外包信息请发到 /go/outsourcing 节点。
• 不要把相同的信息发到不同的节点
zoe1016aaa
V2EX  ›  酷工作

[英伟达 Nvidia] [上海/北京] [高级 Dev Ops 工程师]

  •  
  •   zoe1016aaa · 2022-01-10 10:16:34 +08:00 · 1821 次点击
    这是一个创建于 1073 天前的主题,其中的信息可能已经有所发展或是发生改变。

    [公司名称] 英伟达

    [坐标] 上海 OR 北京

    [简历投递邮箱] [email protected]

    [邮件标题] 姓名+应聘岗位

    [面试流程] 2-3 轮视频面试

    [简历形式] 中英文简历

    NVIDIA Merlin 是一个开源框架,用于构建大规模深度学习推荐系统。Merlin HugeCTR 是其关键组件,可加速基于深度学习的推荐模型的训练和推理。NVIDIA Merlin HugeCTR 团队正在寻找优秀的的 DevOps 工程师来构建下一代产品。作为 HugeCTR 团队的 DevOps 工程师,您将使用现代 DevOps 工具简化框架的开发、构建、测试和发布。

    [您将要做的是] :

    ● 简化和自动化 NVIDIA Merlin HugeCTR 的构建、测试、集成和发布流程;

    ● 管理和发布具有正确解决依赖关系的容器;

    ● 相应地维护和同步分支;

    ● 基于具体的测试用例,以端到端的方式跟踪和验证 HugeCTR 的性能和正确性;

    ● 与 NVIDIA 的库、架构、工具和系统软件团队密切合作,构建和维护生产感知型开发和测试环境;

    ● 实施和宣传构建、测试和发布推荐系统特定框架的最佳实践。

    [我们需要你] :

    ● 计算机科学学士学位或更高学位(或同等经验);

    ● 基于 GitLab CI/CD 和 Jenkins 等工具构建和自动化测试工作流和持续集成系统的丰富经验;

    ● 在版本控制系统(例如 GitHub 和 GitLab )以及构建系统(例如 CMake 和 Make )方面具有丰富的经验;

    ● Python 中的实用编程技能和类 UNIX 系统上的 Shell 脚本;

    ● 在集群环境中使用 SLURM 等作业调度器的经验;

    ● 了解编写 Dockerfile 并使用关键的 Docker 命令并了解容器化;

    ● 对深度学习的理解,尤其是对其部署的理解。

    [如何在人群中脱颖而出] :

    ● 可以与 NVIDIA 的各个工程团队合作协调、讨论的良好沟通技巧;

    ● 对现代推荐系统的理解;

    ● 了解 C++语法及其现代( C++11/14/17/20 )特性;

    ● 了解并行编程,尤其是 CUDA 和 MPI ;

    ● 有 TensorFlow 、PyTorch 等深度学习框架经验;

    ● 继续关注先进的 DevOps 工具和技术。

    3 条回复    2022-01-12 11:51:35 +08:00
    puyangsky
        1
    puyangsky  
       2022-01-11 10:51:20 +08:00
    深圳有就好了
    WatchingJack
        2
    WatchingJack  
       2022-01-11 12:42:40 +08:00
    有校招吗
    zoe1016aaa
        3
    zoe1016aaa  
    OP
       2022-01-12 11:51:35 +08:00
    这个岗位貌似没有。。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3904 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 10:18 · PVG 18:18 · LAX 02:18 · JFK 05:18
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.