西安外国语大学

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 2199|回复: 0
打印 上一主题 下一主题

?【社招】【内推】头条AI-Lab机器学习系统SRE工程师

[复制链接]

4

主题

4

帖子

26

积分

新手上路

Rank: 1

积分
26
跳转到指定楼层
楼主
发表于 2020-12-30 20:12:50 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
职位描述
1、负责维护分布式机器学习系统的稳定运转,包括:机器学习训练平台、机器学习推理平台;
2、负责机器资源的管理与规划,包括: GPU机器资源和CPU机器资源。
职位要求
1、一年以上运维开发项目经验;
2、熟练掌握 Linux 环境下的 Go/Python/Shell 等1至2种以上语言;
3、有大型分布式系统的资源管理和任务调度系统运维经验,熟悉 YARN、Kubernetes、Mesos 等开源技术,具备1年以上相关的运维经验;
4、熟悉 Docker 容器化技术,具备1年以上运维经验;
5、能够承受较高的工作压力,有强烈的工作责任心,较好的学习能力、沟通能力和自驱力,良好的团队合作精神;
6、有良好的工作文档习惯,及时按要求撰写更新工作流程及技术文档;
加分项:
1)、从事过大规模分布式系统的运维,如:机器学习系统,存储系统(比如:HDFS/Cephfs);
2)、有 GPU 服务器的运维经验;
3)、熟悉 Tensorflow/PyTorch/MxNet 1种及以上主流机器学习框架的底层原理和实现。
点击如下链接进行申请:
https://job.toutiao.com/s/J1vXT8k
https://job.toutiao.com/s/J1vXT8k
--
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|Comsenz Inc.

GMT+8, 2025-6-20 22:52 , Processed in 1.898945 second(s), 22 queries .

Powered by Discuz! X3.1

© 2001-2013 Comsenz Inc. Template By 【未来科技】【 www.veikei.com 】

快速回复 返回顶部 返回列表