我们是 阿里云智能 CTO 线-计算平台事业部-基础工程技术 团队,负责 ABM 运维平台。团队致力于以技术为核心,以产品和服务为手段,提供业界领先的稳定、高效、低成本的面向阿里云大数据&AI 产品的运维与交付平台。
- 我们依托于集团和云的主流技术栈及中间件,开发大量的分布式运维服务后端,满足 MaxCompute/Hologres/Flink/DataWorks/PAI/ES/EMR 等大数据&AI 产品海量规模运维的需求;
- 我们以自动化、产品化、数据化、智能化的方式去支撑解决 SRE&DEV 的运维难题,沉淀通用能力,解决各产品核心的稳定、成本、效率、质量问题;
- 我们基于天基&ASI 两大基础底座及自研的低代码平台,打造服务于各产品全生命周期的交付、监测、运维、运营、售后的一站式服务;
职位描述:
- 参与 ABM 运维平台的产品研发工作,包括各类运维产品与服务的架构设计/工具框架优化/平台功能开发,以提升 SRE 运维效率和平台产品质量;
- 参与相关运维工具、数据平台、可观测性平台、CICD 变更交付链路的开发,支撑 SRE 及产研团队高效开发及运维大规模分布式系统;
- 增强 ABM 产品能力,参与运维体系架构改进,助力业务侧的稳定性和研发变更效率的提升,看护计算平台基础架构;
基础平台研发工程师-职位要求( 2026 年毕业实习生):
- 计算机相关专业,熟悉或擅长至少一种主流编程语言( Java/Python/Go ),熟悉常见的后端开发框架;
- 熟悉 Linux 系统,了解 DevOps 、SRE 理念;
- 熟悉云原生的相关技能,有 Kubernetes 、Operator 开发、云原生运维及交付相关的开发经验者优先;
- 具备良好的沟通及协调能力,具备较强的问题分析和解决能力;
如果有意向,可以发送简历到 [email protected] 或邮件咨询相关岗位。
其他兄弟团队的实习岗位在招,也欢迎一起投递:
算法工程师-机器学习-职位要求( 2026 年毕业实习生):
- 具备良好的机器学习理论基础,掌握机器学习和深度学习模型训练和部署等相关技术,熟练掌握 Python/Java 等编程语言;
- 熟悉大模型/时间序列分析/运筹优化/自然语言处理领域相关算法;
- 具备异常检测/根因定位/资源优化等智能运维业务场景实践经验者优先;
- 适应快速变化的创业环境,乐于寻求挑战和突破自我;
- 思路清晰,有良好的沟通表达能力和跨团队协调能力;
运维开发工程师-职位要求( 2026 年毕业实习生):
- 熟悉 C/C++/Java/Golang 等至少一种编程语言,和 Shell/Perl/Python 等至少一种脚本语言,具备清晰的编程思路;
- 熟悉 Linux 操作系统,对 Linux 系统和网络层有一定的了解和知识储备;
- 热爱开源技术,熟悉一种或者多种大数据生态技术( Flume ,Kafka 、Hbase 、Spark 、Storm 、Hadoop 、Flink 等);
- 有广泛的技术视野,具备很强的学习能力、分析能力和解决方案设计能力,热衷于并擅长 Trouble shooting 和 Performance tuning ,以此为乐;
- 有 TeamShip 意识 , 具备良好的沟通以及协调能力,能单打独斗也能擅长团队作战;