团队介绍
我们是字节跳动--基础架构--应用观测(服务端)团队, 专注于 PB 级别海量数据的可观测性基础设施 [Metrics 、Tracing 、Logging 、Event 、Profiling] 和上层可观测性应用[E.g. 报警生命周期管理、异常检测、 根因分析]的建设, 为字节跳动整体业务的稳定性、性能优化、服务治理等方向保驾护航.
关于我们的更多介绍, 参考下面的分享:
Archsummit: “演讲:字节跳动可观测性平台实践的“中场故事”
https://archsummit.infoq.cn/2021/shanghai/presentation/3372
加入我们,你将会获得
- 如果你是有志于 /致力于产品开发的同学, 你可以和我们一起建设更友好 /易用的可观测性平台, 并为字节内部研发和外部云产品用户提供极致的可观测性产品体验.
- 如果你有志于 /致力于低成本地多样数据采集, 你可以和我们一起建设更优秀的打点套件和采集器, 面向 性能、标准化、易用性、稳定性等多方向攻坚.
- 如果你是有志于 /致力于内核研发的同学, 你可以全身心投入时序数据库方向, 专注高吞吐高并发和低延迟的时序存储技术攻坚.
职位 JD
可观测性云产品资深研发(北京)
职位描述:
- 负责监控、报警、链路分析、日志等子产品建设
- 构建 AIOPS 平台, 提升排障效能和自动化效率
职位要求:
- 有公司私有云 PAAS 平台的研发及优化经验优先
- 有针对复杂业务系统架构的实施经验优先
- 具备丰富的云产品研发经验, 产品意识强,善于贴近用户,提炼用户痛点,打造产品体验闭环。
云原生监控研发工程师(杭州 / 上海)
职位描述:
- 参与云监控体系的相关建设和研发,包括打点接入、存储、查询等;
- 支持云报警平台建设,包括报警生命周期管理以及报警智能抑制治理 和后续整体规划
职位要求:
- 具备扎实的编程能力,有优秀的设计和代码能力,技术栈不限
- 熟悉 Prometheus 或 CNCF 监控等常用的组件技术并有能力进行定制改进
- 积极乐观有责任心,工作认真,有良好的团队协作能力
时序数据库组件研发(杭州 / 上海)
职位描述:
- 打造业界领先的 PB 级时序数据库,支撑字节跳动几乎所有产品线,如抖音、今日头条、TikTok ;
- 参与大规模分布式时序数据库的设计和开发,确保系统在极限场景下低延迟、高可用、易伸缩;
- 深入理解业务场景的存储需求,推进时序存储的平台化。
职位要求:
- 有强悍的编码能力,熟练掌握 C++/Java/Go 任意一种语言;
- 具备扎实的计算机基础知识,深入理解数据结构、算法和操作系统;
- 能够分析并解决复杂的分布式系统问题;
Observability Saas Platform 高级研发工程师(上海 / 杭州 / 新加坡)
职位描述:
- 打造一站式链路诊断、指标监控、(智能)报警、诊断工作流和自助修复平台;
- 负责推动业务指标和调用链路的打点规范落地;
- 提升排障效能和自动化效率
职位要求:
- 较好的计算机领域数据结构 和算法掌握度
- 具备优秀的业务理解、分析能力,具备较强的平台规划和项目推进能力
- 对于监控生态系统有二次开发及使用经验;
投递方式