工作职责
1. 云原生平台与混合架构运维:负责基于Kubernetes的生产级容器平台与混合架构(云上/私有化)的规划、部署、治理、容量规划、调优与高可用保障;
2. 可观测性体系建设:基于 OpenTelemetry 生态,构建和优化统一的可观测性平台,实现从应用指标、分布式链路、日志到用户体验的全栈监控与深度洞察;
3. 云原生网关与插件开发:
○ 负责 Higress 等云原生网关的生产级部署、配置管理、性能调优与稳定性保障。
○ 熟练掌握Higress各项插件(如限流、鉴权、WAF、路由等)的配置与管理,具备Wasm插件定制开发能力者优先。
4. DevOps与自动化工程:
○ 设计、编排并维护高效的CI/CD流水线,推动GitOps实践落地,实现持续交付。
○ 通过Ansible, Terraform等工具实现基础设施即代码(IaC),全面实现运维自动化。
5. 基础设施全栈管理:
○ 管理虚拟化平台(VMware/PVE)、负载均衡(Nginx)、消息队列及MySQL/PostgreSQL/Redis等数据库的日常运维、性能优化与高可用方案。
○ 熟悉至少一家主流云平台(阿里云/AWS/GCP)的核心服务与实践。
任职资格
1. 必备经验:5年以上Linux运维/DevOps经验,3年以上生产环境Kubernetes及云原生技术栈实战经验。
2. 核心技术栈:
○ 熟悉Docker、Kubernetes、Helm、Operator等容器化与编排技术。
○ 具备基于OpenTelemetry的可观测性平台建设与运维经验,熟悉Prometheus、Grafana、Loki、Tempo/Jaeger等相关生态。
○ 拥有Higress/Ingress-Nginx/APISIX等网关的实际运维经验,熟悉配置管理。
○ 熟练掌握至少一门编程语言(Python/Go/Shell),能编写高效运维工具与自动化脚本。
3. 综合能力:拥有强大的动手能力、系统性排查与解决复杂问题的能力,对技术有自驱热情,乐于钻研并能快速学习新技术。
4. 素质要求:具备极强的责任心、团队协作精神与良好的沟通能力,能在压力下保持高效。
加分项
1. 具备Higress或相关网关的Wasm插件实际开发经验。
2. 拥有CKA/CKS、阿里云/ AWS专家级认证。
3. 有服务网格(Istio)、FinOps、多云管理平台建设经验。
4. 在GitHub上有开源项目贡献或技术博客。