devops开发运维(英文流利)
法本信息职位描述
云原生数据平台建设与运维 负责基于 Kubernetes (K8s) 和 Docker 构建和维护高可用的容器化集群,为数据应用(如 Spark, Flink, Airflow 等)提供运行环境。 管理云上的 Database Service,包括云原生数据仓库(如 Snowflake, BigQuery, Redshift)、数据湖以及各类数据库(如 MySQL, PostgreSQL, Redis)的部署、配置、性能调优、备份恢复和高可用保障。 设计和实施数据平台的存储、网络和安全方案,确保数据在处理过程中的安全与合规。 数据流水线与自动化 (DataOps/DevOps) 设计和维护 CI/CD (持续集成/持续部署) 流水线,实现数据应用和模型的自动化构建、测试和部署。 开发自动化运维工具和脚本(通常使用 Python 或 Go),实现基础设施即代码(IaC),提升运维效率和可靠性。 优化数据处理的资源调度和成本,通过合理的资源配置和弹性伸缩策略,在保证性能的同时控制云资源开销。 平台稳定性与可观测性 (SRE) 建立完善的监控、告警和日志体系(如使用 Prometheus, Grafana, ELK Stack),对平台健康度、数据任务运行状态、资源使用情况等进行全方位监控。 负责线上故障的快速响应、定位和解决,进行根本原因分析(RCA),并推动系统改进以提升稳定性。 进行容量规划和性能调优,确保数据平台能够应对业务增长带来的负载挑战。 要求 容器与编排: 精通 Docker 和 Kubernetes (K8s) 的核心原理、架构和运维,有大规模集群管理经验是巨大优势。 云平台: 熟悉至少一种主流公有云(如 AWS, Azure, GCP, 阿里云等)的计算、存储、网络和数据服务。 数据库与大数据: 深入理解各类数据库和大数据技术(如 SQL/NoSQL, Hadoop, Spark, Flink)的原理和运维。 编程与自动化: 熟练掌握至少一门脚本语言,如 Python 或 Go,用于开发自动化工具。 运维理念: 深刻理解 DevOps、SRE和 DataOps 的理念与实践
对这个职位感兴趣吗?