Como Sr. Site Reliability Engineer (SRE), serás responsable de garantizar la confiabilidad, disponibilidad y rendimiento de nuestros sistemas y aplicaciones. Trabajarás estrechamente con los equipos de desarrollo y operaciones para implementar prácticas de confiabilidad y resiliencia, automatizar procesos y resolver incidentes críticos. Tu experiencia y conocimientos serán fundamentales para mejorar la infraestructura y los servicios de la empresa.
Responsabilidades:
- Diseñar, implementar y mantener infraestructuras de alta disponibilidad y escalabilidad en entornos de producción.
- Desarrollar y gestionar herramientas de monitoreo y alerta para asegurar la salud y el rendimiento de los sistemas.
- Implementar y optimizar pipelines de CI/CD para automatizar despliegues y pruebas.
- Colaborar con los equipos de desarrollo para diseñar aplicaciones resilientes y escalables.
- Resolver incidentes críticos y realizar análisis postmortem para prevenir problemas futuros.
- Gestionar la capacidad y el rendimiento del sistema para asegurar que cumplan con los SLAs establecidos.
- Desarrollar y mantener documentación técnica y procedimientos operativos.
- Aplicar principios de SRE, incluyendo la gestión de SLIs, SLOs y SLAs.
Habilidades y Tecnologías:
- Experiencia con plataformas de nube pública como AWS, Azure o Google Cloud Platform.
- Conocimiento avanzado de herramientas de monitoreo y alerta como Datadog, Prometheus, Grafana, ELK Stack.
- Habilidades en lenguajes de scripting y programación como Js, Python, Go o Bash.
- Experiencia en la implementación y gestión de contenedores y orquestadores de contenedores como Docker y Kubernetes.
- Conocimiento de prácticas de CI/CD y herramientas como Github Actions, AWS Code Pipeline, Jenkins, GitLab CI.
- Experiencia en la implementación de soluciones de alta disponibilidad y recuperación ante desastres.
- Comprensión profunda de los principios de SRE, incluyendo gestión de la capacidad, SLIs, SLOs y SLAs.
- Experiencia en la automatización de tareas operativas y de infraestructura utilizando herramientas de infraestructura como Código (IaC) como Terraform, CloudFormation o Ansible.
- Conocimiento en bases de datos SQL y NoSQL, y experiencia en su gestión en entornos de nube.
- Familiaridad con sistemas de archivos distribuidos y almacenamiento de objetos como Amazon S3 o Google Cloud Storage.
- Experiencia en la implementación de políticas de seguridad y cumplimiento en entornos de nube.
- Conocimiento de arquitecturas de microservicios y su gestión en la nube.
Beneficios:
15 días de vacaciones desde el primer año
Equipo de trabajo
Aguinaldo de 15 días
Seguro de Gastos Médicos Mayores
5 días de salud mental al año
5 días personales al año
90 días de maternidad y paternidad
La equidad y diversidad importan
Orbi es un empleador igualitario. Es política de Orbi brindar igualdad de oportunidades en la carrera y el desarrollo. Creemos en la igualdad real para todos, por lo que, a través de nuestra política de inclusión, buscamos proporcionar un ambiente de trabajo diverso y equitativo para todos nuestros colaboradores.