Ingeniería y automatización de infraestructura: Diseñar, implementar y mantener infraestructuras en la nube y on-premise mediante infraestructuras como código (IaC) para garantizar disponibilidad, escalabilidad y coste eficiente.
Plataformas y orquestación: Administrar y optimizar plataformas de contenedores y orquestadores (Kubernetes) para despliegue y operación de microservicios, incluyendo gestión de namespaces, ingress, operators y políticas de seguridad.
CI/CD y pipelines: Definir, implementar y mantener pipelines de integración y entrega continua (CI/CD) que automaticen build, test, seguridad y despliegues (canary, blue/green, rolling), usando herramientas como GitHub Actions, GitLab CI, Jenkins, Argo CD o similares.
Automatización y scripting: Desarrollar y mantener scripts y herramientas de automatización (Bash, Python, NodeJS, Go, Terraform, Ansible) para simplificar tareas operativas, provisión de entornos y recuperaciones ante desastres.
Observabilidad y monitoreo: Implementar y operar soluciones de observabilidad con métricas, logs y trazas distribuidas (Prometheus, Grafana, OpenTelemetry, ELK/EFK u otras) para detección temprana de incidentes y análisis post-mortem.
Seguridad y cumplimiento: Aplicar prácticas de seguridad en la plataforma (gestión de secretos, control de acceso basado en roles, escaneo de imágenes, hardening), colaborar con equipos de seguridad y asegurar cumplimiento con políticas y normativas aplicables.
Gestión de incidentes y SRE: Participar en el soporte de producción, responder a incidentes, realizar análisis raíz (root cause analysis), crear playbooks y definir SLOs/SLIs para mejorar confiabilidad y tiempo de recuperación.
Coste y capacidad: Monitorizar y optimizar el uso de recursos en nube, proponer arquitecturas costo-eficientes y participar en la planificación de capacidad y dimensionamiento.
Integración y despliegue de datos: Coordinar integraciones con bases de datos, caches y sistemas de mensajería (Kafka, RabbitMQ u otros) garantizando consistencia, resiliencia y rendimiento en entornos distribuidos.
Colaboración y transferencia de conocimiento: Trabajar junto a desarrolladores, QA, producto y SREs para mejorar procesos y herramientas; documentar procedimientos, runbooks y mentorizar a colegas.
Experiencia demostrable (mínimo 3 años) en roles de DevOps, SRE o ingeniería de plataformas en entornos de producción.
Infraestructura como Código: Dominio de Terraform y/o CloudFormation; experiencia gestionando módulos, estados remotos y prácticas de versionado.
Contenedores y orquestación: Experiencia práctica con Docker y Kubernetes (k8s), incluyendo Helm, operators y gestión de clusters en proveedores cloud (AKS, EKS, GKE) o en entornos on-prem.
CI/CD y GitOps: Conocimiento de herramientas y patrones de CI/CD y GitOps (Argo CD, Flux, GitHub Actions, GitLab CI); experiencia construyendo pipelines reproducibles y seguros.
Observabilidad: Experiencia con Prometheus, Grafana, OpenTelemetry, ELK/EFK o equivalentes; capacidad para definir dashboards, alertas y SLIs/SLOs.
Automatización y scripting: Fluidez en scripting (Bash, Python) y experiencia con herramientas de configuración como Ansible; Experiencia trabajando con aplicaciones GO y NODEJS requerida.
Redes y seguridad en la nube: Conocimientos en networking (VPC, subnets, routing), balanceo de carga, TLS, IAM, y prácticas de seguridad en contenedores y pipelines.
Sistemas de mensajería y bases de datos: Familiaridad con Kafka, RabbitMQ, Redis y bases de datos relacionales/noSQL; experiencia gestionando conectividad y patrones de consumo resilientes.
Testing y calidad operativa: Implementación de pruebas de infra (integration tests, chaos experiments), escaneo de seguridad y aseguramiento de calidad en pipelines.
Buenas prácticas de git y colaboración: Branching, pull requests, code review y documentación clara de cambios y arquitecturas.