DESCRIPCIóN
Administrar y optimizar el ciclo de vida de los datos en un entorno basado en AWS, desde su adquisición y transformación hasta su almacenamiento seguro y su disponibilidad para análisis y toma de decisiones. La posición es clave para garantizar que la organización aproveche eficazmente sus recursos de datos en AWS, colaborando con otros equipos y aplicando mejores prácticas de ingeniería de datos para habilitar soluciones escalables, confiables y costo-eficientes.
-
Recopilación e ingesta de datos
-
Adquirir datos de diversas fuentes internas/externas y asegurar su ingestión y almacenamiento en AWS de manera eficiente y segura.
-
Procesamiento y transformación (ETL/ELT)
-
Diseñar y ejecutar procesos ETL/ELT para limpiar, transformar y enriquecer datos, asegurando calidad y utilidad para consumo analítico.
-
Diseño y gestión de almacenamiento
-
Diseñar y mantener soluciones escalables y seguras en AWS (data lake/warehouse/bases de datos) para garantizar disponibilidad y rendimiento.
-
Automatización y orquestación
-
Desarrollar flujos automatizados y orquestar procesos de datos usando servicios/herramientas de AWS para una operación programada, eficiente y confiable.
-
Seguridad y cumplimiento
-
Implementar controles para proteger datos confidenciales y cumplir políticas/regulaciones aplicables (permisos, accesos, cifrado, auditoría).
-
Monitoreo y optimización
-
Supervisar y optimizar performance, costos y confiabilidad de los procesos de datos (métricas, alertas, capacidad, tuning).
-
Colaboración técnica y comunicación
-
Coordinar con equipos de analítica, ingeniería, arquitectura y negocio; comunicar avances, riesgos y decisiones técnicas con claridad.
REQUISITOS
-
Experiencia mínima: 4 años en ingeniería de datos en entornos cloud (ideal AWS).
-
Dominio de SQL (consultas complejas) y bases de datos relacionales/no relacionales.
-
Experiencia práctica construyendo y operando pipelines ETL/ELT.
-
Conocimiento sólido de arquitectura de datos: diseño de pipelines, esquemas eficientes, resiliencia y escalabilidad.
-
Programación en al menos uno: Python (preferente), Java, Scala o SQL avanzado.
-
Capacidad para documentar, colaborar y comunicar temas técnicos de forma clara.
Escolaridad: Licenciatura (preferente) en Ingeniería/Licenciatura en Sistemas o afín (informática, matemáticas, estadística).
AWS (datos):
-
Amazon S3, Redshift, Glue, EMR, Lambda, DynamoDB, RDS
-
Deseable: Kinesis (streaming/eventos)
Big Data:
-
Apache Spark / Hadoop (por ejemplo en EMR)
Orquestación/automatización:
-
AWS Step Functions, Glue Workflows o AWS Data Pipeline
Monitoreo/optimización:
-
CloudWatch (métricas, alertas) y buenas prácticas de eficiencia/costo
-
Deseable: Trusted Advisor (u operación equivalente)
Contenedores (deseable):
-
ECS/EKS (nociones prácticas)
Versionamiento:
-
Git (control de versiones; deseable conocimiento de IaC)
Cursos deseables:
Certificaciones (deseables, no excluyentes):
-
AWS Certified Data Analytics / Solutions Architect