EN PLAYFUL ESTAMOS BUSCANDO ANALISTA DE DATOS
La persona en este rol será responsable de garantizar la integridad, veracidad y calidad de los datos en los procesos ETL/ELT. Su función principal será diseñar validaciones automáticas, implementar herramientas de observabilidad y colaborar con equipos técnicos y de negocio para asegurar que la información utilizada en el portal y plataformas digitales sea confiable y escalable.
Responsabilidades:
- Automatización de pruebas: Desarrollar scripts y frameworks para validaciones automáticas en flujos ETL/ELT.
- Data Profiling: Analizar datos fuente para detectar anomalías, duplicados o valores incompletos.
- Arquitectura de calidad: Implementar herramientas de observabilidad como Great Expectations, dbt tests o Deequ en entornos Cloud.
- Monitorización y alertas: Configurar dashboards para alertas tempranas de incidentes de calidad.
- Colaboración multidisciplinaria: Trabajar con Arquitectos de Datos y Data Stewards para corregir errores y definir reglas de negocio.
Requisitos Técnicos:
- SQL avanzado (DML y DDL): Queries complejas, optimización y validación de esquemas.
- Python (Pandas, PySpark): Creación de tests unitarios e integración de datos.
- Ecosistema Big Data: Spark, Hive, Presto/Trino.
- Orquestación: Apache Airflow o Dagster para programación de checks de calidad.
- Cloud: Azure (Databricks, Synapse) o GCP (BigQuery).
- Control de versiones: Git y flujos CI/CD.
Requisitos:
- Experiencia: 4+ años en proyectos de datos, ETL/ELT y aseguramiento de calidad.
- Especialidad: Acondicionamiento de datos, validación y observabilidad.
- Valor agregado: Garantizar que los sistemas de datos mantengan integridad y confiabilidad en entornos complejos.
Ofrecemos:
- Prestaciones de ley
- Trabajo de Lunes a Viernes
- Trabajo 100% remoto
- Proyecto de 3 meses mínimo.
Sueldo: $48,000.00 - $50,000.00 al mes
Pregunta(s) de postulación:
- ¿Puedes darme un ejemplo de una query compleja que hayas optimizado en SQL Server, Azure SQL o BigQuery?
- ¿Has desarrollado scripts en Python (Pandas o PySpark) para validar o transformar datos en procesos ETL/ELT?
Lugar de trabajo: Empleo remoto