DESCRIPCIóN
Buscamos un Data Scientist Middle responsable de analizar, transformar y modelar datos para generar soluciones analíticas que apoyen la toma de decisiones del negocio. Participará en el desarrollo de modelos de similitud, optimización y procesamiento de información, trabajando con grandes volúmenes de datos en entornos cloud (GCP), asegurando calidad, eficiencia y claridad en la comunicación de resultados.
REQUISITOS
-
Experiencia práctica en desarrollo con Python 3.10+.
-
Experiencia en manipulación y análisis de datos con Pandas, Polars y NumPy
-
Experiencia en técnicas de NLP y similitud de texto
-
Conocimiento en modelado de problemas de optimización (ILP con PuLP/CBC)
-
Experiencia en entornos GCP, particularmente BigQuery y Google Cloud Storage
-
Capacidad para traducir requerimientos de negocio en soluciones técnicas
-
Deseable conocimiento en temas contables (impuestos y su aplicación)
-
Python avanzado (3.10+).
-
Manipulación avanzada de DataFrames (merge, groupby, apply, iterrows) con Pandas
-
Uso de Polars (operaciones lazy, expresiones y diferencias frente a Pandas)
-
Operaciones vectorizadas y manejo de tolerancias numéricas con NumPy
-
NLP con spaCy (modelo es_core_news_lg) y cálculo de similitud semántica por coseno
-
Vectorización TF-IDF y cosine similarity con scikit-learn
-
Formulación de problemas de optimización con Integer Linear Programming (ILP) usando PuLP/CBC
-
Consultas SQL en BigQuery (queries parametrizadas)
-
Lectura y escritura de archivos en Google Cloud Storage (CSV, Parquet, HTML)
-
Experiencia adicional en proyectos de matching y conciliación de datos.
-
Optimización de rendimiento en procesamiento de grandes volúmenes de información.
-
Conocimiento en modelos de clasificación o clustering.
-
Experiencia en automatización de pipelines de datos.
-
Conocimiento funcional en procesos contables o financieros
-
Analizar y transformar grandes volúmenes de datos utilizando Python y librerías especializadas
-
Diseñar e implementar modelos de similitud de texto y matching utilizando NLP y técnicas vectoriales
-
Formular y resolver problemas de optimización mediante ILP
-
Ejecutar consultas en BigQuery para extracción de datos transaccionales
-
Gestionar archivos en Google Cloud Storage (lectura/escritura en distintos formatos)
-
Colaborar con áreas de negocio para traducir requerimientos en soluciones analíticas
-
Documentar procesos y resultados analíticos.
-
Asegurar calidad y consistencia de los datos utilizados en los modelos.
-
Comunicación efectiva para audiencias técnicas y no técnicas
-
Colaboración en equipo.
-
Proactividad y orientación a resultados