Descripción del puesto
Misión:
Diseñar, implementar y gestionar soluciones de datos integrales, abarcando desde la construcción de pipelines y la infraestructura en la nube hasta las herramientas e interfaces de acceso a la información, actuando con autonomía, agilidad y criterio técnico.
Responsabilidades:
- Participar en el diseño, implementación y evolución de arquitecturas de datos basadas en enfoques Lakehouse y Medallion, soportando procesos batch y streaming.
- Desarrollar, mantener y optimizar pipelines de datos ETL/ELT utilizando servicios de AWS y tecnologías de procesamiento distribuido.
- Diseñar modelos de datos y capas de consumo orientadas a analítica, inteligencia de negocios y ciencia de datos.
- Construir y publicar APIs y servicios de acceso a datos para usuarios y aplicaciones internas o externas.
- Desarrollar prototipos y soluciones de rápida implementación para validar iniciativas de negocio y casos de uso, incorporando herramientas de inteligencia artificial cuando sea pertinente.
- Mejorar el rendimiento y la eficiencia de las plataformas de datos mediante estrategias de optimización de almacenamiento, procesamiento y costos.
- Implementar controles de calidad de datos, monitoreo, alertamiento, trazabilidad y cumplimiento de niveles de servicio definidos para los productos de datos.
- Velar por el cumplimiento de las políticas, procedimientos y buenas prácticas de Seguridad y Salud en el Trabajo (SST).
- Reportar oportunamente riesgos, incidentes o condiciones inseguras identificadas en el entorno laboral.
- Participar en actividades de formación y contribuir al cumplimiento de los objetivos del Sistema de Gestión de Seguridad y Salud en el Trabajo (SG-SST).
- Utilizar adecuadamente los elementos de protección personal y promover una cultura de trabajo seguro.
Requisitos
- Manejo avanzado de servicios AWS para almacenamiento, procesamiento y orquestación de datos.
- Dominio de Python (PySpark) y SQL para desarrollo de soluciones de ingeniería de datos.
- Diseño y exposición de APIs REST para integración y consumo de información.
- Conocimientos en modelado dimensional, optimización de datos y arquitecturas Lakehouse.