
Data Extraction Engineer (En remoto 100%)
Job Description
Posted on: May 7, 2026
Desde MK Development, empresa especializada en servicios IT, tenemos la necesidad de incorporar un/a Data Extraction Engineer / ETL Engineer para un proyecto dentro del Área Digital & Technology – Data & AI.
DETALLES CLAVE:
-Modalidad: Remoto 100%, con disponibilidad para viajes ocasionales a distintas sedes.
-Idioma: Inglés nivel alto (Mínimo B2+).
-Experiencia: +4 años en roles similares.
-Es imprescindible residir en España.
FUNCIONES Y RESPONSABILIDADES:
1. Extracción e Ingesta de Datos (Foco Principal):
-Diseñar pipelines desde fuentes heterogéneas: SAP HANA Rise (CDS Views, ABAP SDK), SQL (Server, PostgreSQL, Azure SQL) y MongoDB.
-Implementar y mantener flujos CDC hacia Azure Data Lake Gen2 usando Apache Kafka / Azure Event Hubs.
-Gestionar extracción de series temporales de alta frecuencia (SCADA, MES, IoT) y conectores basados en API para sistemas SaaS (RR.HH., Calidad, terceros).
2. Orquestación y Fiabilidad:
-Orquestar flujos con Apache Airflow (MWAA o AKS) mediante DAGs idempotentes y observables.
-Garantizar la salud del sistema mediante monitoreo, alertas y seguimiento estricto de SLAs para asegurar datos actualizados al negocio.
3. Calidad y Colaboración Técnica:
-Validar datos en el origen (integridad, tipos, duplicados) antes de la ingesta al lakehouse.
-Documentar esquemas, diccionarios de datos, contratos de datos y ADRs (Architecture Decision Records).
-Colaborar con el equipo de Agentes de IA para preparar datasets curados destinados a arquitecturas RAG y ML.
REQUISITOS TÉCNICOS:
-SQL & NoSQL: Dominio experto de SQL (multi-motor) y experiencia práctica en MongoDB (change streams, oplog).
-Orquestación: Nivel avanzado de Apache Airflow (gestión de dependencias, reintentos y operadores personalizados).
-Patrones CDC: Comprensión profunda de patrones log-based y query-based (Debezium, Kafka Connect).
-Cloud & Dev: Experiencia en arquitecturas Lakehouse (Azure Data Lake, Delta Lake, Databricks) y dominio de Python para lógica de pipelines.
VALORABLE:
Experiencia avanzada con SAP (BAPI, OData, CDS Views), familiaridad con entornos industriales (OPC-UA, MQTT) y herramienta dbt y experiencia previa en el sector automotriz o manufactura en entornos internacionales.
SE OFRECE:
-Contratación indefinida.
-Salario abierto según la experiencia aportada.
Apply now
Please let the company know that you found this position on our job board. This is a great way to support us, so we can keep posting cool jobs every day!
RemoteITJobs.app
Get RemoteITJobs.app on your phone!

Data Extraction Engineer (En remoto 100%)

AI Engineer

Senior Machine Learning Expert

Data Scientist (Python & SQL) - Freelance AI Trainer

