Ingeniero/Arquitecto de la plataforma de datos de Databricks

Indeed

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

79Q22222+22

Favoritos

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Buscamos un ingeniero de plataforma de Databricks altamente cualificado y con experiencia práctica, con sólidos conocimientos en plataformas de datos e ingeniería de software, para asumir la responsabilidad de entregables de extremo a extremo. Aspectos destacados: 1. Gestionar y optimizar la plataforma de datos de Databricks para mejorar el rendimiento y reducir los costos. 2. Diseñar y mantener APIs para la automatización de la plataforma y flujos de trabajo sin servidor. 3. Garantizar la alta disponibilidad, seguridad y rendimiento de los sistemas de datos. ##### **Descripción del proyecto** Buscamos un ingeniero de plataforma de Databricks altamente cualificado con amplia experiencia en ingeniería de datos. El candidato deberá tener una profunda comprensión tanto de las plataformas de datos como de la ingeniería de software, lo que le permitirá integrar y operar eficazmente la plataforma dentro de un ecosistema TI más amplio. Este puesto requiere un profesional práctico y autónomo que asuma la responsabilidad total de los entregables de extremo a extremo, incluyendo diseño, desarrollo, pruebas, despliegue y soporte continuo. ##### **Responsabilidades** Gestionar y optimizar la plataforma de datos de Databricks, incluida la configuración del área de trabajo, las políticas de clústeres, la orquestación de trabajos, Unity Catalog, controles de costos y multi-inquilinato. Diseñar, escribir y mantener APIs utilizadas para la automatización de la plataforma, flujos de trabajo sin servidor, canalizaciones de despliegue, gestión de versiones y gestión de repositorios. Garantizar la alta disponibilidad, seguridad y rendimiento de los sistemas de datos, lo que incluye control de acceso, gestión de secretos, control de acceso basado en roles (RBAC), monitorización, alertas, seguridad a nivel de fila (RLS), gestión de incidencias y ajuste de rendimiento. Proporcionar información valiosa sobre el uso de la plataforma de datos (Databricks), incluyendo atribución de costos, análisis de uso, patrones de carga de trabajo y telemetría. Implementar nuevas funcionalidades de Databricks, como computación sin servidor, canalizaciones declarativas, agentes, lakebase, etc. Diseñar y mantener bibliotecas del sistema (Python) utilizadas en canalizaciones ETL y gobernanza de la plataforma (Databricks). Optimizar procesos ETL. Mejorar y ajustar los procesos ETL existentes para lograr un mejor rendimiento, escalabilidad y fiabilidad. ##### **Habilidades** Imprescindibles Mínimo 10 años de experiencia en TI/Datos. Mínimo 5 años de experiencia como ingeniero de plataforma de datos de Databricks. Más de 3 años de experiencia en el diseño, escritura y mantenimiento de APIs utilizadas para la automatización de la plataforma, flujos de trabajo sin servidor, canalizaciones de despliegue, gestión de versiones y gestión de repositorios. Título universitario en TI o campo relacionado. Infraestructura y nube: Azure, AWS (con experiencia avanzada en almacenamiento, redes y computación). Programación: Conocimientos avanzados de PySpark para computación distribuida. Mínimo 4 años de experiencia en Python para el desarrollo de ETL. SQL: Experiencia avanzada en redacción y optimización de consultas SQL, preferiblemente con bases de datos como PostgreSQL, MySQL, Oracle o Snowflake. Almacenes de datos: Experiencia con conceptos de almacén de datos y con la plataforma Databricks. Herramientas ETL: Conocimientos básicos de herramientas y procesos ETL. Modelado de datos: Experiencia en modelado dimensional, normalización/denormalización y diseño de esquemas. Control de versiones: Conocimientos avanzados de herramientas de control de versiones como Git para gestionar bases de código y colaborar en el desarrollo. Monitorización de canalizaciones de datos: Conocimientos básicos de herramientas de monitorización (por ejemplo, Prometheus, Grafana o scripts personalizados de monitorización) para rastrear el rendimiento de las canalizaciones. Herramientas de calidad de datos: Experiencia en la implementación de marcos de validación, limpieza y calidad de datos, preferiblemente Monte Carlo. Deseables Contenerización y orquestación: Docker, Kubernetes. Infraestructura como código (IaC): Terraform. Conocimientos del dominio de datos de inversión (deseable). ##### **Otros** Idiomas Inglés: C1 Avanzado Nivel de experiencia Senior Teletrabajo en España, España Ref. VR\-118910 Desarrollo de almacenes de datos (DWH) Industria BCM 16/03/2026 Ref. VR\-118910

Fuentea: indeed Ver publicación original

David Muñoz

Indeed · HR

Compañía

Indeed

David Muñoz

Indeed · HR

Empleos similares

Ingeniero/Arquitecto de la plataforma de datos de Databricks

Descripción

Compañía

Empleos similares

Auxiliar de ayuda a domicilio

Tornero

QA Tester

Auxiliar Ayuda Domicilio

Agente comercial junior en entidad bancaria

Pinche de Cocina (Formación y Empleo) - Zuheros