




Resumen: Gambooza busca un Ingeniero de Datos e Ingeniero de MLOps para asumir la responsabilidad y escalar la infraestructura de datos y aprendizaje automático de sus sistemas de visión por computador, construyendo sistemas desde cero y tomando decisiones clave de arquitectura. Aspectos destacados: 1. Asumir la responsabilidad de los datos críticos y la infraestructura de aprendizaje automático desde una etapa temprana 2. Trabajar en sistemas reales de inteligencia artificial en producción, con un impacto directo en el desperdicio de alimentos 3. Diseñar desde cero la plataforma de datos y aprendizaje automático **Descripción de la empresa** Gambooza es una startup de inteligencia artificial en crecimiento con sede en Madrid, que desarrolla sistemas de visión por computador para ayudar a los restaurantes a reducir el desperdicio de alimentos, abordar ineficiencias operativas y mejorar su viabilidad a largo plazo. Estamos resolviendo un problema masivo y subestimado: las ineficiencias y el desperdicio de alimentos en el sector de la restauración. Nuestra tecnología aporta visibilidad a las operaciones de cocina mediante inteligencia artificial, ayudando a los operadores a reducir costes e impacto ambiental. Somos una empresa en una etapa temprana, ya respaldada por programas destacados como *Lanzadera, Madrid Food Innovation Hub, Basque Culinary Center* y fondos tecnológicos de la UE, y reconocida en competiciones como la *Future Gastronomy Startup Competition* y el *Premio Emprendimiento Digital* (Comunidad de Madrid). Actualmente entramos en una fase de expansión, pasando de pilotos a despliegues reales —y construyendo la infraestructura necesaria para apoyarla. Te incorporarás como un miembro clave del equipo técnico en sus primeras etapas, trabajando estrechamente con los fundadores y actuando como el segundo perfil técnico central, con responsabilidad sobre la infraestructura de datos y aprendizaje automático. Buscamos a alguien con aproximadamente 3+ años de experiencia en ingeniería de datos, MLOps o funciones afines, cómodo trabajando en entornos de etapa temprana y asumiendo responsabilidades de extremo a extremo. Si deseas trabajar en sistemas reales de inteligencia artificial en producción, asumir la responsabilidad de infraestructuras críticas y ayudar a moldear una empresa desde cero, este es ese tipo de puesto. **Función** Buscamos un Ingeniero de Datos e Ingeniero de MLOps para asumir la responsabilidad y escalar la infraestructura de datos y aprendizaje automático detrás de nuestra plataforma. Este no es un puesto de mantenimiento: construirás sistemas desde cero, tomarás decisiones clave de arquitectura y trabajarás directamente en pipelines de inteligencia artificial en producción conectados a entornos del mundo real (cocinas, cámaras, dispositivos periféricos). Serás responsable de todo lo que ocurre entre los datos sin procesar y una inteligencia artificial fiable en producción. **Lo que harás** * Diseñar y construir pipelines de datos de extremo a extremo (desde dispositivos periféricos hasta la nube) * Asumir la responsabilidad de la infraestructura que impulsa nuestros sistemas de visión por computador en producción * Desplegar, versionar y supervisar modelos de aprendizaje automático a escala * Construir flujos de trabajo robustos de MLOps (entrenamiento → evaluación → despliegue → supervisión) * Garantizar la calidad, fiabilidad y observabilidad de los datos en toda la plataforma * Optimizar los pipelines para rendimiento, escalabilidad y coste * Trabajar con grandes volúmenes de datos de imágenes y sistemas de ingesta en tiempo real * Apoyar la integración y mejora de modelos de aprendizaje automático y visión por computador (preparación de datos, evaluación y ciclos de iteración) * Contribuir a mejorar el rendimiento de los modelos en producción mediante mejores datos, supervisión y pipelines de retroalimentación * Tomar decisiones fundamentales sobre arquitectura, herramientas e infraestructura **Qué buscamos** * Experiencia sólida con Python y sistemas intensivos en datos * Experiencia construyendo y manteniendo pipelines de datos en producción * Conocimientos sólidos de infraestructura en la nube (GCP preferible, AWS también válido) * Experiencia práctica con Docker y despliegues en producción * Conocimiento de los conceptos de MLOps (ciclo de vida de los modelos, supervisión, reproducibilidad) * Experiencia con herramientas de orquestación de flujos de trabajo (Airflow, Prefect o similares) * Mentalidad fuerte de ingeniería: te importan la fiabilidad, la escalabilidad y los sistemas limpios * Capacidad para trabajar en entornos ambiguos y asumir la responsabilidad de los problemas de extremo a extremo **Valoración adicional muy positiva** * Experiencia desplegando modelos de aprendizaje automático en producción * Experiencia con pipelines de visión por computador * Conocimiento de Kubernetes o sistemas de orquestación similares * Experiencia con herramientas como MLflow, Weights & Biases o almacenes de características (feature stores) * Experiencia trabajando con sistemas de datos en streaming o casi en tiempo real **Qué diferencia a este puesto** * Trabajarás en sistemas reales de inteligencia artificial en producción, no en experimentos * Tu trabajo tendrá un impacto directo en la cantidad de alimentos desperdiciados cada día * Tendrás una alta responsabilidad sobre infraestructuras críticas desde una etapa temprana * Ayudarás a definir cómo se construye desde cero nuestra plataforma de datos y aprendizaje automático * Formarás parte de un equipo pequeño pero de alto impacto, donde las cosas avanzan rápidamente y se lanzan con frecuencia **Detalles prácticos y beneficios** * Puesto a tiempo completo * Modalidad híbrida (Madrid, ~1-2 días/semana en oficina) * Español obligatorio * Entorno laboral flexible y orientado a resultados (nos importan los resultados, no las horas) * Tiempo libre para investigar en proyectos propios * Salario competitivo + acciones fantasma * Alta responsabilidad y autonomía desde el primer día * Organización plana con un equipo pequeño y altamente talentoso Tipo de puesto: Jornada completa, Contrato indefinido Sueldo: 30.000,00€-40.000,00€ al año Beneficios: * Acciones empresariales * Ayuda al desarrollo profesional * Eventos sociales los viernes * Flexibilidad horaria * Ordenador de empresa * Teletrabajo opcional Posibilidad de trasladarse/mudarse: * 28231 Las Rozas de Madrid, Madrid provincia: Desplazarse al trabajo sin problemas o planificar mudarse antes de comenzar a trabajar (Obligatorio) Preguntas para la solicitud: * ¿Está usted legalmente autorizado para trabajar en España? * ¿Cuántos años de experiencia tienes utilizando Python para pipelines de datos o sistemas backend? * ¿Cuántos años de experiencia tienes construyendo y manteniendo pipelines de datos (ETL/ELT)? * ¿Tienes experiencia desplegando o manteniendo modelos de machine learning en producción? * ¿Has trabajado con herramientas de orquestación de workflows (Airflow, Prefect o similares)? * ¿Has trabajado con datos de imagen o pipelines de visión por computador? * ¿Has sido responsable de desplegar sistemas en producción end-to-end? * ¿Tienes experiencia práctica entrenando modelos de visión por computador (por ejemplo, clasificación, detección, segmentación)? * ¿Cuántos años de experiencia tienes en ingeniería de datos, MLOps o roles similares? * En una escala del 0 al 10, ¿cómo valorarías tu experiencia con Docker y la contenerización en entornos de producción? * From 1 to 10, how ready are you to leave the comfort of a stable job to build something meaningful in a high-risk, high-reward startup environment? (1="I need full security", 10="I thrive in chaos") Educación: * Licenciatura/Grado (Deseable) Experiencia: * Data science: 2 años (Obligatorio) Idioma: * Español (Obligatorio) Ubicación del trabajo: Teletrabajo híbrido en 28231 Las Rozas de Madrid, Madrid provincia


