




Resumen: Este es un puesto de ingeniero senior de aprendizaje automático para construir desde cero sistemas de detección impulsados por aprendizaje automático destinados a la seguridad de APIs, ofreciendo una trayectoria clara hacia el liderazgo técnico. Aspectos destacados: 1. Oportunidad de construir desde cero la pila de aprendizaje automático para la seguridad crítica de APIs. 2. Primer ingeniero especializado en aprendizaje automático con una trayectoria clara hacia el liderazgo técnico. 3. Responsabilidad integral del ciclo de vida, desde la exploración de datos hasta la implementación en producción. Desde 2016, Wallarm se ha dedicado a proteger la infraestructura crítica de internet: las APIs. Actualmente, somos la opción de confianza de más de 200 de las empresas más innovadoras del mundo, desde startups de rápido crecimiento hasta empresas líderes de Fortune 500 y Nasdaq. Nuestra plataforma unificada ofrece seguridad integral de APIs durante todo su ciclo de vida, ayudando a los equipos a descubrir su superficie de ataque, protegerse contra amenazas modernas y responder a incidentes en tiempo real. Como graduados de Y Combinator y respaldados recientemente por una ronda **Serie C de 55 millones de dólares**, estamos ampliando nuestro equipo global y remoto de más de 150 innovadores para resolver los desafíos de seguridad de la próxima generación. Estamos desarrollando sistemas de detección impulsados por aprendizaje automático que protegen las APIs contra abusos automatizados, como inyección de credenciales, extracción masiva de datos (scraping), enumeración y patrones de ataque que evolucionan diariamente. Se trata de un proyecto completamente nuevo: contamos con los datos y las ideas, pero la infraestructura de aprendizaje automático, las canalizaciones y los modelos deben construirse desde cero. Serás el primer ingeniero especializado en aprendizaje automático del equipo, trabajando estrechamente con ingenieros, investigadores de seguridad y DevOps. Este es un puesto senior individual con una trayectoria clara hacia el liderazgo técnico; planeamos ampliar la función de aprendizaje automático en torno a esta contratación. ### **Qué harás** * Construir desde cero la pila de aprendizaje automático: diseñar e implementar las canalizaciones de datos, la extracción de características, el entrenamiento de modelos y la infraestructura de servicio necesarias para la detección de anomalías de calidad productiva. * Detectar anomalías en el tráfico de APIs: tu primer resultado importante será construir un sistema que identifique patrones de comportamiento malicioso en las sesiones de clientes con alta precisión y exhaustividad, entrenado específicamente por cliente. * Asumir la responsabilidad integral del ciclo de vida: desde la exploración inicial de datos y la ingeniería de características hasta el desarrollo, evaluación, implementación y monitoreo continuo de los modelos. Sin transferencias a un equipo separado de "producción". * Diseñar experimentos y métricas: crear evaluaciones fuera de línea, definir métricas de calidad de detección y supervisar falsos positivos, derivas y adaptación adversaria. * Trabajar con datos textuales y datos estructurados de comportamiento: extraer señales de sesiones de APIs, secuencias de solicitudes, cargas útiles y metadatos de tráfico mediante técnicas de procesamiento del lenguaje natural y estadísticas. * Aprovechar modelos de lenguaje grande (LLM) donde aporten valor: explorar modelos basados en incrustaciones (embeddings) y enfoques potenciados por LLM para enriquecer señales, clasificación y explicabilidad. * Definir la dirección técnica: documentar hallazgos, presentarlos ante equipos multifuncionales y contribuir a definir la hoja de ruta de aprendizaje automático a medida que el equipo crezca. **Qué buscamos** **Requerido** * 5 o más años de experiencia en aprendizaje automático aplicado o ingeniería de aprendizaje automático con experiencia en implementación en producción (no solo experiencia académica o de investigación). * Amplia experiencia práctica en PLN / datos textuales: trabajo práctico con clasificación de texto, extracción de patrones, tokenización, incrustaciones (embeddings) o similares. Este es el núcleo fundamental del trabajo. * Competencia sólida en Python y sistemas de calidad productiva (APIs, canalizaciones de datos, servicio de modelos). * Habilidades sólidas en ingeniería de datos: experiencia construyendo canalizaciones ETL/de datos, trabajando con datos por lotes y en tiempo real, y comprendiendo el ciclo completo de vida de los datos en aprendizaje automático (DAG, versionado de datos, almacenes de características). * Experiencia práctica profunda en fundamentos de aprendizaje automático: clasificación, detección de anomalías, agrupamiento (clustering), métodos estadísticos, así como el criterio para elegir el enfoque adecuado según cada problema. * Capacidad para trabajar con datos imperfectos: etiquetas ruidosas, desequilibrio entre clases, distribuciones cambiantes, y estrategias prácticas para etiquetado, evaluación e implementación de modelos fiables. * Mentalidad de propiedad integral de extremo a extremo: capacidad para llevar un problema desde los datos crudos hasta su implementación en producción, colaborando con DevOps para configurar la infraestructura necesaria. * Habilidades sólidas en experimentación: prototipado ágil, diseño riguroso de evaluaciones, medición de resultados y análisis de compromisos (costo, calidad, latencia).**Altamente deseable** * Experiencia en dominios donde los actores adversarios se adaptan activamente a los mecanismos de detección (fraude, mitigación de bots, prevención de abusos, spam). La mentalidad de ML para manejar la deriva conceptual y la evasión adversaria es más importante que el conocimiento específico del dominio. * Familiaridad con herramientas para el ciclo de vida de ML: seguimiento de experimentos (MLflow, W&B), versionado de modelos (DVC), herramientas de supervisión débil (Snorkel, cleanlab), monitoreo de derivas. * Experiencia con pilas de big data / transmisión en tiempo real (Spark, Kafka, BigQuery) o plataformas de ML en la nube (AWS SageMaker, GCP Vertex). * Antecedentes en investigación de seguridad o inteligencia de amenazas (no obligatorio; el contexto del dominio puede adquirirse).**Quién prospera aquí** * Eres un ingeniero de aprendizaje automático full-stack: te sientes igual de cómodo construyendo una canalización de datos y ajustando un modelo, diseñando un experimento y desplegándolo en producción. * Ya has construido algo desde cero anteriormente: sabes lo que implica pasar de "tenemos datos e ideas" a "tenemos un sistema de detección funcional". * Te entusiasma la ambigüedad y la propiedad: esto no es una lista bien definida de tareas, sino un espacio de problemas abierto en el que tú defines el camino. * Estás listo para asumir responsabilidades de liderazgo: mentorear a otros ingenieros, definir la estrategia técnica y asumir la responsabilidad de la hoja de ruta de aprendizaje automático a medida que el equipo crece a tu alrededor. * Aprovechas herramientas modernas (desarrollo asistido por IA, flujos de trabajo potenciados por LLM) para avanzar más rápido sin sacrificar calidad.


