Especialista en equipo rojo de IA francófono e inglés – Teletrabajo

Indeed

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

Spain

Favoritos

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Únase a un equipo rojo de expertos en datos humanos para someter modelos de IA a entradas adversarias, identificar vulnerabilidades y generar datos que mejoren la seguridad de la IA. Aspectos destacados: 1. Modelos y agentes de IA conversacional de equipo rojo para descubrir vulnerabilidades 2. Generar datos humanos de alta calidad para reforzar los sistemas de IA 3. Descubrir vulnerabilidades que las pruebas automatizadas pasan por alto **Modalidad de trabajo:** Teletrabajo **Tipo de colaboración:** Contratista independiente **Horario:** Contrato a tiempo completo o a tiempo parcial **Esta función existe** Creemos que la IA más segura es aquella que ya ha sido atacada — por nosotros. Estamos conformando un equipo rojo para este proyecto: expertos en datos humanos que someten modelos de IA a entradas adversarias, identifican vulnerabilidades y generan datos de equipo rojo que hacen que la IA sea más segura para nuestros clientes. Este proyecto implica revisar salidas de IA que abordan temas sensibles como sesgo, desinformación o comportamientos perjudiciales. Todo el trabajo es textual y la participación en proyectos de mayor sensibilidad es opcional y cuenta con pautas claras y recursos de bienestar. Antes de exponerse a cualquier contenido, se comunicarán claramente los temas correspondientes. **Sus responsabilidades** * Realizar pruebas de equipo rojo sobre modelos y agentes de IA conversacional: técnicas de jailbreak, inyecciones de indicaciones (prompt injections), casos de uso indebido, explotación de sesgos, manipulación en múltiples turnos * Generar datos humanos de alta calidad: anotar fallos, clasificar vulnerabilidades y señalar riesgos sistémicos * Aplicar estructura: seguir taxonomías, referencias comparativas (benchmarks) y manuales operativos para mantener la coherencia en las pruebas * Documentar de forma reproducible: elaborar informes, conjuntos de datos y casos de ataque sobre los que los clientes puedan actuar **Perfil ideal** * Posee experiencia previa en equipos rojos (trabajo adversario con IA, ciberseguridad, análisis socio-técnico) * Es curioso y adversario: empuja instintivamente los sistemas hasta sus límites * Es estructurado: utiliza marcos metodológicos o referencias comparativas, no solo ataques aleatorios * Es comunicativo: explica claramente los riesgos tanto a partes interesadas técnicas como no técnicas * Es adaptable: prospera al transitar entre distintos proyectos y clientes **Especialidades deseables (no excluyentes)** * Aprendizaje automático adversario: conjuntos de datos para jailbreak, inyección de indicaciones (prompt injection), ataques RLHF/DPO, extracción de modelos * Ciberseguridad: pruebas de penetración, desarrollo de exploits, ingeniería inversa * Riesgos socio-técnicos: análisis de acoso/desinformación, análisis de abuso, pruebas de IA conversacional * Exploración creativa: psicología, interpretación teatral, escritura para el pensamiento adversario no convencional **Qué significa el éxito** * Descubre vulnerabilidades que las pruebas automatizadas pasan por alto * Entrega artefactos reproducibles que refuerzan los sistemas de IA de los clientes * La cobertura de evaluación se amplía: se prueban más escenarios y surgen menos sorpresas en producción **Condiciones contractuales y de pago** ------------------------------ * Será contratado como contratista independiente. * Se trata de un puesto completamente remoto que puede realizarse según su propio horario. * Los proyectos pueden extenderse, acortarse o finalizarse anticipadamente según las necesidades y el desempeño. * Los pagos se realizan semanalmente mediante Stripe o Wise, según los servicios prestados.

Fuentea: indeed Ver publicación original