




Resumen: Únase a un equipo rojo de expertos en datos humanos para probar modelos de IA con entradas adversarias, identificar vulnerabilidades y generar datos que mejoren la seguridad de la IA. Aspectos destacados: 1. Modelos de IA conversacional del equipo rojo para descubrir vulnerabilidades 2. Generar datos humanos de alta calidad para mejorar la seguridad de la IA 3. Trabajar de forma remota como contratista independiente con horarios flexibles **Modalidad de trabajo:** Remota **Tipo de contratación:** Contratista independiente **Horario:** Contrato a tiempo completo o a tiempo parcial **Conocimientos lingüísticos fluidos requeridos:** Inglés y coreano. Se exige fluidez nativa en inglés y coreano para este puesto. **Función:** Creemos que la IA más segura es aquella que ya ha sido atacada — por nosotros. Estamos formando un equipo rojo para este proyecto: expertos en datos humanos que prueban modelos de IA con entradas adversarias, detectan vulnerabilidades y generan datos del equipo rojo que hacen que la IA sea más segura para nuestros clientes. Este proyecto implica revisar salidas de IA que abordan temas sensibles, como sesgos, desinformación o comportamientos dañinos. Todo el trabajo es basado en texto, y la participación en proyectos de mayor sensibilidad es opcional y está respaldada por pautas claras y recursos de bienestar. Antes de estar expuesto a cualquier contenido, se comunicarán claramente los temas correspondientes. **Sus responsabilidades** * Probar modelos y agentes de IA conversacional del equipo rojo: escapadas (jailbreaks), inyecciones de indicaciones (prompt injections), casos de uso indebido, explotación de sesgos, manipulación multivuelta * Generar datos humanos de alta calidad: anotar fallos, clasificar vulnerabilidades y señalar riesgos sistémicos * Aplicar estructura: seguir taxonomías, referencias comparativas (benchmarks) y manuales para mantener coherencia en las pruebas * Documentar de forma reproducible: elaborar informes, conjuntos de datos y casos de ataque sobre los que los clientes puedan actuar **Perfil ideal** * Tener experiencia previa en equipos rojos (trabajo adversario con IA, ciberseguridad, exploración socio-técnica) * Ser curioso/a y tener mentalidad adversaria: impulsar instintivamente los sistemas hasta sus límites * Ser estructurado/a: utilizar marcos de trabajo o referencias comparativas (benchmarks), no solo ataques aleatorios * Ser comunicativo/a: explicar claramente los riesgos a partes interesadas técnicas y no técnicas * Ser adaptable/a: prosperar al cambiar entre proyectos y clientes **Especialidades deseables (no obligatorias)** * Aprendizaje automático adversario: conjuntos de datos para escapadas (jailbreak), inyección de indicaciones (prompt injection), ataques RLHF/DPO, extracción de modelos * Ciberseguridad: pruebas de penetración, desarrollo de exploits, ingeniería inversa * Riesgo socio-técnico: exploración de acoso/desinformación, análisis de abuso, pruebas de IA conversacional * Exploración creativa: psicología, interpretación, escritura para un pensamiento adversario poco convencional **Qué significa el éxito** * Descubrir vulnerabilidades que las pruebas automatizadas pasan por alto * Entregar artefactos reproducibles que fortalezcan los sistemas de IA de los clientes * Ampliar la cobertura de evaluación: probar más escenarios y reducir sorpresas en producción **Términos del contrato y del pago** ------------------------------ * + Usted será contratado/a como contratista independiente. + Se trata de un puesto completamente remoto que puede realizarse según su propio horario. + Los proyectos pueden ampliarse, acortarse o finalizarse anticipadamente según las necesidades y el rendimiento. + Los pagos se realizan semanalmente mediante Stripe o Wise, según los servicios prestados.


