Categorías
···
Entrar / Registro

Entrenador de IA japonés - Teletrabajo

Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
España
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Únase a un equipo rojo de expertos en datos humanos para evaluar modelos de IA con entradas adversarias, identificar vulnerabilidades y generar datos que mejoren la seguridad de la IA. Aspectos destacados: 1. Equipo rojo de modelos de IA conversacional con entradas adversarias 2. Generar datos humanos de alta calidad para hacer la IA más segura 3. Descubrir vulnerabilidades que las pruebas automatizadas pasan por alto **Modalidad de trabajo:** Teletrabajo **Tipo de vinculación:** Contratista independiente **Horario:** Contrato a tiempo completo o a tiempo parcial **Esta función existe** Creemos que la IA más segura es aquella que ya ha sido atacada — por nosotros. Estamos conformando un equipo rojo para este proyecto \- expertos humanos en datos que evalúan modelos de IA con entradas adversarias, identifican vulnerabilidades y generan los datos del equipo rojo que hacen la IA más segura para nuestros clientes. Este proyecto implica revisar salidas de IA relacionadas con temas sensibles como sesgo, desinformación o comportamientos dañinos. Todo el trabajo es basado en texto, y la participación en proyectos de mayor sensibilidad es opcional y está respaldada por directrices claras y recursos de bienestar. Antes de exponerse a cualquier contenido, se comunicarán claramente los temas correspondientes. **Sus responsabilidades** * Evaluar modelos y agentes de IA conversacional mediante técnicas de equipo rojo: escapadas (jailbreaks), inyecciones de indicaciones (prompt injections), casos de uso indebido, explotación de sesgos y manipulación multi-turno * Generar datos humanos de alta calidad: anotar fallos, clasificar vulnerabilidades y señalar riesgos sistémicos * Aplicar estructura: seguir taxonomías, referencias comparativas (benchmarks) y manuales operativos para mantener la coherencia en las pruebas * Documentar de forma reproducible: producir informes, conjuntos de datos y casos de ataque sobre los que los clientes puedan actuar **Perfil buscado** * Tener experiencia previa en actividades de equipo rojo (trabajo adversario con IA, ciberseguridad, evaluación socio-técnica) * Ser curioso y tener mentalidad adversaria: impulsar instintivamente los sistemas hasta sus límites de fallo * Ser estructurado: utilizar marcos metodológicos o referencias comparativas, no solo ataques aleatorios * Ser comunicativo: explicar claramente los riesgos tanto a partes interesadas técnicas como no técnicas * Ser adaptable: prosperar al trasladarse entre distintos proyectos y clientes **Especialidades deseables** * Aprendizaje automático adversario: conjuntos de datos para escapadas (jailbreak), inyección de indicaciones (prompt injection), ataques RLHF/DPO, extracción de modelos * Ciberseguridad: pruebas de penetración, desarrollo de exploits, ingeniería inversa * Riesgo socio-técnico: evaluación de acoso/desinformación, análisis de abuso, pruebas de IA conversacional * Evaluación creativa: psicología, interpretación, redacción para un pensamiento adversario poco convencional **Qué significa el éxito** * Descubrir vulnerabilidades que las pruebas automatizadas pasan por alto * Entregar artefactos reproducibles que refuercen los sistemas de IA de los clientes * Ampliar la cobertura de evaluación: probar más escenarios y reducir sorpresas en producción **Términos contractuales y de pago** ------------------------------ * Se le contratará como contratista independiente. * Se trata de una posición completamente remota que puede realizarse según su propio horario. * Los proyectos pueden ampliarse, acortarse o finalizarse anticipadamente según las necesidades y el desempeño. * Los pagos se realizan semanalmente mediante Stripe o Wise, según los servicios prestados.

Fuentea:  indeed Ver publicación original
David Muñoz
Indeed · HR

Compañía

Indeed
David Muñoz
Indeed · HR
Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.