Analista de QA contra Fraudes - Teletrabajo

Indeed

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

Spain

Favoritos

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Este puesto implica realizar actividades de equipo rojo sobre modelos de IA conversacional, generar datos humanos de alta calidad, aplicar estructura y documentar hallazgos para mejorar la seguridad de la IA. Aspectos destacados: 1. Probar modelos de IA con entradas adversarias para identificar vulnerabilidades 2. Generar datos de equipo rojo para hacer la IA más segura para los clientes 3. Oportunidad de descubrir vulnerabilidades que las pruebas automatizadas pasan por alto **Ubicación**: Teletrabajo **Tipo**: Trabajo por contrato a tiempo completo o parcial **Conocimientos lingüísticos exigidos**: Inglés e italiano. Se requiere fluidez nativa en inglés e italiano para este puesto. **Motivo de existencia de este puesto** Creemos que la IA más segura es aquella que ya ha sido atacada… por nosotros. Estamos conformando un equipo rojo para este proyecto: expertos humanos en datos que someten modelos de IA a entradas adversarias, identifican vulnerabilidades y generan los datos de equipo rojo que hacen la IA más segura para nuestros clientes. Este proyecto implica revisar salidas de IA relacionadas con temas sensibles, como sesgos, desinformación o comportamientos perjudiciales. Todo el trabajo es textual, y la participación en proyectos de mayor sensibilidad es opcional y está respaldada por directrices claras y recursos para el bienestar. Antes de acceder a cualquier contenido, se comunicarán explícitamente los temas tratados. **Sus responsabilidades** * Realizar actividades de equipo rojo sobre modelos y agentes de IA conversacional: técnicas de jailbreak, inyecciones de indicaciones (prompt injections), casos de uso indebido, explotación de sesgos, manipulación en múltiples turnos * Generar datos humanos de alta calidad: anotar fallos, clasificar vulnerabilidades y señalar riesgos sistémicos * Aplicar estructura: seguir taxonomías, referencias comparativas (benchmarks) y manuales operativos para mantener la coherencia en las pruebas * Documentar de forma reproducible: elaborar informes, conjuntos de datos y casos de ataque sobre los que los clientes puedan actuar **Perfil del candidato** * Posee experiencia previa en actividades de equipo rojo (trabajo adversario con IA, ciberseguridad, exploración socio-técnica) * Es curioso y adversario: empuja instintivamente los sistemas hasta sus límites * Es estructurado: utiliza marcos metodológicos o referencias comparativas, no solo ataques aleatorios * Es comunicativo: explica claramente los riesgos tanto a partes interesadas técnicas como no técnicas * Es adaptable: se desenvuelve con éxito al transitar entre distintos proyectos y clientes **Especialidades deseables (no obligatorias)** * Aprendizaje automático adversario: conjuntos de datos para jailbreak, inyección de indicaciones (prompt injection), ataques RLHF/DPO, extracción de modelos * Ciberseguridad: pruebas de penetración, desarrollo de exploits, ingeniería inversa * Riesgo socio-técnico: exploración de acoso/desinformación, análisis de abuso, pruebas de IA conversacional * Exploración creativa: psicología, interpretación teatral, redacción para un pensamiento adversario poco convencional **Indicadores de éxito** * Identifica vulnerabilidades que las pruebas automatizadas pasan por alto * Entrega artefactos reproducibles que fortalecen los sistemas de IA de los clientes * La cobertura de evaluación se amplía: se prueban más escenarios y surgen menos sorpresas en producción

Fuentea: indeed Ver publicación original