Ingeniero de Fiabilidad de Sitios

Salario negociable

Indeed

Tiempo completo

Presencial

Sin requisito de experiencia

Sin requisito de título

Prta del Sol, 4, 2ºC, Centro, 28013 Madrid, Spain

Favoritos

Nueva

Parte del contenido se ha traducido automáticamenteVer original

Descripción

Como líder mundial en ciberseguridad, CrowdStrike protege a las personas, los procesos y las tecnologías que impulsan las organizaciones modernas. Desde 2011, nuestra misión no ha cambiado: estamos aquí para detener las violaciones de seguridad, y hemos redefinido la seguridad moderna con la plataforma nativa de inteligencia artificial más avanzada del mundo. Trabajamos con sistemas distribuidos a gran escala, procesando casi tres billones de eventos por día, y este volumen de tráfico aumenta diariamente. Nuestros clientes abarcan todos los sectores industriales y confían en CrowdStrike para mantener sus negocios en funcionamiento, garantizar la seguridad de sus comunidades y seguir adelante con sus vidas. Además, somos una empresa impulsada por una misión. Fomentamos una cultura que otorga a cada miembro de CrowdStrike tanto flexibilidad como autonomía para gestionar su propia carrera profesional. Siempre buscamos incorporar a nuestro equipo a talentosos miembros de CrowdStrike que posean una pasión ilimitada, un enfoque incansable en la innovación y un compromiso fanático con nuestros clientes, nuestra comunidad y entre nosotros mismos. ¿Listo para unirte a una misión que realmente importa? El futuro de la ciberseguridad comienza contigo. Acerca del puesto: Nuestra misión consiste en hacer que todos los datos relevantes para la seguridad de nuestros clientes estén continuamente disponibles para la detección y respuesta automatizadas, la investigación de amenazas y otros casos de uso de Falcon. Para lograrlo, los sistemas detrás de NG-SIEM están creciendo para gestionar más de 100 petabytes de datos de eventos y acciones ingeridos cada día, hasta 10 años de retención y decenas de millones de consultas por hora en grandes secciones de los datos almacenados. Como nuevo Ingeniero de Fiabilidad de Sitios (SRE) de NG-SIEM, serás responsable de garantizar la fiabilidad, el rendimiento y la escalabilidad de nuestra plataforma sin servidor, que ofrece esta escala masiva a los clientes y a otros módulos de Falcon. Trabajarás en la mejora de la observabilidad del sistema, la automatización de tareas operativas, la optimización del uso de recursos y el mantenimiento de nuestros estrictos objetivos de nivel de servicio (SLO), equilibrando al mismo tiempo la eficiencia de costos. Este puesto exige una sólida experiencia técnica en sistemas distribuidos, infraestructura en la nube y una profunda pasión por la excelencia operativa. Lo que harás:* Garantizar la fiabilidad de la plataforma: Asumir la responsabilidad de la disponibilidad, latencia, rendimiento y eficiencia de los servicios de la plataforma NG-SIEM, que gestionan más de 100 petabytes/día de ingesta de datos y millones de consultas por hora. * Construir automatización y herramientas: Diseñar e implementar soluciones de automatización para despliegues, monitoreo, respuesta a incidentes y planificación de capacidad, con el fin de reducir la carga operativa y mejorar la eficiencia operativa. * Supervisar y optimizar: Desarrollar soluciones integrales de observabilidad mediante métricas, registros y trazas; identificar y resolver proactivamente cuellos de botella de rendimiento y problemas de fiabilidad. * Gestión de incidentes: Liderar los esfuerzos de respuesta a incidentes, llevar a cabo revisiones posteriores sin asignación de culpas y promover iniciativas de mejora continua para prevenir recurrencias. * Planificación de capacidad: Analizar los datos de rendimiento del sistema y las tendencias de crecimiento para pronosticar las necesidades de infraestructura y asegurar que la plataforma se escale eficientemente según la demanda de los clientes. * Gestión de SLO/SLA: Definir, medir y mantener los objetivos de nivel de servicio (SLO) y los presupuestos de errores; equilibrar la velocidad de desarrollo de nuevas funciones con los requisitos de fiabilidad. * Optimización de costos: Implementar estrategias para optimizar el uso de recursos en la nube y reducir los costos operativos, manteniendo al mismo tiempo los estándares de rendimiento y fiabilidad. * Colaboración interfuncional: Trabajar conjuntamente con equipos de ingeniería para mejorar el diseño de los sistemas desde la perspectiva de la fiabilidad, influir en las decisiones arquitectónicas y aplicar las mejores prácticas de SRE. * Participación en turnos de guardia: Participar en la rotación de turnos de guardia para brindar soporte las 24 horas del día, los 7 días de la semana a los sistemas críticos de producción. * Documentación: Crear y mantener manuales operativos (runbooks), procedimientos operativos y documentación técnica para permitir la escalabilidad del equipo. Qué necesitarás:* Experiencia en Ingeniería de Fiabilidad de Sitios (SRE), DevOps o roles similares que apoyen sistemas distribuidos a gran escala en entornos productivos. * Habilidades sólidas de programación en al menos un lenguaje (Go) para el desarrollo de automatizaciones y herramientas. * Profundo conocimiento práctico de la nube, con experiencia directa en al menos una plataforma en la nube importante (AWS o GCP), incluyendo cómputo, almacenamiento, redes y servicios gestionados. * Conocimientos sobre sistemas distribuidos: Comprensión de patrones de diseño de sistemas distribuidos, modelos de coherencia, tolerancia a fallos y principios de escalabilidad. * Infraestructura como código (IaC): Competencia en herramientas de IaC (Terraform) y gestión de configuraciones (Ansible, Chef, Puppet). * Orquestación de contenedores: Experiencia con Kubernetes, Docker, Podman y patrones de despliegue basados en contenedores. * Experticia en observabilidad: Experiencia práctica con herramientas de monitoreo y observabilidad (Prometheus, Grafana). * Pipelines CI/CD: Experiencia construyendo y manteniendo pipelines de integración y despliegue continuos. * Gestión de incidentes: Trayectoria comprobada en la gestión de incidentes de alta gravedad y la implementación de medidas preventivas. * Enfoque basado en datos: Capacidad para analizar métricas y registros del sistema con el fin de identificar tendencias, anomalías y oportunidades de optimización. * Habilidades comunicativas: Excelentes habilidades verbales y escritas para colaborar de forma remota con equipos globales. Puntos adicionales:* Experiencia a escala masiva: Más de 3 años gestionando sistemas que procesan más de un billón de solicitudes diarias o más de 10 petabytes de datos por día. * Experiencia multi-nube: Trabajo práctico con entornos híbridos o multi-nube. * Experticia en bases de datos: Conocimientos profundos sobre bases de datos distribuidas, lagos de datos o plataformas SIEM (ClickHouse, Redis, MySQL). * Antecedentes en seguridad: Exposición a ciberseguridad, inteligencia de amenazas u operaciones de seguridad. * Experticia en redes: Comprensión avanzada de protocolos de red, equilibrio de carga y tecnologías CDN. #LI-MB1 Beneficios de trabajar en CrowdStrike:* Cultura laboral flexible y compatible con el trabajo remoto. * Líder del mercado en compensación salarial y otorgamiento de acciones. * Programas integrales de bienestar físico y mental. * Vacaciones y días festivos competitivos para recargar energías. * Licencias remuneradas para maternidad, paternidad y adopción. * Oportunidades de desarrollo profesional para todos los empleados, independientemente de su nivel o función. * Redes de empleados, grupos geográficos locales y oportunidades de voluntariado para fortalecer vínculos. * Vibrante cultura de oficina con instalaciones de clase mundial. * Certificado como «Gran lugar para trabajar™» a nivel global. CrowdStrike se enorgullece de ser una empresa que ofrece igualdad de oportunidades. Estamos comprometidos a fomentar una cultura de pertenencia donde todas las personas sean valoradas por quienes son y empoderadas para alcanzar el éxito. Apoyamos a veteranos y personas con discapacidad mediante nuestro programa de acción afirmativa. CrowdStrike se compromete a ofrecer igualdad de oportunidades laborales a todos sus empleados y solicitantes de empleo. La empresa no discrimina en las oportunidades ni en las prácticas laborales por motivos de raza, color, credo, etnia, religión, sexo (incluyendo embarazo o condiciones médicas relacionadas con el embarazo), orientación sexual, identidad de género, estado civil o familiar, condición de veterano, edad, origen nacional, ascendencia, discapacidad física (incluyendo VIH y SIDA), discapacidad mental, condición médica, información genética, participación o actividad en una comisión local de derechos humanos, situación respecto a la asistencia pública, ni por cualquier otra característica protegida por la ley. Todas nuestras decisiones laborales —incluyendo reclutamiento, selección, capacitación, compensación, beneficios, disciplina, ascensos, traslados, despidos temporales, regreso de despidos temporales, terminaciones y programas sociales o recreativos— se basan únicamente en requisitos legítimos del puesto. Si necesitas ayuda para acceder o revisar la información de este sitio web, o requieres asistencia para presentar una solicitud de empleo o solicitar una adaptación razonable, ponte en contacto con nosotros en recruiting@crowdstrike.com para obtener mayor apoyo.

Fuentea: indeed Ver publicación original