Categorías
···
Entrar / Registro

Ingeniero de Confiabilidad del Sitio, Referente Técnico

Indeed
Tiempo completo
Presencial
Sin requisito de experiencia
Sin requisito de título
Carrer d'Aribau, 66, Eixample, 08011 Barcelona, Spain
Favoritos
Compartir
Parte del contenido se ha traducido automáticamenteVer original

Descripción

Resumen: Únete a dLocal como Ingeniero de Confiabilidad del Sitio (SRE) para diseñar, implementar y mantener de forma continua nuestra plataforma centralizada de observabilidad utilizando OpenTelemetry, impactando a millones de personas a nivel mundial. Aspectos destacados: 1. Trabajar en aplicaciones críticas para la misión con marcas globales como Netflix y Amazon 2. Formar parte de un increíble equipo global compuesto por más de 30 nacionalidades diferentes 3. Diseñar, implementar y mantener canalizaciones de observabilidad utilizando OpenTelemetry ¿Por qué deberías unirte a dLocal? dLocal permite que las empresas más grandes del mundo cobren pagos en 40 países de mercados emergentes. Las marcas globales confían en nosotros para aumentar las tasas de conversión y simplificar sin esfuerzo la expansión de los pagos. Al actuar tanto como procesador de pagos como comerciante registrado en las regiones donde operamos, hacemos posible que nuestros comerciantes ingresen a los mercados emergentes de más rápido crecimiento del mundo. Al unirte a nosotros, formarás parte de un increíble equipo global que lo hace todo posible. Ser parte de dLocal significa trabajar con más de 1000 compañeros de más de 30 nacionalidades diferentes y desarrollar una carrera internacional que impacta diariamente la vida de millones de personas. Somos constructores, nunca huimos de un desafío, somos centrados en el cliente y, si esto suena como tú, sabemos que prosperarás en nuestro equipo. **¿Cuál es la oportunidad?** Estamos buscando un Ingeniero de Confiabilidad del Sitio (SRE) para unirse a nuestro equipo. Como Ingeniero de Confiabilidad del Sitio (SRE), te centrarás en el diseño, la implementación y el mantenimiento continuo de nuestra plataforma centralizada de observabilidad utilizando OpenTelemetry (OTEL) como su backend. Formarás parte de un talentoso equipo que trabaja en aplicaciones críticas para la misión con grandes clientes como Netflix, Amazon, Nike, Facebook y muchos más. Como Ingeniero de Confiabilidad del Sitio, siempre se espera que formules las preguntas necesarias: ¿Qué datos necesitamos para comprender cómo están funcionando nuestros sistemas? ¿Cómo recopilamos estos datos? ¿Qué patrones buscamos en los datos y qué significan? ¿A quién se debe notificar cuando un determinado sistema no funciona correctamente? ¿Tenemos algún sistema del que necesitemos más datos? Un ingeniero SRE diseña sistemas y procesos para responder a las preguntas anteriores y proporcionar soporte y respuestas automatizados siempre que sea posible. ### **¿Qué harás?** * **Gestionar canalizaciones de OpenTelemetry**: Diseñar, implementar y mantener canalizaciones de observabilidad en las tres señales principales: registros (logs), métricas y trazas (traces), garantizando una ingesta de datos estandarizada, escalable y eficiente. Optimizar las estrategias de ingesta para equilibrar costos, rendimiento y usabilidad. * **Empoderar a los equipos de ingeniería**: Construir automatización y herramientas de autoservicio que permitan a los equipos de desarrollo instrumentar y aprovechar la observabilidad sin requerir intervención manual del equipo de SRE. Impulsar la adopción de las mejores prácticas, asegurando que los equipos asuman la propiedad de sus datos de telemetría. * **Apoyar la gestión de incidentes**: Ser el lado de ingeniería de nuestro Equipo de Gestión de Incidentes, diseñando los procesos, guías operativas (playbooks), listas de verificación (checklists) y automatizaciones que ellos y otros ingenieros deben seguir durante un incidente. * **Colaborar entre equipos**: Interactuar con miembros de casi todos los equipos de la empresa para comprender sus requisitos de monitoreo, alertas y SLO/SLA, y diseñar sistemas y procesos que garanticen que cumplimos o superamos dichos requisitos. Influir en las decisiones arquitectónicas desde las etapas iniciales de diseño para garantizar resiliencia y escalabilidad desde el inicio del desarrollo de software. * **Automatizar la infraestructura de observabilidad**: Aprovechar la Infraestructura como Código (IaC) para aprovisionar y gestionar herramientas de monitoreo, reglas de alertas y nuestras configuraciones de observabilidad en las canalizaciones de OTEL. * **Definir estándares básicos de observabilidad**: Diseñar requisitos mínimos para servicios nuevos y existentes, garantizando que toda la infraestructura y el código de dLocal estén monitoreados de forma consistente y precisa a un nivel básico. * **Gestionar la salud técnica y de seguridad**: Asumir la responsabilidad total de la confiabilidad de la infraestructura de dLocal, asegurando el cumplimiento de los indicadores clave de rendimiento (KPI) relacionados con la disponibilidad y la seguridad. * **Optimizar los sistemas de alertas**: Refinar de forma continua las señales de alerta para minimizar el ruido y garantizar que siempre sean accionables, reduciendo la fatiga y mejorando la eficiencia de la respuesta. ### **¿Qué habilidades necesitas?** * Más de 4 años de experiencia como ingeniero SRE o en un rol muy similar, con mayor énfasis en observabilidad. * Experiencia avanzada en Kubernetes, incluyendo sus componentes fundamentales, metodologías de implementación y mejores prácticas de monitoreo. * Alguna comprensión de OpenTelemetry, incluyendo la configuración de recolectores (collectors) de OTEL, instrumentación y optimización de canalizaciones. * Competencia con herramientas de monitoreo y registro como Grafana, Prometheus, Loki, New Relic o Datadog. * Experiencia práctica con herramientas de Infraestructura como Código (IaC) (Terraform) y soluciones GitOps de CI/CD (ArgoCD, GitHub Actions u otras similares). * Experiencia integrando plataformas de gestión de incidentes (PagerDuty, Jira) con flujos de trabajo automatizados de alertas. * Capacidad sólida de scripting (Python, Go u otros similares) para automatizar tareas de observabilidad. * Mentalidad orientada a la resolución de problemas, con capacidad para colaborar con equipos multifuncionales para impulsar mejoras en la confiabilidad. **Destacarás si tienes:** * Experiencia en la nube, especialmente con **AWS** y cargas de trabajo basadas en **ECS**. * Experiencia gestionando **canalizaciones de observabilidad a gran escala** en entornos de alto volumen de tráfico. * Familiaridad con **Configuración como Código (Ansible, Chef o SaltStack)** para gestionar configuraciones en instancias heredadas. * Experiencia en **monitoreo del rendimiento de bases de datos**, particularmente en entornos distribuidos a gran escala. ¿Qué ofrecemos? Además de los beneficios personalizados que tenemos para cada país, dLocal te ayudará a prosperar y dar ese paso extra ofreciéndote: * Flexibilidad: contamos con horarios flexibles y nos guiamos por el rendimiento. * Industria fintech: trabaja en un entorno dinámico y en constante evolución, con mucho por construir y potenciar tu creatividad. - Programa de bonos por referidos: nuestros talentos internos son los mejores reclutadores; refiere a alguien ideal para un puesto y recibe una recompensa. * Aprendizaje y desarrollo: obtén acceso a una suscripción Premium a Coursera. * Clases de idiomas: ofrecemos clases gratuitas de inglés, español o portugués. * Presupuesto social: recibirás un presupuesto mensual para relajarte con tu equipo (presencial o remoto) y fortalecer vuestros vínculos. * Casas dLocal: ¿quieres alquilar una casa para pasar una semana en cualquier lugar del mundo trabajando junto a tu equipo? ¡Contamos contigo! **Flexibilidad en tu forma de trabajar:** Nos centramos en el impacto y la productividad, no en horarios fijos. Esto significa que nuestros equipos tienen horarios flexibles y, según tu rol y ubicación, combinarás tiempo de enfoque autogestionado con momentos de conexión presencial en nuestros centros de colaboración. ¿Qué ocurre tras enviar tu solicitud? Nuestro equipo de Adquisición de Talento está comprometido con crear la mejor experiencia posible para los candidatos, así que no te preocupes: ¡sin duda recibirás noticias nuestras! Revisaremos tu currículum y te mantendremos informado por correo electrónico en cada etapa del proceso. Además, puedes visitar nuestra página web, LinkedIn y YouTube para conocer más sobre dLocal. Podemos utilizar herramientas de inteligencia artificial (IA) para apoyar partes del proceso de contratación, como la revisión de solicitudes, el análisis de currículums o la evaluación de respuestas. Estas herramientas ayudan a nuestro equipo de reclutamiento, pero no sustituyen el juicio humano. Las decisiones finales de contratación siempre las toman personas. Si deseas más información sobre cómo se procesan tus datos, contáctanos.

Fuentea:  indeed Ver publicación original
David Muñoz
Indeed · HR

Compañía

Indeed
David Muñoz
Indeed · HR

Empleos similares

Cookie
Configuración de cookies
Nuestras aplicaciones
Download
Descargar en
APP Store
Download
Consíguelo en
Google Play
© 2025 Servanan International Pte. Ltd.