- Michael Friedrich
- Mittwoch, 14. Dez 2022
- 12:00 - 12:45
- Track 7
- Session
Der Kubernetes-Observability-Stack läuft mit Prometheus, und Dashboards bieten viele interessante Einblicke. Die Details sind überwältigend und Teams sind mit Warnmeldungen überschwemmt. Alerts und Service Level Objectives (SLO) erfordern Absprachen im Team. Dokumentation und Alarm-Aktionen für SRE- und DevOps-Teams sind ebenfalls erforderlich.
Ein simulierter Produktionsausfall kann helfen, um zu sehen ob die SLOs erfüllt oder Alarme ausgelöst werden. Gibt es eine Möglichkeit, Anwendungen mit Chaos zu stören, und das Verhalten zu überwachen?
Nehmen Sie an diesem Vortrag teil, um in Ops- und Dev-Geschichten mit praktischen Einblicken in Kubernetes-Metriken, Prometheus-Alarmierung, Chaos-Engineering mit Chaos Mesh, und OpenTelemetry-App-Instrumentierung einzutauchen und von Produktionsausfällen mit fehlgeschlagenen SLOs zu lernen. Gewinnen Sie Vertrauen in Chaos-Engineering als SRE und als Entwickler, welche den Mehrwert von Observability erkennen. Willkommen zu Day 2 DevOps.