Szkolenie: Chaos Engineering - proaktywne wykrywanie słabych punktów
Praktyczny kurs dla inżynierów SRE i DevOps chcących wyjść poza reaktywne zarządzanie awariami i proaktywnie wykrywać słabe punkty systemu zanim znajdą je użytkownicy. Uczestnicy uczą się planować i przeprowadzać kontrolowane eksperymenty chaosowe w środowiskach Kubernetes przy użyciu LitmusChaos i Chaos Mesh, korzystać z natywnych narzędzi chmurowych AWS Fault Injection Service i Azure Chaos Studio, integrować eksperymenty z potokiem CI/CD oraz organizować Game Day jako symulację awarii angażującą cały zespół. Kurs uwzględnia komercyjne narzędzia Steadybit i Gremlin oraz najnowsze trendy włącznie z integracją chaosu z agentami AI
Chaos Engineering - proaktywne wykrywanie słabych punktów
Cele szkolenia
Szkolenie przygotowuje inżynierów SRE i DevOps do prowadzenia kontrolowanych eksperymentów chaosowych w środowiskach produkcyjnych, chmurowych i Kubernetes
Szkolenie uczy strukturyzowania eksperymentów Chaos Engineering poprzez definiowanie hipotez, obserwację stanu ustalonego, analizę metryk oraz ocenę odporności systemów
Szkolenie rozwija umiejętność pracy z LitmusChaos, Chaos Mesh oraz narzędziami AWS Fault Injection Service i Azure Chaos Studio wykorzystywanymi do testowania niezawodności
Szkolenie pokazuje jak integrować eksperymenty chaosowe z procesami CI/CD i Continuous Chaos w celu automatycznej weryfikacji jakości wdrożeń
Szkolenie pokazuje jak przeprowadzać Game Day, planowane symulacje awarii wspierające budowanie kultury niezawodności i resilience engineering
Szkolenie uczy identyfikowania słabych punktów architektury oraz ograniczania ryzyka awarii zanim wpłyną one na użytkowników i procesy biznesowe
Szkolenie rozwija kompetencje związane z observability, SLO, fault injection oraz analizą zachowania systemów podczas kontrolowanych zakłóceń
Szkolenie pokazuje najnowsze trendy w Chaos Engineering, w tym wykorzystanie agentów AI do generowania hipotez i automatyzacji eksperymentów
Dla kogo?
Inżynierowie SRE i DevOps odpowiedzialni za niezawodność systemów produkcyjnych
Architekci systemów weryfikujący hipotezy odporności przed wdrożeniem
Liderzy techniczni chcący wprowadzić kulturę Chaos Engineering w organizacji
Inżynierowie platform wewnętrznych projektujący samoobsługową weryfikację odporności
Menedżerowie zespołów odpowiedzialnych za usługi krytyczne dla biznesu
Efekty kształcenia
Uczestnik definiuje hipotezę chaosową oraz dobiera zakres eksperymentu Chaos Engineering minimalizując ryzyko wpływu na środowisko produkcyjne
Uczestnik konfiguruje i uruchamia eksperymenty LitmusChaos wykorzystując komponenty ChaosEngine i ChaosExperiment w środowisku Kubernetes
Uczestnik tworzy eksperymenty PodChaos, NetworkChaos i StressChaos w Chaos Mesh oraz analizuje ich wpływ na niezawodność systemów
Uczestnik projektuje i realizuje scenariusze fault injection z wykorzystaniem AWS Fault Injection Service i Azure Chaos Studio
Uczestnik integruje eksperymenty chaosowe z procesami CI/CD oraz wdraża praktyki Continuous Chaos wspierające jakość wdrożeń
Uczestnik analizuje metryki observability, SLO oraz wyniki eksperymentów w celu oceny odporności aplikacji i infrastruktury
Uczestnik wdraża mechanizmy bezpiecznego przeprowadzania eksperymentów chaosowych z uwzględnieniem RBAC, polityk bezpieczeństwa i audytowalności
Uczestnik planuje i przeprowadza Game Day obejmujący runbook, role zespołowe, komunikację kryzysową oraz analizę rezultatów
Uczestnik identyfikuje słabe punkty architektury systemowej oraz rekomenduje działania zwiększające resilience i dostępność usług
Uczestnik wykorzystuje nowoczesne narzędzia Chaos Engineering oraz rozwiązania AI wspierające automatyzację eksperymentów i analizę wyników
Wymagania
Doświadczenie z Kubernetes na poziomie operacyjnym - deployments, services, namespaces, kubectl
Znajomość podstawowych wzorców odporności (circuit breaker, retry, timeout)
Praktyczne doświadczenie z jednym z dostawców chmurowych (AWS lub Azure)
Zrozumienie SLI i SLO, uczestnik powinien wiedzieć jak mierzyć dostępność swojego systemu
System operacyjny Linux (Ubuntu 22.04 lub nowszy, Fedora 40 lub nowsza), macOS lub Windows z WSL 2
Docker Engine zainstalowany i przetestowany przed szkoleniem (docker run hello-world kończy się sukcesem)
Stabilne łącze internetowe do pobierania obrazów kontenerowych podczas szkolenia
W cenie otrzymasz:
Materiały szkoleniowe
Certyfikat ukończenia szkolenia
W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki