Python для инженеров
Описание курса
Для SRE-инженеров, которые хотят взять под контроль состояние системы. Научитесь агрегировать SLO/SLI в одну или несколько высокоуровневых метрик.
Общие подходы к формированию мониторинга
На серии мастер-классов вы построите систему мониторинга приложений, состоящих из множества микросервисов.
Настройка Golden Signals
Чтобы научиться использовать основные Golden Signals SRE на любом сервисе для эффективности мониторинга и оповещения.
Система алертов
Чтобы вы могли настроить систему алертов, которая обеспечит быстрое реагирование на аварии без отвлекающих уведомлений.
Мониторинг множества сервисов
Чтобы научиться приоритизировать таски, даже если продакт каждого из 100 сервисов говорит, что его задача самая критичная.
онлайн
- Павел Лакосников, независимый эксперт, более 10 лет в разработке, фанат метрик, регулярный докладчик на конференциях и митапах.
- Настройка мониторинга
- Агрегация SLO/SLI
- Создание системы алертов
- Приоритизация задач по метрикам
- SRE-инженеры
- Команды с внедрённым error budget и SLO
- Компании, которые хотят наладить мониторинг
Базовые знания об SRE-практиках, навыки программирования на Python, работа с Linux, опыт работы с Kubernetes и настройкой мониторинга (Prometheus, Grafana и др.)
Выводы о курсе
Возможны неточности
Курс «SRE: Observability» предоставляет глубокие знания в области мониторинга и управления надежностью систем. Участники научатся анализировать метрики и эффективно предотвратить инциденты, что повысит отказоустойчивость их систем. Получив сертификат, выпускники смогут применить полученные знания в своих компаниях для улучшения процессов и квалификации.
Отзывы о школе Слёрм
Читать все отзывыРекомендованные курсы