Кейсы клиентов

Как банку перейти от ручной работы с ИТ-инцидентами к автоматизации?

В одном из крупнейших российских банков в случае инцидента в ИТ-инфраструктуре или цифровом продукте дежурные выполняли ручную диагностику проблем и оповещение ответственных инженеров. Как Monq с помощью автоматизации помог снизить время устранения ИТ-сбоев?
Проблема
C какими проблемами столкнулись?
  1. Слабая автоматизация процессов: При наступлении инцидентов дежурный выполняет пошагово инструкции по диагностике проблем и оповещению ответственных.
  2. Сложно следить за обновлениями базы знаний: новые сотрудники часто ошибаются при выполнении инструкций.
  3. Большая зависимость от человека: страдает SLA.
Решение
Как решили?
  1. Настроена автоматизация по событиям. Сократили время реагирования на инциденты. Сократили количество ошибок при выполнении инструкций.
  2. Сообщения о проблемах направляются ответственным автоматически. Освободили время сотрудников для выполнения действительно полезных действий по проблемам.
  3. Автоматизация работы с базой знаний. Инженеру в автоматизированном режиме выдается необходимая статья базы знаний.
Результат
Каких результатов достигли?
  1. Снизили время обработки критических инцидентов с 25 до 15 минут.
  2. Снизили число оповещений на одного SRE-инженера со 110 до 10 оповещений.
  3. Снизили время обработки критических инцидентов с 99.4% до 99.8%.