ML/AI в системе мониторинга: прогнозирование и предотвращение инцидентов

Привет, Хабр! Меня зовут Павел Степуро, я исполнительный директор ДИТа «Занять и Сберегать» в Сбере. Вы по-прежнему работаете в ИТ, сопровождаете автоматизированные системы и уже ознакомились с моей первой статьёй про путь от создания базовой системы мониторинга к системе автоматизации и принятия решений Именно поэтому вы находитесь здесь… И это продолжение пути. Итак, вы создали систему мониторинга мечты! У вас уже есть посекундный сбор критичных метрик: инфраструктурных, прикладных и бизнес-метрик, и вы думаете о дальнейшем развитии. В этот момент вы понимаете, что после создания системы, которая обнаруживает инциденты в моменте, вам нужно решение, которое будет их предотвращать, своевременно предсказывать сбои и устранять их причины до того, как они повлияют на клиентов и пользователей. И сделать это можно с помощью ML predict-модели, которая будет предсказывать поведение метрик на 15 минут вперёд.

https://habr.com/ru/companies/sberbank/articles/1015336/

#мониторинг #MLpredict #predictions #алертинг #автоматизация #система_мониторинга #data_scientist_data_analyst #ml #ai #инцидент

ML/AI в системе мониторинга: прогнозирование и предотвращение инцидентов

Привет, Хабр! Меня зовут Павел Степуро, я исполнительный директор ДИТа «Занять и Сберегать» в Сбере.  Вы по-прежнему работаете в ИТ, сопровождаете автоматизированные системы и уже ознакомились с...

Хабр