Увечері я розповів команді про обмін досвідом щодо «надзвичайних ситуацій з несправностями», який включав: 1) процес обробки аварійних ситуацій та СОП; 2) «Життєві показники» та індикатори моніторингу; 3) механізм захисту від DDoS та CC атак; 4) Виявлення піків бізнес-трафіку та вузьких місць у базах даних; 5) режим розподілу ресурсів і багаторядкова стратегія реагування; 6) Усунення несправностей однієї машини та діагностика на рівні процесу; 7) нарощування потенціалу системи моніторингу та діагностики несправностей; Зачекай хвилинку. Ця тема, заглиблюючись, я відчуваю, що можу розповісти про десять уроків, комусь буде цікаво? 😄