À noite, dei à equipe um compartilhamento de experiências de "emergência de falha", que incluiu: 1) Processo de tratamento de emergência de falha e SOP; 2) "sinais vitais" do site e indicadores de monitoramento; 3) Mecanismo de proteção contra ataques DDoS e CC; 4) Identificação de picos de tráfego de negócios e gargalos de banco de dados; 5) modo de alocação de recursos e estratégia de resposta multilinha; 6) Solução de problemas de máquina única e diagnóstico em nível de processo; 7) Capacitação do sistema de monitoramento e diagnóstico de falhas; Espere um minuto. Este tema, indo mais fundo, sinto que posso falar de dez lições, alguém vai se interessar? 😄