O que é a gestão de clusters? E porquê?
Em termos simples, quando você se levanta um sistema de missão crítica de negócios, você precisa projetar a infra-estrutura de forma a minimizar ou eliminar pontos únicos de falha que poderiam fechar ou afetar muito suas operações de negócios (se algo der errado e seu sistema online falhar). A solução é conhecida como design para 'alta disponibilidade / recuperação de desastres'.
Então o que as empresas fariam seria configurar seu(s) sistema(s) de Produção / Vivo em uma configuração de cluster. O clustering é sobre a configuração de hardware e software redundante no caso de sua instância primária falhar, para que as operações possam ser rapidamente comutadas para uma instância secundária. Existem diferentes maneiras de se conseguir esta configuração tanto do ponto de vista do hardware como do software, mas independentemente das opções, no final você precisa ter as seguintes coisas para minimizar / eliminar a interrupção do negócio:
>ul>< A arquitetura de clusters se manteve em pé>li> Software de gerenciamento de cluster (software especializado que monitora o desempenho da instância primária e lida com a transição para a infraestrutura de clusters secundários quando a primária falha)li>li>Um conjunto de processos (alguns automatizados e outros manuais) que complementam a transição para o cluster para que você possa retomar as operações e lidar com quaisquer transações que não foram concluídas como resultado da interrupção do serviço, bem como com quaisquer outras questões técnicas/funcionais que possam surgir como uma conseqüência natural de operar em uma instância secundária.>li> Você também tem que ter um processo no lugar pelo qual você pode fazer uma análise de causa raiz do que causou o problema, depois resolvê-lo, depois planejar a comutação do seu cluster para a instância primária.li>lia>Quando a infra-estrutura e as operações mudam no tempo, os seus procedimentos de gerenciamento de HA/DR/cluster precisam ser mantidos até a data, caso contrário eles não funcionarão. Isto envolve não apenas documentação, mas também testes reais de cenários de desastre.Todos os itens acima dão uma idéia do porquê você precisa ter pessoas, tecnologia e processos associados à gestão de clusters.