CEPH - RBD com disco Travado

Descrição do problema

Temos na FIRMA um ambiente com 10 servidores Proxmox VE (PVE) fazendo a virtualização e utilizando o CEPH como Storage. Após uma pane elétrica foi necessário fazer intervenção manual pois o sistema parou por completo e o CEPH precisava refazer a sincronia e o PVE restabelecer o cluster de virtualização.

Como um dos nós não estava entrando no ar tentei forçar a migração da VM - vou chamar aqui de vm100 - porém por alguma razão a migração não foi efetuada com sucesso, resolvi observar outras questões e depois voltar para analisar a falha de migração da vm100. Após uns 15 minutos o processo não foi concluído, permanecendo como se ainda estivesse executando, por conta da minha ansiedade resolvi reiniciar logo o node problemático.

[Saiba mais]

CEPH - Componentes

Ibagens eu quero ibagens

Mas como é realmente o funcionamento do CEPH ? Como ele faz isso ?

Então para facilitar o entendimento temos de conhecer os componentes básicos do CEPH:

Ferramenta Função
Ceph OSD Daemon responsável por armazenar os dados, replicá-los, fazer o balanceamento e se comunicar com os monitors deixando-os atualizados quanto ao mapeamento dos dados.
Monitors Verifica o funcionamento do Cluster CEPH, o mapeamento dos monitores e dos OSD, os mapas dos PG e o CRUSH. Guarda ainda as alterações ocorridas nos Monitors,OSDs e PGs.
MDS Metadata Server, armazena os metadados para dar apoio ao Ceph Filesystem ( o Ceph Block Devices e Ceph Object Storage não usam MDS ). Ele serve apenas para auxiliar o CEPH FS, tornando possível que usuários de sistemas executem comandos triviais como ls, find, etc…
CRUSH É o algoritmo responsável por determinar como armazenar e coletar os dados. Ele permite que os clientes CEPH se comuniquem diretamente com os OSD invés de precisar de um servidor ou controlador para intermediar a comunicação.
PG Placement Group - agrega os objetos dentro de um pool, já que rastrear objetos e seus metadados em um sistema de armazenamento de objetos pode gerar um custo computacional considerável.
RADOS
Librados
Rados GW

CEPH - O que é?

Série de Posts?

Este será o primeiro de uma série de posts sobre o CEPH, me ajudará mais como plano de estudo, orientando o conhecimento sobre a tecnologia.

A ideia é explicar o objetivo do mesmo e formas de implementação.

Em tempo, existem outras propostas além do CEPH para a parte de distribuição de arquivos, porém a ideia ainda não é fazer comparativos até para não perdermos o foco. A proposta dessa série é elucidar como ele funciona e seus complementos, afinal não adianta tentarmos fazer comparações antes de conhecer como realmente ele funciona.

[Saiba mais]