Como recuperar de uma perda de energia em um servidor OVM

2

Tivemos um erro da UPS e perdemos energia em um servidor físico que hospeda mais de 10 máquinas virtuais usando a plataforma Oracle VM. Nós voltamos a trabalhar, mas estou me perguntando qual é a melhor maneira de se recuperar disso. Especificamente, gostaria de saber se precisamos executar o fsck em cada VM individual e / ou devemos executar o fsck no nível da plataforma? Nosso sysadmin recentemente saiu, e eu sou muito mais um programador do que um administrador de sistemas, então isso está um pouco além do meu eu. Eu tenho olhado para a documentação do OVM (OVM Manager 3.2.1), mas não consigo encontrar nada especificamente sobre como lidar com esse tipo de situação. Sou grato a qualquer um que possa me apontar na direção certa.

    
por fronzee 05.08.2013 / 20:01

1 resposta

1

Idealmente, você deve fsck dos sistemas de arquivos de cada VM. Você deve executar a VM no modo de usuário único ou inicializar a partir da rede ou de uma imagem de CD para fazer isso. Se você quiser inicializar a VM no modo de usuário único, faça o seguinte:

  1. Faça logon no servidor VM como raiz.
  2. Localize o arquivo de configuração da VM. Eu normalmente busco pelo nome da VM:

    grep -r vm_name /OVS/Repositories/*
    
  3. Inicie a VM manualmente usando as ferramentas do Xen, em vez de iniciar a partir do OVM Manager, conectando-se ao console:

    xm create -c <path_from_above>
    
  4. Quando o menu GRUB aparecer, edite as opções de inicialização. Você não disse qual distribuição suas VMs estão rodando, mas assumindo algo como RHEL (RHEL, CentOS, OEL) eu removerei as opções rhgb e quiet e adicione single console=xvc0 . A opção single diz ao init para iniciar o usuário único, console=xvc0 diz ao kernel para usar xvc0 como o dispositivo do console. Este é o console Xen, que você acessa através do Oracle VM Manager.

Depois de inicializar para um usuário único, você pode usar fsck filesystems. No entanto você não deve tentar fsck o sistema de arquivos raiz ou qualquer outro sistema de arquivos montado. Os sistemas de arquivos de usuários / dados podem ser verificados com segurança, desde que estejam umount. Você pode executar fsck -n para verificar se há erros no sistema de arquivos raiz. Se isso informar erros, você deve inicializar pela rede ou executar a CD pela VM e executar fsck para que o sistema de arquivos não seja montado.

    
por 05.08.2013 / 21:42