Capturas Instantâneas de Várias Gerações usando o Device Mapper (Linux)

2

O LVM é uma ferramenta incrivelmente útil, no entanto, parece ainda não ter suporte para capturar instantaneamente uma unidade que já é um instantâneo. Eu fiz um script para lidar com isso automaticamente, mas tive alguns problemas.

Meu ambiente de teste

Estou testando o script em um Xen-box limpo (a partir de agora: testbox ). Depois de criar a caixa, criei um novo volume LVM e o adicionei às unidades testbox . No testbox , ele é exibido como um dispositivo de bloco normal, então não acho que o LVM do Dom0 deve interferir no processo de teste.

A unidade original

Em testbox , criei uma nova partição usando os seguintes comandos:

# Using the data in the other tables i determined 
# where i could begin my new device sectors
dmsetup table

# Create the new device without a table
dmsetup create base --notable
# Put the table into the device...
echo '0 4194304 linear 202:2 0' | dmsetup load base
dmsetup resume base

mkfs.ext2 /dev/mapper/base

Para ser claro, o segundo argumento de destino '202: 2' é o segundo dispositivo que adicionei à máquina de teste, verifiquei da seguinte forma:

ls /dev -l | grep 'xvda2'

Retornando:

brw-rw---- 1 root disk 202, 2 May 3 17:01 xvda2

O script

Eu escrevi essa função para criar um instantâneo:

function create_dm_snapshot {
  banner "0: Checking if block devices don't allready exist, original device should exist...";
  device_exists $base_path$original;
  [ $? -eq 0 ] || error 'The source (original) device should exist';
  device_exists $base_path$snapshot_origin $base_path$snapshot $base_path$cow;
  [ $? -eq 0 ] && error "They allready exist pls use the 'remove' function";
  echo "Done checking.";  

  banner "1: Suspending the original device.";
  suspend_dev $original || error "Failed suspending original device";

  banner "2: Creating snapshot-origin.";
  create_dev $snapshot_origin || error "Failed creating snapshot-origin";

  banner "3: Read original table into snapshot-origin.";
  dmsetup table $original | dmsetup load $snapshot_origin ||
    error 'Failed loading original table into snapshot-origin';
  echo "Done reading.";

  banner "4: Resume snapshot-origin.";
  resume_dev $snapshot_origin || error 'Could not resume snapshot-origin';

  banner "5: Create snapshot device.";
  create_dev $snapshot || error 'Failed to create snapshot device';

  banner "6: Create COW-device.";
  #TODO: check total sector count device
  create_dev $cow ;
  target_device=$( dmsetup table $original | awk '{print $4}' );
  last_table=$( dmsetup table | grep "$target_device" | awk '{print $6}' | sort -g | tail -n 1 );
  begin_sector_args=( $( dmsetup table | grep -E $target_device".*"$last_table"|"$last_table".*"$target_device | awk '{print $2 " " $3 " " $6}' ) );
  begin_sector=$( expr ${begin_sector_args[1]} - ${begin_sector_args[0]} + ${begin_sector_args[2]} );
  table="0 $size linear $target_device $begin_sector";
  echo $table | dmsetup load $cow;
  resume_dev $cow;

  banner "7: Calculate rowcount in snapshot-origin";
  snapshot_origin_size=$( blockdev --getsz $base_path$snapshot_origin ) ||
    error 'Could not determine rowcount';
  echo "Snapshot size: $snapshot_origin_size";

  banner "8: Load snapshot table.";
  table="0 $snapshot_origin_size snapshot $base_path$snapshot_origin $base_path$cow p 64";
  [ $verbose ] && echo "Table: $table";
  echo $table | dmsetup load $snapshot || error 'Failed loading snapshot table';
  echo "Done loading.";

  banner "9: Reload original device table.";
  table="0 $snapshot_origin_size snapshot-origin $base_path$snapshot_origin";
  [ $verbose ] && echo "Table: $table";
  echo $table | dmsetup load $original || error 'Failed reloading original table';
  echo "Done reloading.";

  banner "10: Resume frozen tables.";
  resume_dev $snapshot $original || error 'Could not resume devices';
  echo "Done resuming.";
}

O erro

No passo 8 (banner "8: ...) o script falha com o seguinte erro:

device-mapper: reload ioctl failed: No such device or address

Command failed

dmsetup table

Resulta nos seguintes dados da tabela:

dm.base.snapshot_origin: 0 4194304 linear 202:2 0

base: 0 4194304 linear 202:2 0

dm.base.snapshot:

dm.base.cow: 0 4096 linear 202:2 4194304

Como não consegui determinar a causa do erro, o último passo que fiz foi olhar para o meu dmesg ...

dmesg | tail

Giving me:

PM: freeze of devices complete after 0.080 msecs

suspending xenstore...

PM: late freeze of devices complete after 0.019 msecs

PM: early restore of devices complete after 0.035 msecs

PM: restore of devices complete after 32.367 msecs

Setting capacity to 10485760

Setting capacity to 104857600

device-mapper: persistent snapshot: Invalid or corrupt snapshot

device-mapper: table: 254:2: snapshot: Failed to read snapshot metadata

device-mapper: ioctl: error adding target to table

Não consegui descobrir o que causou a corrupção do instantâneo.

    
por st0ne2thedge 07.05.2013 / 16:03

1 resposta

0

testing the script on a clean Xen-box

Isso não garante que os discos exportados contenham apenas zeros em suas áreas não escritas. Assim, o kernel pode detectar algo que não está realmente lá. Você deve substituir a primeira parte do volume COW (não sei quanto é necessário, mas os primeiros 4 MiB devem ser suficientes. Oh, seu volume COW não tem nem 4 MB de tamanho:

dd if=/dev/zero of=/dev/mapper/dm.base.cow bs=4K count=1024

Talvez haja um tamanho mínimo para os volumes COW e o seu seja simplesmente muito pequeno?

    
por 07.05.2013 / 16:34