Aumentar / redimensionar o RAID ao atualizar o tamanho visível dos discos

10

Eu criei originalmente um RAID de software usando um controlador que só poderia endereçar 2 TB por disco. Os discos são discos de 3 TB. Funcionou bem, mas só usou os primeiros 2 TB de cada disco.

Agora mudei o controlador para ver os 3TB completos. Por isso, gostaria que /dev/md0 usasse a última 1 TB também.

Eu tentei:

# mdadm --grow /dev/md0 --size=max
mdadm: component size of /dev/md0 has been set to 2147479552K

Mas, como você pode ver, só vê os 2TB. Se eu tentar forçá-lo mais alto:

# mdadm --grow /dev/md0 --size=2147483648
mdadm: Cannot set device size for /dev/md0: No space left on device

Então, de alguma forma, o sistema pode ver que os discos são de 3 TB (em /proc/partitions ), mas o RAID não pode vê-los como 3 TB.

detalhes do mdadm:

# mdadm --detail /dev/md0
/dev/md0:
    Version : 1.2
Creation Time : Fri Mar  2 15:14:46 2012
 Raid Level : raid6
 Array Size : 38654631936 (36863.93 GiB 39582.34 GB)
Used Dev Size : 2147479552 (2048.00 GiB 2199.02 GB)
Raid Devices : 20
Total Devices : 21
Persistence : Superblock is persistent

Update Time : Wed Apr 25 19:47:09 2012
      State : active
Active Devices : 20
Working Devices : 21
Failed Devices : 0
Spare Devices : 1

     Layout : left-symmetric
 Chunk Size : 4096K

       Name : node5:1
       UUID : 8603c3df:b740ba22:8c9c82fd:a18b3133
     Events : 845

Number   Major   Minor   RaidDevice State
  20      65       32        0      active sync   /dev/sds
   1      65       64        1      active sync   /dev/sdu
   2      65       80        2      active sync   /dev/sdv
   3      65       96        3      active sync   /dev/sdw
   4       8      192        4      active sync   /dev/sdm
   5       8       32        5      active sync   /dev/sdc
   6       8       48        6      active sync   /dev/sdd
   7       8       64        7      active sync   /dev/sde
   8       8       80        8      active sync   /dev/sdf
   9       8       96        9      active sync   /dev/sdg
  10       8      112       10      active sync   /dev/sdh
  11       8      128       11      active sync   /dev/sdi
  12       8      144       12      active sync   /dev/sdj
  13       8      160       13      active sync   /dev/sdk
  14       8      176       14      active sync   /dev/sdl
  15       8      208       15      active sync   /dev/sdn
  16       8      224       16      active sync   /dev/sdo
  17       8      240       17      active sync   /dev/sdp
  18      65        0       18      active sync   /dev/sdq
  19      65       16       19      active sync   /dev/sdr

  21      65       48        -      spare   /dev/sdt

Tamanhos de disco:

# cat /proc/partitions |grep 2930266584
   8       48 2930266584 sdd
   8       32 2930266584 sdc
   8      112 2930266584 sdh
   8       96 2930266584 sdg
   8       80 2930266584 sdf
   8      128 2930266584 sdi
   8      176 2930266584 sdl
   8       64 2930266584 sde
  65       32 2930266584 sds
   8      192 2930266584 sdm
   8      144 2930266584 sdj
  65       80 2930266584 sdv
   8      224 2930266584 sdo
   8      208 2930266584 sdn
   8      160 2930266584 sdk
   8      240 2930266584 sdp
  65        0 2930266584 sdq
  65       64 2930266584 sdu
  65       16 2930266584 sdr
  65       48 2930266584 sdt
  65       96 2930266584 sdw

Editar:

# mdadm --version
mdadm - v3.1.4 - 31st August 2010
# uname -a
Linux lemaitre 3.2.0-0.bpo.1-amd64 #1 SMP Sat Feb 11 08:41:32 UTC 2012 x86_64 GNU/Linux

O RAID6 usa discos completos (ou seja, sem partições)

Esta manhã o sistema caiu. Depois de uma reinicialização, o sistema não encontrou o RAID (o que foi terrível). Todos os discos apareceram como peças de reposição (S):

cat /proc/mdstat 
Personalities : 
md0 : inactive sdr[20](S) sds[21](S) sdq[18](S) sdp[17](S) sdo[16](S) sdn[15](S) sdl[14](S) sdk[13](S) sdj[12](S) sdi[11](S) sdh[10](S) sdg[9](S) sdf[8](S) sde[7](S) sdd[6](S) sdc[5](S) sdm[4](S) sdv[3](S) sdu[2](S) sdt[1](S)
      42949652460 blocks super 1.2

Mesmo aqui, é claro que mdadm não encontrou o tamanho de 3 TB.

Eu corri mdadm --stop /dev/md0 . Removida a entrada em /etc/mdadm/mdadm.conf. Correu mdadm -A --scan --force , o que fez com que o RAID ficasse on-line e reconstruído.

    
por Ole Tange 25.04.2012 / 20:02

2 respostas

5

Eu andei por aí / sys e cheguei muito perto da resposta.

# cd /sys/block/md0/md
# cat component_size
2147479552

Isso concorda com o que vimos antes. Mas isso:

# grep . dev-sd*/size
dev-sdc/size:2147482623
dev-sdd/size:2147482623
dev-sde/size:2147482623
dev-sdf/size:2930265560
dev-sdg/size:2147482623
dev-sdh/size:2147482623
dev-sdi/size:2147482623
dev-sdj/size:2147482623
dev-sdk/size:2147482623
dev-sdl/size:2147483648
dev-sdm/size:2147482623
dev-sdn/size:2147482623
dev-sdo/size:2147482623
dev-sdp/size:2147482623
dev-sdq/size:2147482623
dev-sdr/size:2147482623
dev-sds/size:2147482623
dev-sdt/size:2147482623
dev-sdu/size:2147482623
dev-sdv/size:2147482623
dev-sdw/size:2930265560

parece explicar por que o RAID vê o tamanho errado: a maioria dos drives aparece como 2TB, enquanto os 2 que foram substituídos aparecem como 3TB. Todas as unidades são do mesmo modelo, portanto, vamos ver se podemos alterar o tamanho percebido:

# parallel echo 2930265560 \> ::: dev-sd*/size
# grep . dev-sd*/size
dev-sdc/size:2930265560
dev-sdd/size:2930265560
dev-sde/size:2930265560
dev-sdf/size:2930265560
dev-sdg/size:2930265560
dev-sdh/size:2930265560
dev-sdi/size:2930265560
dev-sdj/size:2930265560
dev-sdk/size:2930265560
dev-sdl/size:2930265560
dev-sdm/size:2930265560
dev-sdn/size:2930265560
dev-sdo/size:2930265560
dev-sdp/size:2930265560
dev-sdq/size:2930265560
dev-sdr/size:2930265560
dev-sds/size:2930265560
dev-sdt/size:2930265560
dev-sdu/size:2930265560
dev-sdv/size:2930265560
dev-sdw/size:2930265560

Voila. Component_size ainda é pequeno, embora:

# cat component_size
2147479552

Talvez isso possa ser alterado pelo mdadm:

# mdadm --grow /dev/md0 --size=max

Isso infelizmente trava mdadm e o acesso subsequente a / dev / md0 é bloqueado. E assim é o acesso ao component_size:

# cat component_size   # This blocks

Suga. Mas a parte boa é que no syslog diz:

Apr 27 20:45:50 server kernel: [124731.725019] md0: detected capacity change from 39582343102464 to 54010589478912

O sistema de arquivos em / dev / md0 ainda é executado.

Após a reinicialização eu tive que fazer 'mdadm --grow / dev / md0 --size = max' novamente. Aguarde então que resync seja concluído. Novamente, o acesso a / dev / md0 foi bloqueado. Então, outra reinicialização, seguida por xfs_growfs /dev/md0 e depois o redimensionamento foi concluído.

    
por 29.04.2012 / 10:31
3

Acho que durante a criação, o tamanho do dispositivo foi registrado em algum lugar nos metadados. Alterar o controlador não altera os metadados.

Remova o sobressalente do md e, em seguida, adicione-o novamente ao conjunto de RAID como uma nova unidade. Você provavelmente terá que remover os metadados (verifique a página do manual para --zero-superblock ou limpe todo o disco). Se isso funcionar para um único disco, repita o procedimento para todas as unidades restantes. Então finalmente faça o --grow.

Não remova discos adicionais até que a sincronização termine!

    
por 25.04.2012 / 20:28