Falha na unidade no Raid1. Não pode substituir

0

Eu tenho um software raid1 e o mdadm me enviou um email dizendo que uma unidade falhou. Seguindo as etapas que encontrei on-line, marquei como com falha e removi a unidade da invasão.

Substitui a unidade por uma marca e modelo exatos, mas com a nova unidade, a invasão não será iniciada. cat / proc / mdstat apenas diz que é inativo.

Eu também não posso adicionar a nova unidade para o ataque, continua dizendo que não há superbloco na nova unidade, embora eu tenha copiado a partição da unidade de trabalho para a nova unidade.

Eu removi a nova unidade e a coloquei na falha. O ataque inicializa e estranhamente ele está tentando reconstruir agora, mas checando meu mdadm.conf, ele simplesmente parece bobo.

mdadm.conf

# mdadm.conf
#
# Please refer to mdadm.conf(5) for information about this file.
#

# by default (built-in), scan all partitions (/proc/partitions) and all
# containers for MD superblocks. alternatively, specify devices to scan, using
# wildcards if desired.
#DEVICE partitions containers

# auto-create devices with Debian standard permissions
CREATE owner=root group=disk mode=0660 auto=yes

# automatically tag new arrays as belonging to the local system
HOMEHOST 

# instruct the monitoring daemon where to send mail alerts
MAILADDR [email protected]

# definitions of existing MD arrays

# This file was auto-generated on Sun, 30 Dec 2012 02:27:19 -0700
# by mkconf $Id$
DEVICE /dev/sdb1 /dev/sdb1
ARRAY /dev/md0 level=raid1 devices=/dev/sdb1,/dev/sdb1

fdisk -l

Disk /dev/sda: 640.1 GB, 640135028736 bytes
255 heads, 63 sectors/track, 77825 cylinders, total 1250263728 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 512 bytes
I/O size (minimum/optimal): 512 bytes / 512 bytes
Disk identifier: 0x00058100

   Device Boot      Start         End      Blocks   Id  System
/dev/sda1   *        2048  1241874431   620936192   83  Linux
/dev/sda2      1241876478  1250263039     4193281    5  Extended
/dev/sda5      1241876480  1250263039     4193280   82  Linux swap / Solaris

WARNING: GPT (GUID Partition Table) detected on '/dev/sdb'! The util fdisk doesn't support GPT. Use GNU Parted.


Disk /dev/sdb: 2000.4 GB, 2000398934016 bytes
255 heads, 63 sectors/track, 243201 cylinders, total 3907029168 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disk identifier: 0x00000000

   Device Boot      Start         End      Blocks   Id  System
/dev/sdb1               1  3907029167  1953514583+  ee  GPT
Partition 1 does not start on physical sector boundary.

WARNING: GPT (GUID Partition Table) detected on '/dev/sdc'! The util fdisk doesn't support GPT. Use GNU Parted.


Disk /dev/sdc: 2000.4 GB, 2000398934016 bytes
255 heads, 63 sectors/track, 243201 cylinders, total 3907029168 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disk identifier: 0x00000000

   Device Boot      Start         End      Blocks   Id  System
/dev/sdc1               1  3907029167  1953514583+  ee  GPT
Partition 1 does not start on physical sector boundary.

Disk /dev/md0: 2000.3 GB, 2000263380992 bytes
2 heads, 4 sectors/track, 488345552 cylinders, total 3906764416 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disk identifier: 0x00000000

Disk /dev/md0 doesn't contain a valid partition table

Eu nem sei o que colocar aqui que poderia ajudar, mas eu realmente aprecio qualquer ajuda ou conselho para colocar este ataque de volta em ordem.

UPDATE: Adicionando mais informações após outra tentativa. Depois de colocar de volta a unidade defeituosa, ela começou a ser reconstruída e falhou como esperado.

Iniciado fazendo o novo arquivo mdadm.conf sudo su -c "/usr/share/mdadm/mkconf > /etc/mdadm/mdadm.conf"

  1. Falha e, em seguida, removido / dev / sdc1
  2. Instalado novo HD
  3. copiado pela partição usando sgdisk -R /dev/sdc /dev/sdb
  4. UUID atualizado sgdisk -G /dev/sdc
  5. sfdisk -r /dev/sdc
  6. mdadm --manage /dev/md0 --add /dev/sdc1

Tentando adicionar o erro sdc1 mdadm: cannot get array info for /dev/md0

    
por Stephen F 13.08.2014 / 03:00

1 resposta

1

Bem, antes de tudo, um pouco mais de informação sobre sua configuração seria legal, então eu poderia preencher seus nomes de partições, etc.

Como você disse, você o marcou como falho e removeu (eu acho que com mdadm --manage /dev/md0 --remove /dev/sdb1 ou qualquer partição raid / física para cada partição).

Você fez isso em um sistema ao vivo? Significado é uma máquina que você pode desligar? As unidades são capazes de hot plug?

Você também disse que copiou a tabela de partições ( sfdisk -d /dev/sda | sfdisk /dev/sdb ). Como você fez isso? Qual tabela de partições (MBR / GPT) seu dispositivo está usando?

Se é GPT você tem que usar sgdisk -R /dev/sdb /dev/sda para copiar a tabela de partições de sda para sdb.

Depois disso, você terá que fornecer um novo UUID: sgdisk -G /dev/sdb .

Em seguida, use sfdisk -r /dev/sdb para que o Kernel recarregue sua tabela de partições.

Use mdadm /dev/md0 -a /dev/sdb1 . Tal como acontece com a remoção, você tem que fazer isso para cada partição. Em seguida, use grub-mkdevicemap -n para gerar um novo mapa de dispositivos para o Grub2 e, em seguida, grub-install /dev/sdb .

Para o Edit: Este parece ser realmente bobo seu RAID consiste em 2 vezes a mesma partição ...

Talvez você queira criar uma nova configuração: sudo su -c "/usr/share/mdadm/mkconf > /etc/mdadm/mdadm.conf" .

    
por Broco 13.08.2014 / 03:26