Após o problema. Eu tenho um número de Superblades com placas LSI MegaRAID SAS 9240-4i. Um cartão por servidor. Todos eles usam o firmware mais recente (20.13.1-0176) até o momento desta publicação (conforme o site do LSI).
Aqui está uma amostra de configuração de uma das que inicializam (top linhas de megacli -AdpAllInfo -aALL
).
Versions
================
Product Name : LSI MegaRAID SAS 9240-4i
Serial No : SP10195095
FW Package Build: 20.13.1-0176
Mfg. Data
================
Mfg. Date : 01/12/11
Rework Date : 00/00/00
Revision No : 03A
Battery FRU : N/A
Image Versions in Flash:
================
BIOS Version : 4.38.02.0_4.16.08.00_0x06060900
Preboot CLI Version: 03.02-020:#%00009
WebBIOS Version : 4.0-60-e_49-Rel
NVDATA Version : 3.09.03-0056
FW Version : 2.130.404-3067
Boot Block Version : 2.02.00.00-0001
Todos os que eu estou perguntando não relatam nenhum problema e afirmam que o array está em boa saúde. Dois deles estão executando a verificação de consistência no momento, mas cinco em dez não inicializam do disco rígido.
Sintomas
O BIOS está definido para "padrões ideais". Alterei a prioridade de inicialização para adicionar um CD-ROM para aqueles que não inicializaram sozinhos.
Todos os sistemas podem ser inicializados usando um CD-ROM (Ubuntu 14.04.1 amd64). No entanto, apenas cinco de dez inicializações do disco rígido (virtual, ou seja, RAID) após o BIOS MegaRAID ter terminado.
O restante deles fica preso após os espaços em branco da tela logo após o BIOS MegaRAID mostrar suas estatísticas e o prompt para WebBIOS, etc. Ele mostra apenas um cursor (não intermitente) e não prossegue. Eu esperei por um tempo muito longo para ver uma mensagem de erro do BIOS sobre falta de disco rígido ou similar, mas nada. Se eu inserir o CD e informar ao gerenciador de inicialização para inicializar a partir do primeiro disco rígido, os mesmos sintomas aparecerão.
Minha intuição é que algo está errado com o setor de inicialização, gerenciador de inicialização ou similar. Mas é basicamente impossível confirmar.
Quando tento usar grub-setup
(de um CD inicializado ao vivo), obtenho:
grub-setup: warn: This GPT partition label has no BIOS Boot Partition; embedding won't be possible!.
grub-setup: warn: Embedding is not possible. GRUB can only be installed in this setup by using blocklists. However, blocklists are UNRELIABLE and their use is discouraged..
grub-setup: error: will not proceed with blocklists.
Claro que o GRUB está no local. Este é um disco GPT porque é de 5,4 TB. No entanto, alguns deles iniciam bem, enquanto outros não. Eles deveriam, para todos os propósitos práticos, ser (e se comportar) idênticos, embora.
A configuração da partição é assim:
# parted /dev/sda print
Model: LSI MR9240-4i (scsi)
Disk /dev/sda: 5997GB
Sector size (logical/physical): 512B/512B
Partition Table: gpt
Number Start End Size File system Name Flags
1 1049kB 1024MB 1023MB ext4 boot
2 1024MB 25.6GB 24.6GB ext4 msftdata
3 25.6GB 50.2GB 24.6GB linux-swap(v1)
4 50.2GB 74.8GB 24.6GB ext4 msftdata
5 74.8GB 5997GB 5922GB ext4 msftdata
Ao contrário de alguns outros servidores que eu gerencio, isso não tem uma partição "BIOS boot". Não tenho certeza se isso é importante neste caso - mas, novamente, seria importante por que os outros iniciam (sim, eles têm exatamente o mesmo layout que todos eles foram configurados com um CD de instalação pré-configurado).
Qualquer ideia:
- como depurar este problema de inicialização (o cursor e a tela em branco realmente não ajudam)
- como posso tornar um sistema como este inicializável, mesmo sem o GRUB, se tiver que ser