Devo estar preocupado com a mensagem de aviso freqüente de RAID (sentido inesperado - comando anulado)?

3

Eu tenho um host Fujitsu (PRIMERGY RX300 S6) executando o Windows Server 2008 R2 e o Hyper-V (versão 6.1) com dois servidores virtuais (um Windows Server 2008 R2 e um Windows Server 2012). Nossos 25 funcionários estão continuamente conectados aos servidores virtuais durante o dia de trabalho e leem e gravam arquivos em pastas compartilhadas.

O controlador de armazenamento no host é o RAID Ctrl SAS 6G 5/6 512MB (D2616) da LSI Corp.

Recentemente, descobri que o gerente Raid exibe mensagens de aviso muito frequentes. Quase um a cada minuto e às vezes até 15 ou 20 por minuto.

Cada mensagem de aviso é semelhante à seguinte:

-------
Event: Warning
Date: Mar 18, 2015, 1:04:49 PM
Source: TOSHIBA MBF2600RC (1:0)
ID: 10909
Event: Adapter FTS RAID Ctrl SAS 6G 5/6 512MB (D2616) (0): Unexpected sense: 
     Disk (1:0), CDB:28 00 1B 02 B5 80 00 00 80 00, Sense:(command aborted)72 0B 4B 04 00 00 00 20 80 1E 00 28 52 08 01 00 50 03 00 57 00 F3 3F 40 50 06 05 B0 00 02 72 BF 00 01 0C 00 00 00 00 00 
------

Infelizmente, não consegui descobrir quando esta mensagem de aviso começou a ocorrer.

O motivo pelo qual estou um pouco preocupado com os avisos - além de parecer estranho para mim - é que o Backup Exec de repente começou a levar de 3 a 4 horas a mais do que o normal para ser concluído e agora leva de 22 a 23 horas. Comparando as propriedades do trabalho, posso ver que a taxa de trabalho do Backup Exec para esse servidor em particular caiu de cerca de 800 MB / min para 550 MB / min.

Meu provedor de hardware me informou que a mensagem é meramente informativa e que provavelmente deveríamos ter o servidor substituído. É de 3,5 anos e eu acho que deveríamos tê-lo substituído dentro de um ano, mas eu ainda gostaria de chegar ao fundo deste assunto.

    
por Francis 18.03.2015 / 14:19

2 respostas

2

A decodificação de erro é Bh / 4Bh / 0Bh = ABORTED_COMMAND / NAK_RECEIVED. Eu escrevi minha própria ferramenta para decodificá-las e tentar fazer uma avaliação básica no link

Estes erros indicam que você tem um link errado em algum lugar, na maioria das vezes é um cabo ruim, mas também pode ser uma porta ruim em ambos os lados (drive ou slot).

    
por 19.04.2015 / 22:50
0

Sim, você deve se preocupar. Não está extremamente preocupado, mas investigue e, se necessário, substitua algumas partes.

Erros SCSI são geralmente gerados por: problemas com drivers / firmware ou falhas de hardware.

Consulte: link

No mínimo, um erro SCSI significa "algo deu errado". Isso pode ser apenas um problema menor, mas um problema menor que ocorre com frequência é um problema bastante maior e significa que há algo mais errado.

    
por 18.03.2015 / 15:11