Disco Western Digital WD15EARS inexplicavelmente lento

4

Eu tenho quatro discos, dos quais dois são WD15EARS, em um servidor e estou tentando colocar os dois WD15EARS no RAID mdadm do Linux, mas por algum motivo, o desempenho do array é muito lento (ele é sincronizado em cerca de 15 MB / s). No começo eu pensei que era um problema de alinhamento, já que são unidades de formato avançado, mas eu acho que não. Esta é como eu os alinhei. Eu também tenho duas dessas unidades no meu PC de mesa, alinhadas meticulosamente com o LVM e o RAID, e elas estão funcionando bem.

Eu fiz alguns testes de velocidade nas unidades individuais (sdb e sdd). Hdparm -t mostra 80 MB / s para sdb e apenas 30 MB / s para sdd (e as outras duas unidades, duas da Samsung, medem cerca de 100 MB / s). Esses resultados são repetitivos. Também mostra que não é uma coisa de alinhamento, porque então hdparm -t seria lento em ambas as unidades.

Não consegui discernir quaisquer diferenças que possam explicar por que uma dessas unidades é mais lenta, exceto pelo fato de a SMART informar o seguinte sobre a boa campanha:

Offline data collection status:  (0x82) Offline data collection activity
                                        was completed without error.
                                        Auto Offline Data Collection: Enabled.

E relata isso no disco ruim:

Offline data collection status:  (0x85) Offline data collection activity
                                    was aborted by an interrupting command from host.
                                    Auto Offline Data Collection: Enabled.

A coleta automática de dados off-line deve ser executada a cada quatro horas, mas a mensagem de status na unidade defeituosa nunca é alterada.

Eu especulei que é essa coleção off-line que causa lentidão, mas não consigo abortar. Smartctl -X não faz nada, o que faz sentido, porque as unidades não têm a capacidade "Abortar coleção off-line sob novo comando", de acordo com smartctl -c .

Atualmente, estou realizando um longo auto-teste que, espera-se, produz alguma coisa, mas, enquanto isso, esperava que alguém soubesse o que poderia estar acontecendo.

Edit: o autoteste terminou, diz que está tudo bem. Desativar a coleta automática de dados off-line também não ajudou.

E, acabei de escrever testes DD. dd if=/dev/zero of=/dev/sdX bs=10M yieled 65 MB / s no disco bom e cerca de 15 MB / s no mau. Há definitivamente algo de errado.

Edit2: Eu peguei as unidades do datacenter e as conectei ao meu PC com um conversor USB para SATA. Agora funciona bem ...

    
por Halfgaar 10.03.2012 / 19:04

3 respostas

1

Eu resolvi isso. Aconteceu SATA nativo (AHCI) não foi ativado. Ele funciona agora (o Array está sincronizando com 70 MB / s) e os speads de leitura são de 120 MB / s. Ainda assim, essa lentidão não deve acontecer no modo legado, mas pelo menos desapareceu.

Eu agora também tenho um NCQ adequado. Eu costumava ter um NCQ não funcional ( dmesg|grep -i ncq : queue 0/32; o zero significa que o disco o suporta, mas o controlador não suporta).

    
por 11.03.2012 / 17:07
4

Possivelmente a causa para um desempenho significativamente menor seria o Automatic Acoustic Management (AAM) - verifique seu status em ambas as unidades usando hdparm -M e desative-o totalmente definindo o valor como 254.

Além disso, vale a pena ativar o cache de gravação nas unidades usando hdparm -W .

Como você está usando as unidades do Caviar Green (que você não deveria estar fazendo para uma configuração Linux RAID, honestamente) e já está fazendo isso, desabilite os recursos de economia de energia, especialmente o recurso IntelliPark .

Se nada ajudar, pode ser um problema de hardware - abrir uma RMA e retorne a unidade para a WD.

    
por 11.03.2012 / 12:09
-2

Verifique o alinhamento da partição em setores de 4k.

link

    
por 10.03.2012 / 19:14