Drives SATA ou chipset jogando ERD DRDY e CICV ABRT

4

Eu tenho uma placa PCI SD-VIA-1A2S com 2 portas sata (e uma ATA-133 que não é usada). Duas novas unidades Western Digital Caviar Green (WD10EARS 1TB) lançam erros repetidos no kern.log (por exemplo, data / hora removidas / informações do host):

[    7.376475] ata2.00: exception Emask 0x12 SAct 0x0 SErr 0x1000500 action 0x6
[    7.376480] ata2.00: BMDMA stat 0x5
[    7.376483] ata2: SError: { UnrecovData Proto TrStaTrns }
[    7.376489] ata2.00: cmd c8/00:40:20:00:00/00:00:00:00:00/e0 tag 0 dma 32768 in
[    7.376490]          res 51/84:2f:20:00:00/00:00:00:00:00/e0 Emask 0x12 (ATA bus error)
[    7.376493] ata2.00: status: { DRDY ERR }
[    7.376495] ata2.00: error: { ICRC ABRT }
[    7.376504] ata2: hard resetting link

Estou usando o Ubuntu 9.04-2.6.28-18-genérico, embora tenha tentado live cds do Ubuntu 9.10, Fedora 12 e OpenSUSE 11.2 - todos executando vários kernels 2.6.31 - e todos receberam o mesmo erro. / p>

Com base em testar essas unidades e esta placa em duas outras máquinas e combinações de conectar as unidades diretamente à placa-mãe ou à placa suplementar, estou relativamente convencido de que é o chipset VIA que é o problema. Outro computador que também tem um chipset VIA SATA onboard (como a placa suplementar) produz os mesmos erros quando as unidades estão diretamente na placa-mãe. Eu fui capaz de verificar que as unidades são perfeitamente boas, e eu tentei tudo o que posso pensar em termos de troca de cabos, o psu não está sobrecarregado, etc.

O erro ocorre na inicialização uma ou duas vezes, após usar o fdisk na unidade uma ou duas vezes e constantemente ao tentar sincronizar uma nova matriz mdadm raid 1 criada nas duas unidades.

Alguma idéia de onde ir a partir daqui - driver / kernel?

Estou completamente aberto a comprar uma nova placa de expansão PCI se alguém puder recomendar uma com duas portas sata internas que funcionem bem no Debian / Ubuntu.

Obrigado!

    
por Matt 18.03.2010 / 15:19

5 respostas

1

Eu posso recomendar os chipsets Promise e SiliconImage como alternativas para o VIA. Estou usando um adaptador PCI com um chipset SiI-3124 atualmente e não tive nenhum problema com ele.

Eu tive boas experiências com os primeiros chipsets IDE de ambos os fabricantes, mas ainda não tive a oportunidade de testar um chip Promise SATA. Eu recomendo ficar longe do chip VIA; Eu lidei com muitos chips VIA esquisitos e prefiro evitá-los quando possível.

    
por 18.03.2010 / 15:29
1

Eu sei que isso é um pouco antigo, mas eu tive esse problema em uma nova máquina que estou criando e o problema parecia ser esse. Aqui estava o meu erro original:

[  595.535123] ata2.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x6
[  595.535127] ata2.00: BMDMA stat 0x64
[  595.535132] ata2.00: failed command: WRITE DMA EXT
[  595.535140] ata2.00: cmd 35/00:00:08:3c:11/00:02:00:00:00/e0 tag 0 dma 262144 out
[  595.535145] ata2.00: status: { DRDY ERR }
[  595.535147] ata2.00: error: { ICRC ABRT }
[  595.535182] ata2: soft resetting link

Eu tinha ligado uma opção de BIOS para transformar as duas portas SATA 'principais' (0/1) no modo IDE ou algo desse tipo e isso de alguma forma estragou a comunicação do barramento com outros dispositivos não-SATA ou secundários no ônibus. Eu sei que a descrição aqui é um pouco vaga, mas é difícil dizer sobre alguns mobos que são primários / secundários e com qual barramento está associado.

Eu posso apenas dizer que voltar a opção de modo que todos os 6 da minha SATA onboard foram ACHI fez meus erros ir embora imediatamente. Onde eles foram imediatamente reproduzíveis em massa executando bonnie ou iozone, a mudança fez com que esses dois programas de benchmark corressem imediatamente sem erros e completassem em meia hora ao invés de 2-3.

    
por 23.11.2011 / 20:10
0

As mensagens DRDY ERR, na verdade, parecem ser relatadas como um bug do kernel em muitos sistemas que parecem se relacionar muito com o Ubuntu e, em menor extensão, com o Debian. Estou investigando isso porque isso é algo que começou a acontecer comigo recentemente. Eu recomendaria o seguinte (você vai precisar de um CD inicializável para alguns destes e você pode precisar dele devido a problemas de disco para tudo isso. O CD de instalação da área de trabalho do Ubuntu funciona bem sem fazer você instalar nada):

  1. Coloque "opções libata noacpi = 1" em /etc/modprobe.d/options.conf
  2. Execute "e2fsck -f -c -v / dev / sda1", mas substitua / dev / sda1 pelas partições que causaram o erro. Tanto quanto eu sei, e2fsck precisa de uma partição com o sistema de arquivos, então isso provavelmente não funcionará em todo o disco. Se funcionar em todo o disco, você ainda precisará executá-lo nas partições de qualquer maneira. Você precisa de um CD inicializável para isso.
  3. Edite o arquivo /boot/grub/menu.lst e, na linha que começa com "# kopt", adicione "noapic" ao final da linha. O # no início é importante e não age como um comentário. Não remova o #.
  4. Isso não afeta o disco, mas se você alterar "splash" para "nosplash" e remover a palavra "quiet" do /boot/grub/menu.lst na linha que começa com "# defoptions", então ele não será ter uma imagem quando você inicializar o Ubuntu, mas em vez disso, dar-lhe uma saída mais detalhada.
  5. No Ubuntu, depois de alterar qualquer coisa dentro de /boot/grub/menu.lst você deve executar / usr / sbin / update-grub
por 03.04.2010 / 21:54
0

Eu acabei de ter uma experiência parecida com a do último post anterior. Eu tenho um Dell OptiPlex 9020 que vem com 2 drives em uma configuração RAID espelhada. Eu decidi quebrar o espelhamento e usar as duas unidades como unidades separadas. Então eu reconfigurei a configuração do controlador RAID para ver os dois discos como dois discos não-RAID. Rebooted e tudo foi como esperado. Exceto que comecei a receber os erros acima mencionados. Mas foi muito aleatório e escamoso.

Finalmente hoje à noite eu encontrei este tópico e descobri. Fui para a configuração da BIOS (que é totalmente separada da configuração do controlador RAID) e vi que ainda tinha a interface definida como "RAID" em vez de "ACHI". Assim que eu mudei para ACHI e reiniciei, o sistema inicializou muito, muito mais rápido do que nunca, e, melhor de tudo, sem erros.

Sim!

    
por 11.09.2014 / 03:33
0

Eu mudei para AHCI no meu BIOS e não funcionou. Mas depois de verificar minha tabela de partições, ela disse que eu tinha uma tabela GPT quebrada.

dan@zeus:~$ sudo gdisk -l /dev/sda
[sudo] password for dan: 
GPT fdisk (gdisk) version 0.8.4

Caution: invalid backup GPT header, but valid main header; regenerating
backup header from main header.

Warning! One or more CRCs don't match. You should repair the disk!

Partition table scan:
  MBR: protective
  BSD: not present
  APM: not present
  GPT: damaged

****************************************************************************
Caution: Found protective or hybrid MBR and corrupt GPT. Using GPT, but disk
verification and recovery are STRONGLY recommended.
****************************************************************************
Disk /dev/sda: 625140335 sectors, 298.1 GiB
Logical sector size: 512 bytes
Disk identifier (GUID): 4FF348B9-D041-49A6-AD98-18C15F055F2D
Partition table holds up to 128 entries
First usable sector is 34, last usable sector is 625142414
Partitions will be aligned on 8-sector boundaries
Total free space is 0 sectors (0 bytes)

Number  Start (sector)    End (sector)  Size       Code  Name
   1              34       625142414   298.1 GiB   0700  

Então eu digitei w para escrever a tabela GPT novamente. Finalmente eu reiniciei o meu sistema.

E agora está funcionando como um encanto!

    
por 04.04.2015 / 05:09