Estou rodando o Debian 7.2 em um antigo MacBook Pro do final de 2006. Eu tenho dois discos rígidos Seagate Backup Plus de 4 TB conectados a ele que eu tenho em um pool ZFS espelhado. Recentemente, uma das unidades morreu e recebi uma unidade de substituição que estou tentando adicionar como um novo espelho. No entanto, não consigo fazer o resilver, pois um erro inevitavelmente acontece antes que ele termine.
O problema é que essa unidade de substituição aparentemente continua se desconectando e se reconectando em uma fração de segundo. O que eu encontrei são as seguintes mensagens sendo impressas no log do sistema várias vezes:
Jan 19 20:08:07 thingamadealies kernel: [100555.410370] usb 1-1: USB disconnect, device number 43
Jan 19 20:08:07 thingamadealies kernel: [100555.660059] usb 1-1: new high-speed USB device number 44 using ehci_hcd
Jan 19 20:08:07 thingamadealies kernel: [100555.794444] usb 1-1: New USB device found, idVendor=0bc2, idProduct=a0a4
Jan 19 20:08:07 thingamadealies kernel: [100555.794452] usb 1-1: New USB device strings: Mfr=2, Product=3, SerialNumber=1
Jan 19 20:08:07 thingamadealies kernel: [100555.794458] usb 1-1: Product: Backup+ Desk Mac
Jan 19 20:08:07 thingamadealies kernel: [100555.794463] usb 1-1: Manufacturer: Seagate
Jan 19 20:08:07 thingamadealies kernel: [100555.794467] usb 1-1: SerialNumber: XXXXXXXX
Jan 19 20:08:07 thingamadealies kernel: [100555.795636] scsi41 : usb-storage 1-1:1.0
Jan 19 20:08:07 thingamadealies mtp-probe: checking bus 1, device 44: "/sys/devices/pci0000:00/0000:00:1d.7/usb1/1-1"
Jan 19 20:10:46 thingamadealies kernel: [100714.601169] usb 1-1: USB disconnect, device number 44
Jan 19 20:10:46 thingamadealies kernel: [100714.872081] usb 1-1: new high-speed USB device number 45 using ehci_hcd
... etc ...
Às vezes isso acontece várias vezes por minuto. Ocasionalmente, as mensagens são impressas com alguns segundos de diferença. Em outras ocasiões, esse comportamento pára por várias horas, ou até mesmo perto de um dia. Eu meio que suspeito, mas não tenho provas, de que isso possa estar relacionado a quando o disco rígido está sob carga.
Nenhum outro erro de USB ou IO ou outras mensagens relevantes são impressas no syslog e não sei onde mais posso procurar pistas.
A outra unidade não tem esse problema, e tem funcionado muito bem desde o momento em que a obtive.
O que eu tentei até agora:
- mudando qual plug USB as unidades estão conectadas, para ver se a outra unidade começa a ter esse problema. Até agora não tem, mas tem sido apenas uma ou duas horas.
- Eu também pesquisei um pouco e encontrei outras pessoas com problemas semelhantes, mas nenhuma exatamente como a minha, e ainda não encontrei uma solução. A maioria das pessoas com esse problema, pelo menos, recebe algum tipo de erro USB no syslog junto com a mensagem "USB desconectar".
Qualquer ajuda que alguém pudesse me dar seria muito apreciada! Eu realmente não sei como depurar um problema de hardware como este.
Atualização:
Depois de trocar os conectores USB aos quais as unidades estão conectadas, a mensagem que está sendo enviada para o syslog foi alterada para:
usb 1-3: redefina o número do dispositivo USB de alta velocidade 4 usando ehci_hcd
Confirmei que o usb 1-3 é o problema. Então, algo ainda está errado, mas é uma coisa errada um pouco diferente agora. Até agora, o ZFS não teve nenhum erro ... esperamos que continue assim.
Atualização 2:
O resilvering terminou! No entanto, ainda estou recebendo as mensagens "redefinir dispositivo USB de alta velocidade". Eu tentei trocar os cabos entre minhas duas unidades, mas isso não fez nenhuma diferença, então acho que isso impede que o problema seja o cabo.
Eu vi algumas evidências de que atualizar meu kernel pode corrigir isso, então vou tentar.
Atualização 3:
Atualizei meu kernel para 3.10, não tive efeito. Ainda não sei como consertar isso.