Obrigado sendmoreinfo,
Parece que o checksum do TCP é o culpado. Desativei o descarregamento da soma de verificação do TCP:
ethtool -K eth0 tx off rx off
e começou a funcionar novamente.
Temos um servidor Dell PowerEdge 840 executando o CentOS 6.0 de 64 bits com 2 GB de memória ECC. Quando qualquer usuário sshs entrar, após algum tempo a sessão é finalizada com a saída:
Corrupted MAC on input. Packet Corrupt
Isso acontece invariavelmente. A sessão ssh pode funcionar por algum tempo, mas eventualmente falha. Percebi que é mais frequente quando estou usando o X-forwarding.
Depois de Googling para respostas, acredito que exista um problema de hardware (possivelmente memória) com o servidor . Saída de lshw (memória).
capabilities: internal write-back unified
*-memory
description: System Memory
physical id: 1000
slot: System board or motherboard
size: 2GiB
*-bank:0
description: DIMM DDR2 Synchronous 667 MHz (1.5 ns)
product: 72T64000HU3SB
vendor: 7F7F7F7F7F510000
physical id: 0
serial: 09022F17
slot: DIMM1_A
size: 512MiB
width: 64 bits
clock: 667MHz (1.5ns)
*-bank:1
description: DIMM DDR2 Synchronous 667 MHz (1.5 ns)
product: 72T64000HU3SB
vendor: 7F7F7F7F7F510000
physical id: 1
serial: 09022E13
slot: DIMM1_B
size: 512MiB
width: 64 bits
clock: 667MHz (1.5ns)
*-bank:2
description: DIMM DDR2 Synchronous 667 MHz (1.5 ns)
product: 72T64000HU3SB
vendor: 7F7F7F7F7F510000
physical id: 2
serial: 09030910
slot: DIMM2_A
size: 512MiB
width: 64 bits
clock: 667MHz (1.5ns)
*-bank:3
description: DIMM DDR2 Synchronous 667 MHz (1.5 ns)
product: 72T64000HU3SB
vendor: 7F7F7F7F7F510000
physical id: 3
serial: 09030B13
slot: DIMM2_B
size: 512MiB
width: 64 bits
clock: 667MHz (1.5ns)
Eu corri o memtest86 + e ele não retornou nenhum erro. Também recoloquei a memória, movi os módulos de memória para diferentes slots e até mesmo aumentei o espaço de troca para 4 GB. O servidor é um servidor de teste que executa um servidor Apache pré-configurado (compilado da origem) em portas diferentes. Como cada desenvolvedor tem seu próprio httpd.conf e ambiente de teste, mais de um servidor Apache pode estar em execução.
Também verifiquei o syslog em busca de mensagens de erro, mas não consegui encontrar nada interessante. Mesmo depois de pedir a todos para parar de usar o servidor - com o uso mínimo de memória - eu ainda recebo a mesma mensagem de erro e minha sessão ssh termina com a mensagem de erro que apontei acima.
Quais devem ser meus próximos passos para solução de problemas?
como sugerido em "MAC corrompido na entrada. Packet Corrupt" na transferência de arquivos por SSH, SCP e FTP no servidor Linux , O descarregamento do TCP pode ser um problema. Use o ethtool para verificar e configurá-lo.