ubuntu server, ssh, gravação falhou: tubo quebrado

6

Estou obtendo um comportamento bizarro com o Ubuntu Server 10.04 64bit em dois de nossos novos servidores (ambas novas instalações). Eu tenho o servidor ubuntu (mesma versão) implantado em 4-5 outros servidores sem esse problema.

Inicialmente, não consigo fazer o ssh em uma nova instalação do servidor até definir manualmente o endereço que o servidor ssh está escutando em / etc / ssh / sshd_config. Uma vez conectado, pareço ser expulso em intervalos aleatórios com o seguinte erro:

Falha na gravação: cano quebrado

O uso de "ssh -vv" não mostra nenhuma outra informação. Quando sou expulso dessa maneira, não consigo me reconectar por outro período de tempo aparentemente aleatório. Às vezes alguns segundos, outros alguns minutos. Se eu executar "netstat -nap | grep: 22", eu posso ver que minha conexão ainda existe após o erro de gravação falhou. Não consigo me reconectar até que a conexão caia.

Após um desses erros, se eu pular no servidor do console, ssh para outra máquina, e depois tentar fazer o ssh de volta no servidor, tudo funciona bem.

Usando "-o TCPKeepAlive = yes" o lado do cliente parece não ter efeito em nada. Eu desabilitei o iptables e o ufw no servidor. O AppArmor não mostra nenhum perfil imposto e o SELinux não está instalado.

Meus registros não estão relatando erros e não tenho configurações personalizadas. Esta é uma instalação de estoque de caixa. Note que quando eu tento voltar depois do erro do pipe quebrado, este é o erro que recebo:

ssh: conecta-se ao host 172.22.50.92 porta 22: Conexão recusada

E o nmap não mostra mais a porta 22 como sendo aberta, embora o netstat no servidor diga que ainda está escutando na porta 22.

EDIT - Não tenho certeza se isso significa alguma coisa, mas eu instalei o KVM nesses hosts e posso ssh nos guests (servidor ubuntu 64bits também) sem nenhum problema.

UPDATE - Eu tentei limpar o openssh e reinstalar com o apt. Eu também purgou e instalei o openssh da fonte sem sorte. traceroutes e pings durante a noite não mostram nenhuma perda de pacotes.

AINDA OUTRA ATUALIZAÇÃO - A Dell parece pensar que temos uma placa-mãe ruim no servidor. Tendo isso substituído para ver se resolve o problema.

    
por cmhobbs 18.11.2010 / 15:35

4 respostas

3

Esta postagem resolveu o problema: grande perda de pacotes quando os servidores são colocados on-line

    
por 06.12.2010 / 18:20
4

Use mtr para verificar a rede. Tente um comando como mtr -i 15 remotehost . Deixe isso em execução em uma janela ou use a tela para que você possa desanexar. Deve pegar qualquer problema com a rede. A perda de pacotes normalmente é de 0% na maioria dos meus sistemas.

EDIT: O que a saída de arp -n mostra para o seu endereço IP antes e depois da queda do ssh. Você pode querer tentar isso em outro servidor na mesma sub-rede. Deve haver apenas um endereço HW para o endereço IP e não deve mudar. Se isso acontecer, você tem um conflito de endereço IP.

    
por 18.11.2010 / 17:37
2

Ok .. sooo do que eu posso supor de olhar para isso ...

seu basicamente ficando extensa drop outs ..

1.) Você tem uma conexão de rede ruim ..

2.) A rede em que o servidor está ligado, tem uma conexão de rede ruim / roteador ruim / algo ruim: P

3.) Seus servidores possuem endereços conflitantes / problemas de hardware.

Minha solução ..

Execute um ping durante a noite .. e veja quantos pacotes você perde de manhã: D (só para ver se eu estava indo na direção certa)

Espero que isso ajude ..

    
por 18.11.2010 / 15:47
1

Você pode obter conexões diretas com determinadas combinações de NICs / comutadores quando a negociação automática está ativada e negocia com o half-duplex.

Use "ethtool eth0" para verificar se as configurações de velocidade e duplex estão corretas e alterá-las se for necessário.

    
por 18.11.2010 / 18:02