rsync sobre o desempenho do ssh

2

Estou usando o rsync sobre o ssh para fazer backup dos dados do windows para o linux. Isso cria 1 processo de rsync no servidor para cada conexão, pois isso é sobre o ssh. Cada conexão rsync é executada a 1 mbps. Você tem uma idéia de quantas dessas conexões eu posso ter em uma máquina de 2Ghz - 4G RAM antes que a CPU atinja 100%. Não encontrei nenhuma boa informação on-line sobre isso.

Laurent

    
por Laurent Luce 23.08.2009 / 08:42

5 respostas

2

Bastante se você pode configurar os clientes para não rsync ao mesmo tempo.

Mas eu não ficaria nervoso com a CPU / RAM, já que acho que o gargalo será a largura de banda dos discos rígidos.

De qualquer forma, siga o conselho do sysadmin1138 e mantenha-se atento aos recursos com uma ferramenta fácil, como o gkrellm (que pode mostrar a sua CPU , ram, harddrives e rede ao mesmo tempo).

    
por 23.08.2009 / 09:37
2

O Rsync não escala é linear, especialmente quando não são iniciados ao mesmo tempo. A parte mais intensiva é o bit inicial, onde lê os diretórios e sincroniza as listas de arquivos. A versão mais recente do lado do rsync funciona assim, então você só fica com checksums. Se o uso da CPU se tornar um problema, você também poderá desativar essa parte.

O lado SSH geralmente não usa muito cpu, mesmo quando você começa a aumentar a largura de banda. É altamente otimizado e não faz muito. Para registro, eu empurrei 45meg por segundo através de um túnel criptografado ssh sem nenhum dos núcleos na caixa piscando. A carga saltou um pouco do acesso ao disco de empurrar os dados para o array de ataque.

    
por 23.08.2009 / 10:41
1

Eu começaria fazendo alguns testes de escala. Inicie um processo, verifique suas cargas de CPU e memória no gerenciador de tarefas. Execute quatro em paralelo e faça o mesmo para cada um. Presumindo que isso seja escalonado linearmente, você deve ter uma boa idéia de quando começará a atingir os limites de CPU / RAM. Se não escalar linearmente, você precisará obter mais pontos de dados e fazer cálculos.

    
por 23.08.2009 / 08:51
1

O gargalo principal provavelmente será seus discos, não seus processadores. rsync é uma ferramenta para copiar arquivos. O fato de que ele faz criptografia também é uma vantagem, mas a maior parte do tempo será gasto com a leitura de discos.

Os números mais importantes não são a velocidade da sua CPU, mas a velocidade do seu disco. Se você quer mais velocidade, você deve usar algum tipo de RAID.

    
por 23.08.2009 / 16:01
0

Como sugerido por outros, a melhor maneira de resolver isso é apenas para testá-lo.

No entanto, não acredito que você vá atingir os limites de sua CPU ou RAM antes que o sistema se torne inutilizável devido à carga de IO que você está colocando nele.

Eu também não acredito que ele seja escalonado linearmente, eu esperaria chegar a um ponto em que executar um rsync realmente extra tornasse mais lento.

Se você realmente quer testar algo, eu testaria quantos você pode executar simultaneamente antes que ele se torne mais lento do que executá-los um por um. Em discos sata normais eu esperaria que esse número fosse menor que uma dúzia.

    
por 23.08.2009 / 09:39

Tags