Solução (s) de backup para empresa de pequeno e médio porte

2

Atualmente, no datacenter, temos 6 caixas. Cada um deles executa uma pilha LAMP, e cada um deles precisa ser armazenado em backup. A solução óbvia é fazer o backup de tudo isso em uma máquina e, em seguida, conectar uma unidade a ela e fazer o backup.

O problema é que alguns dos nossos funcionários (leia-se: a pessoa que estaria ligando a unidade) são preguiçosos. Então eu fui encarregado de escrever um script para fazer o backup de cada uma de nossas máquinas localmente, para que elas pudessem ser copiadas para backup fora da mesma linha como acima. No entanto, o datacenter cobra um percentil 95 e esses backups estão custando dinheiro à empresa.

Minha pergunta, para empresas de pequeno e médio porte: qual é o cenário apropriado que devemos usar para fazer backup de nossos dados? Atualmente, comprar outra máquina para fazer backup é uma possibilidade remota, mas seria levada em consideração.

    
por Glen Solsberry 12.08.2009 / 18:28

6 respostas

1

Como você está atualmente executando seus backups fora do site?

Se você está feliz com o acordo atual, então você pode limitar a quantidade de largura de banda usada pelo processo que realiza a cópia fora do site, colocando-o com trickle ou algo parecido. Limite a largura de banda a algo consideravelmente abaixo da taxa de dados que você pode cobrar.

Eu pessoalmente (e no trabalho) uso o rsync para todos os backups, pois o protocolo de sincronização é muito eficiente na limitação da quantidade de dados transferidos. Além disso, ele tem uma opção de aceleração de transferência própria, que usamos para não saturar a linha ADSL de saída (o que seria um inconveniente se uma execução de backup fosse iniciada enquanto um de nós estava realizando tarefas administrativas remotas nessa linha ).

    
por 12.08.2009 / 19:10
5

Há uma tonelada de perguntas de backup já disponíveis. Acabei de responder a um na verdade. LOL

O livro O'Reilly "Backup and Recovery" é um ótimo livro se você quiser ler sobre a estratégia geral e alguns das possibilidades lá fora.

Você precisa de um PLAN antes de começar. E o plano precisa fazer sentido e (esperançosamente) ser escalável.

Algumas coisas específicas que você pode querer analisar e considerar são:

Jungledisk

rdiff-backup

rsync (sempre um favorito pessoal)

    
por 12.08.2009 / 18:39
1

Tudo bem, sua primeira etapa deve ser avaliar o que você realmente quer e criar um plano de backup antes de criar uma solução de backup. O cachorro se cansa de ser abanado.

Se eu estivesse nessa situação, aqui está o que eu faria.

Se as máquinas foram criadas no kickstart e são bem gerenciadas, e você pode recriá-las da documentação, ótimo. Se não, faça imagens semestrais deles em drives USB. Você pode usar o clonezilla e pronto em pouco tempo. Isso lhe dará uma recuperação relativamente rápida se uma das máquinas pegar fogo, ou o que for.

Você também desejará backups regulares da configuração e dos dados. Sem saber quantos dados são, eu diria que avalie as necessidades de cada servidor individual e determine o que seu destino de backup exigirá. Depois de ter isso, você tem uma idéia muito melhor de onde você pode colocá-lo.

Avalie. Plano. Construir. Teste. Naquela ordem, por favor.

    
por 12.08.2009 / 18:35
1

Hmm. Bem, nossa solução é ter um servidor de backup separado no datacenter, mas sem backups externos. Isso é barato para nós porque alugamos um rack inteiro, mas usamos apenas 2/3 dele (e estamos super confortáveis com o provedor de datacenter - esse espaço pode até ser gratuito). Eu sugeri backups off-site para o meu chefe, mas ele colocou isso como muito caro em largura de banda. Ele também acha que a probabilidade da destruição do nosso datacenter é muito pequena. Eu dou de ombros e digo "é a sua chamada".

Quanto ao servidor de backup, isso também é feito a baixo custo. É hardware de nível de consumidor com uma unidade não-RAID. A expectativa é que, se a unidade falhar, eu estaria lá com uma nova naquele dia e reconstruiríamos os backups imediatamente. O software que faz o backup dos servidores, no entanto, é enviado para fora do site porque é muito pequeno comparado a todos os outros dados. Também são apenas alguns scripts de shell personalizados que usam o Rsync. Eu faço backups incrementais fazendo tarballs dos diretórios e girando os tarballs.

Tecnicamente falando, isso é "suficiente". Já salvou nossos couros em algumas ocasiões.

    
por 12.08.2009 / 18:56
0

Eu pessoalmente gosto do backuppc que é gratuito, agrupa dados, é muito personalizável, usa ferramentas básicas do Linux, pode fazer backup de todos os tipos de sistemas operacionais, interface web e configurações bastante simples.

    
por 12.08.2009 / 18:34
0

Eu uso o rsync em um servidor de backup central; jogue um pouco de "backups rotativos" usando links físicos para economizar espaço em disco:

cd /backup/

for i in $( seq 0 4 | sort -r)
do
  mv cur.$i cur.$[$i+1]
done

rm -rf cur.5 &
cp -al cur cur.0

Como o rsync moverá um novo arquivo sobre o antigo - os links físicos economizarão uma tonelada de espaço em disco em arquivos que nunca serão alterados (todos eles fazem referência a um inode), mas cada cópia do diretório deve conter cada arquivo (não apenas links simbólicos para os arquivos)

O rsync tem um limitador de largura de banda e a compactação incorporada:

    -z, --compress              compress file data during the transfer
        --bwlimit=KBPS          limit I/O bandwidth; KBytes per second

Eu faço backup de 23 máquinas para um servidor todas as noites. Leva um pouco menos de 2 horas para percorrer todas as máquinas - mas estou usando uma máquina local.

Existem alguns drives de 2 TB decentemente baratos por aí - e você pode facilmente configurar um RAID 1 que espelhe sua unidade de backup em uma unidade extra que se torne a unidade de rotação "externa".

    
por 13.08.2009 / 01:17

Tags