Os arquivos de dumps do Oracle usam um formato binário proprietário. Então você quer uma compressão padrão que seja boa para dados binários. O bzip2 é bom com dados binários, então eu recomendo isso.
Estou planejando compactar os arquivos de despejo de exportação do Oracle de todos os servidores de banco de dados Oracle para reduzir o uso de espaço em seus discos.
Minha pergunta é: Você conhece algum utilitário / algoritmo de compactação para compactar esse tipo de arquivo?
Os arquivos de dumps do Oracle usam um formato binário proprietário. Então você quer uma compressão padrão que seja boa para dados binários. O bzip2 é bom com dados binários, então eu recomendo isso.
Eu fiz algumas comparações usando um arquivo 4800 MB .DMP. Como resultado:
Em seguida, fiz alguns testes em um arquivo .DMP menor, de 72 MB:
Todos esses testes foram feitos com o 7Zip, e os níveis de compressão referem-se às configurações padrão disponíveis no 7Zip.
Algumas conclusões e observações até agora
LZMA e LZMA2 parecem ser as melhores opções para arquivos .DMP. Eu vi outras pessoas relatar isso também em outros fóruns. No 7zip, o LZMA suporta apenas 2 CPUs, e o LZMA2 suporta mais (também usa mais memória). Como os resultados da compactação parecem idênticos, selecionar LZMA2 deve resultar em uma compactação mais rápida.
Agora vamos brincar com tamanho de palavra e dicionário para arquivos LZMA2 ultra compactados ...
Conclusões finais
7zip, 7z, LZMA2, ou como você quiser, é o caminho a seguir.
Se você tiver paciência, a compactação será compensada. Indo para um tamanho de palavra ainda maior também vale a pena, mas indo para um tamanho de dicionário maior não pode (neste caso de teste).
Eu ficaria curioso para obter algumas médias de taxas de compactação de pessoas tentando isso. Tentarei lembrar de postar resultados assim que concluir a compactação de alguns arquivos maiores.
Novas conclusões
Eu ajustei tudo isso e obtive os melhores resultados em tempo / proporção com essas configurações:
Primeiro tento usar o 7zip com nível de ultra-compactação e ver o que você consegue. Eu definitivamente obtenho melhores resultados de .7z do que o formato .zip ...
bzip2
costuma ser a minha resposta padrão para essa tarefa.
AQUI é um ótimo artigo que usei ao fazer um script de backup em algumas máquinas linux. Funcionou muito bem. Acabei usando o rzip para minhas necessidades. Eu usei para fazer backup e comprimir todos os tipos de arquivos de dados, incluindo despejos de banco de dados SQL.
Tags compression oracle