Desculpe, mas isso será em grande parte uma perda de tempo.
A maneira como a compactação de dados funciona é identificar padrões / suposições e representá-los de maneira mais eficiente. No entanto, o resultado final não tende a criar padrões compactáveis.
É possível extrair alguns dados que foram compactados e compactados de forma mais agressiva e obter algum ganho. Normalmente, o ganho é inferior a 3%, com 10% em casos bastante raros. No entanto, há um pouco de sobrecarga. Então, outros resultados, que são bastante comuns, são aproximadamente 0% de economia, com algum custo, então você pode aumentar o tamanho do arquivo.
Sinta-se à vontade para experimentar, se quiser, mas os resultados comuns de tais esforços são melhorias que são insignificantes ou inexistentes, ou até pioram as coisas.
O fato é que nem todos os dados podem ser compactados. O argumento da "contagem", também conhecido como princípio do "buraco dos pombos", explica por quê. (Veja: Seção de Perguntas Frequentes sobre Compactação 8 .) Basicamente, se dados compactados são iguais ou menor (usando menos bits), há menos arquivos compactados possíveis do que arquivos descompactados, o que prova que nem todos os arquivos compactados exclusivos podem ser representados com menos bits.
De fato, a maioria dos dados é incompressível. Felizmente para nós, os dados mais interessantes são compressíveis. Por exemplo, a maioria das imagens não se parece com imagens em preto e branco aleatórias (por exemplo, “neve” em televisores antigos que exibiam pixels monocromáticos aleatórios de intensidade aleatória). A maioria das planilhas na verdade não tem números completamente aleatórios (incluindo números nos trilhões negativos e frações de um que tem quarenta e três casas decimais, além de sinais logo antes dos sinais de divisão).
Até o texto tem padrões, como o uso pesado de vogais e o uso ocasional de sinais de pontuação seguidos por espaços e letras maiúsculas.
No entanto, os dados compactados tendem a ter os padrões úteis e representá-los de maneira eficiente. Portanto, o processo de compactação de dados remove ineficiências. O resultado é que normalmente há pouca ineficiência que podemos identificar e armazenar com mais eficiência.