Por que meus arquivos Excel mesclados são tão grandes?

0

Eu tenho arquivos que precisam ser mesclados antes que possam ser usados (devido a limitações de tamanho no número de linhas que eu posso exportar). Isso significa que as planilhas excel (.xlsx) com colunas idênticas fornecem dados semelhantes para diferentes períodos. Meus arquivos são em torno de 220-280KB cada, mas a mesclagem de dois arquivos é (dependendo do método) em torno de 1MB, e outra mesclagem de cinco arquivos não pode ser menor que 2,25MB.

Estou processando esses (assim como outros arquivos que não requerem mesclagem) em python, e os arquivos mesclados demoram cerca de 6-7 vezes mais tempo para processar do que eu esperaria com base em quanto tempo os outros arquivos ocupam. Alguém sabe por que o mesmo arquivo, dobrando o número de linhas de dados, quadruplicaria de tamanho? Existe uma maneira de mesclar arquivos e evitar isso?

Para informações: não há imagens, fórmulas ou macros ativas no arquivo.

EDIT: Eu realmente descobri que os arquivos que estou mesclando aberto em "visão protegida", e se eu ativar a edição e salvar, eles ficam significativamente maiores (o que explica a disparidade). Não sei por que isso acontece, entretanto - qualquer explicação seria muito apreciada!

    
por Jim Eisenberg 28.09.2018 / 11:34

0 respostas