A tabela no MS ACCESS é significativamente maior que o arquivo CSV original

0

Eu tenho um arquivo CSV que importei para uma tabela no Microsoft Access 2016, há apenas uma tabela no arquivo .accdb. No disco, o arquivo CSV ocupa apenas 66 MB, enquanto o arquivo .accdb ocupa 105 MB. Eu executei uma operação compacta e de reparo no banco de dados, aparentemente sem efeito no tamanho. Eu tentei ajustar os tipos de dados de campo no banco de dados para ser o mínimo necessário, ou seja. Inteiro não "Long Integer" e "Short Text" não "Long Text", mas isso não parece ajudar. Além disso, fazer uma compactação ZIP no arquivo CSV produz um arquivo de apenas 18 MB, o que torna o tamanho grande do banco de dados particularmente irritante.

Por que o Access é tão ineficiente ao armazenar esses dados? O que poderia ser feito para diminuir o tamanho do banco de dados?

As primeiras linhas do arquivo CSV são assim:

0,,299-8,08-011-03,22,6,5,80.0,51.16,-0.88,-57.2,-42.91,-63.99,9.07,124.52,-11.22
1,,299-8,08-011-03,22,6,5,80.15,50.01,-0.96,-51.84,-43.7,-66.7,9.12,123.79,-11.21
2,,299-8,08-011-03,22,6,5,80.3,48.83,-1.04,-59.14,-44.03,-69.22,9.16,123.13,-11.18
3,,299-8,08-011-03,22,6,5,80.45,47.97,-1.06,-54.28,-48.42,-71.65,9.24,121.83,-11.19
4,,299-8,08-011-03,22,6,5,80.6,47.03,-1.16,-56.69,-44.96,-74.12,9.27,121.1,-11.09
5,,299-8,08-011-03,22,6,5,80.75,46.14,-1.16,-65.44,-46.2,-76.52,9.36,120.76,-11.08

Meu design de tabela no banco de dados se parece com isso:

    
por DakotaD 22.09.2017 / 16:55

1 resposta

3

O arquivo CSV armazena apenas texto, nada mais. A tabela do banco de dados inclui metadados sobre os campos, linhas, colunas e o próprio banco de dados. Os tipos de dados na figura que você anexou são evidências disso. Além de tudo isso, o Access não é o mecanismo de banco de dados mais eficiente e é especialmente deficiente com grandes quantidades de dados.

Então você sabe que não é só você ou algo que você fez de errado, aqui estão alguns arquivos de exemplo que eu coloquei juntos:

Ambos os arquivos têm cerca de 4000 linhas de dados. O arquivo maior tem 10 campos, incluindo diferentes tipos de números e comprimentos de texto. O menor tem apenas um único campo de texto (mais PK).

    
por 22.09.2017 / 17:02