Eu dividi um arquivo muito grande (~ 500 MB) em muitas partes usando o comando split
(cada arquivo dividido tem o mesmo número de linhas 131072 e de ~ 2.1 MB exceto o último. Cada linha em cada arquivo dividido contém apenas dois inteiros). O problema é com os arquivos divididos. Alguns arquivos divididos mostram a diferença de tamanho na saída do comando nautilus e ls -l
em grande medida, como mostrado para dois arquivos na imagem a seguir.
Qual poderia ser o motivo disso? Eu estou supondo que ls -l
saída está correta com certeza porque os arquivos devem ser do mesmo tamanho.
Atualização:
Quando arquivos divididos são copiados para outras unidades, eles mostram tamanho comparável para todos os arquivos (~ 2.1 MB, como deveria ser na verdade para o split -a 3 -l 100000 <filename> <file_prefix>
). Depois de abrir os arquivos de alguma outra unidade (após a cópia) e da unidade atual, não há diferença no conteúdo (somente o tamanho exibido nas duas unidades é diferente). Esse problema é observado apenas ao dividir arquivos grandes usando split
. Esse problema ocorre dependendo da maneira como o arquivo é dividido (a alteração do número de linhas no comando de divisão, em algum momento, não resulta nesse problema). Pela observação acima, parece que o problema não é com o comando split
, mas com a forma como o nautilus calcula o tamanho (pode depender da maneira como os arquivos são armazenados ou fornecidos pontos de nó, mas não tenho idéia de como o nautilus calcula o tamanho ). Eu sou capaz de reproduzir o mesmo problema com o arquivo de 250 MB para diferentes configurações de comando split
. Vou tentar reproduzir o problema para arquivo pequeno e se eu puder vou atualizar.
Pode ser dependente de arquitetura. Estou usando o Ubuntu 16.04, Intel Core-i5, RAM 16 GB, formato de disco rígido ext4.
Tags command-line nautilus files