Dividir arquivos xml muito grandes em pequenos pedaços com contagem de números de linha específica

1

Foi assim que eu extraí as primeiras 100.000 linhas do meu arquivo xml grande (2gb):

head source.xml -n 100000 > part.xml

Como posso continuar a dividi-los em 100.000 linhas (ou em pedaços de tamanho de arquivo específicos) até que o arquivo inteiro seja separado?

    
por Badr Hari 09.11.2014 / 17:22

1 resposta

2

Você poderia usar

split -l lines_per_file --additional-suffix=.xml source.xml part

Isso lerá o arquivo source.xml e o dividirá em pedaços de lines_per_file linhas cada. O resultado será gravado em uma série de arquivos partaa.xml , partab.xml , partac.xml , ...

Se você quiser usar outro número de caracteres de sufixo, você pode usar a opção -a para especificar um número, por exemplo. -a 1 para nomear os arquivos parta.xml , partb.xml , partc.xml , ...

Se você deseja dividir em blocos de tamanho de arquivo em vez de contagens de linha, use -b size_in_bytes em vez de -l lines_per_file .

Por favor, note que os arquivos resultantes provavelmente serão arquivos XML inválidos (a menos que você receba um arquivo em retorno, ou seja, sua entrada tenha poucas linhas / bytes para ser dividida).

    
por 09.11.2014 / 17:31

Tags