Eu tenho um arquivo enorme (mais de 2 milhões de registros nele). Aqui está minha exigência:
- Inicialmente, divida o único arquivo grande em 10 arquivos menores.
- Os arquivos devem ser formatados da seguinte forma:
<File_name>
- <timestamp>
- xx
-
<timestamp>
é o mesmo tempo em cada arquivo
-
xx
representará qual arquivo é de 1 a 10
- Os arquivos devem ter
uma divisão limpa entre itens. Ou seja, não podemos ter o mesmo item
em mais de um arquivo.
Por exemplo, se eu tiver o arquivo abaixo:
ITEM,PARENT_PARTNUMBER,STORE_NUMBER,QUANTITY,BUYABLE,AVAILABILITYCODE,STORENAME,PHONENUMBER
400000209333,400000209333P,ALL,1297,1,2,,
400000209333,400000209333P,A-80007838,1297,1,2,,
400009664058,400009664058P,ALL,499,1,1,,
400009664058,400009664058P,A-80007838,477,1,1,,
400009664058,400009664058P,13806529,104,0,0,WDW - FLOWER & GARDEN,8-224-6122/5866
400000276151,400000276151P,ALL,0,0,0,,
400000276151,400000276151P,A-80007823,0,0,0,,
400000209692,400000209692P,ALL,8,1,1,,
Então eu quero dividir os arquivos assim. Primeiro arquivo (suponha que o primeiro arquivo tenha atingido o limite de 20000 e que no 19999 haja uma alteração no número do item que não pode estar no mesmo arquivo devido ao limite máximo do arquivo como 20000 e precisamos manter o número do item exclusivo no arquivo:
400000209333,400000209333P,ALL,1297,1,2,,
400000209333,400000209333P,A-80007838,1297,1,2,,
400009664058,400009664058P,ALL,499,1,1,,
400009664058,400009664058P,A-80007838,477,1,1,,
400009664058,400009664058P,13806529,104,0,0,WDW - FLOWER & GARDEN,8-224-6122/5866
Segundo arquivo:
400000276151,400000276151P,ALL,0,0,0,,
400000276151,400000276151P,A-80007823,0,0,0,,
400000209692,400000209692P,ALL,8,1,1,,
e assim por diante até o arquivo 10.