Como posso abrir um subconjunto de um arquivo .xlsx grande (35MB)?

1

Tenho o Ubuntu 10.04 em execução em um Dell Optiplex com 4 GB de memória e dois processadores de 3,16 GHz.

Recebi uma planilha de 35MB. Ele abriu em Gnumeric após 5 minutos com erros, e não foi aberto no Open Office (morto após 20 minutos), mesmo depois de eu ter dado prioridade ao processo "soffice" (niceness = -20).

Qual é a melhor maneira de lidar com esse arquivo? É possível extrair um subconjunto das primeiras centenas de linhas para que eu possa elaborar o script que precisarei usar para analisar o arquivo inteiro?

atualização:

A função de linha de comando ssconvert BigFile.xlsx BigFile.csv produziu os mesmos erros que Gnumeric (não é surpresa porque o Gnumeric usa ssconvert )

    
por David LeBauer 26.04.2011 / 20:52

1 resposta

1

Provavelmente, mas você precisará de algum trabalho manual.

Os arquivos xslx são, na verdade, arquivos ZIP com dados XML. Então, basta descompactar o arquivo e dar uma olhada no interior. O formato não é algo que uma mente sensata entenderá facilmente, mas deve ser possível abrir os arquivos da pasta, procurar os elementos Row e remover tudo depois das primeiras centenas.

Como alternativa, você pode tentar abrir o arquivo com o Apache POI ; apenas dê Java 1GB de RAM e isso pode funcionar.

    
por 26.04.2011 / 21:34