MS Excel: salvar planilha separada por tabulação com o fim de linhas UNIX e UTF-8?

4

Eu tenho um arquivo de texto separado por tabulação com uma tabela que possui caracteres de fim de linha do UNIX (ou seja, \n ) e codificação UTF-8. Eu posso abri-lo no MS Excel 2010 sem maiores problemas usando Data → Import e selecionando opções relacionadas. No entanto, se eu salvá-lo de volta em um arquivo de texto usando Arquivo → Salvar como → Separado por tabulações, acabo com um arquivo com final de linha do DOS (ou seja, \r\n ) e uma codificação nacional de um byte do Windows (por exemplo, ANSI ").

É claro que posso restaurar o final de linha e a codificação adequados com uma ferramenta externa, mas isso parece um monte de problemas a longo prazo.

Existe uma maneira rápida de salvar arquivos separados por tabulação com EOLs do UNIX e em UTF8 (ou seja, usando todas as configurações que foram usadas durante a importação) no MS Excel?

    
por GreyCat 24.11.2014 / 09:25

1 resposta

3

Resposta curta: não. O Excel não pode fazer isso sem usar o VBA.

Sobre diferentes codificações
Verifique esta questão do Stackoverflow sobre as diferentes codificações (UTF-8, UTF-16 , Unicode, etc.)

O que o Excel pode fazer
O Microsoft Excel pode exportar arquivos de texto usando ANSI ( Windows-1252 ou ISO-8859-1 , que são bastante similar ) ou usando Unicode (que é o mesmo que UTF-16). Ambos têm um final de linha no estilo DOS ([CR] + [LF] ou '\ r \ n' ou no código ASCII HEX: 0x0D0A).

O que o Excel não pode fazer
O Microsoft Excel não pode exportar UTF-8 e não pode usar novas linhas de estilo UNIX ([LF] ou '\ n' ou em código ASCII HEX: 0x0D).

Consulte este artigo da Base de conhecimento da Microsoft onde isso é confirmado. Eles revertem para outra ferramenta (como o Bloco de Notas) para salvar o arquivo ANSI em UTF-8.

Para uma resposta do VBA, consulte esta solução .

    
por 03.12.2014 / 09:54