Arquivo csv delimitado por tabulação russo UTF-8 salvo no Excel 2016 é lixo no editor de texto

1

Existe uma opção no Excel 2016 para exportar como um arquivo CSV delimitado por vírgula UTF-8. Eu não quero vírgulas entre campos, eu quero abas.

Salvei o arquivo como um arquivo txt delimitado por tabulação. No diálogo Salvar como, vou em "Ferramentas", depois em "Opções da Web", depois em "Codificação" e escolha UTF-8. Então eu abro com o Sublime Text 3 - o IDE que eu uso para escrever scripts python para manipular o arquivo (é muito grande para abrir no Bloco de Notas).

É um arquivo grande com cerca de 200.000 sentenças russas e traduções. O outro texto parece bem, mas todos os personagens russos aparecem como ???? ???? Completamente inútil.

O CSV delimitado por vírgulas funciona perfeitamente. Existe apenas uma maneira de salvar com êxito um arquivo CSV UTF-8 delimitado por tabulações no Excel?

    
por Deersfeet 29.11.2016 / 06:40

2 respostas

0

Eu nunca tinha ouvido falar desse recurso 'Opções da Web' antes, infelizmente, no momento em que escrevo, como Deersfeet também confirma, esse recurso parece estar quebrado no Office 2016. Também testei e posso reproduzir esse problema .

Como solução alternativa, você pode usar o método que sempre usei, porque geralmente quero muito mais controle sobre minhas configurações de exportação ...

  • Abra o MS Access, importe seus dados do Excel
  • No Access, exporte seus dados. O Access possui configurações muito mais avançadas para exportar para arquivos de texto simples (encapsulamento, separador, terminações de linha, ...)

A resposta para sua pergunta específica

Is there just no way to successfully save a tab-delimited UTF-8 CSV file in Excel?

parece ser: Não. Até que o MS conserte isso.
Você poderia abrir um relatório de bug, mas fiquei frustrado ao fazer isso, já que a MS não parece se importar com o feedback da comunidade ...

    
por 12.12.2016 / 15:03
0

Acredito que o mais próximo do que você está procurando é " Salvar como tipo: texto Unicode ". Ele fornece arquivos de texto delimitados com guias e suporta caracteres russos, embora não seja utf-8, mas unicode.

    
por 05.12.2016 / 11:37