gedit error: “Erro inesperado: sequência de bytes inválida na entrada de conversão”

5

Estou fazendo um projeto de pesquisa em PNL. Para isso, tenho que analisar um arquivo de texto unicode (cingalês) de cerca de 10mb e ele é aberto no Google Docs. Mas quando eu tento abri-lo do gedit estou recebendo esse erro

Unexpected error: Invalid byte sequence in conversion input

Então, eu segui essa pergunta semelhante e tentou a segunda resposta que sugere a execução deste comando no terminal:

gsettings set org.gnome.gedit.preferences.encodings auto-detected "['UTF-8', 'CURRENT', 'ISO-8859-15', 'UTF-16']"

Eu tenho esse resultado no terminal:

GLib-GIO-Message: Using the 'memory' GSettings backend.  Your settings will not be saved or shared with other applications.
No such key "auto-detected"

Portanto, não há sucesso. Quando tento abrir o arquivo no gedit, estou recebendo o mesmo erro. Como posso consertar isso? Como posso abrir este arquivo em gedit ?

    
por Pankaja Paranavitharana 14.04.2018 / 10:17

1 resposta

6

Não sei qual é a causa do problema, mas consegui reproduzi-lo no meu sistema.

Experimentalmente, eu corri dos2unix no arquivo e a saída disse que era um arquivo UTF-16LE. Para os curiosos, LE significa little endian . Depois de dos2unix ter convertido o arquivo para o formato UTF-8, consegui abri-lo com o Gedit.

sudo apt install dos2unix
dos2unix -n oldfile newfile
gedit newfile

Eu usei o sinal -n para evitar substituir o arquivo original. Substitua oldfile pelo nome do arquivo original e newfile pelo nome que você deseja que o novo arquivo seja chamado. Use a conclusão de tabulação (digite o início do nome do arquivo e pressione tab e o nome completo deve aparecer) ou ' aspas se o nome do arquivo tiver espaços ou outros caracteres especiais.

Como participante, consegui abrir o arquivo sem convertê-lo usando o Pluma , um editor de texto baseado no Gedit , então eu suspeito que isso pode ser um bug no Gedit. A passagem de --encoding UTF-16LE ou --encoding UTF-16 para o Gedit ao abrir o arquivo não ajudou.

    
por Zanna 14.04.2018 / 12:58