Mistura de codificações

0

Para um texto que é uma mistura de diferentes codificações, não há como encontrar todas as codificações? E convertê-los em uma única codificação como utf8?

Eu copiei de diferentes fontes possivelmente com diferentes codificações em um arquivo de texto sob o gedit. Surpreendentemente, raramente tenho que considerar o problema da mistura de codificações. Pergunto por quê?

Mas quando abro esses arquivos no emacs, parece que tenho que enfrentar o problema.

Se eu criar um arquivo de texto copiando de diferentes fontes para o emacs e, em seguida, abrir o arquivo de texto em gedit, será o mesmo? Ou seja vai ficar bem no emacs, mas não no gedit?

    
por Tim 26.09.2014 / 18:21

1 resposta

2

Isto não é possível, porque os intervalos de validade de diferentes codificações se sobrepõem, portanto, não é possível determinar inequivocamente qual parte do texto tem qual codificação.

Você pode não gostar da resposta, mas esses são os fatos, na minha opinião.

    
por 26.09.2014 / 18:26