ISO-8859-5 para Mac OS X

0
mbp:Desktop alexus$ file $$.txt
235.txt: ISO-8859 text, with CRLF line terminators
mbp:Desktop alexus$ 

No entanto, isso não é realmente ISO-8859 , mas 8859-5 (russo).

O arquivo abre no Windows muito bem (eu posso ver caracteres russos) e em um Mac eu recebo alguns símbolos desconhecidos ou pontos de interrogação.

Existe uma solução?

    
por alexus 23.10.2010 / 02:37

2 respostas

2

Para abrir o arquivo sem converter sua codificação, você precisará encontrar uma maneira de especificar a codificação do arquivo para qualquer programa que esteja abrindo o arquivo.

Você vai querer evitar clicar duas vezes no arquivo e, em vez disso, usar diretamente o item de menu Abrir ... (geralmente ⌘O ou Abrir ... no menu Arquivo) do aplicativo que você deseja usar para visualizar / editar o arquivo. Se o aplicativo for capaz de ler arquivos em outras codificações, ele provavelmente permitirá que você especifique a codificação na caixa de diálogo Abrir… (da mesma forma, eles devem permitir que você especifique uma codificação (possivelmente diferente) ao usar Salvar como…).

Por exemplo, TextEdit tem lista suspensa para “Plain Text Encoding” na parte inferior da caixa de diálogo Abrir…. Se a ISO 8859-5 não estiver listada, pode ser necessário selecionar “Personalizar lista de codificações…” para adicioná-la à lista. Você pode querer "cirílico (ISO 8859-5)", "cirílico (Windows)", "cirílico (KOI8-R)", ou qualquer outra coisa (use 8859-5 se tiver certeza de que é a codificação, caso contrário eu não sou Certifique-se de que as atribuições de pontos de código das outras codificações cirílicas sejam semelhantes em tudo.

Terminal normalmente espera caracteres codificados em UTF-8, então você deve transcodificar os dados para UTF-8 se você quiser apenas "cat" o arquivo.

iconv -f ISO-8859-5 -t UTF-8 < filename

Você também pode usar iconv para salvar uma cópia do arquivo convertido (você pode achar mais fácil trabalhar com um arquivo UTF-8, pois muitos programas usarão como padrão a decodificação de um arquivo como UTF-8 ):

iconv -f ISO-8859-5 -t UTF-8 < filename > filename.utf8.txt

Você pode obter uma lista completa das codificações que o iconv suporta com iconv -l .

Se você quiser usar um programa para visualizar / editar o arquivo dentro do Terminal , então os passos (novamente) dependem do programa que você está usando. Você pode fazer isso em Vim assim:

vim -c 'e ++enc=iso-8859-5 filename'

Ou se Vim já estiver iniciado:

:e ++enc=iso-8859-5 filename

Você pode obter uma lista das codificações que o Vim conhece com :help *encoding-names* .

    
por 23.10.2010 / 06:07
0

Use iconv para converter o arquivo em UTF-8.

    
por 23.10.2010 / 03:00

Tags