substitui caracteres de controle no Emacs?

2

Isso é um pequeno texto :

What2s with All the Parentheses?

No Emacs, 2 acima é mostrado como um caractere de controle (em vermelho). É suposto ser ' , mas não entendo porque é 2 , mesmo sabendo que o texto provavelmente foi gerado a partir do OCR?

Eu posso procurar o caractere de controle 2 por

C-s C-q 2 2 2

Mas não consigo quando tento substituí-lo por ' de maneira semelhante:

M-% 
C-q 2 2 2
'

Então eu me pergunto como fazer a substituição? É desnecessário fazer a substituição? Obrigado.

    
por Tim 07.08.2014 / 00:34

1 resposta

2

2 na codificação de caracteres CP-1252 é , ou seja, U + 2019 RIGHT SINGLE MARCA DE COTAÇÃO em Unicode.

Para instruir o Emacs que o arquivo está na codificação CP-1252, execute C-x RET r ( revert-buffer-with-coding-system ) e selecione cp1252 . Para salvar o arquivo em UTF-8 (a codificação padrão de fato no Linux e em outros sistemas unix), execute C-x RET f ( set-buffer-file-coding-system ) e selecione utf-8 .

Você deve poder substituir 2 por ' , mas é possível que isso não seja compatível, pois o Emacs está usando sistemas de codificação diferentes para o conteúdo do buffer e para a pesquisa, porque 2 é um caractere inválido na codificação padrão que o Emacs imaginou (latin1). Esse problema será resolvido se você declarar a codificação correta (e 2 será exibido como ). Se você quiser substituir o caractere sem fazer nada para informar ao Emacs sobre a codificação, copie e cole o caractere do buffer na string de pesquisa.

    
por 07.08.2014 / 01:31