O vim pode exibir somente caracteres ASCII e tratar outros bytes como dados binários?

12

Eu já conheço vim -b , no entanto, dependendo da localidade usada, ele exibe caracteres de multibyte (como UTF-8) como letras únicas.

Como posso pedir ao vim para exibir apenas caracteres imprimíveis ASCII, e tratar o resto como dados binários, não importa o charset?

    
por Totor 06.01.2014 / 02:22

2 respostas

16

Ao usar vim -b , isso exibe todos os caracteres altos como <xx> :

set encoding=latin1
set isprint=
set display+=uhex

Qualquer codificação de byte único funcionará, o vim usará o ASCII para todos os caracteres inferiores e será codificado como imprimível. Definir isprint como vazio marcará todo o restante como não imprimível. A configuração de uhex os exibirá como hexadecimal.

Veja como a exibição muda após cada comando:

    
por 06.10.2014 / 00:15
1

Isso soa como o que você está procurando. Esta dica do wiki vim intitulado: Forçando o UTF-8 Vim a ler Latin1 como Latin1 .

$ vim -c "e ++enc=latin1" file.txt

Também de vim :help você pode fazer isso para ver mais sobre codificações.

:help enc

trecho de :help enc

'encoding' 'enc'        string (default: "latin1" or value from $LANG)
                        global
                        {only available when compiled with the +multi_byte
                        feature}
                        {not in Vi}
    Sets the character encoding used inside Vim.  It applies to text in
    the buffers, registers, Strings in expressions, text stored in the
    viminfo file, etc.  It sets the kind of characters which Vim can work
    with.  See encoding-names for the possible values.

    NOTE: Changing this option will not change the encoding of the
    existing text in Vim.  It may cause non-ASCII text to become invalid.
    It should normally be kept at its default value, or set when Vim
    starts up.  See multibyte.  To reload the menus see :menutrans.

    This option cannot be set from a modeline.  It would most likely
    corrupt the text.

    NOTE: For GTK+ 2 it is highly recommended to set 'encoding' to
    "utf-8".  Although care has been taken to allow different values of
    'encoding', "utf-8" is the natural choice for the environment and
    avoids unnecessary conversion overhead.  "utf-8" has not been made
    the default to prevent different behavior of the GUI and terminal
    versions, and to avoid changing the encoding of newly created files
    without your knowledge (in case 'fileencodings' is empty).
    ...
    ...
    
por 06.01.2014 / 02:40