O que são esses caracteres retangulares e onde esta notação é definida?

3

Usando o Linux (Fedora, especificamente) como minha estação de trabalho principal, notei, às vezes, estranhos caracteres não imprimíveis como nas seguintes capturas de tela (canto inferior esquerdo na primeira imagem e canto superior esquerdo na segunda imagem): / p>

Naimagemacima,oscaracteresnãoimprimíveisapareceramnognome-terminalcomoshellbash.Euestavasaindodoshellinterativodoipythonporumsys.stdin.close()hacking.

Naimagemacima,opersonagemapareceuemumapáginadawebabertanofirefox,especificamentenoarquivodetexto RFC 822 , pouco antes do índice desta RFC.

Estou curioso e quero saber o que são. Eu inferir que estes são algum tipo de representação do Unicode. Estou certo? Se sim, onde esse tipo de notação é definido? Como é chamado?

    
por Naitree 09.12.2015 / 12:04

2 respostas

1

A caixa quadrada é geralmente para caracteres que estão ausentes na sua fonte atual. O código interno é um código de caracteres UTF-8 de dois bytes. Terminais modernos são UTF8, então você pode obter isto se você tentar enviar alguns dados binários para o seu terminal. Parece que você fez algo realmente estranho com o seu python e o python enviou algum lixo para a tela, que foram interpretados como caracteres desconhecidos e você obteve algum lixo utf-8. Você sempre pode obter lixo aleatório semelhante com 'cat / dev / urandom'.

    
por 09.12.2015 / 15:00
1

Na captura de tela do Firefox, você vê o caractere 0x0C ou ASCII , o caractere Formfeed, uma instrução para impressoras continuarem em uma nova página. Veja a captura de tela. Eu marquei azul claro. Está em algum lugar entre o UDel-Relay e o Standard, e entre esse código eu vejo muitos caracteres 0A (alimentação de linha) e um 20 (espaço) e o 0C. Você vê que este editor mostra esses caracteres em cinza claro, o que significa que eles não são impressos.

O que eu fiz: salvei o arquivo. Em seguida, abriu o Jedit e abriu seu editor Hex. Esse é um plugin que você pode instalar no Jedit. Existem provavelmente muitos outros editores hexadecimais, mas este é o que eu conheço e é fácil de usar.

Isso não explica o que você vê no Bash, mas, como Terdon disse, pode ser um caractere ASCII binário, unicode ou não imprimível ...

    
por 09.12.2015 / 14:39