O que é essa sequência de caracteres de controle (M-bM- ^ TM - ^ @) (traços)? Como posso transformar isso? [fechadas]

0

Eu tenho um arquivo 'datilografado' que, se eu cat -v , obtiver o seguinte na saída:

M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-

Eles parecem renderizados dentro do terminal enquanto executam o 'typescript'. Como posso transformá-los em uma representação de texto simples apropriada?

A execução de sed "s/M-bM-^TM-^@/testing123/g" neste arquivo parece não funcionar.

Aqui está o arquivo inteiro:

cat -v typescript
Script started on 2018-07-07 19:08:54+00:00
^[[?1049h^[[22;0;0t^[[H^[[2J^[[?25l^[[1;1H^[(B^[[mHello,                                                                                                                              ^[[2;1H^[(B^[[mWorld!                                                                                                                              ^[[3;1H^[(B^[[mM-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@M-bM-^TM-^@^[[4;1H^[(B^[[m                                                                                                                                    ^[[5;1H^[(B^[[m                                                                                                                                    ^[[6;1H^[(B^[[m                                                                                                                                    ^[[7;1H^[(B^[[m                                                                                                                                    ^[[8;1H^[(B^[[m                                                                                                                                    ^[[9;1H^[(B^[[m                                                                                                                                    ^[[10;1H^[(B^[[m                                                                                                                                    ^[[11;1H^[(B^[[m                                                                                                                                    ^[[12;1H^[(B^[[m                                                                                                                                    ^[[13;1H^[(B^[[m                                                                                                                                    ^[[14;1H^[(B^[[m                                                                                                                                    ^[[15;1H^[(B^[[m                                                                                                                                    ^[[16;1H^[(B^[[m                                                                                                                                    ^[[17;1H^[(B^[[m                                                                                                                                    ^[[18;1H^[(B^[[m                                                                                                                                    ^[[19;1H^[(B^[[m                                                                                                                                    ^[[20;1H^[(B^[[m                                                                                                                                    ^[[21;1H^[(B^[[m                                                                                                                                    ^[[22;1H^[(B^[[m                                                                                                                                    ^[[23;1H^[(B^[[m                                                                                                                                    ^[[24;1H^[(B^[[m                                                                                                                                    ^[[25;1H^[(B^[[m                                                                                                                                    ^[[26;1H^[(B^[[m                                                                                                                                    ^[[27;1H^[(B^[[m                                                                                                                                    ^[[28;1H^[(B^[[m                                                                                                                                    ^[[29;1H^[(B^[[m                                                                                                                                    ^[[30;1H^[(B^[[m                                                                                                                                    ^[[31;1H^[(B^[[m                                                                                                                                    ^[[32;1H^[(B^[[m                                                                                                                                    ^[[33;1H^[(B^[[m                                                                                                                                    ^[[34;1H^[(B^[[m                                                                                                                                    ^[[?1049l^[[23;0;0t^[[?12l^[[?25h^[(B^[[m^[[?12l^[[?25h5^M
zsh:1: command not found: k^M

Script done on 2018-07-07 19:08:55+00:00
    
por Chris Stryczynski 07.07.2018 / 19:11

1 resposta

3

Assumindo que M- é meta e ^ é controle, a seqüência M-b M-^T M-^@ representa hex e4 94 80 . O caractere que você deu é unicode U2500, "BOX DRAWINGS LIGHT HORIZONTAL". Se você alinhar os padrões de bits, você recebe algo como

1110 0100  1001 0100  1000 0000 = e4 94 80
   0 0100     1 0100    00 0000 = 2500

Portanto, esta parece ser uma codificação multibyte, onde os MSBs denotam "primeiro byte" e "seguinte byte", mas não está totalmente claro como. (Ou este palpite está errado e, na realidade, a codificação é diferente). Isso não é UTF-8 e não tenho ideia do que é.

Eu também não tenho certeza se isso responde à sua pergunta, porque você já sabe que essa sequência é renderizada como um único caractere e qual personagem é essa. E da mesma forma que você sabe, você seria capaz de descobrir outros personagens.

Portanto, sem mais informações, isso provavelmente não tem uma resposta real.

    
por 08.07.2018 / 06:53