Eu baixei um arquivo de lista de senhas que tem o tipo MIME application / octet-stream. Quando abro o arquivo usando gedit
ou quando executo o comando head
, vejo o seguinte:
$ head eNtr0pY_ALL_sort_uniq.dic
Como posso saber quais são os caracteres que aparecem como quadrados? Eu poderia pegar o arquivo como text / plain? Quero dizer, se esta é uma lista de senhas que devem ser caracteres UTF-8, certo? Então por que eles não são mostrados assim?
Se eu executar o comando file, ele diz: eNtr0pY_ALL_sort_uniq.dic: data
Se eu fizer o mesmo com a opção -i, diz:
$ file -i eNtr0pY_ALL_sort_uniq.dic
eNtr0pY_ALL_sort_uniq.dic: application/octet-stream; charset=binary
ATUALIZAÇÃO:
Se eu executar o seguinte comando $ od -t c eNtr0pY_ALL_sort_uniq.dic > e.txt
, vejo o seguinte no arquivo e.txt
:
0000000 \n 001 \n 001 001 001 \n 001 001 001 001 001 001 001 001 1
0a 01 0a 01 01 01 0a 01 01 01 01 01 01 01 01 31
0000020 \n 001 002 \n 001 002 003 004 \n 001 030 \n 001 0 \n 001
0a 01 02 0a 01 02 03 04 0a 01 18 0a 01 30 0a 01
0000040 1 1 2 3 4 \n 001 1 2 1 2 3 4 \n 001 1
31 31 32 33 34 0a 01 31 32 31 32 33 34 0a 01 31
0000060 2 3 1 2 3 4 \n 001 1 2 3 4 \n 001 A B
32 33 31 32 33 34 0a 01 31 32 33 34 0a 01 41 42
0000100 C 1 2 3 4 \n 001 A B C D 1 2 3 4 \n
43 31 32 33 34 0a 01 41 42 43 44 31 32 33 34 0a
Eu não entendo o que significa 001 em ASCII. Pode ser que isso significa que não é um caractere ASCII. Nesse caso, seria possível converter esses caracteres para UTF-8?
Eu também tentei o seguinte recebendo esta mensagem de erro:
$ iconv -f application/octet-stream; -t UTF-8 eNtr0pY_ALL_sort_uniq.dic -o e_utf8.txt
iconv: conversion from 'application/octet-stream' is not supported
Try 'iconv --help' or 'iconv --usage' for more information.
Tags password mime-types