Formatos de codificação binária

0
echo random text > text_file

Salva o text_file em formato de texto com codificação ASCII. Para verificar a codificação, eu faço

chardetect text_file

que me diz que o arquivo é codificado em ASCII. Agora eu tenho um arquivo de formato jpg e eu faço o mesmo

chardetect my_image_file

mas não reconhece nenhuma codificação nesse arquivo jpg.

Eu li essas duas respostas ( primeiro e segundo ) sobre qual é a diferença entre formato de arquivo e codificação de arquivo e entendeu que codificação de arquivo (ASCII, UTF-8, etc) é feita para representação de dados para usuários (porque os computadores não podem entender E também verificações de integridade (Base64), enquanto os formatos de arquivo são apenas a representação de como os dados são apresentados ao aplicativo para análise (HTML, JSON, etc) e que a mídia e alguns outros arquivos (JPEG, MP4, DOC, PDF) são armazenado em formato binário.

Perguntas

  • O meu entendimento é correto? Em caso afirmativo, os arquivos de formato binário (PDF, MP4, JPEG) não possuem codificação?
  • Se a codificação para arquivos binários (media / other) existir, como detectá-lo usando terminal.
  • Como detectar o formato que um arquivo está usando (JSON, HTML, texto sem formatação, PDF, GIF, JPEG, etc.) porque chardetect parece apenas informar informações sobre codificação de texto
por GypsyCosmonaut 29.06.2017 / 15:55

2 respostas

1

Use o comando file para determine file type (man file) .

Outros utilitários podem ajudar a identificar tipos específicos de arquivos:

  • chardetect é um universal character encoding detector (man chardetect) .
  • identify describes the format and characteristics of one or more image files.

Além disso, procure outros utilitários específicos de arquivos, como mediainfo , ffmpeg , exiftool .

    
por 29.06.2017 / 16:04
0

Uma "codificação", neste contexto (e meu palpite sobre o comando chardetect ), refere-se especificamente à forma como o texto é representado em um arquivo de texto. Outros arquivos também têm codificações, mas isso se refere a algo diferente.

Acho que você está procurando o comando file : ele tenta adivinhar o formato que um arquivo usa.

    
por 29.06.2017 / 16:04