Como encontrar informações legíveis por humanos sobre tipos de arquivos reconhecidos por 'file'?

2

Pesquisando, googling, não consegui encontrar nenhuma informação sobre tipos de arquivo reconhecidos por file .

Por exemplo, um arquivo * .mp4 é identificado como "Mídia ISO" (embora seja capaz de reproduzir com o VLC normalmente). Isso não é 100% claro, de alguma forma me deixa a pensar se é uma detecção correta ou o arquivo é confuso para a imagem ISO. (Ou porque, por exemplo, a amostra está de alguma forma corrompida ou apenas que o algoritmo não é 100% preciso para todos os tipos.)

Meu problema é que preciso configurar algumas regras para alternar com base no tipo de arquivo. Eu configurei um conjunto de arquivos de amostra, mas não consigo coletar amostras suficientes de todos os tipos que precisam ser reconhecidos pelo meu código. E o conjunto real provavelmente será muito grande.

Seria o suficiente para mim se eu pudesse ler alguns comentários para usar como referência àqueles tipos que não são tão óbvios. Mas, para minha surpresa, não consegui encontrar nenhuma informação útil. A maioria das minhas pesquisas terminou na especificação de formato de arquivo mágico, o que não é muito útil para mim. Estou interessado no arquivo mágico que é distribuído com, digamos, Debian.

    
por Alois Mahdal 03.08.2011 / 11:46

2 respostas

3

As informações de detecção de tipo não são realmente incorporadas no programa de arquivo, o programa de arquivo apenas lê o arquivo mágico e, em seguida, pesquisa as assinaturas nesse arquivo para ver o que corresponde.

O arquivo mágico existe tanto como uma versão compilada, magic.mgc , quanto como a fonte original que é legível e é chamada apenas de magic . Nos meus sistemas baseados no Fedora, estes podem ser encontrados em:

/usr/share/misc/magic
/usr/share/misc/magic.mgc

Mais informações sobre o formato do arquivo podem ser encontradas na página de manual magic(5) .

    
por 03.08.2011 / 12:17
2

Bem, eu não sei se o código fonte do comando file é legível por humanos.

Mas se você quiser descobrir porque o seu mp4 é reconhecido como iso, eu começaria a ler o código fonte.

por 03.08.2011 / 12:04