Como posso determinar o tipo de arquivo sem uma extensão no Windows?

146

Às vezes, recebo arquivos de meus clientes com a extensão de arquivo incorreta. Por exemplo, o nome é image.jpg , mas o arquivo é, na verdade, uma imagem TIFF. Em muitos casos, posso esclarecê-lo abrindo o arquivo em um editor de texto, observando os primeiros bytes e, em seguida, deduzindo qual tipo de arquivo ele é.

Isso funciona para mim com arquivos JPEG, TIFF, GIF e PDF. No entanto, existem muitos outros tipos de arquivos por aí.

É possível automatizar a identificação do tipo de arquivo correto, analisando os dados que os contêm?

    
por Martin 24.04.2011 / 09:36

5 respostas

138

Você pode usar a ferramenta TrID que tem uma biblioteca crescente de definições de tipos de arquivo para identificar arquivos com

Caracterescuringassãosuportados.Porisso,noseuexemplo,vocêpodecolocartodasasimagensaseremexaminadasemumapasta,porexemplo,C:\verifyimages-entãovocêpodeusarocomando:

tridC:\verifyimages\*

Issoexaminarátodososarquivosnapastaverifyimages.

HátambémumaversãoGUIdisponível, TrIDNet :

ExistedocumentaçãodisponívelsobrecomovocêpodeintegrarfacilmenteoTrIDouoTrIDNetnoWindowsExplorerenoTotalCommander:

WindowsExplorer

Total Commander

por 24.04.2011 / 09:47
48

arquivo

File tests each argument in an attempt to classify it. There are three sets of tests, performed in this order: filesystem tests, magic number tests, and language tests. The first test that succeeds causes the file type to be printed.

The type printed will usually contain one of the words text (the file contains only printing characters and a few common control characters and is probably safe to read on an ASCII terminal), executable (the file contains the result of compiling a program in a form understandable to some UNIX kernel or another), or data meaning anything else (data is usually “binary” or non-printable). Exceptions are well-known file formats (core files, tar archives) that are known to contain binary data.

    
por 24.04.2011 / 09:38
12

Eu costumava trabalhar para a Biblioteca Nacional Francesa, para construir um sistema de arquivo digital que contém não apenas livros digitalizados, mas também milhões de artefatos digitais com todos os tipos de arquivos estranhos. Usamos o JHOVE para reconhecer os formatos de arquivo.

O JHOVE é open source, é mantido pela JSTOR e pela Biblioteca da Universidade de Harvard. É bastante simples usar .

    
por 24.04.2011 / 15:16
1

Eu uso bibliotecas OutsideIn do Oracle em meus programas. Não é grátis, mas funcionam bem, especialmente para imagens. O mercado fala que suporta mais de 500 tipos de arquivos.

    
por 24.04.2011 / 13:30
0

Você pode verificar o tipo de arquivo em qualquer computador, incluindo o Windows

link

    
por 04.06.2018 / 13:24