Eu tenho muitos arquivos recuperados, dos quais muitos são inválidos, embora pareçam estar bem por nome e extensão. Isso é esperado.
Agora eu preciso filtrar aqueles que provavelmente estão ok. Eu vejo a opções:
Por exemplo, os arquivos power point (* .pptx) são, na verdade, contêineres zip que começam com PK nos dois primeiros bytes. Então o comando
head --byte 2 filename
gera PK para a maioria dos arquivos bons, enquanto os arquivos ruins não iniciam com PK.
Pergunta 1: Como posso combinar head
com find
para listar os arquivos correspondentes?
Outra abordagem é o comando file
. Imprime
Zip archive data, at least v2.0 to extract
para bons arquivos de ponto de poder, mas simplesmente
data
para arquivos inválidos.
Pergunta 2: Como posso combinar file
com find
para listar arquivos válidos?
Há também outro tipo de arquivo, mas eu posso aumentar o technque se eu só obtiver a dica:)
Pergunta 3: as formas mais óbvias de fazer isso?