Quem é EmilyMarieDaunt ou Como ler / fazer engenharia reversa do arquivo DCF do Master Clips

4

Muitos anos atrás, eu comprei Masterclips 1,250,000 . É um conjunto de cerca de 14 GB de imagens divididas entre 28 ou mais CD's. O software de navegação MasterClips incluído ainda funciona, mais ou menos, em um sistema Windows 7 moderno. No entanto, a interface é bastante antiga e desajeitada. Por exemplo, a roda do meio do mouse não é suportada, as imagens em miniatura são minúsculas e pontilhadas e a pesquisa é muito lenta. Além disso, o gerenciamento de janelas MDI é horrível.

Os arquivos de imagens são acessíveis gratuitamente. O Picasa ou mesmo o Windows Explorer funciona bem para navegar pelas imagens. No entanto, os meta-dados sobre cada imagem (descrições textuais) estão bloqueados em arquivos binários * .DCF. Então a questão é:

Existe alguma maneira de extrair as descrições textuais (juntamente com os nomes de arquivos associados) desses arquivos DCF MasterClips? Ou existe uma versão mais recente do navegador MasterClips mais agradável de usar?

Na verdade, estou curioso para saber o que está acontecendo com o nome: "EmilyMarieDaunt" (veja abaixo)

Algumas informações que podem ajudar:

  • O navegador MasterClips é a versão 1.0.0.7 (na página de propriedades de detalhes do arquivo executável: FrontLine.exe)
  • Copyright 1998
  • A caixa "Sobre" refere-se a uma licença da RasterMaster Imaging Technology da Snowbound Software.
  • A caixa de diálogo "Abrir" refere-se a *.DCF;*.PAQ arquivos como arquivos da Biblioteca GCG3.
  • Existe uma opção de menu Arquivo para criar novos arquivos *.DCF;*.PAQ .
  • A versão mais recente deste software parece ser: ClipArt e mais 3,5 milhões . Não tenho certeza se esta versão usa o mesmo formato de catálogo.

Eu extraí as strings de 500 dos arquivos DCF menores. Strings interessantes que surgiram com frequência:

  • Todos os arquivos DCF começam com "EKIF" no início.
  • O nome "EmilyMarieDaunt" ocorre mais de 2.300 vezes.
  • "Sine Labore Nihil" também ocorre mais de 600 vezes.
  • A data "04/11/90" ocorre exatamente tantas vezes quanto "Sine Labore Nihil"
  • "1992 ACCUSOFT INC, TODOS OS DIREITOS RESERVADOS" ocorre 48 vezes.

Eu compartilhei quatro dos arquivos DCF para qualquer pessoa que queira inspecioná-los:

update:

Um arquivo das imagens ISO está disponível no archive.org, agora. É um conjunto ligeiramente diferente, mas deve ter os mesmos arquivos no formato DCF.

    
por Leftium 31.10.2010 / 18:04

1 resposta

0

DCF parece ser um padrão e as especificações existem, portanto não há necessidade de engenharia reversa.

Como o DCF é baseado em EXIF, exifdump (um script em Python) provavelmente poderia ser adaptado para lê-los. Isso vai exigir um pouco de programação, mas certamente será muito mais fácil do que escrever um analisador do zero.

    
por 24.03.2011 / 01:10