Se bem me lembro, na nuvem hazey do passado, os Documentos da Microsoft são gerados com um Identificador Único Global (GUID) que pode e tem sido usado forense para rastrear a origem de um documento.
O GUID e uma infinidade de dados não visíveis são arquivados com um documento do Microsoft Word em seus formatos de arquivos binários , incluindo informações do usuário no que é denominado 'metadados'. Mais recentemente (relativamente) as pessoas estão achando importante remover essas informações antes de liberar documentos Office 97 2000 2003 (2007 é deixado como um exercício.)
E a partir de seus próprios artigos da base de conhecimento:
Metadata is created in a variety of ways within Word documents. As a result, there is no single method that you can use to eliminate all such content from your documents. The following sections describe areas where metadata may be saved in Word documents.
Nome de usuário: A partir do link acima, o MS Word 97, 2000, 2003 pode usar seu nome de login na rede como detalhes do usuário para documentos criados, salvos pela última vez sob essa conta, da mesma forma, comentários / macros adicionados a documentos existentes. >
A Microsoft não publicou uma forma programática de extrair metadados de nome de usuário armazenados em documentos, embora eles publiquem (veja os links acima) como você pode "remover" dados armazenados.
De toda a Web você pode encontrar histórias de como extrair informações de edição, locais de arquivos foram usados para políticos de vergonha , por isso é possível obter os metadados, embora com algum trabalho.
Na minha experiência com o Microsoft Word 2000, é possível rastrear os metadados:
- authorship / edits - a sequência no arquivo do documento é igual às edições reais que observamos
- Caminhos de armazenamento (ou seja, quais diretórios / nomes e seqüência o arquivo evoluiu).
Nada que se levantaria em um tribunal (por falta de documentação real da Microsoft), mas bom o suficiente em um curso que marca a sequência para questionar a autenticidade de um documento.
Para o Microsoft Word 2007, a vida pode ser mais fácil, pois os metadados estão diretamente acessíveis no formato Docx / XML . Para quem gosta de dor, acessando os metadados de usuário do Microsoft Word 97, 2000, 2003 envolveu o seguinte para mim:
- Obtenha um editor hexadecimal (ou uma ferramenta de pesquisa de arquivos que analisa arquivos binários)
- No final do documento, você encontrará metadados como _PID_HLINKS para hiperlinks (?) no documento, bem como o Resumo do documento, etc. A parte superior do arquivo parece ser informações de formato / contexto de arquivo junto com o texto real do DOC.
Com um bom editor hexadecimal, ferramenta de pesquisa / arquivo, você deve ver padrões que sejam relevantes para o seu cenário de aula, para facilitar a pesquisa em seus documentos.
Boa sorte
Editar: enfatize formatos binários . Tive a chance de ver os arquivos RTF do MS Word hoje e eles definitivamente não fornecem Meta Data (até onde eu entendo).