Como anotar arquivos - quando longos nomes de arquivos não são suficientes

1

Eu trabalho com muitos arquivos fazendo análises gerais de dados.

As coisas que eu quero saber sobre meus arquivos incluem:

  • quais dados estão contidos no arquivo (em texto descritivo longo e muito longo em inglês)?
  • é o arquivo baixado de algum lugar (onde? quando?) ou gerado por um programa (qual?)
  • por que eu criei este arquivo, a descrição verbal, o que eu quero fazer com ele, onde ele pertence ao meu fluxo de trabalho de análise de dados (a descrição adicional do texto em inglês também pode ficar muito longa)

Para isso, nomes extensos de arquivos simplesmente não são a solução! Mesmo nomes extensos de arquivos são muito curtos para as descrições completas, e quando estiver trabalhando com os arquivos (perl, awk, R), os nomes de arquivos longos ficam no caminho.

O que eu faço agora é fazer um readme em cada diretório com o nome do arquivo, tab-separator e a descrição longa. No entanto, esta solução é muito complicada, como você pode imaginar, porque as descrições são completamente separadas do sistema de arquivos e tudo, o leia-me tem que ser mantido e atualizado separadamente, etc.

Existe alguma ferramenta que se pode usar para descrições sistemáticas e detalhadas de nomes de arquivos? Talvez até integrado ao sistema de arquivos?

Sistema operacional usado: Windows 7 e Cygwin, vários tipos de linux / unix através de SSH e importação de X

    
por gojira 28.08.2011 / 16:14

2 respostas

1

Como você precisa de uma solução independente de plataforma usando o arquivo de sistemas de metadados do sistema de arquivos fornecido pelo NTFS, não pode ser usado.

Uma alternativa seria um sistema de banco de dados que gerencia arquivos e metadados - totalmente independente do sistema de arquivos.

Uma solução simples baseada em sistema de arquivos seria adicionar um segundo arquivo contendo os metadados. Por exemplo. um arquivo baseado em XML com o mesmo nome de arquivo anexado ao xml. Todos os sistemas de arquivos atuais suportam várias extensões de arquivos. O arquivo XML adicional teria a vantagem de um usuário poder lê-lo em um editor de texto, onde as ferramentas também poderiam interpretá-lo e extrair dados relevantes, como URL, do qual você fez o download do arquivo.

    
por 28.08.2011 / 16:37
1

Esta resposta é em resposta a seu comentar sobre sistemas de controle de versão .

Sim, sistemas de controle de versão podem ser usados para essa finalidade.
Veja como você poderia descrever um arquivo usando o git:

$ git init # skip this step if you're already using git
Initialized empty Git repository ...
$ touch abstract.md # create a blank markdown document
$ git add abstract.md # stage this change so that it can be committed to the repository
$ git commit

Isso abrirá seu editor de texto definido por $EDITOR , que é assim:

Create file abstract.md

This file holds my abstracts, and this description         
restates the short message because I can't think of anything better to write.

# Please enter the commit message for your changes. Lines starting
# with '#' will be ignored, and an empty message aborts the commit.
# On branch master
#
# Initial commit
#
# Changes to be committed:
#   new file:   abstract.md
#

Quando você fechar o arquivo, o git confirmará suas alterações no repositório.

Depois, para ver seus commits para esse arquivo, faça o git log --follow abstract.md .

commit 57bd5244574cd77ae62e17651578d88ee8bca919
Author: Robert 
Date:   Thu May 18 2017

    Create file abstract.md

    This file holds my abstracts, and this description
    restates the short message because I can't think of anything better to write.

Não sei se o git log --follow segue os ramos embora.

    
por 19.05.2017 / 02:30