O script abaixo encontrará todos os arquivos .docx
e .rtf
no diretório atual e os renomeará como first_few_words.rtf
ou docx
. Primeiro você precisa instalar o catdoc
. No Debian e seus derivados você pode fazer isso com
sudo apt-get install catdoc
Curiosamente, catdoc
me dá um segfault quando eu tento em um docx
, então use docx2txt
para os arquivos doc:
sudo apt-get install docx2txt
Quando tiver catdoc
e docx
instalado, cd
no diretório que contém seus arquivos e execute:
for file in *rtf; do
name=$(catdoc "$file" | grep . | head -1 | sed 's/ /_/g') &&
mv "$file" "$name".rtf;
done
for file in *docx; do
name=$(docx2txt < "$file" | grep . | head -1 | sed 's/ /_/g') &&
mv "$file" "$name".docx;
done
CUIDADO: Isto irá apagar os arquivos originais, certifique-se de fazer um backup primeiro, apenas no caso.
EXPLICAÇÃO: ambos os utilitários convertem docx
ou rtf
em texto, seleciono a primeira linha não vazia desse texto, converto espaços em sublinhados (isso facilitará sua vida a longo prazo) e renomeie os arquivos em conformidade.