Desculpe, pensei em esquecer de adicionar este código no começo:
cp -Rp doument_directory document_directory.orig
cd document_directory
for file in *
do
docx2txt "${file}" > "${file}.txt" && mv "${file}.txt" "${file}.doc"
done
se o seu sistema não tiver o utilitário docx2txt, você poderá obtê-lo no link
Emptor de advertência: A formatação de quebra de linha dos documentos do MS Word pode (e provavelmente será) diferente da do UNIX. Assim, a contagem de linhas pode não ser precisa, mas deve fazer o que você está procurando:
wc file.doc
você verá uma saída assim:
28 377 1492
O primeiro número é o número de linhas, o segundo, o número de palavras e o terceiro é o número de caracteres.
Se você quiser fazer apenas um tipo de contagem por vez, faça o seguinte:
Para o número de linhas
wc -l file.doc
Para o número de palavras
wc -w file.doc
Para o número de caracteres
wc -c file.doc
E você receberá um único número seguido pelo nome do arquivo.