Contar número de caracteres / palavras / linhas no LibreOffice / OpenOffice (usando o terminal) Usando o comando 'wc'

0

O comando wc , usado para contagem, não funciona diretamente com os arquivos do Office.

Por exemplo, criei um arquivo .odt do escritor e escrevi dentro de 7 palavras. Então eu tentei wc -w file.odt , a saída foi 136, o que não é de todo lógico.

Se você tentar o acima em qualquer arquivo, você pode apenas wc -w sem problemas.

Agora, minha pergunta é como usar o comando wc com o Libre / OpenOffice?

    
por Maythux 08.03.2014 / 06:29

3 respostas

2

Atualizar : você pode usar libreoffice , que é instalado por padrão, para converter o arquivo em um arquivo de texto simples e contar os caracteres / palavras / linhas usando wc :

Para contar os caracteres:

libreoffice --headless --convert-to txt:Text <path_to_source_file> &> /dev/null && < <plaint_text_file_name> wc -c && rm test.txt

* < path_to_odt_file > = caminho para o arquivo de origem; < texto simples_file_file_name > = nome do arquivo de origem com a extensão substituída por .txt ;

Para contar as palavras:

libreoffice --headless --convert-to txt:Text <path_to_source_file> &> /dev/null && < <plaint_text_file_name> wc -w && rm test.txt

* < path_to_odt_file > = caminho para o arquivo de origem; < texto simples_file_file_name > = nome do arquivo de origem com a extensão substituída por .txt ;

Para contar as linhas:

libreoffice --headless --convert-to txt:Text <path_to_source_file> &> /dev/null && < <plaint_text_file_name> wc -l && rm test.txt

* < path_to_odt_file > = caminho para o arquivo de origem; < texto simples_file_file_name > = nome do arquivo de origem com a extensão substituída por .txt ;

    
por kos 22.04.2015 / 13:56
1

Eu encontrei este comando:

Para contar o número de palavras

unzip -p doc.odt content.xml | sed 's|<[^>]*>| |g' | wc -w

Para contar o número de linhas

unzip -p doc.odt content.xml | sed 's|<[^>]*>| |g' | wc -l

Para contar o número de caracteres

unzip -p doc.odt content.xml | sed 's|<[^>]*>| |g' | wc -c
    
por Maythux 08.03.2014 / 06:29
1

Há também o odt2txt autônomo (o pacote unoconv também oferece odt2txt ):

sudo apt-get install odt2txt
odt2txt foo.odt | wc -w

Os manpages do Ubuntu surpreendentemente carecem de uma manpage para ele.

    
por muru 22.04.2015 / 14:21