Análise de palavras-chave do Microsoft Office [fechada]

0

Existe algum software que fará a análise de palavras-chave em um lote de arquivos do Microsoft Word? Em outras palavras, eu simplesmente gostaria de uma contagem de palavras em todas as palavras usadas. O objetivo é identificar palavras-chave como base para criar uma taxonomia.

    
por mmcglynn 11.10.2011 / 15:03

2 respostas

1

Eu uso um script Python que usa o módulo docx.py (consulte aqui ) para ler o Word arquivos e processar as palavras individuais para uma tarefa relacionada. Os bits de chave estão no código a seguir (que apenas lê um arquivo .docx dado como o primeiro argumento de linha de comando, mas pode ser facilmente expandido para contar palavras em muitos arquivos:

from docx import *
import sys

try:
    document = opendocx(sys.argv[1])
except:
    print('Could not open '+sys.argv[1])
    exit()

## Fetch all the text out of the document       
paratextlist = getdocumenttext(document)    

count = {}
for line in paratextlist:
    for word in line.rstrip().split():
        count{word} = count.get(word,0) + 1
    
por 17.01.2013 / 21:20
0

Que tal WordStat ?

    
por 11.10.2011 / 20:33