Além do VBA, é possível desenvolver esse aplicativo usando a API do OpenOffice para ler o conteúdo do documento do Word; processe-o e exporte os resultados como um arquivo CSV para abrir em um aplicativo de planilha.
No entanto, na verdade, são apenas algumas linhas de códigos se você estiver familiarizado com qualquer linguagem de programação. Por exemplo, em Python, você pode facilmente fazer assim:
Aqui definimos uma função simples que conta as palavras com uma lista
def countWords(a_list):
words = {}
for i in range(len(a_list)):
item = a_list[i]
count = a_list.count(item)
words[item] = count
return sorted(words.items(), key = lambda item: item[1], reverse=True)
O resto é manipular o conteúdo do documento. Primeiro cole-o:
content = """This is the content of the word document. Just copy paste it.
It can be very very very very long and it can contain punctuation
(they will be ignored) and numbers like 123 and 4567 (they will be counted)."""
Aqui, removemos a pontuação, EOL, parênteses, etc. e, em seguida, geramos uma lista de palavras para a nossa função:
import re
cleanContent = re.sub('[^a-zA-Z0-9]',' ', content)
wordList = cleanContent.lower().split()
Em seguida, executamos nossa função e armazenamos seu resultado (pares de contagem de palavras) em outra lista e imprimimos os resultados:
result = countWords(wordList)
for words in result:
print(words)
Então o resultado é:
('very', 4)
('and', 3)
('it', 3)
('be', 3)
('they', 2)
('will', 2)
('can', 2)
('the', 2)
('ignored', 1)
('just', 1)
('is', 1)
('numbers', 1)
('punctuation', 1)
('long', 1)
('content', 1)
('document', 1)
('123', 1)
('4567', 1)
('copy', 1)
('paste', 1)
('word', 1)
('like', 1)
('this', 1)
('of', 1)
('contain', 1)
('counted', 1)
Você pode remover parênteses e vírgulas usando pesquisa / substituição, se quiser.
Tudo o que você precisa fazer é baixar o Python 3 , instalá-lo, abrir o IDLE (vem com o Python), substituir o conteúdo do seu documento do Word e execute os comandos um de cada vez e na ordem dada.