Você poderia usar algumas linhas de Lua para conseguir isso. Lua está disponível em uma ampla variedade de plataformas, incluindo Windows e Linux.
-- Quick and dirty - no error checking, unsorted output
io.input('huge_text_file.txt')
results = {}
for line in io.lines() do
for text, number in string.gmatch(line, '(%w+)%s+(%d+)') do
results[text] = (results[text] or 0) + number
end
end
for text, number in pairs(results) do
print(text, number)
end
Você pode classificar a saída usando qualquer utilitário de classificação ou mais algumas linhas de Lua.