agrupando linhas com palavras semelhantes

1

Eu tenho vários documentos com uma quantidade enorme de dados textuais que eu queria agrupar por cluster. as linhas de agrupamento com várias duplicatas, como a linha 23, têm duas palavras: carro e caminhão, e a linha 197, carro e caminhão também, e eu quero agrupar essas duas linhas juntas porque elas têm dois conjuntos de duplicatas.

car truck scooter bike
cat horse duck rat
ship car boat truck

existe alguma maneira que detecta dois ou mais conjuntos de duplucados em linhas e agrupa / classifica essas linhas de forma que

car truck scooter bike
ship car boat truck
cat horse duck rat

eu sou um noob no excel embora

    
por adi 18.10.2015 / 15:16

0 respostas