Microsoft Excel - Plugin de pesquisa difusa

0

Para quem já usou o plug-in de pesquisa difusa -

No caso de correspondência difusa com várias colunas, será diferente se eu escolher cada coluna separadamente nas "Colunas de correspondência" ou juntas? Qual a diferença?

    
por tempidope 13.02.2018 / 19:16

1 resposta

0

Sim, isso fará uma enorme diferença nos resultados. A segunda opção é a maneira que você quer ir.

Em seu primeiro caso, a pesquisa difusa combinará todos os três campos como uma única string e, em seguida, avaliará a% de similaridade com base no número de caracteres da string inteira.

No seu segundo caso, ter três colunas de correspondência separadas dará igual peso a cada comparação. Cálculos separados estão sendo realizados na cor e na fruta.

A razão de ter os campos separados (cálculos separados) é mais precisa é que, digamos que os nomes da fruta em média têm 12 caracteres de comprimento, e as cores em média têm 6 caracteres de comprimento. Se você combinar as duas strings em uma, os nomes terão um peso maior só porque contêm mais caracteres. Quando você calcula cada campo separadamente, a porcentagem de similaridade compara nome x nome, gera uma pontuação, depois tira cor vs cor e gera uma pontuação separada. A semelhança% as médias das duas pontuações juntas para obter a% de Similaridade final.

Em última análise, a resposta pode ser diferente, dependendo do que você está procurando, mas a segunda opção avalia cada campo igualmente, independentemente do tamanho das palavras nessa string.

... Espero que isso ajude! Eu passei por muitas tentativas e erros frustrantes antes de descobrir isso sozinho;)

    
por 25.03.2018 / 22:11