Eu usaria o suplemento de pesquisa difusa para isso. Ele será lido em duas tabelas e retornará a melhor correspondência (ou correspondência), juntamente com as pontuações de confiança e similaridade.
Com conjuntos de dados típicos, você pode definir limites altos e baixos com base na pontuação de Confiança (por exemplo, aceitar qualquer correspondência acima de 0,9, rejeitar qualquer correspondência abaixo de 0,5), o que deixa você com um conjunto menor de candidatos para revisão manual. / p>