Objetivo: Eu preciso encontrar uma maneira de consolidar várias apólices de seguro residencial e automóvel adquiridas por um Segurado (também conhecido como segurado) e atribuir essas políticas a uma única conta de cliente para aquele Segurado.
Problema: tenho mais de 100 mil registros de política. Um Segurado pode adquirir uma ou mais apólices, mas cada apólice recebe atualmente um número de conta de cliente exclusivo, mesmo que essas apólices pertençam ao mesmo Segurado. Além disso, a forma como a informação foi inserida no banco de dados, não posso apenas agrupar as políticas pelo nome do Segurado, endereço ou algum outro valor em outros campos sem intervenção manual pesada, porque as informações poderiam ser inseridas de forma diferente em cada campo para o mesmo Segurado (por exemplo, Smith, J vs. Smith, James ou Highland de 1000 E, Sac, CA vs. East Highland, Sacramento, CA).
Pergunta: Alguém sabe de uma ferramenta / utilidade (esperançosamente livre) que poderia ser usada para interrogar os registros e, através de algum algoritmo "fuzzy", agrupar esses 100k + registros de política em agrupamento associado a um determinado Segurado?
Tags data-validation