Sugiro dar uma olhada no link do Data Wrangler. Parece ser um serviço da web.
Alguém pode recomendar uma ferramenta para limpar / esfregar dados além do Google Refine? Não tenho nenhum motivo específico para não querer usar o Google Refine, só quero avaliar algumas alternativas. Idealmente, a ferramenta seria capaz de operar em milhões de registros. Ouvi dizer que o Google Refine tem alguns problemas com grandes conjuntos de dados. Estou apenas começando a avaliar esses produtos, então ainda não testemunhei nenhum problema pessoalmente.
(Não é possível adicionar uma tag para o google-refine)
Nota editorial: o Google Refine agora se chama OpenRefine.
Sugiro dar uma olhada no link do Data Wrangler. Parece ser um serviço da web.
Tags openrefine