Usando o Mac Excel, como posso excluir linhas duplicadas parciais?

2

Estou executando o Mac Office 2011 no Lion.

Eu tenho uma folha de muitos milhares de linhas de dados, com boas 40 ou 50 colunas. Uma coluna é o endereço de email. Se alguma das duas linhas tiver um endereço de e-mail duplicado, eu gostaria de manter apenas uma das linhas.

Idealmente, quando as duplicatas forem encontradas, o padrão será manter a linha que possui um valor específico ("Y") em uma célula específica, se aplicável. Mas mesmo que apenas mantivesse o primeiro ou o último, seria uma melhoria.

Além disso, pode haver facilmente mais de duas instâncias de um endereço de e-mail específico, portanto, uma solução precisa ser capaz de lidar com qualquer número arbitrário de duplicatas.

Eu tentei a solução sugerida aqui - Remover linhas duplicadas no Excel quando nem todas as colunas são as mesmas - mas não fez nada para mim.

Obrigado por qualquer sugestão!

    
por Jonathan van Clute 19.09.2012 / 07:55

1 resposta

2

Eu não sei especificamente sobre o Mac Excel, mas acredito que a abordagem a seguir funciona para quase todos os aplicativos de planilhas:

  1. Ir para uma coluna vazia .
  2. Use a função =COUNTIF(A:A,A2) . A: A é a coluna que contém e-mails e A2 é a célula mais próxima que contém o e-mail.
  3. Copie a fórmula mencionada para a coluna inteira.
  4. "1" é retornado para valores exclusivos. Qualquer coisa além de "1" significa valor duplicado .
  5. Classifique por e-mail, se quiser ter duplicatas em linhas nas células vizinhas.
  6. Use o filtro para ocultar valores não duplicados (ou seja, ocultar 1s) ou classificar pela nova coluna descendente para obter todas as duplicatas na parte superior da tabela.
  7. Além disso, você pode usar o filtro em outra coluna (contendo "Y" ou sth) para separar os e-mails que deseja deixar e os que serão removidos.
por 19.09.2012 / 09:54