Removendo duplicatas em linhas 3K, 9 colunas

1

Eu tenho uma tabela do Excel 2010 de 3.800+. Gostaria de identificar duplicatas em 6 colunas, muitas com texto, algumas com endereços IP e nomes de host, para que os dados precisos sejam refletidos. Eu tentei o antigo Remove Duplicates, formatação condicional, destacando várias linhas com cores diferentes usando uma macro VBA, combinando colunas, em seguida, fazendo COUNTIFS e IF. Escusado será dizer que, com o tipo de dados que tenho nenhum deles funcionou exatamente. Com esse conjunto de dados, o objetivo é reduzir a lista em 1.900 ou mais, porque sei que muitas são duplicatas (já que combinei um conjunto antigo e um novo conjunto de dados, propositalmente, para poder ver anotações antigas). No entanto, os métodos mais recentes só foram reduzidos em 100

Eu quero identificá-los e, em seguida, ser capaz de filtrá-los junto com o original e, em seguida, ser capaz de excluir facilmente as duplicatas, realçando e pressionando Excluir.

Alguém já fez algo assim antes? Eu sou um iniciante do Excel, embora eu tenha uma formação técnica, por favor, faça quaisquer explicações novato amigável. Gostaria de ter algumas ideias específicas para lidar com esta situação, se alguém tiver alguma?

Clique aqui para o exemplo

imagine isso mais mais 3.000 linhas. Esse é o número exato de colunas que eu tinha, tipos semelhantes de dados.

Eu quero reduzir duplicatas de acordo com A2 & B2 & E2 & J2 & L2

Obrigado,

KMG

imagine this plus 3,000 more rows. These are the exact number of columns I had,similar types of data.

    
  

Eu quero reduzir duplicatas de acordo com A2 & B2 & E2 & J2 & L2

    
por KMG 29.03.2017 / 22:28

2 respostas

0

Crie uma nova coluna Q por exemplo e escreva a fórmula: =A2&B2&E2&J2&L2

Concatene a coluna-chave e você pode arrastá-la para baixo Comece na primeira linha Dados (eu comecei com a linha 2)

Na coluna R, escreva a fórmula:% =COUNTIF($Q$2:Q3800,Q2) e arraste-a para baixo

$Q$2:Q3800 é a nova coluna para células concatenadas

você pode ter mais que Q3800 escrever a última linha em seus dados, mas manter o $ em $Q$2 nesse caso você terá 1 para as linhas sem duplicar e a primeira linha para duplicatas (as outras 2,3 , 4 ... depende do número de duplicatas)
No final, classifique seus dados na coluna R Descending (4,3,2,1). Nesse caso, as duplicatas serão mostradas no início não duplicadas no final (1), você pode excluir todas as linhas com number > 1

Você pode copiar sua planilha e tentar este método na cópia, apenas em caso de erro, a planilha inicial é segura

    
por 30.03.2017 / 00:21
0

Tente isso,

Sub RemoveDuplicate ()

Range ("A1: D10"). RemoveDuplicates Columns: = Array (1)

End Sub

Acima está o comando de linha única. Ou use a validação de dados para parar Duplicatas, Na validação de dados selecione Custom , Formula, = Countif ($ A $ 2: $ D $ 100, A2) = 1

Ou Encontre linhas duplicadas, = if (Countifs ($ A $ 2: $ A $ 100, A2, $ B $ 2: $ B $ 100, b2) > 1, "Duplicado", "Exclusivo")

Use este código

Sub DeleteRow ()

Dim lRow As Long Dim iCntr As String lRow = 20 Para iCntr = lRow To 1 Step -1 Se Células (iCntr, 1)="Duplicar" Então Linhas (iCntr) .Delete Fim se Próximo End Sub

    
por 31.03.2017 / 17:45