Verifique se existe um intervalo específico de valores em um conjunto de dados em outro conjunto de dados

1

Eu tenho dois conjuntos de dados, 1 e 2, cada um contendo um número de colunas com valores. Meu objetivo final é encontrar todas as linhas no dataset 1 que são diferentes e não podem ser encontradas no dataset 2.

Conjunto de dados 1 (exemplo):

Name        Species Age
Donald       Dog    3
Petronella   Dog    5

Conjunto de dados 2 (exemplo):

Name        Species Age
Donald       Dog    3
Anna         Dog    5

No exemplo acima, gostaria de descobrir que a combinação de valores de célula em relação a Petronella é exclusiva do primeiro conjunto de dados e não pode ser encontrada no segundo. Donald e Anna são de menor interesse neste caso.

Talvez uma opção fácil seja adicionar uma quarta coluna com um valor de 1 ou 0, dependendo de o intervalo de dados estar presente no segundo conjunto de dados.

Eu sei como comparar um intervalo diretamente com outro intervalo, mas como expandir essa comparação para incluir todas as linhas no conjunto de dados 1? A ordem das linhas não deve ser um fator ao determinar se um intervalo de valores no dataset 1 pode ser encontrado no dataset 2.

    
por Linebeck 09.07.2018 / 11:55

2 respostas

0

Você pode usar MATCH e CONCATENATE em uma fórmula de matriz para conhecer a lista de valores exclusivos do Dataset1. Como MATCH é usado, a comparação não é sensível a maiúsculas e minúsculas.

O Dataset1 da amostra está nas células B4: D7 & dataset2 é digamos em G4: I7. Agora, no E4, coloque a seguinte fórmula e pressione CTRL + SHIFT + ENTER de dentro da barra de fórmulas para criar uma fórmula de matriz. A fórmula deve ser incluída em Chaves Encaracoladas para indicar que é qualquer Fórmula de Matriz.

=IF(ISERROR(MATCH((B4&C4&D4),CONCATENATE($G$4:$G$7,$H$4:$H$7,$I$4:$I$7),0)),"Unique","Duplicate")

Veja a imagem abaixo. É o uso básico da MATCH, mas o argumento é Concatenated List of Rows em uma Matriz.

    
por 09.07.2018 / 12:27
0

Basta adicionar a função

=COUNTIF(range,criteria)

nessa quarta coluna.

No seu caso, o intervalo seria de células contendo

Donald
Anna

e os critérios seriam a célula a ser avaliada.

A saída é 1 se houver uma correspondência e 0 caso contrário.

    
por 09.07.2018 / 19:41