Eu tenho uma planilha de excel com três campos:
USER_ID | DATE_CREATED | TAGS
As tags aplicadas aos itens da planilha variam um pouco e são configuradas como | tag1 tag2 tag3...
| dentro do campo.
Eu quero obter uma lista de todos os IDs de usuário únicos que adquiriram uma determinada tag a qualquer momento ( tagx
), mas não tinham outra tag diferente em nenhum ponto anterior a ela ( tagy
).
Devido à variabilidade de vezes em que os usuários poderiam ter adquirido tagx
, não tenho certeza da melhor maneira de configurar isso.
Como eu iria estruturar minha planilha para filtrar essas informações? Fico feliz em configurar colunas auxiliares adicionais que fazem testes e para criar pivotables.
EDIT: atualizado para melhor explicar - os campos incluídos são apenas aqueles campos que estão disponíveis para eu completar este tipo. A saída que estou procurando é, de qualquer forma, uma lista de todos os IDs de usuário exclusivos que adquiriram tagx
a qualquer momento, mas não tinham tagy
antes de adquirirem tagx
.
EDIT (1): aqui está uma foto demonstrando o que estou procurando:
neste caso, eu gostaria de obter uma ID # 2 (e outras semelhantes) porque ela adquire e retém o tagx em 1/3/2001 e não tem tagy antes
mas eu gostaria de excluir a ID # 1 porque, embora ela também pegue e mantenha tagx em 1/2/2001, ela tem tagy de antemão