Top Percentile por grupo

2

todos. Alguém pode me ajudar com o seguinte? Quaisquer ponteiros ou assistência são apreciados!

Eu tenho um subconjunto do conjunto de dados com +500.000 linhas semelhante a este

|— Group —|— Name —|— Value1 —|— Value2 —|

Dentro de cada grupo, estou tentando identificar os nomes no top 5 e top 10 percentil do valor 1 , para que eu possa continuar a calcular a soma do valor 2 para cada um dos percentis identificados.

Até agora eu consegui criar uma tabela dinâmica que se parece com isso.

           |----------|--Sum Val1--|--Sum Val2--|
|--GroupA--|----------|     Totals for GroupA
|----------|-Name A1--|     Values.......
|----------|-Name A2--|     Values.......
    ...
|----------|-Name An--|     Values.......
|--GroupB--|----------|     Totals for GroupB
    ...                     Values.......
|--GroupZ--|----------|     Totals for GroupZ

Eu consegui identificar os percentis manualmente, mas imagino que haja uma maneira mais fácil. Fiz várias pesquisas sobre como proceder, mas só encontro procedimentos para encontrar percentis em todo o conjunto de dados.

    
por HolaGonzalo 27.12.2015 / 00:07

1 resposta

1

A maneira como sua tabela dinâmica é configurada, a aplicação de um filtro top 10 a Names encontrará os Names superiores em cada Group . Se você quiser encontrar o top Names geral, você deve colocar o campo Names antes do campo Group .

Aqui está uma maquete que fiz:

QuandoeufiltroparaoTop2Names:

QuandocolocoNamescomoocamposuperioredepoisfiltroparaoTop2:

Como sugerido nos comentários, você também pode adicionar colunas auxiliares aos dados originais que calculam o impacto de cada linha e, em seguida, determinar se está no Top 10 e retornar TRUE / FALSE. Você pode aplicar um filtro à tabela dinâmica para mostrar apenas aqueles com TRUE nesse campo.

    
por 27.01.2016 / 18:21