Convertendo a variável dummy em uma variável que mostra em qual período um indivíduo é retirado

0

Eu tenho um conjunto de dados no Excel onde as medidas (M) foram obtidas de diferentes indivíduos (ID) em vários períodos de tempo (T) (M1 igual a uma medida no período 1, M2 uma medida no período 2 etc.) .

Alguns indivíduos são removidos durante o período da experiência. Isto é representado por uma variável dummy que indica se um indivíduo é removido em um determinado período ou não (Rd). Como os indivíduos não fazem medições depois de removidos, a situação fica assim em uma versão simplificada.

ID; T; M; Rd
1; 1; M1; 0
2; 1; M1; 0 3, 1, M1 e 1 1; 2; M2; 0
2; 2; M2; 1 1; 3; M3; 0

O que eu preciso é ter uma variável que me diga diretamente em qual período o indivíduo foi removido da experiência (ao contrário da variável dummy que apenas me diz se uma árvore é removida em um certo período ou não).

Além disso, o que não ficou claro na minha primeira tentativa de escrever essa questão é que preciso ter informações sobre em que período de tempo um indivíduo é removido ao lado da medição no período de tempo 1 (a medida da linha de base).

Assim, o que eu quero alcançar é uma situação como abaixo, onde a variável R foi criada para representar em qual período a medição é retirada.

ID; T; M1; R
1; 1; M1; 0
2, 1, M1 e 2 3; 1; M1; 1

Onde R = 1 mostra que o indivíduo 3 é removido no período 1 e R = 2 mostra que o indivíduo 2 é removido no período 2, enquanto R = 0 mostra que o indivíduo 1 não é retirado. E todas essas informações estão ao lado de M1.

A razão pela qual eu preciso dessa configuração de dados é porque eu preciso modelar o desenvolvimento desses indivíduos (a partir da medição da linha de base, M1) e comparar esse desenvolvimento modelado com o desenvolvimento real do experimento.

Portanto, para modelar esse desenvolvimento da maneira mais precisa possível, preciso da primeira medição (a medida da linha de base) e, ao lado dessa medida da linha de base, as informações sobre quando o indivíduo é retirado.

Portanto, não posso simplesmente filtrar os dados, pois a maioria das informações referentes a quando um indivíduo é removido pertence a medidas tomadas em outros períodos.

Existe alguma função no Excel que pode fazer isso para mim (convertendo de Rd para R)?

Muito obrigado pela sua ajuda! Desculpe que tudo não ficou claro desde o começo.

Atenciosamente

Ditlev

    
por Ditlev Reventlow 26.06.2017 / 19:06

1 resposta

0

Obrigado pelo esclarecimento, Ditlev.

Para exibir os resultados nas primeiras linhas, é necessária uma referência INDIRECT (). Além disso, para o indivíduo com maior duração ter um resultado igual a 0, uma função IF verifica se o resultado é a última linha dos dados e define como 0 em caso afirmativo.

Esta fórmula fará o trabalho.

= SE (SUMPRODUCT (MÁXIMO (LINHA ($ 2: $ 7) * (A $ 2: A $ 7 = A2))) = LINHAS ($ 2: $ 7) +1,

0, INDIRETO ("B" e SUMPRODUCT (MAX (LINHA (US $ 2: US $ 7) * (US $ 2: A US $ 7 = A2)))))

Isso pressupõe que sua tabela de dados comece em A1. A fórmula vai em D2 e é preenchida apenas até o final do primeiro julgamento. É claro que você deve alterar os intervalos de $ 2: $ 7 para se referir a toda a sua tabela de dados. Boa sorte.

Os resultados são mostrados abaixo.

    
por 26.06.2017 / 19:26