Como lidar eficientemente com dados do Excel

1

Eu tenho dados de nível firmes sobre várias variáveis, mas um grande conjunto de dados está faltando. Então, quero reduzir o tamanho do meu conjunto de dados descartando as empresas que têm um número muito menor de observações. Eu não quero fazer isso manualmente. Existe alguma maneira eficiente de lidar com esse problema no Excel?

    
por Raystafarian 30.04.2014 / 12:59

2 respostas

3

Crie uma cópia da sua pasta de trabalho para modificá-la

  1. Crie uma nova planilha em sua nova pasta de trabalho.

  2. Obtenha uma lista exclusiva de nomes de empresas e Coloque isso na nova folha. Você pode fazer isso usando o filtro comando sem duplicatas.

  3. Agora, use a função countif () para contar quantas vezes cada empresa aparece. Descubra qual será o seu corte baseado nisso, ou seja, decidir quantas vezes uma empresa precisa ter uma entrada para incluí-la.

  4. Suponha que você queira apenas manter as empresas com 10 ou mais observações. Em sua planilha original com todas as observações, crie uma nova variável chamada COUNT em uma coluna e use a função VLOOKUP na qual deseja procurar o nome da empresa na nova planilha e importe quantas vezes a empresa apareceu. Isso deve fornecer uma coluna na qual, para cada empresa, você tem um valor na coluna COUNT correspondente a quantas vezes essa empresa apareceu (o valor deve ser o mesmo para todas as observações dessa empresa).

  5. Classifique sua planilha original pela variável COUNT em ordem decrescente. Isso significa que as empresas com mais observações estarão no topo.

  6. Exclua todas as empresas com menos de dez observações.

Para resumir: descubra quantas vezes cada empresa aparece. Classifique as observações por esse valor. Solte as empresas que têm poucas observações.

Eu não sei se isso é realmente uma questão de estatística, tanto quanto uma pergunta do Excel.

    
por 30.04.2014 / 13:38
0

Eu faria algo parecido com a resposta do @ Deathkill14, mas criaria as etapas de 1 a 5 usando uma Tabela Dinâmica. No painel Lista de Campos da Tabela Dinâmica, eu arrastaria o Nome da Empresa para os Rótulos de Linha e arraste-o novamente para a região Valores para obter uma Contagem pelo nome.

Em seguida, clico em qualquer uma das células Nome da empresa na Tabela dinâmica e, na faixa de opções Dados, clique em Classificar e, em seguida, selecione Decrescente por contagem do nome da empresa.

Se você estiver tentando gerenciar grandes conjuntos de dados no Excel, consulte o Power Pivot, também conhecido como Modelo de Dados do Excel. Isso comprime os dados para o desempenho e suporta as relações e fórmulas das tabelas.

    
por 01.05.2014 / 02:34