Meu entendimento do que você está tentando fazer é examinar três colunas de dados de entrada (Tempo, Temperatura, Insolação) e comparar com uma quarta (Produção). Você deseja controlar a temperatura e a insolação e determinar se a produção varia com o tempo.
Este é um exercício estatístico bastante complexo, especialmente porque a variação do resultado dos sistemas PV varia muito lentamente com o tempo - na ordem de 20% de perda na produção ao longo de 20 anos, quando a variação devida às outras variáveis é muito maior e tenderá a mascarar o efeito que você está procurando.
Eu acho que você percebe que isso é uma tarefa difícil, já que você perguntou sobre como simplificar a análise estar olhando para pares de temp e insolação que são os mesmos em dias diferentes. No entanto, isso resultaria em centenas de pares de dados diferentes, cada um com um número razoavelmente pequeno de repetições e com um poder individual tão baixo para procurar uma correlação com o tempo.
Em vez de dividir os dados em várias centenas de análises menores, sugiro analisar todo o conjunto de dados, mas tentar isolar a variável de tempo para ver se ela tem impacto na produção.
Como eu mencionei, fazer isso corretamente requer estatísticas complexas, além do que eu tenho aplicação cotidiana. Mas aqui está uma solução que você poderia tentar que ainda pudesse lhe dizer o que você precisa sem ser estatisticamente rigoroso:
Supondo os seguintes dados de exemplo:
Time Temp Rad Production
hours *C W/m2 W
1 18 20 3194
2 20 30 3984
3 20 40 3976
4 16 20 3174
5 14 0 0
6 10 0 0
7 8 0 0
8 10 0 0
9 14 10 1964
10 16 20 3136
11 17 30 3888
12 18 40 3856
13 15 30 3824
14 13 20 3034
15 5 0 0
16 8 0 0
17 12 8 1478
18 25 15 2263
19 30 25 2942
20 30 35 3240
21 25 20 2712
22 20 10 1768
23 22 0 0
24 18 0 0
25 22 0 0
26 25 10 1619
27 26 20 2539
28 18 24 2943
29 12 26 3047
30 10 18 2427
Podemos construir um modelo que tente prever a produção, dadas as outras 3 variáveis. Uma vez que encontramos o melhor ajuste, podemos verificar se o tempo era realmente uma variável importante ou não, e qual a taxa de redução aplicada.
Neste exemplo, suponho que a seguinte equação nos dará a produção:
Production = A*(B*Temp^b)*(C*Rad^c)*(1+D*Time^d)
Este modelo assume que a variação devido à temperatura e à insolação varia de acordo com uma relação de potência, e o tempo pode colocar uma inclinação negativa no resultado, sendo D um pequeno número negativo.
Identifique algumas células como A, B, b, C, c, D, d. Em seguida, crie uma nova coluna ao lado dos dados de produção para calcular novos dados de produção desse modelo. Digite a equação, consultando os dados registrados e as células nomeadas, conforme apropriado. Faça as referências às células nomeadas fixadas usando $ notation, depois arraste / preencha.
No momento, o modelo dará erros, pois os parâmetros são zero. Então envolva a equação em uma declaração iferror (__, 0).
Crie outra coluna à direita chamada Error, com fórmula (Modelo de Produção) ^ 2, e preencha. Esta é uma medida de quão longe está o nosso modelo. Soma os valores das colunas em algum lugar - isso fará um grande número. Idealmente, esse grande número se tornará pequeno mais tarde, indicando que nossa equação funciona e prevê a realidade.
Use o Solver para alterar todas as variáveis, minimizando o valor da célula que é a soma dos erros.
Neste ponto, se você representar graficamente a produção ao longo do tempo, e também a produção modelada ao longo do tempo, os dois devem dar uma boa correspondência.
Dos valores de parâmetro encontrados pelo solucionador, observe os relacionados ao Tempo (D e d). Se você plotar a parte do tempo do modelo (y = 1 + D * Tempo ^ d) em relação ao tempo, você verá o% de impacto que o solucionador acha que o tempo está tendo em sua produção.