Filtro de diferença de desempenho do PowerShell vs. função

8

Estou lendo atualmente o livro Step by Step do Windows PowerShell 3.0 para obter mais informações sobre o PowerShell.

Na página 201, o autor demonstra que um filtro é mais rápido do que a função com o mesmo funcionalmente.

Este script demora 2,6 segundos no computador dele:

MeasureAddOneFilter.ps1
Filter AddOne
{ 
 "add one filter"
  $_ + 1
}

Measure-Command { 1..50000 | addOne }

e este 4,6 segundos

MeasureAddOneFunction.ps1
Function AddOne
{  
  "Add One Function"
  While ($input.moveNext())
   {
     $input.current + 1
   }
}

Measure-Command { 1..50000 | addOne }

Se eu executar este código, obtenho exatamente o oposto do resultado dele:

.\MeasureAddOneFilter.ps1
Days              : 0
Hours             : 0
Minutes           : 0
Seconds           : 0
Milliseconds      : 226
Ticks             : 2266171
TotalDays         : 2,62288310185185E-06
TotalHours        : 6,29491944444444E-05
TotalMinutes      : 0,00377695166666667
TotalSeconds      : 0,2266171
TotalMilliseconds : 226,6171

.\MeasureAddOneFunction.ps1

Days              : 0
Hours             : 0
Minutes           : 0
Seconds           : 0
Milliseconds      : 93
Ticks             : 933649
TotalDays         : 1,08061226851852E-06
TotalHours        : 2,59346944444444E-05
TotalMinutes      : 0,00155608166666667
TotalSeconds      : 0,0933649
TotalMilliseconds : 93,3649

Alguém pode me explicar isso?

    
por Marcel Janus 09.11.2013 / 07:38

2 respostas

11

A menos que o autor desse mais evidências, talvez ele estivesse cheio de ar quente. Você executou o teste e obteve o resultado e provou que ele estava errado.

Editar: Do blog de Jeffrey Snover:

A filter is a function that just has a process scriptblock

Isso por si só não é suficiente para me convencer de que um filtro terá uma vantagem de velocidade em relação a uma função, já que ambos têm blocos de processo idênticos.

Além disso, que tipo de equipamento da década de 1950 é esse cara em que leva 4,6 segundos para adicionar um a um número?

PS C:\Users\Ryan> Measure-Command { Filter AddOne { $_ + 1 }; AddOne 1 }

TotalMilliseconds : 7.7266


PS C:\Users\Ryan> Measure-Command { Function AddOne { $_ + 1 }; AddOne 1 }    

TotalMilliseconds : 0.4108

4,6 segundos é uma loucura. Talvez o autor estivesse usando algum tipo de versão CTP do Powershell antes que os binários fossem ngeneados. : P

Por fim, tente seu teste em uma nova sessão do Powershell, mas em ordem inversa. Tente a função primeiro e depois o filtro, ou vice-versa:

PS C:\Users\Ryan> Measure-Command { Function AddOne { $_ + 1 }; AddOne 1 }    

TotalMilliseconds : 6.597    


PS C:\Users\Ryan> Measure-Command { Filter AddOne { $_ + 1 }; AddOne 1 }

TotalMilliseconds : 0.4055

Veja? O primeiro que você executar sempre será mais lento. Foi apenas sobre os internos do .NET de ter carregado coisas na memória que torna a segunda operação mais rápida, independentemente de ser uma função ou um filtro.

Admito que a função ainda parece ser consistentemente mais rápida que o Filter, independentemente de quantas vezes ela é executada.

Measure-Command { Function AddOne($Num) { Return $Num += 1 }; 1..50000 | AddOne $_ }

TotalMilliseconds : 13.9813

Measure-Command { Filter AddOne($Num) { Return $Num += 1 }; 1..50000 | AddOne $_ }

TotalMilliseconds : 69.5301

Então o autor estava errado ... e agora eu não me sinto mal por nunca ter usado um filtro em vez de uma função antes.

    
por 09.11.2013 / 17:44
3

Na verdade, a diferença é muito menor se você usar o mesmo $ _ em ambos os testes. Eu não investiguei a causa, mas suponho que seja porque o autor não está usando a mesma abordagem em ambos os testes. Além disso, a saída do console pode interferir nos resultados. Se você cortar essas partes, os números são muito parecidos. Veja:

Function AddOneFunction
{  
    process {
        $_ + 1
    }
}

Filter AddOneFilter
{ 
    $_ + 1
}

write-host "First"
Measure-Command { 1..50000 | AddOneFilter } | select totalMilliseconds
Measure-Command { 1..50000 | AddOneFilter } | select totalMilliseconds
Measure-Command { 1..50000 | AddOneFilter } | select totalMilliseconds
Measure-Command { 1..50000 | AddOneFilter } | select totalMilliseconds
Measure-Command { 1..50000 | AddOneFilter } | select totalMilliseconds

write-host "Second"
Measure-Command { 1..50000 | AddOneFunction } | select totalMilliseconds
Measure-Command { 1..50000 | AddOneFunction } | select totalMilliseconds
Measure-Command { 1..50000 | AddOneFunction } | select totalMilliseconds
Measure-Command { 1..50000 | AddOneFunction } | select totalMilliseconds
Measure-Command { 1..50000 | AddOneFunction } | select totalMilliseconds

Os resultados serão muito próximos, mesmo que você altere a ordem dos comandos.

First

TotalMilliseconds
-----------------
        84.6742
        84.7646
        89.8603
        82.3399
        83.8195
Second
        86.8978
        87.4064
        89.304
        94.4334
        87.0135

A documentação também diz que os filtros são basicamente atalhos para funções com apenas o bloco de processo. Funções, a menos que especificado com um bloco de processo (ou alguma outra técnica como o uso de variáveis automáticas como $ input), executadas uma vez, não usam entrada e não passam para o próximo comando no pipeline.

Mais informações em link e link

    
por 23.01.2016 / 20:24

Tags