Se você não se importa em usar o Perl & grep aqui está uma solução para o seu problema. Aqui está o script, chamado cmd.pl
:
#!/usr/bin/env perl
use feature 'say';
#use Data::Dumper;
@file = 'grep -f cust_no.txt -A 1 sample.log';
my (%info, $secLineSeen, $time, $custno);
$secLineSeen = 0;
foreach my $line (@file) {
if ($secLineSeen == 1) {
#2013/09/05 08:18:18 Total Time = 8.27 Secs
(my $totTime) = ($line =~ m!\S+ \S+\s+Total Time\s+=\s+(\S+ Secs)!);
$info{$custno}{totTime} = $totTime;
$secLineSeen = 0;
} elsif ($line =~ m/Processing Batch/) {
#2013/09/05 08:18:10 Processing Batch /fbc/dev/cebi/dod/9844867675
($time, $custno) = ($line =~ m!\S+ (\S+)\s+Processing Batch.*/(\S+)!);
$info{$custno}{onetwo} = $time;
} elsif ($line =~ m/Batch.*successful/) {
#2013/09/05 08:18:18 Batch 9886743777 was successful
($time, $custno) = ($line =~ m!\S+ (\S+)\s+Batch (\S+) was.*!);
$info{$custno}{twotwo} = $time;
$secLineSeen = 1;
}
}
#print Dumper(\%info);
#9739867262,04:26:00,04:26:02,3.13 Secs
foreach my $key (sort keys %info) {
say "$key,$info{$key}{onetwo},$info{$key}{twotwo},$info{$key}{totTime}";
}
Exemplo
$ ./cmd.pl
9739867262,04:26:00,04:26:02,3.13 Secs
9844867675,08:18:10,08:18:16,6.00 Secs
9886743777,08:18:10,08:18:18,8.27 Secs
Detalhes
Este script Perl cria primeiro uma matriz, @file
, que contém os resultados deste comando:
$ grep -f cust_no.txt -A 1 sample.log
Esse comando pega o arquivo de log, sample.log
, e seleciona todas as linhas que contêm números de clientes do arquivo cust_no.txt
, assim:
2013/09/05 04:26:00 Processing Batch /fbc/dev/cebi/dod/9739867262
2013/09/05 04:26:02 Batch 9739867262 was successful
2013/09/05 04:26:02 Total Time = 3.13 Secs
--
2013/09/05 08:18:10 Processing Batch /fbc/dev/cebi/dod/9844867675
2013/09/05 08:18:10 Processing Batch /fbc/dev/cebi/dod/9886743777
2013/09/05 08:18:16 Batch 9844867675 was successful
2013/09/05 08:18:16 Total Time = 6.00 Secs
--
2013/09/05 08:18:18 Batch 9886743777 was successful
2013/09/05 08:18:18 Total Time = 8.27 Secs
Esse comando grep
faz uma coisa extra especial que vale a pena mencionar, principalmente porque mantém uma linha adicional após ( -A 1
) qualquer correspondência. Isso nos permite pegar a linha com o "Tempo Total".
Quando esses dados forem extraídos, o script Perl usará um hash multidimensional para armazenar os resultados das principais partes de dados dessa saída, de acordo com os requisitos mencionados na pergunta.
O hash se parece com isso assim que terminamos de processar o conteúdo de @file
:
$VAR1 = {
'9739867262' => {
'twotwo' => '04:26:02',
'totTime' => '3.13 Secs',
'onetwo' => '04:26:00'
},
'9886743777' => {
'twotwo' => '08:18:18',
'totTime' => '8.27 Secs',
'onetwo' => '08:18:10'
},
'9844867675' => {
'twotwo' => '08:18:16',
'totTime' => '6.00 Secs',
'onetwo' => '08:18:10'
}
};
Finalmente, percorremos esse hash e imprimimos o conteúdo que coletamos, no formato especificado na pergunta.