Como posso extrair os números no arquivo usando sed ou qualquer outra ferramenta?

Question

Como posso extrair os números no arquivo usando sed ou qualquer outra ferramenta?

#1 resposta do (8 votos)
#2 resposta do (3 votos)
#3 resposta do (0 votos)

5

Eu tenho um arquivo com esse formato

[ 2014/05/01 10:48:26 | 13963 | DEBUG ] It took 11.16837501525879 seconds to complete the process

Portanto, tenho milhares de linhas como esta e gostaria de "extrair" a parte 11.16837501525879
Eu tentei:

 sed -e 's/^.* (\d+\.\d*)//g' logfile.txt > out.txt

mas eu recebo:

sed: -e expression #1, char 21: invalid reference  on 's' command's RHS

O que posso fazer aqui?

text-processing sed regular-expression

por Jim 02.05.2014 / 12:28

3 respostas

Tags text-processing sed regular-expression

tail -f não produz saída no live CD do Ubuntu RAID ressincronizando automaticamente?

score 8 · Answer 1

sed usa Basic Regular Expressions por padrão e BREs não sabe sobre \d . Aqui estão algumas outras abordagens:

sed

sed -r 's/.* ([0-9]+\.*[0-9]*).*?//' logfile.txt > outfile.txt

O -r é necessário para evitar a fuga dos parênteses.

perl

perl -pe 's/.* (\d+\.*\d*).*/$1/' logfile.txt > outfile.txt

grep

grep -Po '.* \K\d+\.*\d*' logfile.txt > outfile.txt

Todos eles usam sua abordagem básica, que preenche os todos conjuntos de dígitos na linha que são precedidos por um espaço. Dependendo de quantos conjuntos de números podem aparecer na linha, se as linhas de entrada forem sempre do formato que você mostra, uma abordagem mais segura seria:

grep -Po 'took \K\d+\.*\d*' logfile.txt

score 3 · Answer 2

Parênteses de agrupamento devem ser invertidos em sed. Além disso, o sed não suporta \d . Além disso, você também deve remover as palavras após o número:

sed -e 's/^.* \([0-9]\+\.[0-9]*\) .*//g'

BTW, você tem certeza de que o ponto está sempre presente, mas os números decimais são opcionais? 12. não parece um valor esperado.

score 0 · Answer 3

0

Você pode usar o awk para imprimir a 11ª coluna.

awk '{ print $11 }' logfile.txt > output

por 10.02.2017 / 15:25