awk -F , -v OFS='\t' 'NR == 1 || $6 > 4 {print $1, $6, $7, $8}' input.txt
Eu tenho um longo arquivo delimitado por vírgula separado com 20 mil linhas. Aqui está um exemplo:
Eu quero imprimir como as colunas com ID, número 4, número 5 e número 6 com configuração delimitada por tabulação. A condição número 4 é maior que 4.0. Aqui está um exemplo de saída:
id number4 number5 number6
MRTAT_3of3.RTS 5.31274131274131 2.40945646701554 0.676814519398334
Concordo que o awk é a melhor solução. Você pode fazer isso apenas no bash com algumas outras ferramentas:
cut -d , -f 2,6,7,8 filename | {
read header
tr , $'\t' <<< "$header"
while IFS=, read -r id num4 num5 num6; do
# bash can only do integer arithmetic
if [[ $(bc <<< "$num4 >= 4.0") = 1 ]]; then
printf "%s\t%s\t%s\t%s\n" "$id" "$num4" "$num5" "$num6"
Realmente não pode bater o script awk acima, mas aqui está uma solução de rubi,
puts "id\tnumber4\tnumber5\tnumber6"
ARGF.each_line do |line|
arr = line.split(',')
puts "#{arr[1]}\t#{arr[5]}\t#{arr[6]}\t#{arr[7]}" if arr[5].to_f > 4.0
Para usar o script, chame-o com o nome do arquivo ou insira o arquivo nele.
Solução de Perl:
perl -F, -le '$, = "\t"; print @F[1,5,6,7] if $F[5] > 4 || $. == 1' file
specifies the pattern to split on.-F
implicitly sets-a
turns on autosplit mode when used with a-n
. An implicit split command to the@F
array is done as the first thing inside the implicit while loop produced by the-n
implicitly sets-n
causes Perl to assume the loop around your program, which makes it iterate over filename arguments somewhat likesed -n
enables automatic line-ending processing. It has two separate effects. First, it automatically chomps the input record separator (\n
). Second, it assigns the output record separator to\n
used to enter one line of program
Então, perl -F, -le '$, = "\t"; print @F[1,5,6,7] if $F[5] > 4 || $. == 1'
faz algo assim:
use English;
while (<>) { # iterate over each line of the each file
@F = split(',');
print @F[1,5,6,7] if $F[5] > 4 || $INPUT_LINE_NUMBER == 1;
Tags text-processing perl awk sed csv