paste qual.txt data.txt | awk '$1 > 0.5'
Isso gerará primeiro os dados que contêm os valores de qualidade como a primeira coluna e os outros dados como as outras colunas usando paste
. O código awk
simplesmente seleciona e imprime as linhas cuja primeira coluna (a qualidade) é maior que 0,5.
Se você não quer a qualidade na saída:
paste qual.txt data.txt | awk '$1 > 0.5' | cut -f 2-
Para o exemplo dado, isso gerará
rs2745406 C T 1.993 1.166 1.003 ..............
rs6939431 A G 0.003 0.207 0.005 ..............