Eu tenho um grande número de arquivos, todos com o mesmo formato.
line 1: Gene ID
line 2: chromosomal position
line 3 - x: names of genetic variants)
Eu quero selecionar apenas arquivos contendo pelo menos 5 variantes (ou seja, arquivos que tenham pelo menos 10 linhas no total). Se um arquivo tiver pelo menos 5 variantes, desejo gravar o conteúdo menos as duas primeiras linhas em um novo arquivo.
Abaixo, forneço dois arquivos de entrada de exemplo, foo1
e foo2
.
foo1:
echo {885743,4:139381:3783883,rs93487,rs82727,rs111} | tr " " "\n" > foo1
foo2:
echo {10432,1:3747548:2192993,rs10204,rs262222,rs436363,rs3636,rs9878,rs11856} | tr " " "\n" > foo2
Arquivo de saída desejado (neste caso, apenas 1 arquivo, na realidade, haverá vários arquivos de saída separados): foo2.checked
, parecido com:
rs10204
rs262222
rs436363
rs3636
rs9878
rs11856