Se você sabe como fazer isso em R, então faça isso em R. Com ferramentas clássicas de unix, isso é feito naturalmente no awk.
awk '
FNR==1 && NR!=1 { while (/^<header>/) getline; }
1 {print}
' file*.txt >all.txt
A primeira linha do script awk corresponde à primeira linha de um arquivo ( FNR==1
), exceto se também for a primeira linha em todos os arquivos ( NR==1
). Quando essas condições são atendidas, a expressão while (/^<header>/) getline;
é executada, o que faz com que o awk continue lendo outra linha (pulando a atual) desde que a atual corresponda à regexp ^<header>
. A segunda linha do script awk imprime tudo, exceto as linhas que foram ignoradas anteriormente.