paste -d' ' - - < TEXTEN1.txt
Para obter uma contagem dos bigramas produzidos:
paste -d' ' - - < TEXTEN1.txt | sort | uniq -c
No entanto, este método vai excluir metade dos bigramas. Por exemplo, se o seu arquivo de entrada for:
alpha
beta
gamma
alpha
beta
gamma
Os bigramas incluirão as linhas 1-2, linhas 3-4 e linhas 5-6, mas não as linhas 2-3 e as linhas 3-4.
Uma maneira de resolver isso seria criar uma cópia do arquivo de entrada e adicionar uma não palavra à parte superior (por exemplo, "#") e depois filtrar o resultado que contém a não palavra:
cat <(paste -d' ' - - < TEXTEN1.txt; paste -d' ' - - < TEXTEN2.txt) | sort | uniq -c | grep -v #