Se você quiser os dois primeiros milhões de linhas:
head -n 2000000 sub2016
Se você quiser um bloco de dois milhões de linhas tomadas aleatoriamente no arquivo:
tail -n +$((RANDOM * RANDOM % 18000000)) sub2016 | head -n 2000000
Isto escolhe dois números aleatórios entre 0 e 32767, multiplica-os, reduz o alcance para 18 milhões (20 milhões menos 2 milhões), pula muitas linhas e gera dois milhões de linhas.