Paralelizar o SCP é contraproducente, a menos que ambos os lados funcionem em SSDs. A parte mais lenta da SCP é a rede, caso em que a paralelização não ajudará, ou discos de ambos os lados, o que você tornará pior ao paralelizar: o tempo de busca vai matar você.
Você diz que machineA está em SSD, portanto, o paralelismo por máquina deve ser suficiente. A maneira mais simples de fazer isso é envolver o primeiro forloop em um subshell e colocar em segundo plano.
( for el in "${PARTITION1[@]}"
do
scp david@${FILERS_LOCATION[0]}:$dir1/t1_weekly_1680_"$el"_200003_5.data $PRIMARY/. || scp david@${FILERS_LOCATION[1]}:$dir2/t1_weekly_1680_"$el"_200003_5.data $PRIMARY/.
done ) &