Coloque todos os nomes de arquivos em um array chamado "arquivos" no bash:
files=( * )
tamanho da matriz:
echo ${#files[@]}
defina 2/3 deles como tamanho da amostra:
take=$((2*${#files[@]}/3))
for i in $(seq 1 $take)
do
r=$((RANDOM%${#files[@]}))
echo ${files[r]}
done
Isto irá selecionar duplicatas, e é não testado com nomes de arquivos com espaços em branco e tal.
A maneira mais simples de evitar duplicatas é fazer uma iteração em todos os arquivos e escolher cada um com 2/3 de chance, mas isso não levará necessariamente a 200 arquivos.
Isso removerá um arquivo se ele foi escolhido na lista e atenderá aos seus requisitos:
#!/bin/bash
files=( * )
# define 2/3 of them as sample size:
take=$((2*${#files[@]}/3))
while (( i < $take ))
do
r=$((RANDOM%${#files[@]}))
f=${files[r]}
if [[ -n $f ]]
then
i=$((i+1))
echo ${files[r]}
unset files[r]
fi
done