Use o ID ESMTPS em mx.google.com para identificar duplicatas. Estes devem ser não modificados. No exemplo acima: por mx.google.com com ESMTPS id e20sm18902485fga.1.2008.01.04.07.58.46
Uma implementação muito simples colocaria todos os e-mails em um diretório, extrairia o id e vincularia o arquivo ao id sem usar -f. Como:
for FILE in *; do
smtpid=$(do_extract_smtp_id_here)
if test -f ${smptid}; then
echo "DUPE: ${FILE}"
else
ln -s ${FILE} ${smtpid}
fi
done