Talvez essa pergunta deva estar em outro site da SE, mas aqui está minha opinião sobre esse assunto.
1) Não é o tipo básico que você forneceu em sua pergunta rápido o suficiente? Quão rápido deveria estar? Meu tipo de mesa de 2 anos 270MB de arquivos de log de acesso do Apache em 21 segundos.
2) Se isso não for rápido o suficiente, você pode tentar primeiro classificar cada arquivo individualmente e depois mesclá-los com "sort -m"
3) Se não for rápido o suficiente e você tiver mais de uma CPU / núcleo, paralelize (sp?) o processo com Paralelo GNU
4) Se ainda não for rápido o suficiente e você tiver mais máquinas disponíveis, paralelize o processo de classificação em máquinas multilinhas com GNU Parallel