Você não fala muito sobre o que está tentando fazer ou sobre quais são os dados, mas aqui está minha ideia - que pressupõe que todas as palavras sejam exclusivas. Você não diz que está preocupado com o uso eficiente de espaço em disco.
Sistema de arquivos ext4. Armazene cada palavra em um arquivo separado em um grande diretório. Deixe o sistema de arquivos encontrá-los para você - muito fácil para você (basta abrir o arquivo que deseja por nome) e o sistema de arquivos tem um método eficiente de localizar os arquivos.
Você precisará ter certeza de que seu sistema de arquivos tem inodes livres suficientes - um por arquivo, então você precisará de 250.000 livres: du -i
.
Evite fazer ls
ou outras coisas que precisam enumerar os arquivos (como abri-lo em um navegador de arquivos) e o desempenho deve ser bom.