Eu acho que você quer dizer Text-To-Speech (TTS), já que você está falando de uma voz robótica. Os mecanismos TTS pegam texto escrito e o fazem de volta, enquanto os mecanismos de reconhecimento de fala entendem a fala humana e a convertem em um formato legível por máquina. O Loquendo tem o motor TTS mais natural Eu ouvi. Eles têm uma versão para o Linux. Eles têm um demonstração interativa você pode brincar para ouvir o quão bom soa. Há mecanismo TTS pode ter caracteres especiais no texto para fazer coisas como fornecer ênfase em frases ou até mesmo fazer a voz rir ou chorar. Não são muitos os motores TTS que fazem isso.