Eu sei que isso é antigo, mas para expandir a resposta do Nikolay e salvar alguém no futuro, para obter uma versão atualizada do Pocketsphinx, é necessário compilá-lo no repositório do github ou do sourceforge. (não tenho certeza que é mantido mais atualizado). Observe que o -j8 significa executar 8 trabalhos separados em paralelo, se possível; se você tiver mais núcleos de CPU, você pode aumentar o número.
git clone https://github.com/cmusphinx/sphinxbase.git
cd sphinxbase
./autogen.sh
./configure
make -j8
make -j8 check
sudo make install
cd ..
git clone https://github.com/cmusphinx/pocketsphinx.git
cd pocketsphinx
./autogen.sh
./configure
make -j8
make -j8 check
sudo make install
cd ..
Depois, em: link
faça o download das versões mais recentes de cmusphinx-en-us-....tar.gz
e en-70k-....lm.gz
tar -xzf cmusphinx-en-us-....tar.gz
gunzip en-70k-....lm.gz
Então você pode finalmente prosseguir com os passos da resposta de Nikolay:
ffmpeg -i book.mp3 -ar 16000 -ac 1 book.wav
pocketsphinx_continuous -infile book.wav \
-hmm cmusphinx-en-us-8khz-5.2 -lm en-70k-0.2.lm \
2>pocketsphinx.log >book.txt
Sphinx funciona bem. Eu não confiaria nele para fazer uma versão legível do texto, mas é bom o suficiente para que você possa pesquisá-lo se estiver procurando por um orçamento específico. Isso funciona especialmente bem se você usar um algoritmo de busca como o Xapian ( link ) que aceita curingas e não exige expressões exatas de pesquisa.
Espero que isso ajude.