Eu também faço muita pesquisa em bibliotecas muito grandes de PDFs. Para mim, esta é a frustração # 1 do Linux que me faz sentir falta do MS Windows. Eu tentei tudo neste momento, e a solução que resolvi agora é usar os seguintes programas em combinação.
Infelizmente, nenhum desses parece estar nos repositórios do Ubuntu no momento e pode ser instável. Então, se Recoll (agora no repositório padrão para o Ubuntu 14.04 eu acredito?) Ou algo mais funciona para você, é melhor ficar com isso.
1) Sinapse
Instalação: Leia este post para detalhes, mas basicamente você pode instalá-lo por executando os seguintes comandos em um terminal.
sudo apt-add-repository ppa:synapse-core/testing
sudo apt-get update
sudo apt-get install synapse
Positivo
- Resultados de pesquisa muito rápidos e inteligentes
- Se o que você quer não aparecer imediatamente, você pode pressionar e aba para encontrar mais com "localizar".
Negativo
- Apenas pesquisa nomes de arquivos, não texto dentro.
- Parece que falta muito, especialmente antes de tentar "localizar".
2) Launchy
Instalação: Faça o download do pacote aqui .
Positivo:
- Quase tão rápido quanto o Synapse
- Os resultados são muito abrangentes.
Negativo:
- Também apenas pesquisa nomes de arquivos.
- Provavelmente o mais problemático desses três.
3) DocFetcher
Instalação: A menos que você possa encontrá-lo em algum repositório, você está preso à versão portátil. Faça o download aqui e siga as instruções.
Positivo:
- Pesquisas dentro do texto dos seus PDFs
- Resultados abrangentes, mas relevantes, em uma ordem lógica (geralmente, os resultados em Recoll ou Tracker são completamente malucos em comparação)
- Painel de visualização completo do documento para que você possa ver mais do arquivo antes de abri-lo (não apenas algumas linhas)
- Razoavelmente rápido
Negativo:
- Difícil de instalar e executar nativamente no Ubuntu (por exemplo, sem tempo de execução Java)
- Muito mais lento do que os aplicativos que pesquisam apenas nomes de arquivos
Espero que o Dash se atualize e torne tudo isso obsoleto, mas enquanto isso, esses três são basicamente o que estou usando.
Outras opções talvez valham a pena tentar:
-
O Gnome-Do pode ser uma alternativa valiosa para o Synapse, mas por último verifiquei que ele só pode indexar 5000 arquivos, e isso não é o suficiente para mim
-
pdfgrep às vezes é útil, mas é lento e não tem uma interface gráfica que conheça