Você pode usar, por exemplo, mutool clean -d
do pacote mupdf
para descompactar os fluxos em um arquivo PDF, então você pode consultá-lo (ou grep
diretamente).
Infelizmente, o texto em arquivos PDF é renderizado colocando glifos (ou sequências de glifos) em coordenadas pré-calculadas. Portanto, tanto $2^n$
como $$2^n$$
consistirão em dois glifos para 2
e n
em posições diferentes, e isso é realmente difícil de combinar com uma expressão regular.
Sugiro que você descomprima seu documento em pdf e veja como a renderização do texto realmente se parece.