Existem muitas bibliotecas que permitem ler ou manipular arquivos DOCX. Pensando em Apache POI , ou python-docx , por exemplo. Eu não sei se já existe um wrapper que permite que você grep um DOCX, mas isso certamente não seria muito difícil de fazer usando POI (eu não tenho experiência com python-docx. Pode ainda ser uma solução mais rápida .).
EDITAR:
Além disso, mais simples, você pode descompactar o DOCX (porque na verdade é apenas um arquivo ZIP) e percorrer o conteúdo, como sugerido aqui .