Esta é uma abordagem diferente de onde você estava indo com isso, mas talvez você pudesse usar apenas os métodos str.replace()
ou re.sub()
do python para analisar as sequências hexadecimais do corpo do texto. ou seja:
Se o hexadecimal for previsível:
originalText = "\xc3\xa5Test"
filteredText = originalText.replace("\xc3\xa5", "")
Ou se você precisar corresponder qualquer caractere hexadecimal com uma expressão regular:
import re
originalText = "\xc3\xa5Test"
filteredText = re.sub(r'[^\x00-\x7f]', r'', originalText)