Você pode usar o Microsoft Word para ler o HTML e salvá-lo em um arquivo "texto simples", especificando a codificação como UTF-8 ou ISO árabe. Eu suponho que você poderia pesquisar no Word o texto em árabe sem salvar o arquivo também.
Como alternativa, se a página HTML estiver em árabe e não estiver em inglês / árabe, tente google translate . São necessários links de URL ou você pode simplesmente copiar / colar o conteúdo do HTML diretamente.