wget
recuperará apenas o documento. Se o documento estiver em HTML, o que você deseja é o resultado da análise do documento.
Você poderia, por exemplo, usar lynx -dump -nolist
, se tiver lynx por perto.
lynx
é um navegador da Web simples e leve, que possui o recurso -dump
, usado para gerar o resultado do processo de análise. -nolist
evita a lista de links no final, que aparecerá se a página tiver hiperlinks.
Como mencionado por @Thor, elinks
também pode ser usado para isso, pois também tem uma opção -dump
(e tem -no-references
para omitir a lista de links). Pode ser especialmente útil se você atravessar algum site usando frames de alta (MTFBWY).
Além disso, lembre-se de que, a menos que a página seja realmente apenas código C com tags HTML, será necessário verificar o resultado, apenas para garantir que não exista nada além de código C.