Outra opção para páginas da Web simples é 'lynx', que tem uma opção -dump. Ele salvará em um arquivo uma visão 'legível' do conteúdo das páginas da web.
lynx é um pouco antigo e cabeludo agora, e não suporta quadros nem javascript. Mas se você está tentando retirar o conteúdo 'legível por humanos' de uma página web plana / não interativa, é um pouco mais simples de trabalhar do que curl.
A maioria das distro Linux tem o lynx como um pacote opcional, então você provavelmente terá que instalá-lo com o gerenciador de pacotes de versões.