como salvar o conteúdo de uma página da Web em um arquivo usando o shell script

0

como salvar o conteúdo de uma página da Web em um arquivo usando o shell script. A página da Web está usando URL, nome de usuário e senha para abrir.

curl -O odcview:password http://stomv11204:8080/SIM/realGraph.do?componentId=76&filterString=MCRC_STR&tabname=Durables&componentId=75&filterFlag=0&reqtype=de&filterTitle=dname
    
por iram 27.02.2015 / 09:50

2 respostas

1

Você precisa citar o URL, caso contrário, os sinais & serão interpretados como delimitadores de comando. Dito isso, você pode redirecionar a saída curl para um arquivo ( curl [...] > index.html ) ou usar wget , que salva no arquivo por padrão.

    
por 27.02.2015 / 10:11
0

Outra opção para páginas da Web simples é 'lynx', que tem uma opção -dump. Ele salvará em um arquivo uma visão 'legível' do conteúdo das páginas da web. lynx é um pouco antigo e cabeludo agora, e não suporta quadros nem javascript. Mas se você está tentando retirar o conteúdo 'legível por humanos' de uma página web plana / não interativa, é um pouco mais simples de trabalhar do que curl.

A maioria das distro Linux tem o lynx como um pacote opcional, então você provavelmente terá que instalá-lo com o gerenciador de pacotes de versões.

    
por 27.02.2015 / 23:39