Detectando 404 De alguma forma

2

Eu mantenho meu PC rodando em casa. Às vezes, quando estou no trabalho, meu PC não consegue carregar as páginas que eu quero carregar. Eu tenho que ssh para ele e reinicie / reinicie o navegador. É muito chato e estou tentando encontrar uma maneira mais fácil de fazer isso. Eu pensei em fazer uma captura de tela e de alguma forma tentar verificar se parece uma página 404 que eu tirei screenshot antes. Mas isso pode usar um pouco os recursos do meu sistema.

Eu tentei pegar o título da página com xdotool , mas isso falha.

Existe uma maneira de detectar páginas 404? Estou usando o chromium-browser com o Ubuntu. Essas páginas da Web não estão acessíveis no meu computador devido à minha conexão com a Internet / computador. A página da Web está sempre ativa, mas às vezes, por causa de problemas de conexão, o navegador mostra 404 com aquele minúsculo dinossauro. Este é o meu código xdotool:

#!/usr/local/bin/xdotool
a='xdotool search "http://a.com is not available - Chromium" | head -1'
if [[ $a ]]; then
    echo "yes"
else
    echo "nope"
fi
    
por user1652575 09.05.2014 / 22:00

1 resposta

3

Que tal wget ?

Três exemplos: um para uma página não existente, um para uma página existente que você não tem permissão para baixar e um que funciona.

wget link

--2014-05-09 22:06:20--  https://askubuntu.com/testfor404
Resolving askubuntu.com (askubuntu.com)... 198.252.206.24
Connecting to askubuntu.com (askubuntu.com)|198.252.206.24|:80... connected.
HTTP request sent, awaiting response... 404 Not Found
2014-05-09 22:06:21 ERROR 404: Not Found.

wget link

--2014-05-09 22:07:11--  https://askubuntu.com/reputation
Resolving askubuntu.com (askubuntu.com)... 198.252.206.24
Connecting to askubuntu.com (askubuntu.com)|198.252.206.24|:80... connected.
HTTP request sent, awaiting response... 403 Forbidden
2014-05-09 22:07:11 ERROR 403: Forbidden.

wget link

--2014-05-09 22:07:36--  https://askubuntu.com/
Resolving askubuntu.com (askubuntu.com)... 198.252.206.24
Connecting to askubuntu.com (askubuntu.com)|198.252.206.24|:80... connected.
HTTP request sent, awaiting response... 200 OK
Length: 69629 (68K) [text/html]
Saving to: ‘index.html’

100%[======================================>] 69.629       257KB/s   in 0,3s   

2014-05-09 22:07:36 (257 KB/s) - ‘index.html’ saved [69629/69629]

Esse comando pode ser expandido para mostrar "true" ou "false" caso a saída mostre "ERROR 404: Not Found".

A opção --delete-after excluirá o index.html após baixá-lo. --spider flag irá verificar o cabeçalho / status da página sem fazer o download.

    
por Rinzwind 09.05.2014 / 22:09