Eu juntei este pequeno servidor proxy para baixar apenas arquivos perdidos. Basta configurar seu arquivo / etc / hosts para apontar os sites que você deseja armazenar em cache em 127.0.0.1 e aqueles que você deseja bloquear em 0.0.0.0
#!/bin/sh
nc -ll -p 80 -e sh -c '
while read A B DUMMY
do
case "$A" in
[Gg][Ee][Tt])
FULL=$B #full path of the file
F=${FULL##*/}
F=${F%%\?*} #file name only
#if we have it cat it back to browser
[ -f "$F" ] && cat "$F" && break
;;
[Hh][Oo][Ss][Tt]*)
[ -f "$F" ] && break #file already exists
HOST=${B:0:$((${#B}-1))} #the host name
#resolve by DNS first so we can cache it
sed -i "s/hosts:\t\tfiles /hosts:\t\t/g" /etc/nsswitch.conf
wget -t 0 -q --no-dns-cache $HOST$FULL
#got it now revert to checking host file 1st
sed -i "s/hosts:\t\t/hosts:\t\tfiles /g" /etc/nsswitch.conf
#cat the file because I didn't think to wget through tee
cat "$F"
break
;;
esac
done
'
Observe que ele coloca todos os arquivos em um diretório, por isso pode causar conflitos de versão. (Eu fiz isso intencionalmente para não ter 500 cópias de jquery)