A maneira como o cloudflare funciona é atuar como um firewall entre o site e o usuário. Obviamente, isso não funcionaria se houvesse uma maneira de acessar o site diretamente. O principal ponto de venda do cloudflare é a proteção contra ataques de ddos, portanto, se você pode ignorar o cloudflare, isso destruiria todo o ponto de usar o cloudflare, que é meio óbvio se você parar para pensar nisso.
Basicamente, você precisa verificar algumas coisas, o que significa que o site não está configurado corretamente:
Veja se você pode encontrar registros antigos em algum lugar do seu IP real, o que o cloudflare usa para acessar o site. Se não existirem tais registros, eles não devem, porque se você usar o cloudflare, você deve ter alterado o endereço IP para um novo que o cloudflare saiba. Então isso seria um erro de configuração.
Em segundo lugar, você tentaria acessar o site em questão diretamente através de seu endereço IP e, se ele tivesse as regras de reconfiguração adequadas, qualquer acesso que não fosse o nome do domínio seria reconfigurado para seu nome de domínio. enviado de volta para o firewall cloudflare, que termina a história.
Eu não sei nada sobre o blazingfast, mas a menos que o site tenha bagunçado a configuração do cloudflare, isso deve desabilitar qualquer conexão direta possível com qualquer arquivo no site via http / https.
Às vezes, você pode encontrar endereços IP antigos para o site listado, mas, novamente, se o site configurar seu cloudflare corretamente, eles mudaram o IP no momento da mudança para o cloudflare, para remover essa detecção de chance.
Em um nível técnico, a única razão pela qual alguém iria querer fazer algo assim é porque eles são precisamente a pessoa que o cloudflare está sendo usado para proteger contra.
Obviamente, você pode acessar qualquer html de página da Web, por navegador, mas o cloudflare faz alguns outros truques que tornam difícil, se não impossível, baixar o html do site com ferramentas de linha de comando, devido a alguns recursos que variam dependendo do nível de segurança e requisitos de cache, etc, das configurações do cloudflare. Eu tive que, por exemplo, colocar na lista de permissões os IPs para algumas solicitações do tipo wget que o site recebe que são legítimas quando foram transmitidas pelo cloudflare, mas você precisa ser o administrador da conta do cloudflare para fazer isso.
Se você não está falando do download em massa do site, é claro que você pode salvar a fonte html de um navegador de gui.
[marcado, revisado:] na verdade, eu acabei de testar, e o wget pegou o html de um site protegido pelo cloudflare, mas não tenho certeza, já que eu posso estar na lista de permissões, não consigo me lembrar. mas vale a pena tentar, um download de site recursivo wget pode funcionar, difícil dizer, a única maneira de saber é tentar. Mas com a camada extra de firewall, isso dependeria do que eles fazem também, que filtros executam, etc., e quais níveis de serviço o site tem com essa empresa de hospedagem etc. No entanto, solicitações repetidas de páginas podem resultar em um bloqueio de IP , a única maneira de saber é testá-lo.
A saída raw do wget também mostrará o que aconteceu na solicitação, códigos de resposta, etc., que podem ser informações úteis.
Parece que o blazingfast está usando algo semelhante à configuração de alta segurança do cloudflare, que define um cookie e basicamente requer um navegador de gui, é um acelerador que depende do navegador completo de trabalho, para que usuários normais possam acessar o site assim que O navegador faz o que eles esperam que um navegador GUI faça. Meu palpite é que qualquer tentativa de download automatizado, mesmo que você tenha conseguido seus primeiros arquivos, tropeçaria em um bloqueio de IP automatizado.
Naturalmente, o que a sua pergunta realmente está perguntando é como ignorar a proteção do DDOS em um site, algo que muitos invasores de sites irritados também gostariam de saber.