Telefone para os seus administradores e pergunte a eles?
Digamos que eu esteja no processo de planejar a configuração de um website. Eu estudo sites semelhantes que oferecem serviços semelhantes ou podem receber um modelo de tráfego semelhante.
Existe uma maneira de determinar um pouco o tipo de configuração, software e / ou hardware.
Algumas coisas são óbvias. Se eu vejo .php ou .jsp, então eu já sei um pouco. Mas alguma ideia de como decifrar mais?
Talvez onde o site está hospedado, hardware, plataformas ...
Telefone para os seus administradores e pergunte a eles?
Você pode obter hospedagem (ou pelo menos rede) com facilidade (traceroute), sistema operacional e software de servidor (cabeçalhos nmap / HTTP), mas isso não lhe diz nada. Há muito mais a fazer um site útil e escalável do que escolher o sistema operacional e o provedor de trânsito de rede. Na verdade, você poderia estar comprando um monte de problemas replicando a arquitetura de outra pessoa - quem sabe se eles têm problemas constantes com ela? É muito melhor encontrar alguém que saiba como fazer esse tipo de coisa e fazer com que trabalhem com você para entender seus problemas específicos e como lidar com eles.
Examinar os registros DNS de todos os nomes de host de sites relacionados lhe dará uma dica da topologia do site. Você pode ver vários endereços IP (o que não significa necessariamente várias máquinas físicas, mas geralmente serão) e os mesmos endereços de rede, o que pode sugerir como eles distribuem a carga por motivos de redundância ou velocidade.
Examinar os cabeçalhos HTTP dos vários serviços de um site lhe dará uma ideia possível do front-end. Eles estão usando um proxy reverso, como nginx ou Varnish, ou você está acessando diretamente os servidores web? Os pedidos de páginas PHP são provenientes de um servidor diferente (apache) do que aqueles para arquivos de imagem e HTML estáticos (nginx, lighttpd, etc.)?
Examinar os cabeçalhos SMTP dos emails enviados de um site lhe dará mais dicas.
Traceroutes e pings produzirão um pouco mais de informação.
Naturalmente, muitas informações coletadas serão especulações e adivinhações de sua parte, porque um site bem configurado não fornecerá muitas informações sobre sua arquitetura interna. O que você estaria fazendo, em essência, é muito o que um testador de penetração faria por certas informações. Apenas certifique-se de não cruzar a linha e interromper o site.
De uma perspectiva do lado do cliente, não há quase nada de útil que você possa descobrir, não, a não ser que o site tenha se esforçado para tornar isso fácil para você - qualquer um que não tenha.
Você está fazendo isso completamente errado. Qualquer site pode ser alcançado de várias maneiras. Esqueça o que os outros fazem ou usam. Comece com uma definição do que você está tentando alcançar. Em seguida, determine a melhor maneira de chegar lá. A TI inteligente não é sobre copiar o que outra pessoa fez. Ele está elaborando a melhor e mais eficiente maneira de realizar o trabalho com o mínimo de manutenção possível. Um fator importante deve ser o que você (ou quem quer que tenha que manter a fera) está confortável trabalhando com ele.
Você deve conseguir informações sobre o host do DNS, embora seja improvável que isso o ajude a descobrir a plataforma, a menos que o host seja algo como o Google.
Trabalhe pelo site e estude os arquivos HTML e de script gerados. Ao compará-los com os mesmos sites cuja origem de hospedagem é conhecida, você deve ser capaz de fazer muitas inferências. Isso funcionará particularmente bem se o site for construído em algo como WordPress ou Movable Type. Em sites escritos sob medida (como o SO Trilogy), será preciso um monte de escavações para encontrar breadcrumbs levando ao framework (por exemplo, ASP.net MVC), mas a menos que os desenvolvedores tenham feito um esforço conjunto para limpá-los, as pistas são provavelmente lá.
Tags web-server forensics