Como posso detectar qual programa gerou o HTML de um site?

1

Estou fazendo uma pesquisa que envolve a comparação de sites. Alguns dos projetos são terríveis, e por curiosidade mórbida eu quero descobrir qual programa (Word, Dreamweaver, etc) os gerou. Existe uma ferramenta para detectar isso? Uma pesquisa do Google não transformou nada.

O Word HTML é fácil de detectar porque sua marcação é muito ruim, mas outros aplicativos são mais difíceis de detectar.

    
por JohnWoltman 11.02.2012 / 04:00

2 respostas

3

Vários programas de criação de páginas da Web inserem uma tag <meta name="generator" content="..."> . É claro que tal tag também poderia ser escrita à mão por um autor, por exemplo, e as discussões sobre esse tipo de tag parecem girar em torno da questão de como evitar que um programa o emita (geralmente com respostas efetivas).

Existem várias maneiras de detectar heuristicamente qual software foi usado. Por exemplo, o Word HTML pode ser limpo usando "Saída filtrada" no Word e pelo pós-processamento, mas geralmente os sintomas como class=MsoNormal permanecem.

    
por 11.02.2012 / 06:22
1

As dicas também podem existir no URL da página. Por exemplo, as extensões de arquivo .jsp .pl .asp .cfm denotam Java Server Pages, Perl, .Net e ColdFusion, para citar algumas. Eles também são removidos com frequência para simplificar o URL e ocultar a tecnologia.

    
por 11.02.2012 / 08:02