Páginas de qualquer site são apenas arquivos HTML que são transferidos de um servidor remoto para o seu computador para que o navegador possa renderizá-los. (É muito mais complexo do que isso, na maioria das vezes eles podem ser gerados on-the-fly, e também há arquivos de imagens separadas transferidos junto com o arquivo HTML para que o navegador possa colocar imagens na página, e também há javascript que descreva bevahiour e CSS que descreverão a aparência, mas para os propósitos desta resposta podemos simplificá-la ao que afirmei anteriormente).
Arquivos HTML são apenas arquivos de texto simples. Eles devem ter tags específicas neles (as tags HTML, delimitadas por <>
), mas além disso, são arquivos de texto ASCII como qualquer .txt
. Se você "visualizar a fonte" em qualquer navegador, verá apenas o conteúdo exato do arquivo HTML que o navegador recebe antes de processá-lo em sua tela.
Agora, o seu navegador não se importa com de onde vem o arquivo HTML. Pode vir de um site ou de uma pasta no seu computador. Você pode até mesmo arrastar um arquivo .html
para uma janela broser e ele tentará renderizá-lo (pode ser quebrado e estranho pela falta de imagens, javascript e css, mas ele terá algum conteúdo pelo menos).
Quando você visualizar a fonte, copiá-la, colá-la no Word e salvar como texto , estará apenas criando um novo arquivo HTML em seu computador. Esse arquivo não terá todas as imagens, javascript e CSS, mas além disso, será um arquivo HTML perfeitamente válido. O que você verá na tela será a melhor tentativa do navegador para processá-lo corretamente .
Para ilustrar o que quero dizer, abri essa página muito exata para essa pergunta, colei o código no bloco de notas, salvei-a em uma pasta e a abri. Aqui está o resultado (note que não vejo nenhuma tag HTML, apenas texto!):
Dependendo do navegador, se você simplesmente alterar a extensão do arquivo para .txt
, ele exibirá o código-fonte do arquivo, as tags HTML e tudo, em vez de processá-lo. O Firefox 31 no Windows 7 faz isso pelo menos.
Observe que, se você colar o HTML no Word e salvá-lo como .doc
ou .docx
file e depois abri-lo no seu navegador, tudo o que você verá serão caracteres ilegíveis, porque navegadores não são destinados a renderizar arquivos do Word.