HTML do arquivo de texto

1

Por que copiar dados da "fonte de exibição" de uma página da Web, colocá-la em um documento do Word e abri-la em uma página da Web resulta em um arquivo de texto, em vez do html real? Por exemplo, digamos que eu pegue um html do superuser.com, faça uma pequena modificação e tente executá-lo. Existe algo que me impeça de ver a página?

    
por user347132 24.08.2014 / 01:26

2 respostas

1

Páginas de qualquer site são apenas arquivos HTML que são transferidos de um servidor remoto para o seu computador para que o navegador possa renderizá-los. (É muito mais complexo do que isso, na maioria das vezes eles podem ser gerados on-the-fly, e também há arquivos de imagens separadas transferidos junto com o arquivo HTML para que o navegador possa colocar imagens na página, e também há javascript que descreva bevahiour e CSS que descreverão a aparência, mas para os propósitos desta resposta podemos simplificá-la ao que afirmei anteriormente).

Arquivos HTML são apenas arquivos de texto simples. Eles devem ter tags específicas neles (as tags HTML, delimitadas por <> ), mas além disso, são arquivos de texto ASCII como qualquer .txt . Se você "visualizar a fonte" em qualquer navegador, verá apenas o conteúdo exato do arquivo HTML que o navegador recebe antes de processá-lo em sua tela.

Agora, o seu navegador não se importa com de onde vem o arquivo HTML. Pode vir de um site ou de uma pasta no seu computador. Você pode até mesmo arrastar um arquivo .html para uma janela broser e ele tentará renderizá-lo (pode ser quebrado e estranho pela falta de imagens, javascript e css, mas ele terá algum conteúdo pelo menos).

Quando você visualizar a fonte, copiá-la, colá-la no Word e salvar como texto , estará apenas criando um novo arquivo HTML em seu computador. Esse arquivo não terá todas as imagens, javascript e CSS, mas além disso, será um arquivo HTML perfeitamente válido. O que você verá na tela será a melhor tentativa do navegador para processá-lo corretamente .

Para ilustrar o que quero dizer, abri essa página muito exata para essa pergunta, colei o código no bloco de notas, salvei-a em uma pasta e a abri. Aqui está o resultado (note que não vejo nenhuma tag HTML, apenas texto!):

Dependendo do navegador, se você simplesmente alterar a extensão do arquivo para .txt , ele exibirá o código-fonte do arquivo, as tags HTML e tudo, em vez de processá-lo. O Firefox 31 no Windows 7 faz isso pelo menos.

Observe que, se você colar o HTML no Word e salvá-lo como .doc ou .docx file e depois abri-lo no seu navegador, tudo o que você verá serão caracteres ilegíveis, porque navegadores não são destinados a renderizar arquivos do Word.

    
por 24.08.2014 / 05:27
-2

Salve-o como um arquivo de texto com o bloco de notas (não com a palavra), renomeie-o para .html ou .htm e abra-o em um navegador. Claro que você pode combinar salvar e renomear em uma operação se você entender quando a extensão está realmente mudando e quando não está. A diferença é que a palavra também está escrevendo informações não vistas ... o bloco de notas não.

    
por 24.08.2014 / 04:58