Ultimamente, tenho visto que o scribd torna muito difícil para os usuários (usuários gratuitos) navegar em um documento hospedado em seu site. Não há capacidade de pesquisar em um documento, muito menos de poder fazer o download do mesmo.
Usando javascript, eles carregam páginas sob demanda no navegador e, portanto, o recurso "salvar como" do navegador não ajuda muito.
Para meu espanto, vi que até copiar / colar texto copia rabiscos para a área de transferência!
Para verificar o que estava errado, desliguei o javascript no navegador e, em seguida, carreguei o mesmo documento novamente. Voila, eu vi o rabisco. E assim, parece que o javascript do scribd de alguma forma decodifica o texto sem sentido e o exibe no navegador.
Agora, minha pergunta é, mesmo depois que o javascript está habilitado e o texto é renderizado corretamente no navegador, se eu for examinar os objetos DOM correspondentes ao texto que seleciono, ainda vejo o texto sem sentido.
Então, agora estou confuso. O texto é exibido bem para o usuário, mas os objetos DOM ainda contêm conteúdo sem sentido. Então a questão é, que tipo de hook / code javascript o site está usando, de modo a ser capaz de reter o jargão nos objetos DOM e ainda renderizar o texto decodificado?
Existe uma maneira de acessar o texto decodificado?
Minha intenção não é inverter a engenharia do algoritmo para decodificar, mas para localizar onde o texto decodificado está sendo armazenado?
Exemplo de documento é:
link
Veja o que acontece quando você liga / desliga o Javascript!