O texto na página da web é criptografado quando copiado e colado

4

Quando tento copiar e colar o texto na página da Web a seguir no Bloco de notas, o texto fica criptografado.

http://www.hurriyet.com.tr/yazarlar/17887201.asp?yazarid=249

  1. Como isso acontece? Qual é o truque por trás disso?
  2. Essa criptografia pode ser superada? Se sim, como?

Mais informações:

Eu tentei colar no Notepad ++, no MS Word 2007 e no Firefox (nesta mesma caixa de perguntas); tenho o seguinte texto (o mesmo snippet @Matt Jenkins referido em sua resposta ):

Tuntnzkuecelhl3ak9i’djtbs2oe 4t2havd kicctd8slol4a3b6suk,iuwjcd Birbzow4ngönzy12al’dvgbvm4e 80ak5v8 ki0vgi2ulol2yajv4uk nd56f6basnskrbdma 3nwdb1düz3ojhteenel3452aklict9uzn ma8rostuyın06g53u bua86al4lunpnlbnwdu.33kig4 Şı4ol281rnaamhetrk’tct8mr6a aljkeposkei3wtderi 4eaw3ebirdbj3e5likgh2jj2 gebd3nfuçerorbo1fkenozaw8k, T320odzNT 3wa1eave 25at8lgüb63k8cureye5grtwle d4vernhaz3r1tt6ırlkhl2vyanıer8seup ymj3c61ol 3mocutkenvantlharı5zrugwna ps6y1rtuz4rkkooaklmtof93anaatvuuvn 2bvs0u20 kyf5v1filo586tb6luk98ndfu mavadwhayınvswyoj pa5wglpztlabiwcm3dı.

    
por Mehper C. Palavuzlar 27.05.2011 / 13:20

2 respostas

5

Seu navegador copia o que vê na página - o que nem sempre é o mesmo que você vê.

Por exemplo, este parágrafo na sua página:

Tunceli’de 4 kiloluk, Bingöl’de 8 kiloluk basma düzenekli mayın bulundu.

é exibido a partir desse código HTML:

<P><EM>Tun<span class="yfji">tnzkue</span>cel<span class="eikn">hl3ak9</span>i’d<span class="bcb6">jtbs2o</span>e 4<span class="zgd9">t2havd</span> ki<span class="y3nt">cctd8s</span>lol<span class="eoaa">4a3b6s</span>uk,<span class="m5z5">iuwjcd</span> Bi<span class="ckun">rbzow4</span>ngö<span class="t8jr">nzy12a</span>l’d<span class="v1vy">vgbvm4</span>e 8<span class="h3v5">0ak5v8</span> ki<span class="szmy">0vgi2u</span>lol<span class="p00o">2yajv4</span>uk <span class="my4v">nd56f6</span>bas<span class="b5sl">nskrbd</span>ma <span class="j3y5">3nwdb1</span>düz<span class="l53b">3ojhte</span>ene<span class="e8a8">l3452a</span>kli<span class="yby5">ct9uzn</span> ma<span class="kjf5">8rostu</span>yın<span class="f1jt">06g53u</span> bu<span class="p2b1">a86al4</span>lun<span class="fkzc">pnlbnw</span>du.

Como você pode ver, o texto está cheio de tags como <span class="yfji">tnzkue</span> . Você não os vê na página porque essas classes são declaradas como invisíveis pelo CSS. (Eu acho que é para proteger contra ladrões de conteúdo ou motores de busca).

  • Um exemplo do arquivo link :

    .yfji{
    display:none;
    }
    .ni6c{
    display:none;
    }
    

    Isso significa que todas as tags com class="yfji" ou class"ni6c" seriam invisíveis.

Alguns navegadores (Firefox, Opera e Chrome) são inteligentes o suficiente para ignorar o texto oculto, enquanto outros, como o Internet Explorer, copiam tudo.

Para responder à sua outra pergunta: Atualize seu navegador.

    
por 27.05.2011 / 16:47
0

Funciona bem para mim, mas não uso o Bloco de notas.

Meu palpite é o texto UFT-8 ou UTF-16, e o bloco de notas não pode lidar com isso.

Eu sei que posso copiar e colar o texto do Firefox no gEdit no Ubuntu, então talvez tente um editor diferente que possa lidar com mais do que simplesmente ASCII.

Eu não sei o que isso diz, mas aqui está um trecho:

Tunceli’de 4 kiloluk, Bingöl’de 8 kiloluk basma düzenekli mayın bulundu. Şırnak’ta askeri birlik geçerken, TNT ve gübreyle hazırlanıp yol kenarına tuzaklanan 20 kiloluk mayın patladı.

    
por 27.05.2011 / 13:45