como mod reescrever a sequência de bytes unicode para o caractere de hífen multibyte

1

Temos casos em que alguns arquivos pdf da Adobe formatam o caractere de hífen como% E2% 80% 90. Veja link isso é causado pela fonte Calibri, eu acho.

Então, esses arquivos pdf foram liberados e os links não funcionam. Então, pensei que a reescrita de mods viria para o resgate.

Eu segui este post aqui mod_ReWrite para remover parte de um URL mas não consigo procurar os% caracteres de acordo com essa pergunta.

Existe mais alguma coisa que eu possa fazer?

Aqui está a regra de regravação que desejo usar:

RewriteRule ^foo%(.+)bar  /foo-bar [L,R=301]

Eu também tentei isso e não funciona

RewriteRule ^foo%E2%80%90bar  /foo-bar [L,R=301]

Alguma idéia?

    
por ChickenFur 30.05.2012 / 18:06

2 respostas

1

Usando a resposta de esta pergunta , consegui criar com essa regra .htaccess que corrigiu meu próprio problema unicode-hífen-links-em-pdfs:

# for janky pdfs with links using unicode hyphens
RewriteRule ^([^_]*)\x25E2\x2580\x2590([^_]*_.*) $1-$2 [N]
RewriteRule ^([^_]*)\x25E2\x2580\x2590([^_]*)$ /$1-$2 [L,R=301]
    
por 24.01.2013 / 17:53
1

De os documentos :

... it is applied to the (%-decoded) URL-path of the request ...

Portanto, use o caractere real em um arquivo codificado em UTF-8.

    
por 30.05.2012 / 18:23