Eu tenho um log de dbpedia cheio de URLs. Alguns deles não são formatados, mas alguns têm alguma formatação, o que resulta em incontáveis símbolos.
exemplo:
529e0532100c7d6f2b6ba4c093ff9581 - - [03/Jan/2014 00:00:00 +0100] "GET /sparql/?callb...
07.02.2017 / 16:07