notepad ++ alterando uma URL

0

Eu tenho uma conta no Newspapers.com. A sintaxe para baixar manualmente uma imagem está usando o ID de exemplo 999:

link

Mas se você tentar fazer o download manualmente de uma imagem sem usar o software especial, o URL desfeito será:

link ?

O segundo link não funciona. Precisa ser alterado para o layout do primeiro. Como faço para alterar a segunda linha para incluir as informações da primeira linha no Notepad ++?

Às vezes, o URL que precisa ser alterado tem informações extras no final. Por exemplo:

link ou link

Como faço para remover o código depois da parte / 999?

    
por Mark Cooper 15.05.2018 / 16:50

2 respostas

0

  • Inicie o notepad ++
  • Cole os links que você deseja corrigir
  • Abra o diálogo substituto via Ctrl + H
  • Defina Find what para ^(.*?)(\d+)(\D*)$
  • Defina replace with para https://www.newspapers.com/download/image/?type=jpg&id=
  • Ativar modo de pesquisa regular expression
  • clique em replace all

Concluído. Como isso funciona: O único identificador que temos é o grupo de dígitos. Portanto, pegamos a string inteira com uma expressão regular e capturamos os dígitos no segundo grupo de captura. Podemos então substituir toda a string pela fixa que sabemos estar trabalhando, colando nos dígitos onde eles são necessários.

Se você quiser brincar um pouco com isso, eu recomendo regex101.com.

    
por 15.05.2018 / 17:22
0
  • Ctrl + H
  • Encontre o que: https://www.newspapers.com/\K(image)/(\d+)(/\?)\S*
  • Substituir por: download/$1$3type=jpg&id=$2
  • check Embrulhe
  • verificar expressão regular
  • NÃO VERIFIQUE . matches newline
  • Substituir todos

Explicação:

https://www.newspapers.com/ : literally
\K                          : forget all we have seen until this position
(image)                     : group 1, literally "image"
/                           : a slash
(\d+)                       : group 2, 1 or more digits (ie. the id)
(/\?)                       : group 3, a slash and a question mark
\S*                         : 0 or more non space character

Substituição:

download/       : literally "download/"
$1              : content of group 1, (ie. image)
$3              : content of group 3, "/?"
type=jpg&id=    : literally
$2              : content of group 2, (ie. the id)

entrada:

https://www.newspapers.com/image/999/?
https://www.newspapers.com/image/999/?terms=randomletters 
https://www.newspapers.com/image/999/?terms=123456

Resultado:

https://www.newspapers.com/download/image/?type=jpg&id=999
https://www.newspapers.com/download/image/?type=jpg&id=999 
https://www.newspapers.com/download/image/?type=jpg&id=999
    
por 16.05.2018 / 12:41

Tags