remove URLs de linhas consecutivas no notepad ++

0
subject1
image url follows here
[img]http:f6.abc.com/246421f...
[img]http:f6.abc.com/246421d...
[img]http:f6.abc.com/246421h...
[img]http:f6.abc.com/246421m...
download url follows here
[url]link1[/url]

subject2
image url follows here
[img]http:z.uvw.com/7862252...
[img]http:z.uvw.com/4621017...
[img]http:z.uvw.com/4728212...
[img]http:z.uvw.com/78293.5...
download url follows here
[url]link2[/url]

da mesma forma, tenho toneladas de blocos. Preciso apenas de um URL de imagem (o arquivo tem muitas imagens imediatamente após o URL). O primeiro URL de imagem é o melhor. Isso significa que eu preciso da saída como abaixo

subject1
image url follows here
[img]http:f6.abc.com/246421f...
download url follows here
[url]link1[/url]

subject2
image url follows here
[img]http:z.uvw.com/7862252...
download url follows here
[url]link2[/url]
    
por Steven K 21.05.2017 / 13:22

2 respostas

0

No notepad ++, localize o diálogo de substituição:

  • procure: (\[img\].+\n)(\[img\].+\n)*
  • substitua por:% $1
  • marque "expressão regular"
  • clique em "substituir tudo"

você pode testá-lo aqui

    
por 21.05.2017 / 13:43
0

Aqui está um caminho a seguir:

  • Ctrl + H
  • Encontre o que: ^(\[img\].+\R)(?1)*
  • Substituir por: $1
  • Substituir todos

Explicação:

^           : begining of line
(           : start group 1
  \[img\]   : literally [img]
  .+        : 1 or more any character but newline
  \R        : any kind of linebreak (\r, \n, \r\n)
)           : end group 1
(?1)*       : same pattern that the one is defined in group 1, 0 or more times

NÃO VERIFIQUE . matches newline

Substituição:

$1          : content of group 1

Resultado para o exemplo dado:

subject1
image url follows here
[img]http:f6.abc.com/246421f...
download url follows here
[url]link1[/url]

subject2
image url follows here
[img]http:z.uvw.com/7862252...
download url follows here
[url]link2[/url]
    
por 23.08.2017 / 12:44

Tags