Notepad ++ Localizar e substituir várias linhas no arquivo HTML

0

Eu escrevi um longo post para dar uma boa quantidade de informações sobre o meu problema. O ponto principal é que eu gostaria de gerar um layout específico na saída de macro 'localizar e substituir' para que possa ser facilmente copiado para o Excel. Estou quase lá, mas preciso de ajuda para cobrir o último obstáculo.

Plano de fundo

Eu estava procurando alugar uma casa. Para isso, queria saber qual preço era normalmente solicitado por m2. Eu naveguei para um grande site de hospedagem e coppied manualmente o preço e m2 de cada propriedade para calcular o preço overal / m2, então eu teria uma idéia sobre os preços nas diferentes áreas da cidade.

Ao fazer isso, imaginei se poderia automatizar esse processo para um horário seguro. Então comecei a navegar na internet porque nunca fiz nada assim. Eu aprendi muito nesse meio tempo e agora, automatizar essa tarefa me custou muito mais tempo do que realmente fazer isso manualmente ahaha, mas não posso desistir agora ...! Estou tão perto!

Fonte

Primeiro de tudo, eu pego o código-fonte do site de hospedagem. No próximo extrato, você verá alguns valores:

  • 9,950 € (este é o preço / mês)
  • 528 m & # 178- (este é o total de m2 da propriedade, neste caso 528)

    </div><div class="search-result-info search-result-info-price">
    <span class="search-result-price">€ 9.950 /mnd</span>
    <span class="search-result-info-small">Geen kosten huurder</span>
    </div>
    <div class="search-result-info">
    <ul class="search-result-kenmerken ">
    <li><span title="Woonoppervlakte">528 m&#178;</span>
    </li>
    <li>6 kamers</li>
    <li>In overleg</li>
    

PROCEDIMENTO ATUAL

Copio todo o código-fonte no Notepad ++ e faço dois comandos Localizar e Substituir. Primeiro pelo preço, subsequentemente a superfície (FYI: surface em holandês é escrita como oppervlakte)

Find1

<span class="search-result-price">(.*?)/mnd</span>

Substituir1

\r\nHITPRICE: $1

Find2

<span title="Woonoppervlakte">(.*?)m&#178;</span>

Substituir2

\r\nHITOPPERVLAKTE: $1

Ótimo! Agora faço uma pesquisa e marque o comando para os valores HITPRICE e HITOPPERVLAKTE. Em seguida, clique em Pesquisar > Marcador > Remova todas as linhas não marcadas. O resultado é uma boa lista de todos os preços e superfícies que eu posso copiar para se destacar.

HITOPPERVLAKTE: 135
HITPRICE: € 9.950
HITOPPERVLAKTE: 528
HITPRICE: € 1.560
HITOPPERVLAKTE: 106
HITPRICE: € 1.250 

No entanto, a lista mostra o preço e a superfície em uma linha diferente a cada vez. Eu posso trabalhar com isso, mas eu prefiro o seguinte formato em que tanto a superfície quanto o preço são combinados:

HITOPPERVLAKTEPRICE: 106   € 1.250 
HITOPPERVLAKTEPRICE: 528   € 1.560 
HITOPPERVLAKTEPRICE: 135   € 9.950 

Simplesmente porque, ao copiar para o excel, as superfícies e os preços aparecerão lado a lado em diferentes colunas imediatamente.

PROCEDIMENTO NÚMERO 2

Então o seguinte é o que eu tenho feito até agora; um único comando Localizar e substituir:

Encontre

(<span title="Woonoppervlakte">(.*?) m&#178;</span>)|(<span class="search-result-price">(.*?)/mnd</span>)

Substituir

(\r\nHITOPPERVLAKTEPRIJS: $2\t$4)

Isso me dá o seguinte resultado:

HITOPPERVLAKTEPRIJS:    € 2.200 
HITOPPERVLAKTEPRIJS: 135    
HITOPPERVLAKTEPRIJS:    € 9.950 
HITOPPERVLAKTEPRIJS: 528    
HITOPPERVLAKTEPRIJS:    € 1.560 
HITOPPERVLAKTEPRIJS: 106    
HITOPPERVLAKTEPRIJS:    € 1.250 

Então eu estou quase lá, mas o outpit separa as superfícies e os preços em linhas diferentes. Isso é facilmente resolvido no Excel (basta mover todas as superfícies para cima uma linha), mas eu me pergunto se é possível arrumar este aspecto final do meu processo de automação em miniatura: -)

A PERGUNTA

Como modificar meu comando 'localizar e substituir' para criar um layout de saída em que superfície e preço são combinados em uma única linha e separados por uma guia (para que eles resultem em colunas diferentes quando copiados do Excel)

    
por sjeupie 25.10.2017 / 20:34

1 resposta

0

Sua entrada:

HITOPPERVLAKTE: 135
HITPRICE: € 9.950
HITOPPERVLAKTE: 528
HITPRICE: € 1.560
HITOPPERVLAKTE: 106
HITPRICE: € 1.250 

Localizar / substituir:

  • Encontre o que: \r\nHITPRICE
  • Substituir por: \tHITPRICE
  • Modo de pesquisa: estendido

Resultado:

HITOPPERVLAKTE: 135 HITPRICE: € 9.950
HITOPPERVLAKTE: 528 HITPRICE: € 1.560
HITOPPERVLAKTE: 106 HITPRICE: € 1.250 

E se você quiser separar números em suas próprias colunas,

  • Encontre o que: :•
    ( representa o espaço aqui)
  • Substituir por: \t
  • Modo de pesquisa: estendido

Em seguida, você pode usar Texto para colunas no menu Dados do Excel para criar números dessas colunas, para criar cálculos neles, por exemplo, € / m².

    
por 30.10.2017 / 14:49