Eu usaria apenas regex no shell ou em alguma linguagem de script de shell:
paragraphs of (do shell script "/bin/echo " & quoted form of "<p class=\"new\">yyy</p><p>uuu</p>" & " | ruby -e 'puts $<.read.scan(/<p.*?>(.+?)<\/p>/)'")
Como posso analisar dados de dentro de uma tag com o Applescript? Eu sei que o Applescript tem a sintaxe words 3 thru -2 of myTextVariable
- mas como usá-lo para ter certeza de que estou recebendo apenas This is my text
das tags abaixo?
<p>This is my text</p>
ou
<p class="new">This is my text</p>
ou
<h1>This is my text</h1>
ou
<content class="new" id="content">This is my text</content>
Tags mac html parsing macos applescript