Você pode usar o script python aqui
Este script obtém todos os links iniciados com link
import re
f = open('sitemap.xml','r')
res = f.readlines()
for d in res:
data = re.findall('>(http:\/\/.+)<',d)
for i in data:
print i
E no seu caso, o próximo script encontra todos os dados em tags
import re
f = open('sitemap.xml','r')
res = f.readlines()
for d in res:
data = re.findall('<loc>(http:\/\/.+)<\/loc>',d)
for i in data:
print i
Aqui uma boa ferramenta para brincar com o regexp se você não estiver familiarizado com ele.
se você precisar carregar um arquivo remoto, poderá usar o próximo código
import urllib2 as ur
import re
f = ur.urlopen(u'http://server.com/sitemap.xml')
res = f.readlines()
for d in res:
data = re.findall('<loc>(http:\/\/.+)<\/loc>',d)
for i in data:
print i