consulta XML no Bash com XMLStarlet

0

Eu preciso extrair alguns valores de um arquivo XML, e eu tropecei em XMLStarlet que parece muito poderoso. Sabendo pouco sobre XML, estou sobrecarregado com a ferramenta e, provavelmente, preciso apenas de uma pequena parte dela. Eu tenho um arquivo como o seguinte e eu queria obter, digamos, o seguinte endereço:

<es:ipAddress>123_Westbrook</es:ipAddress>

Como eu digitaria isso?

Qual é o significado desses campos extras, como es ? Eu assumo isto entre parênteses neste objeto particular (o ipAddress value, 123 Westbrook ), mas que parte do caminho é realmente dada a XMLStarlet ? Os suportes? O nome do parâmetro? Separado por barras?

Talvez:

xmlstarlet sel '<bulkCmConfigDataFile xmlns:gn="JOE.xsd"> < configDat dnPrefix="Undefined"> < xn:Subnetwork id="Oz"><xn:MeContext id="BANANS"><xn:attributes><es:vsDataMeContext><es:ipAddress>

Qual deve apontar para o valor 123_Westbrook ? Inserir barras? Algo mais?

O arquivo original é muito grande, então aqui está a primeira parte do XML (muitas tags de fechamento estão faltando postando apenas parte dele):

 1 <?xml version="1.0" encoding="UTF-8"?>
 2 <bulkCmConfigDataFile xmlns:un="utranNrm.xsd"
 3     xmlns:es="FRED.99.88.xsd"
 4     xmlns:xn="JIM.xsd" xmlns:gn="JOE.xsd" xmlns="CARL.xsd">
 5     <fileHeader fileFormatVersion="THE_GOOD_OND" vendorName="Mr. Softie"/>
 6     <configData dnPrefix="Undefined">
 7         <xn:SubNetwork id="ROOM_4_MORE">
 8             <xn:SubNetwork id="Oz">
 9                 <xn:attributes>
10                     <xn:userDefinedNetworkType>SECRET_SERVICE</xn:userDefinedNetworkType>                 
11                     <xn:userLabel>OZ</xn:userLabel>
12                 </xn:attributes>
13                 <xn:MeContext id="BANANAS">
14                     <xn:VsDataContainer id="BANANAS">
15                         <xn:attributes> 
16                             <xn:vsDataType>SECRET_SQUIRREL</xn:vsDataType>
17                             <xn:vsDataFormatVersion>GOOD_HUMOR</xn:vsDataFormatVersion>         
18                             <es:vsDataMeContext>
19                                 <es:userLabel>ORANGE</es:userLabel>
20                                 <es:ipAddress>123_Westbrook</es:ipAddress>
21                                 <es:neMIMversion>S-11</es:neMIMversion>
22                                 <es:lostSynchronisation>SYNCHRONISED</es:lostSynchronisation>         
23                                 <es:bcrLastChange>LAST_DATE</es:bcrLastChange>
24                                 <es:bctLastChange>LAST_DATE</es:bctLastChange>
25                                 <es:multiStandardRbs6k>uh-uh</es:multiStandardRbs6k>
    
por gmark 15.01.2016 / 01:09

2 respostas

0

What is the significance of these extra fields like es?

es significa que ipAddress vem do formulário FRED.99.88.xsd XML Schema - veja a definição de espaço de nomes xmlns:es="FRED.99.88.xsd" (um dos atributos da tag raiz bulkCmConfigDataFile ).

I assume this brackets this particular object (the ipAddress value, 123 Westbrook), but what part of the path is actually given to XMLStarlet?

De acordo com a documentação do XMLStarlet :

sel (or select) - Select data or query XML document(s) (XPATH, etc)

e depois de xmlstarlet sel --help :

XMLStarlet Toolkit: Select from XML document(s)
Usage: xmlstarlet sel <global-options> {<template>} [ <xml-file> ... ]
where
  <global-options> - global options for selecting
  <xml-file> - input XML document file name/uri (stdin is used if missing)
  <template> - template for querying XML document with following syntax:

<global-options> are:
  -Q or --quiet             - do not write anything to standard output.
  -C or --comp              - display generated XSLT
  -R or --root              - print root element <xsl-select>
  -T or --text              - output is text (default is XML)
  -I or --indent            - indent output
  -D or --xml-decl          - do not omit xml declaration line
  -B or --noblanks          - remove insignificant spaces from XML tree
  -E or --encode <encoding> - output in the given encoding (utf-8, unicode...)
  -N <name>=<value>         - predefine namespaces (name without 'xmlns:')
                              ex: xsql=urn:oracle-xsql
                              Multiple -N options are allowed.
  --net                     - allow fetch DTDs or entities over network
  --help                    - display help

Syntax for templates: -t|--template <options>
where <options>
  -c or --copy-of <xpath>   - print copy of XPATH expression
  -v or --value-of <xpath>  - print value of XPATH expression
  -o or --output <string>   - output string literal
  -n or --nl                - print new line
  -f or --inp-name          - print input file name (or URL)
  -m or --match <xpath>     - match XPATH expression
  --var <name> <value> --break or
  --var <name>=<value>      - declare a variable (referenced by $name)
  -i or --if <test-xpath>   - check condition <xsl:if test="test-xpath">
  --elif <test-xpath>       - check condition if previous conditions failed
  --else                    - check if previous conditions failed
  -e or --elem <name>       - print out element <xsl:element name="name">
  -a or --attr <name>       - add attribute <xsl:attribute name="name">
  -b or --break             - break nesting
  -s or --sort op xpath     - sort in order (used after -m) where
  op is X:Y:Z, 
      X is A - for order="ascending"
      X is D - for order="descending"
      Y is N - for data-type="numeric"
      Y is T - for data-type="text"
      Z is U - for case-order="upper-first"
      Z is L - for case-order="lower-first"
...    

Você pode usar o XPath para selecionar o elemento do arquivo XML aqui.

Which should point to the value 123_Westbrook? Insert slashes? Something else?

Como sua pergunta parece ser uma lição de casa para mim, eu só lhe dou:

  • Dica de sintaxe do XMLStarlet:
    xmlstarlet sel -t <template option> <XPath to es:ipAddress tag> -n <filename.xml>
    usar opções de modelo contendo XPATH .
  • exemplos e sandbox
por 15.01.2016 / 19:57
0

Para obter o valor desse elemento "es: ipAddress" com xmlstarlet:

xmlstarlet sel -t -v '//es:ipAddress'  thefilename.xml

que imprime: "123_Westbrook".

    
por 01.02.2016 / 10:57