Converter linha de comando do shell XML para CSV

5

Eu tenho um arquivo XML grande (600MB) e quero convertê-lo em CSV por meio de comandos de terminal. Eu tentei converter o XML em TXT através do comando xml2 usando a seguinte sintaxe.

xml2 < BIG.xml > BIG.txt

Meu XML Fromat é

<ReportDetails>
    <Date>08/08/2012</Date>
    <CaseNo>13030903</CaseNo>
    <UserDetailsText>Individual Details</UserDetailsText>
    <UserDetails>
        <UserId>0903</UserId>    
        <FirstName>John</FirstName>
        <Surname>Perry</Surname>
        <Occupation>Developer</Occupation>
        <DateofBirth>02/14/1981</DateofBirth>    
    </UserDetails>
    <ApplicationDetailsText>Conflict Resolution Details</ApplicationDetailsText>
    <ApplicationDetails>
        <ApplicationNo>13033</ApplicationNo>
        <ApplicationName>John Perry</ApplicationName>
        <Department>Information Technology</Department>
        <ApplicationType>Personal</ApplicationType>
        <ApplicationDate>06/07/2012</ApplicationDate>
        <ApplicationEndDate>09/07/2012</ApplicationEndDate>
        <ApplicationStatus>Closed</ApplicationStatus>    
     </ApplicationDetails>  
</ReportDetails>

Eu quero esses campos no arquivo CSV separados por um Pipe (|)

Date | CaseNo | FirstName | Surname | ApplicationNo | ApplicationName | ApplicationDate | ApplicationStatus

Além disso, se eu quiser fazer o arquivo através de um arquivo PHP, eu precisarei de um script de shell para fazer isso.

    
por HardCode 10.08.2012 / 08:43

1 resposta

6

Use o XSL para realizar a transformação no formato exato que você precisa; por exemplo,

<xsl:stylesheet version="1.0"
xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
<xsl:output method="text" encoding="iso-8859-1"/>
<xsl:strip-space elements="*" />

<xsl:template match="/ReportDetails">
  <xsl:value-of select="Date"/><xsl:text>|</xsl:text>
  <xsl:value-of select="CaseNo"/><xsl:text>|</xsl:text>
  <xsl:apply-templates select="UserDetails" />
</xsl:template>

<xsl:template match="/ReportDetails/UserDetails">
  <xsl:value-of select="FirstName"/><xsl:text>|</xsl:text>
  <xsl:value-of select="Surname"/><xsl:text>|</xsl:text>
</xsl:template>

<!-- etc -->
</xsl:stylesheet>

Em seguida, é dado o exemplo acima (por exemplo, em foo.xsl para transformar o documento xml original foo.xml):

$ xsltproc  foo.xsl  foo.xml 
08/08/2012|13030903|John|Perry|

(O diabo está nos detalhes do xsl ... existem várias maneiras de implementar isso ...)

    
por michael 13.08.2012 / 08:48