Como dar ao array multidimensional um valor para cada 'cell'

1

Eu não sou um programador, mas preciso escrever um script para cortar um arquivo e produzir um array multidimensional a partir desse arquivo.

Sou químico, então minha matriz deve ser algo como:

[pe][pH][element][concentration].

Dessa forma, poderei traçar a mudança de concentração para um único elemento com pH e pe .

Então eu escrevi este script para cortar meu arquivo de entrada e indexar pe , pH e espécies, mas agora estou preso. Não tenho ideia de como completá-lo.

    #!/bin/bash
    inputFile='test.inp'

    awk '/Distribution of species/ {f=1} /Saturation indices/ {f=0} f' $inputFile > distriPack.inout
   csplit -z -f distri_ distriPack.inout /Distribution/ {*}
   sed -i '1,5d; $d' distri_*
   sed -i 's/^ *//' distri_*
   cut -d ' ' -f1 distri_* | sort | uniq > especes.inp
   grep -E "pH  =   " $inputFile | cut -d '=' -f 2 | cut -d ' ' -f 4 > ph.inp
   grep -E "pe  =   " $inputFile | cut -d '=' -f 2 | cut -d ' ' -f 4 > pe.inp

   declare -a tableVariable=(ipe ipH ies)

  ipe=0 
  tablepe=0
  for pe in cat "$pe.inp"
  do 
      if ([ $ipe -eq 0 ] || pePrev=pe)
          then 
           tablepe=$((tablepe+1))
           ipe=$((ipe+1))
           pePrev=$pe
           fi
             ipH=0
             tablepH=0
             for pH in cat "$pH.inp"
             do 
             if ([ $ipH -eq 0 ] || pHPrev=pH )
             then 
             tablepH=$((tablepH+1)) > tablepH.inp
             ipH=$((ipH+1))
             pHPrev=$pH
             fi
                ies=0
                tablees=0
                for espece in cat "$espece.inp"
                do
                    if ([ $ies -eq 0 ] || especePrev=espece )
                    then 
            #                       indEspece=0
            #                       for espece in distri_$pe
            #                       do 
            #                          if ([ $indEspece -eq 0 ])
                       maVariable= grep -E "espece" < distri_10  | cut -d ' ' -f 1 

                       ${tableVariable[ $((ipe)) $((ipH)) $((ies)) ]}=$((maVariable))
          #                     done            
                    ies=$((ies+1))
                    tablees=$((tablees+1))
                    especePrev=$espece
                    fi  
                    done
                   done

           done 

val = $ {monTableau [$ {i_pe} $ {i_pH} $ {es} $ {pa}]} > monTableau.inp

Eu gostaria de ter algo como: for [pe][pH][specie]=[0][12][15]

indexTable = concentração.

Mas não sei como dizer no bash for pe = i, pH = j e specie=k e do indexTable[i][j][k]=value das segundas colunas do arquivo Distri_ (valor do índice pe / pH) para a linha correspondente à espécie do índice k . Aqui você tem "algumas" linhas do meu arquivo de entrada:

    >Initial solution 1. \newline
    >Description of solution 
    >pH = 0.0 
    >pe = 0.0 
    >Distribution of species 
    >Species Molality log Activity 
    >H+       1.1e+00 1.0e+00 
    >OH-      1.5e-14 9.5e-15 
    >Am+2     0.0e+00 0.0e+00


    >Initial solution 2. pe 0 pH 0.5 
    >Description of solution 
    >pH = 0.5 
    >pe = 0.0 
    >Distribution of species 
    >Species Molality Log Activity 
    >H+ 4.1e-01 3.1e-01 
    >OH- 4.5e-14 3.1e-14 
    >Am+2 0.0e+00 0.0e+00 

Gostaria de obter algo assim: outputfile_ [pe value] .out onde os dados seriam ordenados assim:

    >Column 1    C2 .....      Cn 
    >Specie\pH   0             n 
    >H+          [H+] at pH=0  [H+] at pH=n 

etc

    
por Nicolas Schmitt 06.03.2017 / 18:38

1 resposta

0

Não tenho certeza se você deseja imprimir o ">" Entre na saída ou se existir na entrada ... Por favor, me dê um feedback para que eu possa fazer as correções no script.

Isso deve fazer o trabalho se a entrada e a saída forem exatamente como você descreveu:

#!/usr/bin/awk
{
# Set the INDEX for each 'Initial Solution'
if ($1==">Initial"){
        gsub(/\./,"",$3);
        INDEX=$3;}

#Discard lines with 'Species' or 'Description'
if (($1==">Description")||($1==">Species")) next;

#Remove '>' from the first field
gsub(/>/,"",$1)

#Set the labels of the rows
PH[0]="Column"
PE[0]="Specie\ph"
H[0]="H+"
OH[0]="OH-"
AM[0]="Am+2"

#Set other values (pH, pe, etc)
if ($1=="pH") PH[INDEX]=$3
if ($1=="pe") PE[INDEX]=$3
if ($1=="H+") H[INDEX]=$2" "$3
if ($1=="OH-") OH[INDEX]=$2" "$3
if ($1=="Am+2") AM[INDEX]=$2" "$3
}

# Print each array.
END {
for (i = 0; i <= INDEX; i++) printf("%s\t",i)
printf("\n")
for (i = 0; i <= INDEX; i++) printf("%s\t",PH[i])
printf("\n")
for (i = 0; i <= INDEX; i++) printf("%s\t",PE[i])
printf("\n")
for (i = 0; i <= INDEX; i++) printf("%s\t",H[i])
printf("\n")
for (i = 0; i <= INDEX; i++) printf("%s\t",OH[i])
printf("\n")
for (i = 0; i <= INDEX; i++) printf("%s\t",AM[i])
printf("\n")
}

Algumas notas:

  1. A primeira linha (#! / usr / bin / awk) deve apontar para a localização do awk em sua máquina (tente whereis awk no prompt)
  2. No bloco final, o \ t insere uma 'guia' entre os campos. Você pode substituí-lo por \ t \ t por 2 guias, uma vírgula 'ou' simplesmente um espaço '' para atender às suas necessidades.
  3. Salve este script e, para usá-lo, simplesmente faça: awk -f script.name.awk input.file.inp

    Espero que isso resolva seu problema.

por 08.03.2017 / 18:39