Uma maneira mais eficiente de encontrar o número que falta

1

Eu tenho uma variável chamada DISK_INFO com o seguinte conteúdo:

diskid   HGST     HUSMH8010BSS204  serial             no  no  [0] Slot00
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot02
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot03
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot04
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot05
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot06
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot07
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot08
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot09
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot10
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot11
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot12
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot13
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot14
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot15
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot16
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot17
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot18
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot19
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot20
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot21
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot22
diskid   HGST     HUH728080AL4204  serial             no  no  [0] Slot23
diskid   HGST     HUH728080AL4204  serial             no  no  [1] Slot00
diskid   HGST     HUH728080AL4204  serial             no  no  [1] Slot01
diskid   HGST     HUH728080AL4204  serial             no  no  [1] Slot02
diskid   HGST     HUH728080AL4204  serial             no  no  [1] Slot03
diskid   HGST     HUH728080AL4204  serial             no  no  [1] Slot04
diskid   HGST     HUH728080AL4204  serial             no  no  [1] Slot05
diskid   HGST     HUH728080AL4204  serial             no  no  [1] Slot06
diskid   HGST     HUH728080AL4204  serial             no  no  [1] Slot07
diskid   HGST     HUH728080AL4204  serial             no  no  [1] Slot08
diskid   HGST     HUH728080AL4204  serial             no  no  [1] Slot09
diskid   HGST     HUH728080AL4204  serial             no  no  [1] Slot10
diskid   HGST     HUH728080AL4204  serial             no  no  [1] Slot11
c2t0d0                  Kingston DataTraveler 2.0 -                    -   -   -

Quando um disco falhou, ele será removido da lista, neste exemplo, o disco no gabinete 0 Slot 01 falhou.

Supondo que o gabinete 0 sempre terá 24 discos 00-23 e o gabinete 1 sempre terá 12 discos 00-11, como eu posso determinar de maneira eficiente e precisa o (s) disco (s) ausente (s)?

Atualmente, tenho o seguinte, mas tenho certeza de que isso pode ser feito em um único comando awk:

enclosure0=($(awk '$7 ~ "[0]"{print $8}' <<<"$DISK_INFO" | sort -n))
enclosure1=($(awk '$7 ~ "[1]"{print $8}' <<<"$DISK_INFO" | sort -n))
for n in {00..23}; do
  grep -q "$n" <<<"${enclosure0[@]}" || missing+=("Enclosure 0 - Slot$n")
done
for n in {00..11}; do
  grep -q "$n" <<< "${enclosure1[@]}" || missing+=("Enclosure 1 - Slot$n")
done
    
por Jesse_b 10.05.2018 / 23:38

3 respostas

1

Como você sabe de antemão quais itens precisam existir, crie uma lista e marque-os ao vê-los.

awk '
    BEGIN {
        for (i = 0; i < 24; i++) missing[0][sprintf("%02d", i)] = 1;
        for (i = 0; i < 12; i++) missing[1][sprintf("%02d", i)] = 1;
    }
    $7 ~ /^\[[0-9]+\]$/ && $8 ~ /^Slot[0-9]+$/ {
        gsub(/[^0-9]/, "", $7);
        sub(/^[^0-9]+/, "", $8);
        delete missing[$7][$8];
    }
    END {
        for (enclosure in missing) {
            for (slot in missing[enclosure]) {
                printf "Missing enclosure %d Slot%s\n", enclosure, slot;
            }
        }
    }
'
    
por 10.05.2018 / 23:53
3

Sem awk , para cada gabinete:

{ printf '[0] Slot%s\n' {00..23} ; grep -Eo '\[0\] Slot..' disks ; } | sort | uniq -u

Em câmera lenta:

  • printf '[0] Slot%s\n' {00..23} gera a lista de todos os discos possíveis
  • grep -Eo '\[0\] Slot..' disks extrai os discos existentes
  • {..} concatena a saída dos dois comandos
  • sort | uniq -u extrai as linhas que aparecem apenas uma vez

Você pode substituir as etapas printf e grep por funções adequadas ou a parte printf por um grep semelhante em outro arquivo, que é a lista esperada de discos.

    
por 11.05.2018 / 00:44
0
perl -sle '
  my(@e, @AoA) = qw/ 24 12 /;
  $AoA[$1][$2]++ while /\[([01])]\h+(?:(?!\d)\S)+0*(\d+)$/mg;
  for my $enc ( 0 .. $#e ) {
     for my $m_slot ( grep { ! defined $AoA[$enc][$_] } 0 .. $e[$enc]-1 ) {
         print "in enclosure $enc - Slot$m_slot is missing.";
     }
  }
 ' -- -_="$DISK_INFO";

Explicação:

°  Initialize the array @e which holds the number of slots in the various enclosures. 

° The Disk info variable is passed into the command line as $_ initialized to $DISK_INFO. 

°  progressively scan and match the $_ variable using the while loop and look for the numbers in the '[..]' and the 'Slot...'  locations. Using these we update the array of array @AoA, it can be viewed as a matrix. 

°  Now once we have ingested all the data, its time to process it now in two for loops. 

° The outer for loops on the enclosures, in our case, they are two. 

° The inner for loop computes the indices of the current enclosure elements that are undefined, IOW, those slots that were never encountered during the data collection drive in the while loop. 
    
por 12.05.2018 / 19:21