Multipath que executa muito mal RHEL / HSV200

1

Estou executando um RHEL 5.5 com o sistema de armazenamento multipath @ HSV200.

O desempenho do disco para gravação é MUITO fraco em comparação com os equivalentes do sistema Windows (que estão usando o mesmo armazenamento e multipath).

Aqui estão os resultados:

mpath17 (3600508b400105f9d0002100000780000) dm-12 HP,HSV200
[size=850G][features=0][hwhandler=0][rw]
\_ round-robin 0 [prio=100][active]
 \_ 2:0:1:30  sdaw       67:0   [active][ready]
 \_ 1:0:1:30  sdc        8:32   [active][ready]
\_ round-robin 0 [prio=20][enabled]
 \_ 2:0:0:30  sdau       66:224 [active][ready]
 \_ 1:0:0:30  sda        8:0    [active][ready]

'atop' result:

LVM |      mpath17  | busy     99% |  read    3077 | write      6  | KiB/r     90 |               | KiB/w      4 |  MBr/s  27.11 | MBw/s   0.00  | avq     2.41 |  avio 3.21 ms 

Observe como o "ocupado" é de 99% - e isso acontece na maior parte do tempo.

O multipath.conf está usando as práticas recomendadas recomendadas pela HP para esse armazenamento:

device {
                vendor                                   "HP"
                product                                  "HSV2[01]0|HSV3[046]0|HSV4[05]0"
                path_grouping_policy        group_by_prio
                getuid_callout                      "/sbin/scsi_id -g -u -s /block/%n"
                prio_callout                           "/sbin/mpath_prio_alua /dev/%n"
                path_selector                       "round-robin 0"
                path_checker                       tur
                hardware_handler              "0"
                failback                  immediate
                rr_weight                               uniform
                rr_min_io                              100
                no_path_retry                       18
}

Existe alguma maneira de diagnosticar este evento? Eu quero entender onde está o gargalo nesse cenário ... Alguma sugestão por onde começar?

(Este é o meu primeiro post aqui, muito obrigado)

    
por Daniel Sartori 21.12.2012 / 14:06

2 respostas

0

Isso pode ser um sintoma de um problema de desempenho. Como o armazenamento por trás desse LUN é configurado? Qual tipo de disco, quantos discos e que tipo de invasão? O cache está configurado para write-back?

Você mencionou em um comentário que está quantificando a utilização de disco por MB / s, porém na maioria das vezes, a limitação para unidades não-SSD não é MB / s, mas IO / s como eles têm que buscar muito para leituras aleatórias.

    
por 22.12.2012 / 00:14
0

O problema todo era o controlador de disco; ele não tinha um controlador de cache, então ele apresentava um desempenho ruim de várias maneiras - como grandes gravações de arquivos ou muitos arquivos gravados ao mesmo tempo.

Obrigado pelo diagnóstico.

    
por 19.04.2013 / 13:22