O efeito do cache de buffer do Linux nas gravações de IO?

5

Estou copiando arquivos grandes (3 x 30G) entre 2 sistemas de arquivos em um servidor Linux (kernel 2.6.37, 16 núcleos, 32G RAM) e estou obtendo um desempenho ruim. Eu suspeito que o uso do cache de buffer está matando o desempenho de E / S.

Para tentar diminuir o problema, usei o fio diretamente no disco SAS para monitorar o desempenho.

Aqui está a saída de 2 fio corre (o primeiro com direto = 1, o segundo direto = 0):

Configuração:

[test]
rw=write
blocksize=32k
size=20G
filename=/dev/sda
# direct=1

Execução 1:

test: (g=0): rw=write, bs=32K-32K/32K-32K, ioengine=sync, iodepth=1
Starting 1 process
Jobs: 1 (f=1): [W] [100.0% done] [0K/205M /s] [0/6K iops] [eta 00m:00s]
test: (groupid=0, jobs=1): err= 0: pid=4667
  write: io=20,480MB, bw=199MB/s, iops=6,381, runt=102698msec
    clat (usec): min=104, max=13,388, avg=152.06, stdev=72.43
    bw (KB/s) : min=192448, max=213824, per=100.01%, avg=204232.82, stdev=4084.67
  cpu          : usr=3.37%, sys=16.55%, ctx=655410, majf=0, minf=29
  IO depths    : 1=100.0%, 2=0.0%, 4=0.0%, 8=0.0%, 16=0.0%, 32=0.0%, >=64=0.0%
     submit    : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%
     complete  : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%
     issued r/w: total=0/655360, short=0/0
     lat (usec): 250=99.50%, 500=0.45%, 750=0.01%, 1000=0.01%
     lat (msec): 2=0.01%, 4=0.02%, 10=0.01%, 20=0.01%

Run status group 0 (all jobs):
  WRITE: io=20,480MB, aggrb=199MB/s, minb=204MB/s, maxb=204MB/s, mint=102698msec,    maxt=102698msec

Disk stats (read/write):
  sda: ios=0/655238, merge=0/0, ticks=0/79552, in_queue=78640, util=76.55%

Execução 2:

test: (g=0): rw=write, bs=32K-32K/32K-32K, ioengine=sync, iodepth=1
Starting 1 process
Jobs: 1 (f=1): [W] [100.0% done] [0K/0K /s] [0/0 iops] [eta 00m:00s]     
test: (groupid=0, jobs=1): err= 0: pid=4733
  write: io=20,480MB, bw=91,265KB/s, iops=2,852, runt=229786msec
    clat (usec): min=16, max=127K, avg=349.53, stdev=4694.98
    bw (KB/s) : min=56013, max=1390016, per=101.47%, avg=92607.31, stdev=167453.17
  cpu          : usr=0.41%, sys=6.93%, ctx=21128, majf=0, minf=33
  IO depths    : 1=100.0%, 2=0.0%, 4=0.0%, 8=0.0%, 16=0.0%, 32=0.0%, >=64=0.0%
     submit    : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%
     complete  : 0=0.0%, 4=100.0%, 8=0.0%, 16=0.0%, 32=0.0%, 64=0.0%, >=64=0.0%
     issued r/w: total=0/655360, short=0/0
     lat (usec): 20=5.53%, 50=93.89%, 100=0.02%, 250=0.01%, 500=0.01%
     lat (msec): 2=0.01%, 4=0.01%, 10=0.01%, 20=0.01%, 50=0.12%
     lat (msec): 100=0.38%, 250=0.04%

Run status group 0 (all jobs):
  WRITE: io=20,480MB, aggrb=91,265KB/s, minb=93,455KB/s, maxb=93,455KB/s, mint=229786msec, maxt=229786msec

Disk stats (read/write):
  sda: ios=8/79811, merge=7/7721388, ticks=9/32418456, in_queue=32471983, util=98.98%

Não tenho conhecimento suficiente com fio para interpretar os resultados, mas não espero que o desempenho geral usando o cache de buffer seja 50% menor do que com O_DIRECT.

Alguém pode me ajudar a interpretar o resultado da produção?
Há algum afinamento do kernel que consiga corrigir / minimizar o problema?

Muito obrigado,

    
por Patrick LeBoutillier 22.02.2011 / 22:45

2 respostas

2

Com O_DIRECT, o kernel ignora todos os mecanismos usuais de armazenamento em cache e grava diretamente no disco. Já que você não está usando O_SYNC, se o cache está ativado (não usando O_DIRECT), então o kernel pode se voltar para você dizendo que "sim, sim, eu escrevi, não se preocupe!", Mesmo que não escrevê-lo no disco, ele só foi gravado em algum cache (cache de disco / cache de páginas /...).

    
por 02.07.2013 / 12:37
0
Ir direto significa que você não gasta tempo fazendo cópias, portanto não é impossível que a E / S direta seja mais rápida, mas os resultados parecem estranhos, com a disseminação dos tempos de conclusão da segunda execução sendo muito maiores do que os da Primeira corrida. Compare também as estatísticas do disco:

sda: ios=0/655238, merge=0/0, ticks=0/79552, in_queue=78640, util=76.55%

vs

 sda: ios=8/79811, merge=7/7721388, ticks=9/32418456, in_queue=32471983, util=98.98%

A primeira execução não fez nenhuma mesclagem (a mesclagem =) de I / Os que o segundo fez. Durante a primeira execução, o disco não estava totalmente ocupado (util =) e, na segunda execução, estava muito ocupado. O tempo in_queue da segunda execução também é maior, sugerindo que o E / S estava fazendo backup no kernel. Estranho - talvez o write-back tenha sido quebrado de alguma forma? Você pode conseguir resolver o problema alterando o agendador de E / S para noop ou deadline , mas ele parece com problemas ...

    
por 08.02.2018 / 18:13