É um bug de 3 anos ou mais com o ZFS ARC que ainda persiste!
Ele também sairá dos limites da VM de um hipervisor!
ontem adicionei novos discos rígidos (quatro como um raidz1 e um como hot spare) a um servidor opensolaris, depois de estender o zpool o servidor trava ao gravar arquivos grandes, mas não ao ler arquivos grandes (arquivos grandes = > 1GiB) .
A configuração do zpool antes da atualização ficou assim:
state: ONLINE
NAME STATE READ WRITE CKSUM
storage ONLINE 0 0 0
raidz1 ONLINE 0 0 0
c9t0d0 ONLINE 0 0 0
c9t1d0 ONLINE 0 0 0
c9t2d0 ONLINE 0 0 0
c9t3d0 ONLINE 0 0 0
Após a atualização, o zpool fica assim:
state: ONLINE
NAME STATE READ WRITE CKSUM
storage ONLINE 0 0 0
raidz1 ONLINE 0 0 0
c9t0d0 ONLINE 0 0 0
c9t1d0 ONLINE 0 0 0
c9t2d0 ONLINE 0 0 0
c9t3d0 ONLINE 0 0 0
raidz1 ONLINE 0 0 0
c9t4d0 ONLINE 0 0 0
c9t5d0 ONLINE 0 0 0
c9t6d0 ONLINE 0 0 0
c9t7d0 ONLINE 0 0 0
spares
c9t8d0 AVAIL
Como você pode ver todas as unidades estão on-line e até mesmo o controlador 3Ware 9690SA-4I me diz que tudo está correto:
Unit UnitType Status %RCmpl %V/I/M Stripe Size(GB) Cache AVrfy
----------------------------------------------------------------------------- -
u0 SINGLE OK - - - 1862.63 RiW ON
u1 SINGLE OK - - - 1862.63 RiW ON
u2 SINGLE OK - - - 1862.63 RiW ON
u3 SINGLE OK - - - 1862.63 RiW ON
u4 SINGLE OK - - - 1862.63 RiW ON
u5 SINGLE OK - - - 1862.63 RiW ON
u6 SINGLE OK - - - 1862.63 RiW ON
u7 SINGLE OK - - - 1862.63 RiW ON
u8 SINGLE OK - - - 1862.63 RiW ON
VPort Status Unit Size Type Phy Encl-Slot Model
----------------------------------------------------------------------------- -
p8 OK u0 1.82 TB SATA - /c9/e0/slt1 SAMSUNG HD203WI
p9 OK u1 1.82 TB SATA - /c9/e0/slt3 SAMSUNG HD203WI
p10 OK u2 1.82 TB SATA - /c9/e0/slt5 SAMSUNG HD203WI
p11 OK u4 1.82 TB SATA - /c9/e0/slt6 SAMSUNG HD203WI
p12 OK u5 1.82 TB SATA - /c9/e0/slt8 SAMSUNG HD203WI
p13 OK u3 1.82 TB SATA - /c9/e0/slt10 SAMSUNG HD203WI
p14 OK u6 1.82 TB SATA - /c9/e0/slt13 SAMSUNG HD203WI
p15 OK u7 1.82 TB SATA - /c9/e0/slt15 SAMSUNG HD203WI
p16 OK u8 1.82 TB SATA - /c9/e0/slt17 SAMSUNG HD203WI
Mas quando eu começo a escrever arquivos para este zfs, o servidor trava em algum momento durante o processo de gravação e, às vezes, apenas depois de gravar o arquivo inteiro, mas com certeza o servidor trava .... Ler arquivos grandes (7-8GiB) no outro lado não é problema!
Obrigado pelas suas respostas!
cu
Guido
editar:
fyi: O servidor é executado em svn_111b
edição 2:
scrub: scrub completed after 6h20m with 0 errors on Thu Jul 22 00:33:29 2010
Como você pode ver, não há erros no sistema de arquivos ...
É um bug de 3 anos ou mais com o ZFS ARC que ainda persiste!
Ele também sairá dos limites da VM de um hipervisor!
Tags zfs raidz opensolaris