Como posso saber se o xfs_repair está parado ou ainda em execução?

1

Eu tenho um servidor de backup com ~ 72TB de espaço. Apenas metade disso é usado. No começo da semana recebi a seguinte mensagem e diretamente depois que o sistema de arquivos do xfs foi desmontado.

Mar 15 15:15:47 kernel: Filesystem dm-0: XFS internal error xfs_trans_cancel at line 1164 of file fs/xfs/xfs_trans.c.  Caller 0xffffffff883e54fe
Mar 15 15:15:47 kernel: 
Mar 15 15:15:47 kernel: 
Mar 15 15:15:47 kernel: Call Trace:
Mar 15 15:15:47 kernel:  [<ffffffff883dfd95>] :xfs:xfs_trans_cancel+0x55/0xfa
Mar 15 15:15:47 kernel:  [<ffffffff883e54fe>] :xfs:xfs_mkdir+0x429/0x465
Mar 15 15:15:47 kernel:  [<ffffffff883ee399>] :xfs:xfs_vn_mknod+0x161/0x215
Mar 15 15:15:47 kernel:  [<ffffffff800ed95a>] vfs_mkdir+0xe3/0x152
Mar 15 15:15:47 kernel:  [<ffffffff800edf30>] sys_mkdirat+0xa3/0xe4
Mar 15 15:15:47 kernel:  [<ffffffff800a7f3f>] sys_futex+0x129/0x14a
Mar 15 15:15:47 kernel:  [<ffffffff8005ddf9>] error_exit+0x0/0x84
Mar 15 15:15:47 kernel:  [<ffffffff8005d116>] system_call+0x7e/0x83
Mar 15 15:15:47 kernel: 
Mar 15 15:15:47 kernel: xfs_force_shutdown(dm-0,0x8) called from line 1165 of file fs/xfs/xfs_trans.c.  Return address = 0xffffffff883dfdae
Mar 15 15:15:47 kernel: Filesystem dm-0: Corruption of in-memory data detected.  Shutting down filesystem: dm-0
Mar 15 15:15:47 kernel: Please umount the filesystem, and rectify the problem(s)
Mar 15 15:15:57 kernel: Filesystem dm-0: xfs_log_force: error 5 returned.

Então eu corri o seguinte comando começando há quatro dias:

xfs_repair -vv -o bhash=16384 -o ihash=16384 -o ag_stride=16 /dev/mapper/cdp1raid-cdp1raid

As opções extras de -o ajudaram a acelerar substancialmente e foram enviadas para um arquivo de log que mostrou o progresso, mas nos últimos dois dias foi mostrada apenas a mensagem:

rebuild AG headers and trees - 73 of 73 allocation groups done

Eu olhei para coisas como strace , iostat , htop e atop para ver se eu poderia descobrir se ainda está progredindo ou se está preso, mas não vi nada que soletre o que o processo está fazendo. Da execução de iostat -xd , posso ver as listagens sdc , sdc1 e dm-0 contando os valores r/s , w/s e rsec/s , mas não tenho certeza se isso realmente significa alguma coisa.

QUALQUER ajuda ou orientação sobre isso seria mais do que apreciado.

    
por willinit 19.03.2016 / 21:46

0 respostas