Servidor Linux muito lento apesar de estar ocioso

1

Eu tenho uma caixa Linux Ubuntu 16.04 que tem sido lenta por alguns dias agora, embora quase não haja carga. Não é underpowered para o que tem que fazer:

  • servidor de arquivos com Owncloud (dois usuários),
  • git server com Gogs.

Hardware : processador Intel Atom dual core a 1,7 GHz, 4 GB DDR3 & 1 TB HDD.

Quando digo devagar, isso significa que tudo leva mais tempo do que deveria. Por exemplo, apt-get upgrade leva 5mn mesmo sem grandes atualizações que geralmente são uma questão de segundos.

Quando eu uso Gogs, as páginas são muito lentas para gerar também. Gogs dá estatísticas: Page: 9803ms Template: 10ms , geralmente a página é mais parecida com 500ms para gerar…

Saída principal:

top - 10:23:59 up 34 min,  2 users,  load average: 0.58, 0.82, 1.00
Tasks: 132 total,   1 running, 131 sleeping,   0 stopped,   0 zombie
%Cpu(s):  0.2 us,  0.3 sy,  0.0 ni, 94.9 id,  4.6 wa,  0.0 hi,  0.0 si,  0.0 st
KiB Mem :  4008036 total,  3014964 free,   366540 used,   626532 buff/cache
KiB Swap:  1000444 total,  1000444 free,        0 used.  3370956 avail Mem 

Processos:

ps h -Led -o user | sort | uniq -c | sort -n
  1 Debian-exim
  1 messagebus
  2 ntpd
  4 syslog
 21 www-data
 24 gogs
 30 mysql
 31 sensu
133 root

dmesg:

dmesg | grep "sd\|EXT\|mount\|filesystem\|SATA"
[   20.069558] ahci 0000:00:18.0: AHCI 0001.0300 32 slots 2 ports 3 Gbps 0x3 impl SATA mode
[   20.069563] ahci 0000:00:18.0: flags: 64bit ncq led clo pio deso sadm sds apst 
[   20.084065] ata1: SATA max UDMA/133 abar m2048@0x80024000 port 0x80024100 irq 24
[   20.084068] ata2: SATA max UDMA/133 abar m2048@0x80024000 port 0x80024180 irq 24
[   20.518945] ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
[   20.518972] ata2: SATA link down (SStatus 0 SControl 300)
[   20.606811] sd 0:0:0:0: [sda] 1953525168 512-byte logical blocks: (1.00 TB/932 GiB)
[   20.606815] sd 0:0:0:0: [sda] 4096-byte physical blocks
[   20.606972] sd 0:0:0:0: [sda] Write Protect is off
[   20.606977] sd 0:0:0:0: [sda] Mode Sense: 00 3a 00 00
[   20.607034] sd 0:0:0:0: [sda] Write cache: enabled, read cache: enabled, doesn't support DPO or FUA
[   20.607508] sd 0:0:0:0: Attached scsi generic sg0 type 0
[   20.649884]  sda: sda1 sda2 sda3
[   20.651578] sd 0:0:0:0: [sda] Attached SCSI disk
[   22.965497] EXT4-fs (sda2): mounted filesystem with ordered data mode. Opts: (null)
[   27.112100] systemd[1]: Set up automount Arbitrary Executable File Formats File System Automount Point.
[   33.547005] EXT4-fs (sda2): re-mounted. Opts: errors=remount-ro
[   36.480793] Adding 1000444k swap on /dev/sda3.  Priority:-1 extents:1 across:1000444k FS
[   37.538548] EXT4-fs (sda1): mounted filesystem with ordered data mode. Opts: (null)
[  948.341404] QNX4 filesystem 0.2.3 registered.

Investigar com o iotop durante a sincronização de algumas coisas com o Owncloud mostra claramente que o problema é vinculado ao E / S, principalmente devido ao MySQL.

Noentanto,eunãoqualificariaoMySQLcomointensivodegravaçãoaqui,e movendo-o para uma partição sem journal apenas por questões de jdb2 não parece uma solução; tanto mais que funcionou perfeitamente como até alguns dias, e a mesma configuração funciona como um encanto em outra máquina.

Depois de executar um teste completo com smartctl -t long /dev/sda :

Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000b   100   100   062    Pre-fail  Always       -       0
  2 Throughput_Performance  0x0005   100   100   040    Pre-fail  Offline      -       0
  3 Spin_Up_Time            0x0007   153   153   033    Pre-fail  Always       -       1
  4 Start_Stop_Count        0x0012   100   100   000    Old_age   Always       -       11
  5 Reallocated_Sector_Ct   0x0033   100   100   005    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000b   100   100   067    Pre-fail  Always       -       0
  8 Seek_Time_Performance   0x0005   100   100   040    Pre-fail  Offline      -       0
  9 Power_On_Hours          0x0012   094   094   000    Old_age   Always       -       3022
 10 Spin_Retry_Count        0x0013   100   100   060    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       4
191 G-Sense_Error_Rate      0x000a   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       3
193 Load_Cycle_Count        0x0012   100   100   000    Old_age   Always       -       50
194 Temperature_Celsius     0x0002   206   206   000    Old_age   Always       -       29 (Min/Max 19/30)
196 Reallocated_Event_Count 0x0032   100   100   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0022   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0008   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x000a   200   200   000    Old_age   Always       -       0
223 Load_Retry_Count        0x000a   100   100   000    Old_age   Always       -       0

SMART Error Log Version: 1
No Errors Logged

Desempenho de disco com hdparm (testado a partir de recue com FS não montado):

hdparm -Tt /dev/sda

/dev/sda:
 Timing cached reads:   2836 MB in  2.00 seconds = 1418.58 MB/sec
 Timing buffered disk reads: 236 MB in  3.01 seconds =  78.51 MB/sec

Isso parece muito lento para mim, embora o SMART não mostre nenhum erro, pode ser um problema de hardware ...

Além disso, o FS parece sensato:

e2fsck /dev/sda2
e2fsck 1.42.9 (4-Feb-2014)
/dev/sda2 : clean, 314622/60956672 files, 12081169/243818240 blocks

O problema estava vindo do disco rígido. Como os resultados do hdparm mostram, o disco estava com desempenho abaixo do esperado, gerando assim muita espera por IO e desacelerando o sistema.

    
por Buzut 11.10.2016 / 10:27

2 respostas

2

Com base no que você forneceu, problemas com o disco parecem prováveis. Eu recomendo executar testes SMART como smartctl -t short / dev / sda e ver o resultado. Se os resultados incluírem muitos setores defeituosos e erros, isso deve ser uma desistência.

Se o seu teste inteligente não produzir respostas dentro de um curto período de tempo, ele estará sob estresse pesado (não é provável em sua história) ou com defeito. Possivelmente, a correção constante de erros poderia estar criando sobrecarga tremenda.

Eu ficaria curioso em saber qual o desempenho do disco que você gerencia quando todos os serviços não essenciais são encerrados. Por favor, execute hdparm -Tt / dev / sda e compartilhe os resultados conosco.

    
por 11.10.2016 / 16:18
-2

a questão de por que os gogs devem diminuir é que gogs liga o serviço da web ao ipv6. Neste caso, todos os pedidos da web e do git vão para o ipv4.

tente ligar apenas os gogs no ipv4 e será muito rápido responder aos pedidos

    
por 30.07.2017 / 17:09