Linux gerando gigabytes de logs em uma sessão

3

No meu laptop HP Pavilion rodando Linux Mint 18.3 Estou tendo o problema que o sistema está gerando gigabytes de arquivos de log em apenas uma ou duas sessões (não mais que meio dia cada).

Os arquivos de log grandes e gerados são /var/log/kern.log e /var/log/syslog . Ambos são preenchidos com o seguinte relatório:

Feb 27 13:54:38 workstation kernel: [  390.503777] pcieport 0000:00:1d.0: AER: Corrected error received: id=00e8
Feb 27 13:54:38 workstation kernel: [  390.503786] pcieport 0000:00:1d.0: can't find device of ID00e8
Feb 27 13:54:38 workstation kernel: [  390.503802] pcieport 0000:00:1d.0: AER: Multiple Corrected error received: id=00e8
Feb 27 13:54:38 workstation kernel: [  390.504154] pcieport 0000:00:1d.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, id=00e8(Receiver ID)
Feb 27 13:54:38 workstation kernel: [  390.504158] pcieport 0000:00:1d.0:   device [8086:9d1b] error status/mask=00000001/00002000
Feb 27 13:54:38 workstation kernel: [  390.504162] pcieport 0000:00:1d.0:    [ 0] Receiver Error         (First)
Feb 27 13:54:38 workstation kernel: [  390.504172] pcieport 0000:00:1d.0: AER: Corrected error received: id=00e8
Feb 27 13:54:38 workstation kernel: [  390.504180] pcieport 0000:00:1d.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, id=00e8(Receiver ID)
Feb 27 13:54:38 workstation kernel: [  390.504185] pcieport 0000:00:1d.0:   device [8086:9d1b] error status/mask=00000001/00002000
Feb 27 13:54:38 workstation kernel: [  390.504190] pcieport 0000:00:1d.0:    [ 0] Receiver Error         (First)

de novo e de novo e de novo. Esse erro costumava aparecer durante a inicialização, mas como não parecia afetar minha experiência de trabalho diário após a inicialização, eu os suprimia com o pci=nomis adicionado a /etc/default/grub e, em seguida, a execução de update-grub .

No entanto, obviamente, apenas suprimi a impressão dessas mensagens de erro, pois o log agora está cheio com elas.

Eu também tentei usar logrotate para limitar o tamanho do arquivo dos arquivos de log, mas isso não tem nenhum efeito, já que o arquivo de log está crescendo tão grande em apenas uma sessão.

Alguém tem uma ideia de como eu posso manter esses arquivos de log em um tamanho aceitável (talvez algumas centenas de MBs no máximo)? Porque agora eu regularmente tenho que excluir esses arquivos de log manualmente, a fim de evitar que ocupem todo o meu espaço em disco.

EDIT: saída de lspci -tv :

-[0000:00]-+-00.0  Intel Corporation Sky Lake Host Bridge/DRAM Registers
           +-02.0  Intel Corporation Sky Lake Integrated Graphics
           +-04.0  Intel Corporation Skylake Processor Thermal Subsystem
           +-14.0  Intel Corporation Sunrise Point-LP USB 3.0 xHCI Controller
           +-14.2  Intel Corporation Sunrise Point-LP Thermal subsystem
           +-16.0  Intel Corporation Sunrise Point-LP CSME HECI
           +-17.0  Intel Corporation Sunrise Point-LP SATA Controller [AHCI mode]
           +-1c.0-[01]----00.0  NVIDIA Corporation GM108M [GeForce 940MX]
           +-1c.4-[02]----00.0  Realtek Semiconductor Co., Ltd. RTS522A PCI Express Card Reader
           +-1c.5-[03]----00.0  Realtek Semiconductor Co., Ltd. RTL8101/2/6E PCI Express Fast/Gigabit Ethernet controller
           +-1d.0-[04]----00.0  Realtek Semiconductor Co., Ltd. RTL8723BE PCIe Wireless Network Adapter
           +-1f.0  Intel Corporation Sunrise Point-LP LPC Controller
           +-1f.2  Intel Corporation Sunrise Point-LP PMC
           +-1f.3  Intel Corporation Sunrise Point-LP HD Audio
           \-1f.4  Intel Corporation Sunrise Point-LP SMBus
    
por Raven 28.02.2018 / 08:43

1 resposta

3

A partir dos seus registros, vemos que um dispositivo no PCI 1d.0 está gerando muitos logs.

 pcieport 0000:00:**1d.0**

Com o auxílio do comando solicitado lspci -tv , podemos ver que é o seu dispositivo realtek. Eles são conhecidos por serem lentos, com bugs e não confiáveis.

1d.0-[04]----00.0 Realtek Semiconductor Co., Ltd. RTL8723BE PCIe Wireless Network Adapter

Como tal, proponho como uma solução de curto prazo, simplesmente instruir rsyslog a descartar todos esses log / erros.

Configure rsyslog para ignorar todas essas mensagens, como:

Adicione como a primeira linha do seu /etc/rsyslog.conf :

:msg, contains, "0000:00:1d.0:" ~

Depois de adicionar esta linha, você precisa reiniciar o serviço rsyslog , caso contrário, ele só estará funcionando na próxima reinicialização.

sudo service rsyslog restart

Veja Como descartar mensagens indesejadas

Note that the statement is placed on top of rsyslog.conf. This makes it being executed before any other action statement. So each message received will be checked against the string and discarded, if a match is found.

Quanto a uma solução de longo prazo, compre outra placa Wifi PCIe compatível com a marca e o modelo do seu notebook. Realtek é muito buggy.

Relacionados: Problemas de Wi-Fi usando o ASUS USB Adaptador N13

Notas adicionais:

  • 8086: 9d1b é o seu controlador PCI;
  • Também sugeri como uma pista para o OP, mas ele não resolveu a questão, tentando os parâmetros% kernel epci=nomsi e pci=noaer . Veja a severidade do erro PCIe Bus ;
  • À medida que os arquivos de log são rotacionados, não se esqueça de excluir seus registros antigos, se você não precisar manter histórico de registros;
  • Uma possível solução de médio prazo é usar um stick wifi e colocar o blacklist do módulo wifi do realtek;
  • Eu adicionei as tags [realtek] e [rsyslog] à pergunta.
por 28.02.2018 / 12:29