Ubuntu 14.04 / Apache 2.4 causa falha no kernel na instância média do Amazon EC2

2

Recebemos uma falha perturbadora ao executar 'apachectl stop'. Sistema geral:

$ uname -a 
Linux www.example.com 3.13.0-24-generic #47-Ubuntu SMP Fri May 2 23:30:00 UTC 2014 x86_64 x86_64 x86_64 GNU/Linux

$ lsb_release -d
Description:    Ubuntu 14.04 LTS

Muita capacidade extra em disco, memória, CPU. Esta é uma instância de nuvem do Amazon EC2, sendo executada hoje às 13h de 5 de abril de 2014, região-leste-1a, instância de médio porte com 3,7 GB de mem / 2CPU. Minhas outras instâncias no mesmo VPC e mesma região estavam bem.

Eu li em outro lugar que nos kernels de hoje, você não consegue uma falha assim a menos que o hardware esteja falhando. Parece improvável que a Amazon teria hardware defeituoso na nuvem? Ou eu estou sendo pollyannish?

De qualquer forma, o despejo de dmesg (o sistema continuou a operar servindo páginas da Web e conversando com o banco de dados, mas novos processos ficaram suspensos instantaneamente, como ps e ssh ):

[27917995.400499] general protection fault: 0000 [#1] SMP 
[27917995.400515] Modules linked in: isofs crct10dif_pclmul crc32_pclmul ghash_clmulni_intel aesni_intel aes_x86_64 lrw gf128mul glue_helper ablk_helper cryptd
[27917995.400537] CPU: 0 PID: 1672 Comm: apache2 Not tainted 3.13.0-24-generic #46-Ubuntu
[27917995.400545] task: ffff8800020117f0 ti: ffff88005f012000 task.ti: ffff88005f012000
[27917995.400551] RIP: e030:[]  [] devpts_kill_index+0x13/0x60
[27917995.400564] RSP: e02b:ffff88005f013d58  EFLAGS: 00010286
[27917995.400568] RAX: dc73af5e3df7dcab RBX: ffff880003f30400 RCX: 0000000181000079
[27917995.400574] RDX: 00000000ffffffff RSI: 0000000000000002 RDI: ffff8800aab76ff8
[27917995.400579] RBP: ffff88005f013d68 R08: 0000000000000000 R09: 0000000000000001
[27917995.400583] R10: ffffea0003a01180 R11: ffffffff8144a320 R12: 0000000000000002
[27917995.400588] R13: ffff8800e87a8001 R14: 0000000000000002 R15: 0000000000000001
[27917995.400598] FS:  00007f8d8b320780(0000) GS:ffff8800ef600000(0000) knlGS:0000000000000000
[27917995.400605] CS:  e033 DS: 0000 ES: 0000 CR0: 000000008005003b
[27917995.400610] CR2: 00007f8d79aea7e0 CR3: 0000000001c0e000 CR4: 0000000000002660
[27917995.400616] Stack:
[27917995.400619]  ffff880003f30400 ffff880003f30800 ffff88005f013d78 ffffffff8144caa8
[27917995.400628]  ffff88005f013d90 ffffffff81440e47 ffff880003f30400 ffff88005f013e38
[27917995.400636]  ffffffff81443159 ffff880003f30610 ffff880003f30628 ffff880003f30630
[27917995.400645] Call Trace:
[27917995.400656]  [] pty_unix98_shutdown+0x18/0x20
[27917995.400662]  [] release_tty+0x37/0x140
[27917995.400668]  [] tty_release+0x4b9/0x600
[27917995.400678]  [] __fput+0xe4/0x260
[27917995.400684]  [] ____fput+0xe/0x10
[27917995.400693]  [] task_work_run+0xc4/0xe0
[27917995.400701]  [] do_exit+0x2ab/0xa50
[27917995.400708]  [] ? vtime_account_user+0x54/0x60
[27917995.400717]  [] ? context_tracking_user_exit+0x4f/0xc0
[27917995.400723]  [] do_group_exit+0x3f/0xa0
[27917995.400729]  [] SyS_exit_group+0x14/0x20
[27917995.400738]  [] tracesys+0xe1/0xe6
[27917995.400742] Code: 0f 1f 84 00 00 00 00 00 48 83 c4 08 b8 fb ff ff ff 5b 41 5c 5d c3 66 90 66 66 66 66 90 55 48 89 e5 41 54 41 89 f4 53 48 8b 47 28  81 78 58 d1 1c 00 00 74 0b 48 8b 05 44 bf d7 00 48 8b 40 08 
[27917995.400796] RIP  [] devpts_kill_index+0x13/0x60
[27917995.400803]  RSP 
[27917995.400811] ---[ end trace 5b24303912015285 ]---
[27917995.400815] Fixing recursive fault but reboot is needed!
    
por BaseZen 07.05.2014 / 21:01

1 resposta

0

A nuvem é composta de hardware ainda, portanto, uma falha de hardware é totalmente possível. Se você suspeitar de problemas de hardware, pare e reinicie a instância. Isso deve colocá-lo em um novo host.

    
por 09.09.2015 / 00:40