O Amazon EFS trava ao tentar listar arquivos dentro

4

Ao fazer um ls dentro de um ponto de montagem do Amazon EFS, ele simplesmente trava.

A seção de solução de problemas do EFS na solução de problemas do EFS

Menciona o seguinte:

Mount Does Not Respond

An Amazon EFS mount appears unresponsive. For example, commands like ls hang.

Action to Take

This error can occur if another application is writing large amounts of data to the file system. Access to the files that are being written might be blocked until the operation is complete. In general, any commands or applications that attempt to access files that are being written to might appear to hang. For example, the ls command might hang when it gets to the file that is being written. This is because some Linux distributions alias the ls command so that it retrieves file attributes in addition to listing the directory contents.

To resolve this issue, verify that another application is writing files to the Amazon EFS mount, and that it is in the Uninterruptible sleep (D) state, as in the following example:

$ ps aux | grep large_io.py

root 33253 0.5 0.0 126652 5020 pts/3 D+ 18:22 0:00 python large_io.py /efs/large_file

After you've verified that this is the case, you can address the issue by waiting for the other write operation to complete, or by implementing a workaround. In the example of ls, you can use the /bin/ls command directly, instead of an alias, which will allow the command to proceed without hanging on the file being written. In general, if the application writing the data can force a data flush periodically, perhaps by using fsync(2), this might help improve the responsiveness of your file system for other applications. However, this improvement might be at the expense of performance when the application writes data.

Então, verifiquei se havia algo escrito, mas a única coisa que apareceu foi

raiz 43556 0.0 0.0 124356 756 pts / 6 D + 19:15 0:00 ls - cor = auto / efs /

raiz 43558 0.0 0.0 112664 972 pts / 3 S + 19:16 0:00 grep --color = auto efs

Portanto, nada está sendo escrito para o EFS até onde eu sei. Há outras coisas que eu possa investigar como causas disso?

Eu também tentei montar o EFS em uma máquina separada apenas para verificar, eu também testei outra máquina em um AZ diferente para o outro ponto de montagem naquele AZ e vi o mesmo comportamento.

atualização:

lsof mostra:

nfsv4.1-s 113422 root cwd DIR 202,1 4096 128 /

nfsv4.1-s 113422 root rtd DIR 202,1 4096 128 /

nfsv4.1-s 113422 txt cwd unknown /proc/113422/exe

Isso desaparece quando desmontado e reaparece após a montagem.

    
por John Doe 15.11.2017 / 20:21

1 resposta

0

Dadas todas as informações anteriores, é difícil dizer exatamente o que está acontecendo. No entanto, você precisa que a montagem do Amazon EFS funcione, portanto:

Seus resultados lsof mostram o provável pseudofile no sistema de arquivos / proc. Em algum momento esse processo perdeu seu executável, e eu suspeito que ele está tentando continuar rodando. Ele desaparece quando você desmonta porque o comando lsof não consegue ver o volume e, quando você monta novamente, o comando vê esse executável perdido novamente. Este é provavelmente o processo que está riscando recursos. Quando você executa um comando ps , você vê o processo 113422? Como você não informou que outro aplicativo está em execução, você pode tentar eliminar esse processo.

Primeiro eu coloco ps -aux para ver todos os processos em execução, incluindo os processos em segundo plano, e veja se você pode encontrar o processo 113422. Em caso afirmativo, o que está sendo executado? (Ou achando que está sendo executado.) Se você se sentir à vontade para interromper esse processo, execute kill -9 113422 e pare por completo.

Tente novamente seu comando ls e ele deve ser executado normalmente. Você também pode usar o comando /bin/ls diretamente. Na verdade, como você tem muitos arquivos pequenos, eu recomendo usar esse método apenas, para que o sistema não fique pendurado esperando por um arquivo.

Quanto ao desempenho, a partir do seu comentário, parece que você escolheu o EFS devido ao tamanho irrestrito do sistema de arquivos, portanto, o EBS não era uma opção, embora pudesse proporcionar um melhor desempenho. Cada tipo tem seus prós e contras . No entanto, se você continuar tendo problemas, talvez a revitalização da decisão do sistema de arquivos ajude.

    
por 10.12.2017 / 08:41