Perguntas sobre 'cluster'

Um cluster de computador é um conjunto de sistemas conectados que trabalham juntos para que, em muitos aspectos, possam ser vistos como um único sistema.
1
resposta

o pacemaker trava ao parar

Eu instalei recentemente o marcapasso e o corosync para gerenciar um IP virtual. A coisa é que quando eu quero parar um recurso (IP virtual) em todos os nós, o comando de parada trava. [root@isis ~]# sudo pcs cluster stop --all isis: Stopp...
08.12.2014 / 07:48
1
resposta

Sobre mem e vmem

Estou trabalhando com uma máquina de cluster em execução no linux. Eu tenho um script de shell que usa mpirun para enviar meus trabalhos para a máquina do cluster. Nesse mesmo script, posso escolher o número de nós que serão atribuídos ao...
14.11.2014 / 04:18
1
resposta

Escolha do sistema de arquivos do cluster para leitura / gravação de grande número de arquivos pequenos

Estou configurando um pequeno cluster Linux para o meu laboratório. Atualmente, temos um nó de login para envio de trabalho e 3 nós computacionais, e eles são conectados por Gigabit LAN (infelizmente sem infinibandos). No começo, eu simplesme...
08.04.2017 / 15:12
0
respostas

qsub job no estado Eqw error: não pode chdir para o diretório: No such file or directory

Estou tentando enviar um trabalho em um cluster via qsub , mas ele fica preso no estado " Eqw " com a mensagem de erro: $ qstat -j 466 | grep error error reason 1: 09/18/2015 17:12:32 [1125:3453]: error: can't chdir to /export/ho...
18.09.2015 / 22:26
1
resposta

reduz o consumo de largura de banda do download de atualizações do yum

Eu tenho várias máquinas (7) rodando o fedora e gostaria de reduzir a quantidade de largura de banda externa que estou consumindo. Eu vejo que houve várias tentativas de configurar espelhos, mas esses projetos parecem mortos. Eu usei um proxy sq...
07.02.2015 / 04:16
0
respostas

Perda de sincronização do cluster Corosync / Pacemaker

Estou enfrentando um problema com o software de cluster do corosync e do marcapasso. Eu tenho dois nós virtuais (Scientific Linux 6.4) e corosync / pacemaker instalados neles: corosync-1.4.1-17.el6.x86_64 pacemaker-1.1.10-14 O arquivo de c...
11.12.2013 / 18:01
2
respostas

Memória por núcleo [fechado]

Estou usando os supercomputadores da rede fornecidos pelo Compute Canada e, na página documentação , vejo o seguinte: Estou bastante curioso - qual é o conceito de memória por núcleo aqui? Eu pensei que todos os núcleos deveriam compar...
07.07.2018 / 21:21
1
resposta

SED e PDSH: adicionando uma linha a um arquivo em um nó escravo em um cluster

Eu estou tentando adicionar uma nova linha contendo GATEWAY=10.0.10.1 ao arquivo /etc/sysconfig/network em cada um dos 32 nós escravos em um cluster. Eu li esta postagem sobre como inserir uma linha com sed . Isso funciona para eu ad...
10.07.2014 / 09:42
1
resposta

Recurso do MySQL DRBD com falha ao iniciar o PaceMaker + Corosync

Então, cheguei ao ponto de ter todos os serviços em execução quando configurei o cluster, mas depois da reinicialização estou recebendo o seguinte: Full list of resources: virtual_ip (ocf::heartbeat:IPaddr2): Started node1 webser...
04.06.2016 / 07:25
1
resposta

Execute o qsub no cluster via ssh

Estou configurando um sistema que gera automaticamente trabalhos de computação em uma máquina local (Linux), copia-os para um cluster e os envia para o sistema de enfileiramento. Eu tento evitar a necessidade de scripts que são executados no...
18.09.2015 / 17:39