Como configurar um sistema rápido com o Ubuntu instalado em uma estação de trabalho para computação científica [closed]

5

Estou encarregado de uma poderosa estação de trabalho para suportar as necessidades de computação científica em nosso centro de pesquisa. Decidimos rodar o Ubuntu 16.04 LTS na máquina. No entanto, não faço tarefas semelhantes há anos. A última vez que eu estava gerenciando um cluster / estação de trabalho estava usando o CentOS nos velhos tempos. Estou escrevendo para pedir seu conselho principalmente por duas coisas:

  1. Como devo configurar o espaço de armazenamento limitado para o melhor desempenho? A máquina possui HDD de 512 GB de desempenho incompatível + 2 TB HDD. Pode ser expandido para ter mais PCIe-SSDs e HDDs no futuro, e teremos 10 a 20 usuários para usar o computador. Devo usar o LVM para todas as partições com btrfs filesystems para instantâneos rápidos? Eu acho que o LVM e btrfs são bons para futuras expansões de disco com bom desempenho, mas podem aumentar a complexidade do sistema, dado que um /home ou diretório raiz pode ser medido em SSDs normais de 2.5in e SSDs PCIe m.2 mais rápidos.

  2. Qual software é bom para o gerenciamento de submissão de trabalhos, já que a máquina tem 28 núcleos atualmente com 1 GPU para CUDA (Matlab e outros) e programação de propósito geral? Podemos instalar mais GPUs no futuro. Pode ser bom fazer a rede com outros computadores como um mini cluster, mas, atualmente, ainda não temos o plano aberto.

Abaixo está meu plano inicial para agrupar as partições, e eu ouvi que o Slurm é bom para o gerenciamento de filas de tarefas. O PBS / TORQUE também é bom para o gerenciamento de filas de tarefas. Não tenho certeza qual é o melhor para o meu caso.

SSD de 512 GB ( /dev/sda ) :

/boot , ext2, 250MB

/swap , LVM-SWAP, 10 GB (32 GB de memória instalada, a ser atualizada com placas SSD PCIe-NVM mais tarde)

/ (raiz), LVM-btrfs, 100 GB (será usado para instalar muitos softwares compartilhados)

/home , LVM-btrfs, ~ 400 GB

disco rígido de 2 TB (/ dev / sdb) :

/backup , LVM-btrfs, 1TB (também temos um servidor de disco de backup remoto)

/data , LVM-btrfs, 1TB

Neste estágio, não tenho certeza sobre a estratégia de backup nem sobre a estrutura do arquivo. Dado o espaço limitado do SSD, reduzimos o /home para estar apenas no SSD para dar aos atuais 10 usuários espaço suficiente para os programas e deixar espaço para futuras expansões de cartões PCIe NVM SSD. Então, se você tiver alguns pensamentos sobre os outros aspectos da configuração da estação de trabalho, não hesite em postar.

Obrigado antecipadamente!

    
por Xiaodong Qi 12.11.2016 / 09:51

1 resposta

0

Supondo que você possa precisar de virtualização, de alguma forma, observe o Proxmox, pois ele é um excelente sistema de gerenciamento, provisionamento e orquestração de VMs. O Proxmox suporta o usuário mgmt, o mgmt de rede e o cluster mgmt também, e há tanto o desenvolvedor strong & amp; comunidades de usuários.

O BTRFS ou o ZFS fornecerão recursos de captura instantânea / restauração. Cada um tem seus próprios Plus / Minuses. BTRFS funciona muito bem para os meus servidores .. só não use sua capacidade Raid5 como sua quebrada. Eu uso o BTRFS Raid10.

Backups para um grupo tão grande de usuários & amp; trabalho sério não deve estar na mesma máquina física.

Desenvolva uma política de segurança para usuários & amp; proteção de rede também.

    
por bmullan 13.11.2016 / 13:39