Quão comuns são as falhas no fornecimento de energia em comparação com falhas no disco rígido?

2

Meu webhost oferece dois tipos diferentes de opções de alta disponibilidade para servidores dedicados:

  1. Discos rígidos redundantes (RAID1)

  2. Discos rígidos redundantes (RAID1) mais fonte de alimentação redundante

Quão comum é uma falha na fonte de alimentação em comparação com a falha do disco rígido? Eu sei que não é possível saber os números exatos sem saber o hardware exato, mas os números do estádio são bons o suficiente para mim no momento.

Obrigado,

Adrian

    
por Adrian Grigore 10.01.2011 / 17:48

5 respostas

4

Eu geralmente vejo discos rígidos falhar muito mais do que fontes de alimentação. Em qualquer ano, provavelmente substituirei 20 ou 30 discos rígidos e talvez apenas 3 ou 4 fontes de alimentação. Uma coisa a notar sobre fontes de alimentação redundantes, se eles são apenas redundantes, é bom, se eles estão balanceando a carga + redundante é incrível. Além de um par de acessos diretos, em diferentes clientes, eu nunca precisei me preocupar com fontes de alimentação redundantes / com balanceamento de carga indo mal. Há algo sobre o balanceamento de carga que é feito que realmente ajuda a manter as fontes de energia saudáveis. Com frequência, substituí servidores inteiros antes de substituir as fontes de alimentação quando eles estão com carga balanceada.

    
por 10.01.2011 / 17:51
7

Um dos maiores fatores aqui é o condicionamento da energia antes que ela chegue às fontes de alimentação. Hardware do tipo servidor tende a ser protegido por UPS's e isso geralmente parece prolongar a vida útil da fonte de alimentação, pois obtém uma onda senoidal muito mais limpa e é geralmente submetido a muito menos soluços etc. Na maioria das vezes, a fonte de alimentação fãs) em um servidor falhará quando o servidor estiver sendo desligado. As fontes de alimentação e os ventiladores que funcionam sem parar por anos, de repente, desistem do fantasma assim que são desligados, e se recusam a ligar novamente. Se uma fonte de alimentação estiver falhando enquanto ainda estiver ativa, ela pode fazer com que o servidor pareça aleatoriamente congelar ou agir de forma estranha e parar de responder.

Discos rígidos parecem falhar aleatoriamente e pouco ou nada percebem. O RAID1 é uma solução decente (o RAID6 é melhor, você obtém mais capacidade de suas unidades e pode suportar duas falhas de uma só vez). O problema com o RAID é que você precisa ter unidades idênticas para substituir as que falharam, e elas podem ser difíceis de encontrar após o fato, por isso é recomendável que você compre as unidades de substituição junto com as unidades originais e as tenha em mãos . Ao alugar servidores dedicados de hosts da Web, eles alegarão ter feito isso, mas em algum momento eles construirão seus servidores mais novos com unidades diferentes e, eventualmente, ficarão sem as unidades usadas pela matriz, o que pode significar que você está sem sorte Hot-swap quando chegar a sua hora. Além disso, o Google fez uma extensa pesquisa sobre discos rígidos, eles descobriram que os drives morrem quase imediatamente (no primeiro mês) ou duram alguns anos, mas drives idênticos tendem a falhar na mesma época. O RAID6 mostra sua vantagem. (A desvantagem é que requer mais drives e um controlador mais caro)

Se você puder pagar, obtenha tudo redundante. Se você não puder, pergunte a si mesmo novamente se não puder pagar.

    
por 10.01.2011 / 18:11
3

Em meus 15 anos de experiência com servidores Dell e HP, posso dizer que você pode medir o número de unidades com falha por ano, enquanto, por outro lado, é possível medir o número de anos entre falhas na fonte de alimentação.

    
por 10.01.2011 / 19:30
-1

A falha pode ocorrer a qualquer momento - e sem conhecer o fabricante das fontes de alimentação e / ou discos rígidos, é impossível ter certeza. Mesmo sabendo que os números são apenas falhas médias podem ocorrer a qualquer momento. Você precisa avaliar as opções e decidir se elas valem o (s) custo (s).

    
por 10.01.2011 / 17:50
-1

Depende de quanto tempo de inatividade você pode pagar.

Se um único disco rígido ficar inativo, no RAID1 você ainda está ativo e funcionando.

Se uma única fonte de alimentação cair, seu servidor estará inativo até que o suprimento seja substituído.

Sim, as fontes de alimentação em data centers decentes tendem a durar muito tempo, possivelmente excedendo a vida útil do servidor. Ainda é um risco embora. Além disso, há uma questão de quanto tempo demorará a substituição - o centro de dados empilhará as peças sobressalentes, ou terá que ser encomendado ou algo assim.

Existem estimativas de disponibilidade para esses tipos de coisas. Eu acho que o datacenter deve fornecer apenas uma estimativa do tempo de atividade que você recebe pelo preço, em vez de tentar envolvê-lo em uma discussão técnica sobre como alcançá-lo.

Em geral, no entanto, se você puder ter um tempo de inatividade inesperado do servidor de 30 minutos (se o data center acumular suprimentos) até três a cinco dias úteis (ou o que for necessário para obter um novo pedido e entregue) , então não há necessidade de fonte de alimentação extra. Se você preferir não considerar, se o preço é justo por ter se protegido contra isso. Em geral, fontes de alimentação extras não devem ser muito caras.

    
por 10.01.2011 / 19:36

Tags