Confiabilidade do servidor de montagem em rack por nome de marca e fator de forma

1

Nossa empresa opera sites de comércio eletrônico (milhares) em dois clusters em dois data centers separados.

Basicamente, tudo o que precisamos para operar são nós de servidor montáveis em rack. Cada nó precisa de:

1.) 4 ou 8 núcleos 2.) 32 gb de ram 3) 1 disco sata de 250 gb 4.) 2 portas, Gigabit, adaptadores Ethernet 5.) Capacidade de inicializar o Windows XP Pro

Isso. Nós rodamos cerca de 40 nós em um cluster totalmente redundante, sempre ativo (esperamos que!) (Escrevemos a parte de clustering)

Anteriormente, comprávamos nossos sistemas whiteboxed (basicamente, tinha uma pequena loja personalizada para construir nossos servidores (supermicro) para nossas especificações).

Esse esquema estava funcionando bem até nossa última rodada de compras de nós. Fora da última rodada de compras de nós tivemos uma super alta taxa de falhas (30% falharam em 6 meses). Nenhum motivo, PSU ruim, memória ruim, mobo frito, etc.

Minhas perguntas são estas:

Será que teremos uma confiabilidade mais consistente se comprarmos de um fornecedor de marca (IBM / DELL / HP) ou se estivermos basicamente na mesma porcaria de confiabilidade em que estávamos antes? Lembre-se, estes são servidores low-end. Nós não vamos fazer a transição para um mainframe ou qualquer coisa exótica.

A nossa confiabilidade varia com o fator de forma dos servidores? Ou seja, os servidores 2u serão mais confiáveis do que os de alta densidade, 2 nós em um servidor de 1 u?

Alguém lá fez a transição de servidores de caixa branca para servidores de marca (ou modificou fatores de forma) e tem uma história para contar?

    
por SvrGuy 28.12.2009 / 23:29

6 respostas

3

Os nomes das marcas, em geral, tendem a serem mais confiáveis do que os whiteboxes (embora o supermicro não conte como "caixa branca" no meu mundo), mas você ainda terá uma corrida ocasional má sorte com o hardware das marcas de nome. O que você tende a obter, no entanto, se você tem um grande volume de compras e história com uma das crianças maiores, é uma solução rápida para corrigir esses tipos de problemas. Se você receber um monte de placas-mãe de um fornecedor de whiteboxs, há uma chance limitada de que elas tenham uma pilha de peças sobressalentes para substituí-las, enquanto um grande nome poupará seus ouvidos - e a longo prazo, leal clientes (ou seja, "vacas em dinheiro") receberão esse estoque primeiro.

Em última análise, porém, é o hardware do computador, e esse é o motivo pelo qual executamos extensos testes de burn-in em todo o hardware recebido. Isso acontece com uma regularidade alarmante quando você entra no gerenciamento em larga escala, e tê-lo falhando no rack de teste é uma opção muito melhor do que falhar na produção (mesmo que você faça tenha sistemas redundantes em massa) ).

Além disso, "executa o XP Pro" - você está falando sério?

    
por 28.12.2009 / 23:57
2

altere o construtor, mas mantenha a marca.

Realmente, o hardware da Supermicro é muito bom. Se você está tendo taxas de falha tão altas, eu primeiro suspeito que os caras da build estão bagunçando tudo.

    
por 28.12.2009 / 23:40
0

A Supermicro é uma marca muito confiável, desde as placas-mãe até as soluções completas.

Um bom construtor deve apoiar seu trabalho e ajudá-lo, no entanto, na medida do possível. Ir com uma grande marca como a Dell e a HP vai te dar a mesma coisa.

Quanto ao tipo de configuração. Quanto mais calor você tiver em um ponto, maior a taxa de falha. Então, 2 nós em um 1u vão adiar mais calor do que 1 em um 2u. Se você tiver resfriamento suficiente em seu rack, isso não deve ser um fator, apesar de tudo.

    
por 28.12.2009 / 23:54
0

Uma coisa boa sobre a Dell é que eles constroem seus servidores para especificações e eles fazem isso em um ambiente muito limpo e agradável - isso aumenta a longevidade de seus servidores. Na minha experiência, nunca abrir um servidor aumenta a longevidade. Eu diria que, se o servidor funcionar depois do primeiro ano, é provável que ele continue trabalhando por muito tempo. Além disso, você deseja manter seus servidores em um bom datacenter que forneça um bom ambiente tanto eletricamente quanto fisicamente. Temperaturas constantes importam - temperaturas variáveis mata o hardware muito mais rápido.

Quanto ao formfactor, qualquer fornecedor decente, como as marcas bem conhecidas, consruta seus sistemas de maneira a negar a maioria dos efeitos devidos ao formfactor. Pessoalmente eu digo que não importa, embora isso não seja inteiramente verdade. A Dell, a HP e a IBM são bem conhecidas pelo design de cada bladecenter. :-) Mas eu ouso dizer que eles são todos muito bons de qualquer maneira, então no final do dia os seus planos de substituição de hardware são importantes e o TCO, tanto quanto um corp sério.

Mantemos a Dell por causa do fato de que mais barato do que a IBM e a HP têm, em minha experiência, taxas de falha muito baixas porque distribuem seu material (construção para especificação e envio). Isso também me poupa um monte de tempo. A última vez que comprei a HP, comprei uns 30 blades com discos, armazenamento, etc. Foi entregue como algumas caixas de 316. A Dell enviaria mais como 10. :-) Eu não gosto de gastar três horas de hardware de unboxing, então tenho para arrastá-lo para o datacenter e obtê-lo em racks (porque esse é o único local seguro para deixar o hardware de qualquer maneira).

Conforme a temperatura vai, eu olho para os processadores xeon da série 55xx, especialmente as variantes L. Eles são altamente eficientes em termos de energia, geralmente operando a 60 watts ou por aí.

E, hehe, sim, o que é isso com o XP? Você está executando seus servidores web no XP pro? : -)

    
por 29.12.2009 / 02:15
0

O ponto de venda para mim ao comprar hardware de grandes OEMs é o fato de que, ao contrário de pequenos fornecedores, grandes OEMs constroem milhares de máquinas todos os dias e têm seu processo de fabricação / montagem ajustado a uma ciência. Eles têm fabricantes de peças e engenheiros à sua disposição e têm depósitos de peças e técnicos de serviço em todas as principais áreas metropolitanas. Não é apenas o equipamento "testado em estrada" antes de ser entregue a você, ele vem com milhares de horas de experiência e engenharia por trás dele. IMHO isso se traduz em confiabilidade, estabilidade e consistência.

    
por 29.12.2009 / 04:28
0

Uma coisa que não gosto no hardware de baixo custo é a ventilação. Com servidores de alta densidade 1 ou 2U, os ventiladores e muitos deles são críticos, assim como as zonas térmicas. Os servidores IBM / HP / Dell têm essa tecnologia, e eles também têm inúmeros sensores de temperatura / velocidade do ventilador e software de gerenciamento que o alertarão se algo estiver fora de sintonia.

Se você já tem tudo isso coberto, não me concentro em mudar de marca de hardware.

A maioria dos bons servidores tem uma temperatura de entrada de até 95 graus F, mas pode ficar muito mais rápida do que em um rack ou gabinete com pouca ventilação.

    
por 29.12.2009 / 06:02

Tags