Oracle: 1 Servidor Grande vs. 2 Servidores Menores?

Question

Oracle: 1 Servidor Grande vs. 2 Servidores Menores?

#1 resposta do (5 votos)
#2 resposta do (3 votos)
#3 resposta do (-1 votos)

6

Estamos nos estágios de planejamento da configuração do ambiente de produção do Oracle 10gR2. Nosso orçamento nos dá a capacidade de comprar duas licenças de processador do Oracle DB Standard Edition. Nós temos experiência mínima com a Oracle, então eu vou adiar para qualquer um que a tenha usado. Estamos tentando decidir se devemos configurar uma única caixa quad-core dupla ou duas caixas quad-core individuais em uma configuração RAC.

Nosso banco de dados agora tem cerca de 60 GB e, no nosso pico, teremos até 150 usuários simultâneos. A maioria das coisas grandes é feita por processamento em lote à noite.

Meu instinto me diz que ter 2 caixas em uma configuração RAC não pode ser uma coisa ruim, pois fornece uma solução de failover de hardware verdadeira. BD armazenado em um LUN compartilhado em uma SAN via iSCSI. Além disso, se precisarmos adicionar capacidade, já temos caixas que podem ser atualizadas com procs extras (suponho que com tempo de inatividade zero, já que ela está configurada em uma configuração do RAC) se adicionarmos licenças extras ou RAM.

O RAC tem alguma penalidade de desempenho? Isso adicionará latência extra? Existe alguma vantagem real para ter caixas de processador duplo executando esses sistemas? Se construirmos as caixas do Oracle com hardware especial: placas de hardware iSCSI, TOE NICs, estas caixas serão sólidas? Estamos implantando no Windows de 64 bits.

Então, o que você faria? Uma caixa ou duas?

hardware oracle infrastructure

por nvahalik 19.05.2010 / 13:48

3 respostas

5

Mantenha a simplicidade, se possível. Uma caixa é melhor que a maioria dos aplicativos de banco de dados, a menos que você tenha motivos específicos, como desempenho.

É muito menos provável que a falha de hardware reduza o tempo de inatividade do que algo interrompido devido a um erro de configuração. A configuração mais simples geralmente será compensada por ter menos modos de falha. Você pode descobrir que, na prática, você obtém um sistema mais confiável com apenas um servidor e um banco de dados replicado simples em uma máquina em espera.

Não faça um SLA mais restrito do que realmente precisa e não crie um sistema com complexidade adicional para obter um SLA não suportado por todos os aspectos do software, operações e hardware.

Uma visão ligeiramente diferente da confiabilidade de "cinco noves".

Sem dúvida, seu fornecedor reivindicará algumas estatísticas de confiabilidade impressionantes para o produto. Como um contador, aqui está um take 'nines' relacionando vários níveis de SLAs ao que é realmente necessário para alcançá-los na prática:

Dois noves (99%) se traduzem em um período de 24 horas de recuperação de desastres e podem ser relevantes para aplicativos como sistemas de data warehouse em que o sistema não suporta diretamente os processos operacionais. Este nível de serviço pode ser alcançado restaurando o sistema a partir de backups.
Três noves (99,9%) equivalem a uma janela de DR de 4 horas e são realmente tudo o que é necessário para a maioria dos aplicativos de linha de negócios. Esse tipo de estratégia de recuperação de desastres pode ser obtido com replicação de envio de logs simples e um servidor em espera. Muitas vezes, a simplicidade desse tipo de arquitetura significa que ela possui relativamente poucos modos de falha baseados em configuração e alcança uma confiabilidade consideravelmente melhor na prática. Há vários exemplos de aplicativos 4GL de dois níveis que atingem uptimes contínuos de meses ou anos com esse tipo de configuração.
Quatro noves (99,99%) podem ser visualizados como uma janela de DR por alguns minutos e precisam de uma arquitetura hot standby ou hot failover. Atingir esse tipo de SLA na prática é bastante difícil e normalmente requer um software projetado para isso. Ironicamente, a complexidade adicional das arquiteturas de N camadas agrupadas abre uma superfície muito mais ampla de modos de falha devido à má configuração ou deslizes no gerenciamento de mudanças.

Deve-se notar que erros de configuração e gerenciamento de mudanças ruins são as maiores causas de falhas. tempo de inatividade não programado nas operações do data center e têm muito mais probabilidade de causar uma interrupção não programada do que a falha de hardware em um servidor.
Cinco noves (99,999%) exigem não mais do que alguns segundos de tempo de inatividade não programado a cada ano. Esse tipo de SLA coloca você no domínio de hardware e software especializados criados para tolerância a falhas. A implementação desse tipo de SLA é dispendiosa, requer uma plataforma específica, como um mainframe e pessoas com habilidades especializadas que a maioria das empresas não possui internamente.

A maioria das pessoas que reivindicam 99,999% de SLAs estão cheias de merda, q.v. Microsoft, Accenture e Bolsa de Valores de Londres .

por 19.05.2010 / 14:32

-1

Se o dinheiro é um problema, sugiro strongmente outra solução RDBMS.

O RAC e o DG são muito difíceis de configurar e manter conforme indicado. Você realmente precisa da experiência para gerenciá-lo. Você precisa de SCANs, VIPs, HB e HBA, de preferência.

Além disso, recomendo que você fique longe do Windows para Oracle.

Os dados na SAN também precisam ser RDM e não um armazenamento de dados.

por 17.04.2015 / 17:43

Tags hardware oracle infrastructure

Qual é o número máximo de virtualhosts que o Apache pode manipular? Tráfego idêntico

score 3 · Accepted Answer

Duas coisas que eu consideraria com cuidado:

1) O suporte 10gR2 já está começando a cair no penhasco de manutenção. Em cerca de um ano, será muito caro obter patches, e a Oracle já declarou que os últimos patches públicos serão lançados no verão de 2010. Existe algum motivo para você não estar usando a versão 11 na criação de um novo servidor?

2) O RAC / Data Guard é realmente doloroso para configurar e manter. Não apenas requer licenças Enterprise (muito mais caras que a licença padrão), seu sistema operacional de servidor também deve ser a edição Enterprise e ser configurado em um cluster de janelas.

Pessoalmente, se você pode tolerar o potencial de uma janela de tempo de inatividade / perda de dados em potencial, você está muito melhor com a caixa única, o ideal é ter um servidor de "espera" que possa ser rodado. Estas são apenas as minhas opiniões, e tenho certeza de que elas podem ser disputadas, mas realmente um banco de dados de 60 GB com 150 usuários de pico não é mais tão grande. A caixa dual quad-core provavelmente será dimensionada melhor que a configuração RAC, certamente, se você colocasse o dobro da quantidade de RAM na caixa individual.