Ao elaborar um SLA, é mais importante concordar com o cliente o que ele espera (e pagar) do que você está disposto a suportar dentro das restrições do equipamento e do orçamento que você possui.
Por exemplo: um único servidor não agrupado não é adequado para um cliente que deseja 99,999% de tempo de atividade e 24 horas de serviço de plantão e 1 hora de "retorno às operações" em uma falha grave. Não é tecnicamente razoável aceitar isso e o cliente precisa entender isso.
Sim, o Windows 2003 Server é confiável e pode funcionar muito bem. Servidores de marca vêm com confiabilidade comprovada e garantias sólidas. O monitoramento regular e o TLC em um servidor podem mantê-lo por muitos anos.
Você precisa "esperar o melhor, mas planejar o pior".
Você também precisará calcular com precisão as estatísticas de disponibilidade e ter o cálculo acordado com o cliente (o tempo de inatividade de 1 hora às 2h é um "custo" diferente das 11h de uma terça-feira).
Você precisará incorporar todo o equipamento adicional necessário para manter um servidor ativo (rede, switches, firewalls, tempo de operação, backups).
Por fim, você precisará testar seus planos de contingência e manter sua infraestrutura flexível para que possa solucionar a falha de várias maneiras diferentes.