Use o Route 53 roteamento baseado em latência com verificações de saúde ativadas . Ele aborda seus dois objetivos:
- Envia solicitações para o servidor mais rápido para o cliente
- Se um servidor parar de responder, todas as solicitações serão enviadas para o outro servidor
Se você tiver apenas uma instância por região, não precisará de nenhum tipo de balanceador de carga.
Como Michael aponta, você deve considerar o uso do CloudFront. Não vou copiar o comentário dele, mas o método dele tem vantagens sobre o método básico que descrevi acima.