@ O link do Gnanam aponta para alguns bons conselhos, particularmente esta descrição de uma configuração de trabalho . Não vejo razão para evitar o uso do EBS, mas trate um volume do EBS como se fosse um único disco rígido em um servidor real: propenso a falhas. Assim, você vai querer um nível de RAID com boa resistência a falhas, então não RAID 0. E, dadas as suas necessidades, você quer um nível de RAID que seja rápido na gravação. Portanto, o RAID 10 em 6 a 10 volumes parece ser o melhor lugar para começar.
Quanto ao desempenho real, vai depender dos seus requisitos de indexação e do tamanho e tipo de dados que você está inserindo. O melhor da AWS é que é relativamente barato descobrir como uma certa configuração será executada. Então, o que você precisa fazer é criar alguns dados de amostra e uma maneira de simular o feed de entrada que está tentando processar (um script que insere os registros um de cada vez e grava uma instrução de log com um timestamp a cada X número de linhas, por exemplo). Provavelmente, tudo bem se os dados da amostra se repetirem ao longo do tempo para seus propósitos, mas certifique-se de que seu script possa ser executado por uma hora ou mais, pelo menos.
Agora, execute esse script em um banco de dados postgresql configurado em várias configurações do EBS, usando o snapshot ou o novo serviço Cloud Formation da Amazon. para produzir alguns pontos de partida reprodutíveis de forma confiável e medir as mudanças de desempenho à medida que você altera a configuração (e com o tempo também será importante). Você pode querer lançar configurações de volume único e RAID5 apenas para comparar.