O MIPS é uma arquitetura "RISC" ou "load-store".
A RAM costumava ser tão rápida quanto as CPUs. Então, as pessoas escreveriam programas que usariam RAM como armazenamento intermediário ou temporário. CPUs iniciais tinham apenas alguns registros devido a isso (ou seja, 6502, Z80 - o 6502 só tinha 3 registradores de propósito geral. Alguns processadores, como o TMS9900, usavam RAM como registradores). Isso fez com que as CPUs usassem menos transistores, o que significa que eles eram mais baratos, mais fáceis de obter bons rendimentos, mais fáceis de desenvolver (nenhum design de chip baseado em CAD nos anos 70 ...)
A RAM é tão rápida quanto a CPU deixou de ser verdadeira por volta de 1985 e só piorou.
O RISC passou a ser parcialmente para resolver isso (isso foi antes que o cache da CPU fosse comum ou grande como é hoje) - por ter um monte de registros, a RAM lenta pode ser evitada muito tempo para resultados de cálculos intermediários.
Reduzir os registros disponíveis significa que ele precisa ir para a RAM mais lenta com mais frequência para esse fim.
Não sei exatamente por que 32 foi selecionado como um "ponto ideal" - além dos 5 bits e sei que os opcodes MIPS têm 3 campos de 5 bits, o que significa que são fáceis de decodificar (outro atributo de "RISC" filosofia) - e é realmente 31 como o primeiro registro sempre retorna 0.