Outros benchmarks
Encontrei uma referência interessante aqui em VPS Benchmarks. Note que eles têm grafos injustos que não incluem 0 na escala, então os gráficos são praticamente inúteis. Os números por trás dos testes parecem bons.
O teste deles compara um AWS t2.small (1 core, 2GB RAM) com um GCE n1-standard-1. As instâncias t2 não são uma ótima comparação para o padrão n1, elas têm um desempenho de CPU estonteante comparado com o GCE com CPU constante, mas é o único teste adequado que posso encontrar.
As instâncias t2 têm a reputação de ser executadas em hardware da AWS mais antigo (geração m1), enquanto as instâncias da AWS M3 / M4 que são mais recentes. O teste GCE foi feito muito mais recentemente também.
Testes individuais
Todos se referem ao teste vinculado acima.
O teste da CPU está próximo, em 3%.
A leitura aleatória do arquivo IO não está próxima. A AWS tem 24Mbps e a GCE a 1787Mbps. Eu sei que na AWS sua E / S está intimamente relacionada ao seu tipo de instância, pequenas instâncias recebem muito menos E / S do que grandes instâncias. Dada essa enorme discrepância, e os outros testes sendo aproximadamente semelhantes, eu gostaria de ver isso novamente antes de confiar nos números. Eu li que o GCE funciona muito bem com o Network I / O. Também pode ser que o teste de GCE tenha sido feito com o SSD local e o teste da AWS feito com armazenamento anexado à rede.
Outros testes de IO são aproximadamente semelhantes. Às vezes, a AWS é mais alta, às vezes a GCE é maior, mas não há um vencedor claro.
Os testes de memória são mais ou menos semelhantes, com a AWS superando o Google.
Notas
Qualquer teste único em qualquer instância de qualquer provedor pode ser considerado baixo por uma grande variedade de razões. Hardware superprovisionado, um vizinho barulhento levando mais do que sua parcela de recursos e CPU Stealing são apenas alguns exemplos.
Um bom teste usaria uma variedade de testes (CPU, E / S, memória, etc) e seria executado em pelo menos três máquinas virtuais separadas.
Conclusão
O AWS e o GCE parecem ter um desempenho aproximadamente semelhante nesses testes razoavelmente bem documentados, embora os tipos de instâncias e o hardware sejam bem diferentes.
Eu gostaria que o @StanHou fizesse testes significativamente mais robustos e bem documentados para comparar o desempenho, em vez de confiar no que poderia ser um único teste em uma única instância.