Duas coisas, 1) limitar a taxa em sua API para clientes pagantes e usos de nível gratuitos. 2) Um padrão de arquitetura da AWS para isso seria enfileirar as mensagens e dimensionar os trabalhadores com base no tamanho da fila. Você pode até ter filas separadas para usuários pagos e usuários gratuitos. Dessa forma, os funcionários verificam as filas pagas primeiro / com mais frequência do que as filas gratuitas.