Como foi dito acima, a sobrecarga é mínima. A troca de namespaces geralmente vem sem sobrecarga (esses campos já existem até mesmo para processos de host), então a sobrecarga principal vem dos poucos recursos extras que precisam ser criados pelo LXC, geralmente 4-5 bind-mounts, talvez um par de montagens tmpfs , dois dispositivos VETH e um dispositivo de loopback.
Como as bibliotecas costumam ser compartilhadas entre os contêineres, até mesmo iniciar o init e vários outros processos não custa muitos recursos.
Tudo o que dizer é muito difícil responder à sua pergunta :) Se você pegar um único processo e compará-lo em execução no host ou em um contêiner, a sobrecarga desse processo específico será 0. A sobrecarga real do LXC vem do pai e dos recursos adicionais do processo que o processo pode usar (dispositivos de rede, ...).
De qualquer forma, eu não fiz nenhum benchmarking louco recentemente, mas alguns meses atrás eu consegui rodar em torno de milhares de containers apache2 completos com um sistema init em uma simples caixa Pentium4 com 4GB de RAM. Esses contêineres estavam compartilhando seus rootfs para otimizar o uso da memória compartilhada, mas tudo começou bem.Ah, e sobre o limite de pid_max, não é realmente um limite, pois isso pode ser afetado até hoje em 2 ^ 64 (pelo menos em sistemas de 64 bits), então o limite de 32768 é algo do passado.