Existem muitas camadas para isso. E, mais importante, muitos deles são intercambiáveis.
Por exemplo, você pode ter uma rede de cabo coaxial, uma ethernet ou um Wi-Fi no nível físico. O HTTP funciona em cima de todos, mas cada um deles tem um tratamento um pouco diferente da carga sendo enviada ao redor.
O HTTP funciona sobre outro protocolo, chamado TCP, que, por sua vez, é mais ou menos executado em cima de outro protocolo, chamado IP (atualmente em grande parte em duas variantes - IPv4 e IPv6).
Assim, o servidor HTTP registra um endereço IP (como 184.38.45.1
ou, na maioria das vezes, "qualquer"), juntamente com uma porta TCP ( 80
sendo o padrão para HTTP, mas em geral qualquer coisa de 1
para 65535
), com o sistema operacional. Agora, o servidor HTTP informa ao SO para fazer ping quando os dados (ou outra mensagem) chegarem. O SO sabe quando isso acontece, porque o driver da placa de interface de rede diz isso. E o driver da NIC é informado pela própria NIC, que na verdade tem seu próprio software para interpretar os sinais elétricos no cabo de rede (ou os sinais sem fio no ar, etc., você entendeu).
Nota lateral :
Se você quiser saber mais sobre como a NIC pode iniciar a comunicação com o driver / sistema operacional, convém consultar algumas informações básicas sobre interrupções de hardware - basicamente, o que a CPU está fazendo no momento está parado e as alternâncias de fluxo do programa a uma rotina de manipulador de interrupção - um código extremamente simples que cuida de notificar o sistema e, em seguida, retorna imediatamente o controle de volta à coisa original que a CPU estava fazendo. Na verdade, ele pode lhe responder muitas perguntas sobre o funcionamento interno do sistema operacional e do próprio computador - como um sistema operacional pode "roubar" a CPU dos aplicativos em execução e embaralhar os recursos da CPU entre diferentes aplicativos executados ao mesmo tempo, mesmo que eles não colaborem.
De volta aos negócios:
Na sua analogia manual do telefone, imagine que o seu telefone não toca realmente. Para saber se você está tendo uma tentativa de telefonema, você terá que olhar para a tela periodicamente e verificar. Para facilitar o gerenciamento do servidor HTTP (já que existem várias camadas que fazem essa verificação periódica), é possível bloquear a tentativa de verificação.
Então, ao invés de verificar, vendo que não há nada lá e checando novamente, você basicamente fica olhando para a tela o tempo todo. No entanto, você basicamente tem um sistema totalmente separado para lidar com isso (no seu caso, o centro auditivo, que verifica as vibrações do ar em busca de informações úteis, o anel), de modo que na verdade não requer sua atenção (tempo de CPU).
Isso é aprimorado ainda mais por técnicas que permitem monitorar muitas conexões de uma só vez (IOCP). Isso fica cada vez mais perto do sistema de chamadas telefônicas - você tem uma sala com dez mil telefones, mas você só se importa com aqueles que estão tocando no momento, os outros não estão tomando sua atenção.