Pode variar de acordo com o protocolo, mas, como você especificou o SIP e o Skype nas tags, especificarei com base nesses termos específicos.
O SIP é baseado em sessão, portanto, uma vez que uma sessão é criada entre dois pontos (por meio de um servidor SIP), os pacotes RDP que transportam o fluxo de áudio RTP viajam apenas entre os dois pontos, portanto, se estiver em uma LAN , uma vez que o servidor SIP (onde quer que seja) inicia a conexão entre os dois pontos, ele recua até receber solicitações de um dos telefones (como uma transferência ou um bye). Os pacotes de voz neste ponto nunca sairão da LAN.
No que diz respeito ao Skype, não é SIP, é um protocolo proprietário que é de código fechado . Eu honestamente não sei como esse protocolo funciona, mas eu diria que é similar (redirecionar todo o tráfego de voz através de um servidor coloca cargas pesadas naquele servidor e aquela conexão que eu acho que custaria uma empresa muito mais do que vale a pena lidar com como há relativamente poucas vantagens em fazê-lo).