Você precisará abrir mais portas do que apenas 5060. 5060 é a porta de "controle" SIP que é usada apenas para sinalização. Outras portas são necessárias para os fluxos de mídia reais.
No caso do VoIP, você normalmente estaria usando SIP / RTP, onde o tráfego RTP usa uma ou mais portas entre 10.000 e 20.000.
Você precisará examinar o transporte de vídeo que está usando para determinar quais outras portas estão em uso.