O stream da internet teria que estar vários segundos à frente do fluxo de TV, para que o jogador tivesse algum espaço de manobra para trabalhar. Isso requer um atraso no final da TV, que não está sempre presente. . Você teria que estar no controle de ambas as transmissões.
Se você pudesse fazer isso, então eu suponho que seria possível analisar o áudio chegando, para sincronização. Dependendo de como você faz isso, pode ser muito mais fácil usar as legendas.
Eu também acho que sua ideia de que a maioria das pessoas assistem TV via DVR está um pouco inflada. Mesmo quando você olha para os números da Nielson sobre isso, tenha em mente que muitos (a maioria) dos mercados não são medidos, e as pessoas escrevem todos os tipos de coisas em pesquisas. "Ei, está perguntando sobre o nosso DVR ... nós temos um certo?"