Como foi dito anteriormente nos comentários, o h.264 é um codec melhor (como em compactos melhores) que o xvid, então com todas as outras coisas sendo iguais (qualidade, framesize, framerate etc.) o xvid sempre produzirá arquivos maiores. o lado positivo do xvid é que ele consome menos CPU do que o h.264, e é por isso que os media players mais baratos podem usá-lo.
Por exemplo, o XBMC no xbox original (que tinha uma CPU de arquitetura PIII rodando a 733 MHz) poderia ser coagido a reproduzir conteúdo HD de 720p, mas apenas se o codec fosse leve o suficiente e com sinalizadores muito específicos. isto era tipicamente xvid como h.264 mesmo em resoluções de SD era geralmente muito para o PIII velho pobre. nas resoluções SD, um típico programa de TV Q 45 min, aceitável, pesa em torno de 350 Mb, mas em h.264 seria em torno de metade disso.
Para sua melhor aposta, codifique novamente os vídeos com a mesma res do dispositivo (mas mantendo a qualidade), assim você não estará perdendo largura de banda em imagens que serão reduzidas no tempo de reprodução de qualquer maneira. - reduzir pela metade a resolução em qualquer direção (por exemplo, 1280x720 - > 640x360, conforme mencionado acima) reduzirá a largura de banda necessária (e o tamanho do arquivo resultante) para 1/4.