O XvBA é o equivalente da ATI VDPAU. As mesmas restrições se aplicam: nem todos os media players usarão aceleração (libVA).
Veja o SDK do stream para suporte ao OpenCL. Eu não brinquei com isso, mas o sentimento geral é que o CUDA é mais maduro que o OpenCL para GPGPU no momento (embora naturalmente limitado por não ser um padrão neutro de fornecedor). Por outro lado, como você diz, a ATI tem a vantagem no desempenho agora.
Eu não vi uma placa da série 58xx equipada com apenas 512MB de RAM disponível.