Isso dependerá até certo ponto de como o áudio contido no arquivo MP3 foi mixado. Se:
- foi mixado em estéreo e
- os vocais foram posicionados em um centro morto na imagem estéreo, ou seja, em mono e
- o resto da música na gravação tem componentes estéreo strongs,
ou
- há outro recurso exclusivo do áudio dos vocais (por exemplo, o intervalo de frequência) que permite filtrá-los sem afetar significativamente o restante da gravação
então você terá uma chance razoável de diminuir o nível dos vocais, em relação ao resto do áudio, a ponto de misturar uma nova gravação vocal irá mascará-los efetivamente.
Aqui está algum bom conselho para alguém que fez uma pergunta semelhante.