Uma capa de álbum incorporada em um arquivo de áudio é o exemplo mais comum do que você deseja. Você pode verificar com ffprobe
- parte de ffmpeg
- se a imagem incorporada é a faixa de "vídeo" do arquivo.
Um reprodutor de vídeo como mpv
reproduz o áudio com a imagem como uma imagem estática, que eu assumo é o que você deseja.
Portanto, a resposta mais fácil é tratar sua imagem como uma capa de álbum e lidar com a tarefa com um dos programas de marcadores de música. Eu recomendaria EasyTAG
para isso.Você pode arrastar e soltar o arquivo de imagem para o arquivo de áudio realçado e salvar os resultados.