Eu quero criar um vídeo de apresentação de slides com música de fundo automaticamente a partir de uma pasta contendo 1000 subpastas, na qual há 1 imagem e 1 arquivo de texto servindo como texto no slide de imagem.
Então eu teria
Pic1 + Pic2 + Pic3 + Pic4 + ... + Pic1000 ao longo da linha do tempo como slides, cada slide terá uma caixa de texto contendo palavras do arquivo de texto na mesma subpasta da foto.
A estrutura da pasta é
//folder
//subfolder1
pic1.png
text1.txt
//subfolder2
pic2.png
text2.txt
Existe algum software ou biblioteca de programação que me permita fazer isso?
Eu sei que existem bibliotecas python que manipulam imagens com estouro de texto. Mas isso requer decidir a posição do pixel do texto e provavelmente requer o cálculo do tamanho da imagem / tamanho da caixa de texto / tamanho da fonte / etc, o que eu não estou realmente familiarizado. E uma coleção de fotos também não entra em vídeo automaticamente. Então, alguma abstração de nível mais alto seria legal.