Se você estiver no computador (ou celular), não deve importar quem é a pessoa do outro lado do telefone. O mesmo software que grava vídeo também grava áudio e, em seguida, usa uma ferramenta como VLC ou ffmpeg, você deve conseguir extrair apenas o áudio do arquivo e descartar o vídeo.
Esta string é um exemplo do comando para o ffmpeg extrair o áudio de um formato de vídeo suportado (encontrado via google aqui ):
ffmpeg -i “whatever.format” -vn -ac 2 -ar 44100 -ab 320k -f mp3 output.mp3
Para Android, existem vários programas de screen-cap que funcionarão da mesma forma, o que pode ou não exigir raiz. Opções não-root parecem geralmente exigir depuração USB e um computador host para capturar o vídeo e o áudio (que você alimentaria através do ffmpeg como acima).
ATUALIZADO com informações gerais sobre software:
Primeiro, as solicitações de software não são incentivadas porque o software muda rapidamente e as recomendações são baseadas na experiência pessoal, que geralmente é específica e possivelmente não é amplamente aplicável. Você deve considerar uma pesquisa pessoal no Google como o melhor lugar para começar a procurar o software certo para você.
Levando isso em conta, eu não tenho muita experiência com gravação de tela em comparação com alguns, mas eu uso OBS para gravar minha tela de PC para transmissão de jogos de vídeo. Ele funciona da mesma maneira que simplesmente gravar em um arquivo, a partir do qual o comando acima pode ser executado para extrair o áudio.
Se você quer tentar uma solução somente de áudio, você pode começar com o VLC player, mas eu acho que é temperamental trabalhar com algo difícil e mais difícil do que reproduzir arquivos de vídeo, mas a capacidade é lá.