Se você tiver sorte e seu autor existir no wiki E o nome dele / dela existir lá apenas uma vez (não ambíguo), você poderá usar essa abordagem:
$ cat mywiki.sh
NAME=$(echo $@ | tr " " "_")
wget -O $NAME.html https://en.wikipedia.org/wiki/$NAME
lynx -dump $NAME.html > $NAME.txt
dataurl=$(awk 'sub(/.*www.\wikidata\.org/, "http://wikidata.org") {print; exit}' $NAME.txt)
lynx -dump -nolist $dataurl > $NAME.dat
Dessa forma, você terá o código html da página, um txt com a mesma informação, mas sem tags html e um dat com os dados principais do autor (e a página wiki) nas linhas de fatos. Outro script de filtro pode ser escrito para filtrar esses arquivos e escrever uma tabela csv / html que, quando aberta, é fácil ter uma visão geral do que deve ser pesquisado manualmente.