O software pode acessar o conteúdo da tela por outros meios além de usar um dispositivo ótico (ao fazer uma "captura de tela", isso se torna óbvio). Esta tecnologia existe há algumas décadas e, como você diz corretamente, pode ser usada para espionagem.
Mas não há câmera envolvida.
Adicionado - citando a Wikipédia:
The first screenshots were created with the first interactive computers around 1960