O arquivo robots.txt precisa estar no diretório de nível superior do seu servidor da web. Se o seu domínio principal e cada subdomínio estiverem em vhosts diferentes, você poderá colocá-lo no diretório de nível superior de cada subdomínio e incluir algo como
User-agent: *
Disallow: /
O local em que o robots.txt está localizado depende de como você acessa um site específico. Dado um URL como
http://example.com/somewhere/index.html
um rastreador descartará tudo à direita do nome de domínio e adicionará o robots.txt
http://example.com/robots.txt
Então você precisa colocar seu arquivo robots.txt no diretório apontado pela diretiva DocumentRoot para example.com e não permitir o acesso a / algum lugar que você precisa
User-agent: *
Disallow: /somewhere
Se você tiver subdomínios e acessá-los como
http://subdomain.example.com
e você quer impedir o acesso a todo o subdomínio, então você precisa colocar seu robots.txt no diretório apontado pela diretiva DocumentRoot para o subdomínio, etc.