A resposta para sua primeira pergunta parece ser "talvez":
What file types can Google index?
Google can index the content of most types of pages and files. See the most common file types.
Mas o link para tipos de arquivos comuns é todo texto.
Mesmo que você pesquisar por arquivos binários como o Windows Installer (.msi) , você pode obter um link para uma página contendo o arquivo ou um link direto para o arquivo, mas o Google quase certamente decide como indexá-lo com base no que está ao redor do link na página, em vez de baixar e decifrar os arquivos binários conteúdo.
Quanto à sua pergunta principal , recomendado pelo Google método maneira de verificar se o bot atingiu o seu site ou não é usar uma pesquisa de DNS reverso:
$ host 66.249.66.1
1.66.249.66.in-addr.arpa domain name pointer crawl-66-249-66-1.googlebot.com.
Lembre-se de que a missão do Google "é organizar as informações do mundo e torná-las universalmente acessíveis e úteis." Isso significa que eles estão constantemente inovando, tentando indexar dados não textuais de forma a torná-lo pesquisável. Para expandir a ideia do ceejayoz de que só porque não o fizeram ontem não significa que não o farão amanhã: o Google fará tudo o que puder para o conseguir amanhã!