Tivemos um problema semelhante, depois de termos levantado a chamada do PSS com a Microsoft e investigado em profundidade a questão que definimos na seguinte possível causa e resolução.
Causa:
A causa provável dos sintomas deve-se a discos / lun nos quais os bancos de dados do usuário são colocados com problemas graves de resposta de E / S; isso faz com que o ponto de verificação automático nos bancos de dados do usuário demore muito para ser concluído.
Agora, o ponto de verificação no tempdb ocorre apenas quando o log do tempdb fica 70% cheio e também tem uma prioridade mais baixa do que os pontos de verificação do banco de dados do usuário. Portanto, efetivamente quando o ponto de verificação automático no banco de dados do usuário é emitido e está tentando concluir, devido ao uso intenso do tempdb, o arquivo de log do tempdb é preenchido rapidamente; com 70% de uso de log, o ponto de verificação tempdb ocorre, mas é enfileirado atrás do ponto de verificação do banco de dados do usuário.
No tempo que leva para o ponto de verificação do banco de dados do usuário concluir o arquivo de log do tempdb sendo preenchido e, se o crescimento automático estiver definido, o arquivo de log aumentará quando ele exigir mais espaço. Essa é a razão pela qual o arquivo de log continua crescendo.
Em resumo, a causa raiz mais provável para os sintomas que você descreve é devido à fraca resposta de I / O dos discos / lun para o seu usuário e / ou banco de dados tempdb / arquivos de log.
Solução:
Trabalhamos em torno do problema enquanto resolvemos o subsistema de E / S configurando um alerta que disparou quando o arquivo de log tempdb ficou cheio em 75% e em resposta executou um trabalho que forçou um manual "CHECKPOINT" (que tem precedência sobre pontos de verificação automáticos do sistema), limpando o log do tempdb evitando que ele cresça indefinidamente. Ainda é uma boa ideia deixar o arquivo de registro em crescimento automático para qualquer outra eventualidade.
Espero que isso ajude.