Há duas partes nessa pergunta: quando adicionar um novo FILEGROUP e quando adicionar um novo FILE em um grupo de arquivos. Primeiro vamos falar teoria:
Mark está certo sobre o principal motivo de desempenho.
O motivo secundário é a recuperação de desastres. Com o SQL Server 2005 e mais recente, você pode fazer restaurações de grupo de arquivos. Quando ocorre um desastre, você pode restaurar apenas o primeiro grupo de arquivos primário e colocar o banco de dados parcialmente online para consultas. Os usuários podem executar consultas enquanto você restaura outros grupos de arquivos. Isso é útil para bancos de dados com uma grande quantidade de dados históricos que podem não ser necessários imediatamente, ou armazéns de dados que precisam carregar dados em tabelas atuais sem precisar de dados históricos para acesso.
Outro motivo é o perfil de leitura / gravação de grupos de dados. Se você tiver alguns dados que são constantemente gravados, e outros dados que recebem uma atividade de leitura pesada, você pode criar diferentes tipos de armazenamento para acomodar essas necessidades. Você poderia colocar o material de escrita pesada no ataque 10 e deixar as coisas com preconceito de leitura no ataque mais barato 5.
Agora, vamos falar de arquivos versus grupos de arquivos. Quando você coloca objetos no SQL Server, é necessário colocá-los no nível de grupo de arquivos. Você pode colocar uma tabela ou um índice em um grupo de arquivos, mas não pode escolher um arquivo específico. Então, tudo que discutimos até agora foi sobre quando adicionar um grupo de arquivos - mas quando você adiciona um arquivo?
Se você está projetando armazenamento e tem 80 discos rígidos, há algumas maneiras de dividi-lo:
- Um pool de 80 unidades
- Dois conjuntos de 40 unidades
- Quatro pools de 20 drives, etc ...
Diferentes subsistemas de armazenamento possuem diferentes perfis de desempenho. Eu trabalhei com algumas SANs que tiveram o melhor desempenho com matrizes de drive de 12 a 16, e qualquer coisa maior do que isso não teve uma melhoria de desempenho. Outro exemplo é SANs com múltiplos caminhos: se você tiver vários HBAs conectando seu servidor ao seu armazenamento, e se o seu software de múltiplos caminhos não for real / ativo, você pode precisar de um array por caminho para distribuir a carga. Quatro caminhos, quatro conjuntos de unidades terão melhor desempenho nesses tipos de unidades.
Nesses casos, você acaba com quatro matrizes diferentes, quatro unidades diferentes no Windows (a menos que você use pontos de montagem e, mesmo assim, são pastas diferentes) e precisará de quatro arquivos separados no SQL Server. Esses arquivos separados podem estar no mesmo grupo de arquivos.