Onde os Metadados de Blocos no RAID são armazenados?

1

Estou muito entusiasmado em saber sobre os data centers, depois me deparei com sistemas RAID.

Minhas perguntas podem ser muito bobas, por favor, tenha paciência comigo.

Geralmente em qualquer nível de RAID > 0, Ex: RAID 5 Como o Sistema de Operação Conhece um pedaço de arquivo localizado em qual disco e qual bloco?

Quais metadados serão armazenados para um determinado arquivo?

Se ele realmente armazena os metadados sobre arquivos. Onde esses metadados são armazenados fisicamente (e em qual disco eles são armazenados)?

Como eles dizem, o RAID 5 pode suportar 1 falha de disco, mas se o disco que contém os metadados falhar, tudo será perdido, certo?

Eu queria saber um ciclo de vida de um arquivo que será armazenado no RAID 5 e a atualização funciona e como a exclusão de um arquivo funciona?

Cada bloco contém informações de um único arquivo ou de vários arquivos?

Posso chegar a uma conclusão de que, à medida que o nível de RAID aumenta, o Paralelismo de Leitura aumenta e o desempenho de Gravações diminui?

    
por PK Chem 31.01.2018 / 16:36

1 resposta

1

What metadata will be stored for a given file?

O RAID não tem absolutamente nada a ver com metadados arquivo . É puramente um arranjo disco e, como tal, apenas faz um endereço de disco para a conversão física de blocos.

Os metadados de arquivos são puramente uma coisa do sistema de arquivos e um sistema de arquivos fica no topo de uma partição em um disco. Existem várias camadas de tradução entre um arquivo e um bloco de disco. No que se refere a um controlador de disco (o controlador RAID) no momento em que recebe dados pertencentes a um "arquivo" ele já foi reduzido pelo sistema de arquivos e drivers de disco lógicos do sistema operacional para "gravar este bloco de dados no bloco de disco número X ".

O RAID irá organizar os discos de uma maneira lógica e precisa. O controlador conhece detalhes como número de discos, tamanho da faixa e ordem da faixa de disco e, dado esses detalhes, qualquer endereço de bloco lógico transmitido pelo sistema operacional pode ser calculado e mapeado para "disco 2, local Y "ou assim por diante.

As they say RAID 5 can support 1 Disk Failure, But if the disk that contains the metadata fails then everything is wasted right?

Não. O RAID 5 contém 1 disco (valor de dados) que é uma soma lógica dos outros discos. Você sempre tem 1 cópia completa de todos os metadados mais de dados, o que equivale a uma soma combinada dos outros 3 discos.

Disk1 block + disk2 block + disk3 block = redundant (disk4) block

Se uma unidade falhar, você pode reorganizar a soma para fornecer

Disk1 block + disk2 block + disk4 (redundant) block = disk3 block

Assim, você obtém algum nível de tolerância a falhas nos seus discos. Se algum disco aleatório falhar, você ainda terá acesso a dados suficientes para substituir esse disco. Espero que você substitua esse disco antes que outro falhe e você possa reconstruir seus dados perdidos para restaurar completamente a tolerância a falhas.

A matemática por trás do bloco redundante vale um artigo próprio e eu recomendo que você leia a página da Wikipedia sobre o RAID matrizes para ter uma ideia melhor disso.

I wanted to know a Life Cycle of a File that is going to be Stored in RAID 5 and does updating works and how does deleting a File works?

Does each block contains information of a single file or multiple files?

Os arquivos são uma construção do sistema de arquivos e são gerenciados pelo seu sistema operacional. O RAID preocupa-se inteiramente com discos e não sabe nada sobre arquivos.

Um bloco de disco pode conter qualquer número de arquivos, cabe ao sistema operacional colocar os dados em blocos no disco.

O controlador RAID simplesmente apresenta uma interface de disco para o sistema operacional, o sistema operacional grava blocos nele. O que está nesses blocos depende do sistema operacional.

Can I come to a Conclusion that as RAID level increases the Read Parallelism increases and Writes performance decreases?

Sim, até certo ponto, depende do nível de RAID utilizado e o desempenho de gravação não diminui necessariamente de acordo com o aumento do desempenho de leitura. O desempenho de gravação pode ser (digamos) 3/4 do desempenho de leitura, dependendo da tarefa.

Em Wikipedia

In comparison to RAID 4, RAID 5's distributed parity evens out the stress of a dedicated parity disk among all RAID members. Additionally, write performance is increased since all RAID members participate in the serving of write requests. Although it won't be as efficient as a striping (RAID 0) setup, because parity must still be written, this is no longer a bottleneck.

Since parity calculation is performed on the full stripe, small changes to the array experience write amplification: in the worst case when a single, logical sector is to be written, the original sector and the according parity sector need to be read, the original data is removed from the parity, the new data calculated into the parity and both the new data sector and the new parity sector are written.

    
por 31.01.2018 / 18:34