Quais são alguns exemplos de “Appending Operations” e “Random Writes Operations”?

0

Acabei de ler o documento do Google File System (GFS). O documento diz que o GFS é

optimized for appending operations rather than random writes. 

Vendo que essa característica é enfatizada em todo o artigo, entendo que isso deve ser muito importante.

Como um estudante que não teve nenhuma experiência de trabalho, quais são alguns exemplos da vida real do Appending Operations do qual o Google fala? Parece muito intenso.

(suponho que os logs sejam pesados demais. Talvez também o e-mail?)

    
por Some Noob Student 06.01.2012 / 09:07

1 resposta

1

Sim, os registros seriam um exemplo clássico de uma operação de acréscimo. O email é dependente da implementação. Por exemplo, os armazenamentos de e-mail em formato Maildir são um e-mail por arquivo, portanto, nenhum acréscimo precisa ocorrer. Com o formato mbox, todos os e-mails estão em um único arquivo, para que novos sejam adicionados no final - eles são anexados.

Uma atualização de banco de dados seria um exemplo de uma operação de gravação aleatória, por exemplo, se você decidisse atualizar o nome de todos em um banco de dados, isso resultaria em uma série de gravações no meio do arquivo que contém o banco de dados .

O que o Google está dizendo aqui é que, para manter o desempenho ideal e se você conseguir se safar, adicione novas informações ao final dos arquivos existentes, em vez de modificar o conteúdo que já contém. Se você precisar excluir dados de um arquivo, basta sinalizá-lo de alguma forma e excluí-lo mais tarde, quando o desempenho não for importante, como em um trabalho em lotes de limpeza. Um exemplo disso seria com os armazenamentos de email no formato mbox novamente. Se você excluir um email, ele será rastreado em um arquivo separado. Depois, você pode "compactar" o arquivo, o que efetivamente reescreve o arquivo sem os e-mails excluídos.

    
por 06.01.2012 / 09:47