Ah, essa é uma daquelas perguntas simples que têm respostas realmente complexas. A resposta simples é, bem, depende de como a gravação foi feita e que tipo de cache existe. Aqui está uma cartilha útil sobre como os caches funcionam .
As CPUs podem gravar dados de várias maneiras. Sem qualquer armazenamento em cache, os dados são armazenados na memória imediatamente e a CPU aguarda a conclusão da gravação. Com o armazenamento em cache, a CPU geralmente armazena dados na ordem do programa, ou seja, se o programa gravar no endereço A e no endereço B, a memória A será gravada antes da memória B, independentemente do armazenamento em cache. O cache só afeta quando a memória física é atualizada, e isso depende do tipo de cache usado (veja o link acima). Algumas CPUs também podem armazenar dados de forma não temporal, isto é, as gravações podem ser reordenadas para aproveitar ao máximo a largura de banda da memória. Então, escrevendo para A, então B, então (A + 1) poderia ser reorderdado para escrever para A então A + 1 em uma única rajada, então B.
Outra complicação é quando mais de uma CPU está presente. Dependendo da maneira como o sistema é projetado, as gravações feitas por uma CPU não serão vistas por outras CPUs, porque os dados ainda estão no primeiro cache de CPUs (o cache está sujo). Em vários sistemas de CPU, fazer com que o cache de cada CPU corresponda ao que está na memória física é denominado consistência de cache. Existem várias maneiras pelas quais isso pode ser alcançado.
Claro, o acima é voltado para processadores Pentium. Outros processadores podem fazer coisas de outras maneiras. Tomemos, por exemplo, o processador Cell do PS3. A arquitetura básica de uma CPU Cell é um núcleo PowerPC com vários núcleos Cell (na PS3 existem oito células, uma das quais está sempre desativada para melhorar os rendimentos). Cada célula tem sua própria memória local, uma espécie de cache L1 que nunca é gravada na RAM do sistema. Os dados podem ser transferidos entre essa RAM local e a RAM do sistema usando transferências DMA (acesso direto à memória). A célula pode acessar a RAM do sistema e a RAM de outras células usando o que parece ser uma leitura e uma gravação normais, mas isso apenas desencadeia uma transferência de DMA (por isso é lento e deve ser evitado). A idéia por trás desse sistema é que o jogo não é apenas um programa, mas muitos programas menores que combinam para fazer a mesma coisa (se você conhece * nix, é como programar programas de linha de comando para realizar tarefas mais complexas).
Para resumir, escrever para RAM costumava ser muito simples nos dias em que a velocidade da CPU correspondia à velocidade da RAM, mas à medida que a velocidade da CPU aumentava e os caches eram introduzidos, o processo se tornava mais complexo com muitos métodos diferentes.Skizz