Eu acredito que o termo que você está procurando é "domínio magnético", "uma região dentro de um material magnético que possui magnetização uniforme" (wp). Os projetistas de discos rígidos estão sempre tentando reduzir o tamanho dos domínios magnéticos.
Mas.
Primeiro, os "códigos de canal" são usados: Os 0s e 1s gravados na unidade não são os mesmos que os 0s e 1s que você escreve e acabará por ler. Serragem está correta sobre como 1s e 0s são registrados, mas há mais: O drive recupera pulsos de clock (para saber onde esperar uma inversão de fluxo, se houver) das reversões de polaridade de fluxo , mas não pode fazê-lo de trechos onde não há reversões.
Isso pode ser um problema. É totalmente plausível que alguém possa escrever um setor inteiro - 4096 bits com setores de 512 bytes - de todos os 0s! Que (se registrado simplesmente) não tem reversões de fluxo. Devido a irregularidades na velocidade de rotação, entre outras coisas, a unidade provavelmente "perderia o seu lugar" muito antes do fim daquele setor.
Assim, os dados a serem escritos são realmente expandidos em mais bits, usando um código de canal que garante que nunca haverá mais do que um número de reversões não-fluxo escritas em uma linha.
Eu não tenho uma referência para os códigos de canais usados em discos rígidos modernos, mas você pode ter uma ideia de como funciona procurando a "modulação de oito a quatorze" ("EFM") usada em CDs. Sob EFM, cada grupo de oito bits (que tem 256 combinações possíveis de 0s e 1s) é convertido em uma seqüência de 14 bits (16384 combinações, mas apenas 256 deles são códigos válidos). As seqüências dentro de cada código de 14 bits são escolhidas de modo que nunca existam mais do que algumas - eu acho que são três - reversões não-fluxo (0s) seguidas. Eles também são escolhidos para reduzir a largura de banda do sinal. Parece bizarro, mas é verdade: ao gravar mais bits, você pode se safar com menos transições de fluxo. Por exemplo, oito bits de todos os 1s exigiriam oito inversões de fluxo sem um código de canal, mas, em vez disso, podem ser registrados como 14 bits com menos de oito inversões de fluxo.
Agora, pense no primeiro bit escrito em um setor. Vamos supor que seja um 0. Onde está? Graças ao código do canal, o primeiro bit realmente escrito para o setor pode ser um 1!
Incidentalmente, falar sobre CDs não é tão inconveniente quanto parece. Os CDs usam um esquema semelhante ao descrito pela serragem: O início ou fim de um "pit" marca um 1, um lugar onde um pit poderia começar ou terminar, mas não, é um 0. como reversões de fluxo.
Depois, há correção de erros. A correção de erros envolve dados adicionais armazenados em cada setor. No passado, a unidade leria o campo de dados primário + os dados ECC do setor, e se algum erro fosse detectado (por exemplo, lendo um dos muitos códigos de canal "não deveria existir"), ele usaria os dados ECC para corrigir os erros.
Não mais. As densidades de dados modernas são tais que os erros são mais ou menos esperados . Assim, os mecanismos de ECC foram fortalecidos para que muito mais dos erros sejam corrigíveis.
Sim, isso significa que você precisa gravar mais bits, mas é uma vitória líquida em termos de capacidade.
O resultado, porém, é que não podemos dizer que um bit individual, até mesmo um bit de código de canal, seja gravado em um local específico, porque os dados de ECC são tão vitais para recuperar o bit quanto o canal código. E da maneira como o ECC funciona, a "influência" de cada bit nos dados do ECC é distribuída por muitos, muitos bits dos dados do ECC. (Esse princípio é chamado de "difusão").
Então, onde está o pouco? Bem, é meio que espalhado por aí. Mude um bit na entrada e haverá mudanças nas inversões de fluxo em muitos lugares do setor.
Se isso parecer estranho, espere até que você aprenda sobre PRML, que significa "máxima verossimilhança de resposta provável": mesmo a forma de onda recuperada da cabeça, na qual a unidade procura por inversões de fluxo, é interpretado estatisticamente. Mas isso não tem muito a ver com "onde estão os bits".