Eu não estou familiarizado com os detalhes sangrentos de como a RAM trabalha com CPU da Intel atualmente, considerando coisas mais novas como cache coherency e NUMA, mas do ponto de vista da RAM, acredito que ainda sejam bytes de 8 bits. comumente organizado em canais onde vários slots podem ser acessados de uma só vez. Então, pegar 4 bytes (assumindo 4 slots) por vez vai demorar o mesmo tempo que pegar 1 byte em tal sistema. Ainda assim, a RAM aceita um endereço do controlador de memória como entrada e devolve 8 bits como saída AFAIK.
O tamanho "palavra" pode significar coisas diferentes. Eu lembro primeiro de encontrar este termo estudando 68000 linguagem de montagem - no texto que eu estava lendo, "byte" significava 8 bits e "word" significava 16 bits, e "alinhado por palavra" significava um endereço caindo em um limite de 16 bits. Eu sei que o termo "palavra" estava em uso anteriormente para a introdução do 68000 (1980?) E pode ter sido sinônimo de "byte" em tempos anteriores a isso.
Os dados "nativos" com os quais a CPU "prefere" correspondem ao "bitness" de sua arquitetura e ao modo em que está sendo executado. Uma CPU de 32 bits (ou CPU de 64 bits que não está no "modo longo") ) tem registros de 32 bits, um monte de instruções para carregar valores de RAM (4 bytes) para os registradores e outros stuf. Mas com a Intel, um registrador de 32 bits como o EAX também pode ser endereçado como dois registradores AH (os 16 bits superiores do EAX) e AL (os 16 bits mais baixos) e existem inúmeras instruções MOV que carregam material da RAM no EAX, AH, AL, e de lá de volta para a RAM. Estou com preguiça de olhar para o guia de referência do programador Intel no momento, mas acho que há instruções para carregar bytes simples para os 8 bits superiores ou inferiores de AH ou AL. (Eu sei que o MIPS tem instruções como essa). Mas eu acho que há mais instruções que funcionam com todos os 32 bits, e se você quiser trabalhar com menos bits, você terá sucesso na eficiência, porque você precisa mover o stuf para os registros temporários primeiro e tal.
Portanto, na Intel e na maioria dos outros processadores de uso geral feitos desde a era de 16 bits, você é realmente flexível na forma como endereça a memória. No entanto, é provável que as instruções sejam mais otimizadas para trabalhar na "bitness" da arquitetura.