Na resposta de isto , mencionou:
People also hear that X uses the "network" and think this is going to be a performance bottleneck. "Network" here means local UNIX domain socket, which has negligible overhead on modern Linux. Things that would bottleneck on the network, there are X extensions to make fast (shared memory pixmaps, DRI, etc.). Threads in-process wouldn't necessarily be faster than the X socket, because the bottlenecks have more to do with the inherent problem of coordinating multiple threads or processes accessing the same hardware, than with the minimal overhead of local sockets.
Mas eu sempre acho que vários threads se comuniquem por variáveis compartilhadas deve ser mais rápido do que vários processos se comunicarem pelo soquete do domínio Unix. Então estou errado? Isso é coordenar vários segmentos como um trabalho demorado? E a ordem de como os processos obtêm programado não afeta o desempenho do soquete do domínio Unix?
Alguma ideia?