Entendo que o processador teria registros de desempenho coletando contagens de eventos para um determinado núcleo físico e seus recursos (por exemplo, caches L1).
Como o perf
ou qualquer outra ferramenta de monitoramento de desempenho mede contadores por processo ou por thread? Por exemplo, digamos que eu esteja monitorando as falhas de cache L1, agora que o cache é compartilhado por todos os processos em execução nessa CPU, como perf
determina quantas falhas ocorreram em determinado processo ou em determinado segmento?