A medição do cache de último nível falha no PAPI na máquina AMD que executa o Ubuntu Linux

3

Parece que, por padrão, o PAPI (Performance Application Programming Interface) não oferece suporte para medir falhas de cache de último nível (L3) em minha máquina AMD que executa o Ubuntu Linux. No entanto, posso medir erros de cache L1 / L2. Você pode ver os detalhes do processador abaixo. Ouvi dizer que é possível medir os erros de cache do último nível se instalar o driver apropriado. Alguém poderia me fornecer mais informações sobre isso, por favor?

$ uname -a
Linux 2.6.32-21-server #32-Ubuntu SMP Fri Apr 16 09:17:34 UTC 2010 x86_64 GNU/Linux

$cat /proc/cpuinfo
processor   : 0
vendor_id   : AuthenticAMD
cpu family  : 16
model       : 8
model name  : Six-Core AMD Opteron(tm) Processor 8431
fpu     : yes
fpu_exception   : yes
cpuid level : 5
wp      : yes
flags       : fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ht syscall nx mmxext fxsr_opt pdpe1gb rdtscp lm 3dnowext 3dnow constant_tsc rep_good nonstop_tsc extd_apicid pni monitor cx16 popcnt lahf_lm cmp_legacy svm extapic cr8_legacy abm sse4a misalignsse 3dnowprefetch osvw ibs skinit wdt
bogomips    : 4788.66
TLB size    : 1024 4K pages
clflush size    : 64
cache_alignment : 64
address sizes   : 48 bits physical, 48 bits virtual
power management: ts ttp tm stc 100mhzsteps hwpstate
    
por samarasa 18.01.2012 / 17:09

2 respostas

2

Tente usar o profiler do cache de Valgrind ou o especialista em perf ou perf. Todos eles fornecerão detalhes do cache LastLevel, já que o L3 está na maioria dos casos.

Você precisa carregar todos esses módulos.

* Comando para execução: * * VALGRIND: * valgrind --tool = cachegrind ./exe

PERFEXPERT: perfexpert_run_exp ./exe

PERF: perf stat -e ... -e ./exe

    
por 26.02.2013 / 17:16
0

você também pode usar a ferramenta perf. primeiro você precisa verificar se os seus contadores são capazes de contar os erros de cache do último nível ou não usando o comando "perf list". então você pode lê-los com perf_record ..

    
por 24.06.2013 / 10:56