LINUX.ORG.RU

История изменений

Исправление Saakx, (текущая версия) :

«В процессорах Intel есть специальные счетчики производительности, которые могут считать события на кольцевой шине (например, UNC_H_RING_AD_USED — использование кольца данных). Их можно прочитать утилитами perf или likwid-perfctr»

# likwid-perfctr -a
    Group name  Description
--------------------------------------------------------------------------------
   UOPS_RETIRE  UOPs retirement
    UOPS_ISSUE  UOPs issueing
     UOPS_EXEC  UOPs execution
          UOPS  UOPs execution info
           TMA  Top down cycle allocation
     TLB_INSTR  L1 Instruction TLB miss rate/ratio
      TLB_DATA  L2 data TLB miss rate/ratio
          SBOX  Ring Transfer bandwidth
      RECOVERY  Recovery duration
           QPI  QPI Link Layer data
          NUMA  Local and remote memory accesses
           MEM  Main memory bandwidth in MBytes/s
       L3CACHE  L3 cache miss rate/ratio
            L3  L3 cache bandwidth in MBytes/s
       L2CACHE  L2 cache miss rate/ratio
            L2  L2 cache bandwidth in MBytes/s
        ICACHE  Instruction cache miss rate/ratio
            HA  Main memory bandwidth in MBytes/s seen from Home agent
     FLOPS_AVX  Packed AVX MFLOP/s
   FALSE_SHARE  False sharing
        ENERGY  Power and Energy consumption
        DIVIDE  Divide unit information
          DATA  Load to store ratio
  CYCLE_STALLS  Cycle Activities (Stalls)
CYCLE_ACTIVITY  Cycle Activities
         CLOCK  Power and Energy consumption
          CBOX  CBOX related data and metrics
        CACHES  Cache bandwidth in MBytes/s
        BRANCH  Branch prediction miss rate/ratio

«Каждое ядро имеет уникальный номер на аппаратном уровне, он называется APIC ID (Advanced Programmable Interrupt Controller ID).»

Исправление Saakx, :

«В процессорах Intel есть специальные счетчики производительности, которые могут считать события на кольцевой шине (например, UNC_H_RING_AD_USED — использование кольца данных). Их можно прочитать утилитами perf или likwid-perfctr»

# likwid-perfctr -a
    Group name  Description
--------------------------------------------------------------------------------
   UOPS_RETIRE  UOPs retirement
    UOPS_ISSUE  UOPs issueing
     UOPS_EXEC  UOPs execution
          UOPS  UOPs execution info
           TMA  Top down cycle allocation
     TLB_INSTR  L1 Instruction TLB miss rate/ratio
      TLB_DATA  L2 data TLB miss rate/ratio
          SBOX  Ring Transfer bandwidth
      RECOVERY  Recovery duration
           QPI  QPI Link Layer data
          NUMA  Local and remote memory accesses
           MEM  Main memory bandwidth in MBytes/s
       L3CACHE  L3 cache miss rate/ratio
            L3  L3 cache bandwidth in MBytes/s
       L2CACHE  L2 cache miss rate/ratio
            L2  L2 cache bandwidth in MBytes/s
        ICACHE  Instruction cache miss rate/ratio
            HA  Main memory bandwidth in MBytes/s seen from Home agent
     FLOPS_AVX  Packed AVX MFLOP/s
   FALSE_SHARE  False sharing
        ENERGY  Power and Energy consumption
        DIVIDE  Divide unit information
          DATA  Load to store ratio
  CYCLE_STALLS  Cycle Activities (Stalls)
CYCLE_ACTIVITY  Cycle Activities
         CLOCK  Power and Energy consumption
          CBOX  CBOX related data and metrics
        CACHES  Cache bandwidth in MBytes/s
        BRANCH  Branch prediction miss rate/ratio

Исходная версия Saakx, :

«В процессорах Intel есть специальные счетчики производительности, которые могут считать события на кольцевой шине (например, UNC_H_RING_AD_USED — использование кольца данных). Их можно прочитать утилитами perf или likwid-perfctr»