LINUX.ORG.RU

UnixBench Эльбрус-4С и R1000

 


2

3

Сразу вопрос. По каким попугаям оценить, у кого производительность выше?
Залил на обе машинки этот тест.

Эльбрус 4С

   BYTE UNIX Benchmarks (Version 5.1.3)                                                               
                                                                                                      
   System: MONOCUB GNU/Linux                                                                   
   OS: GNU/Linux -- 2.6.33-elbrus.033.6.63 -- #1 SMP Sat Dec 5 20:55:11 MSK 2015                      
   Machine: e2k (MONOCUB)                                                                             
   Language: en_US.utf8 (charmap="ANSI_X3.4-1968", collate="ANSI_X3.4-1968")                          
   CPU 0: E2S (1600.8 bogomips)                    
                                                                                                      
   CPU 1: E2S (2251.9 bogomips)                    
                                                                                                      
   CPU 2: E2S (1923.7 bogomips)                    
                                                                                                      
   CPU 3: E2S (1600.0 bogomips)                                                                       
                                                                                                      
   12:56pm  up 5 days  3:14,  2 users,  load average: 0.40, 0.09, 0.03; runlevel Jul                  
                                                                                                      
------------------------------------------------------------------------                              
Benchmark Run: Mon Jul 24 2017 12:56:47 - 13:26:03                                                    
4 CPUs in system; running 1 parallel copy of tests                                                    
                                                                                                      
Dhrystone 2 using register variables        2291941.5 lps   (10.0 s, 7 samples)                       
Double-Precision Whetstone                     1010.8 MWIPS (9.9 s, 7 samples)                        
Execl Throughput                                345.2 lps   (29.5 s, 2 samples)                       
File Copy 1024 bufsize 2000 maxblocks        115158.5 KBps  (30.0 s, 2 samples)                       
File Copy 256 bufsize 500 maxblocks           31426.0 KBps  (30.0 s, 2 samples)                       
File Copy 4096 bufsize 8000 maxblocks        389251.0 KBps  (30.0 s, 2 samples)                       
Pipe Throughput                              264312.7 lps   (10.0 s, 7 samples)                       
Pipe-based Context Switching                  70155.6 lps   (10.0 s, 7 samples)                       
Process Creation                                802.5 lps   (30.0 s, 2 samples)                       
Shell Scripts (1 concurrent)                    898.2 lpm   (60.1 s, 2 samples)                       
Shell Scripts (8 concurrent)                    297.7 lpm   (60.1 s, 2 samples)                       
System Call Overhead                         499089.2 lps   (10.0 s, 7 samples)                       
                                                                                                      
System Benchmarks Index Values               BASELINE       RESULT    INDEX                           
Dhrystone 2 using register variables         116700.0    2291941.5    196.4                           
Double-Precision Whetstone                       55.0       1010.8    183.8                           
Execl Throughput                                 43.0        345.2     80.3                           
File Copy 1024 bufsize 2000 maxblocks          3960.0     115158.5    290.8                           
File Copy 256 bufsize 500 maxblocks            1655.0      31426.0    189.9                           
File Copy 4096 bufsize 8000 maxblocks          5800.0     389251.0    671.1                           
Pipe Throughput                               12440.0     264312.7    212.5 

Pipe-based Context Switching                   4000.0      70155.6    175.4                           
Process Creation                                126.0        802.5     63.7                           
Shell Scripts (1 concurrent)                     42.4        898.2    211.8                           
Shell Scripts (8 concurrent)                      6.0        297.7    496.1                           
System Call Overhead                          15000.0     499089.2    332.7                           
                                                                   ========                           
System Benchmarks Index Score                                         213.4                           
                                                   
------------------------------------------------------------------------                              
Benchmark Run: Mon Jul 24 2017 13:26:03 - 13:55:53 
4 CPUs in system; running 4 parallel copies of tests                                                  
                                                   
Dhrystone 2 using register variables        9166126.3 lps   (10.0 s, 7 samples)                       
Double-Precision Whetstone                     4044.1 MWIPS (9.9 s, 7 samples)                        
Execl Throughput                               1321.1 lps   (29.4 s, 2 samples)                       
File Copy 1024 bufsize 2000 maxblocks        151441.3 KBps  (30.0 s, 2 samples)                       
File Copy 256 bufsize 500 maxblocks           39385.3 KBps  (30.0 s, 2 samples)                       
File Copy 4096 bufsize 8000 maxblocks        536897.5 KBps  (30.0 s, 2 samples)                       
Pipe Throughput                             1050143.7 lps   (10.0 s, 7 samples)                       
Pipe-based Context Switching                 278396.0 lps   (10.0 s, 7 samples)                       
Process Creation                               2823.1 lps   (30.0 s, 2 samples)                       
Shell Scripts (1 concurrent)                   2359.9 lpm   (60.1 s, 2 samples)                       
Shell Scripts (8 concurrent)                    340.2 lpm   (60.3 s, 2 samples)                       
System Call Overhead                        1640121.0 lps   (10.0 s, 7 samples)                       
                                                                                                      
System Benchmarks Index Values               BASELINE       RESULT    INDEX                           
Dhrystone 2 using register variables         116700.0    9166126.3    785.4                           
Double-Precision Whetstone                       55.0       4044.1    735.3                           
Execl Throughput                                 43.0       1321.1    307.2                           
File Copy 1024 bufsize 2000 maxblocks          3960.0     151441.3    382.4                           
File Copy 256 bufsize 500 maxblocks            1655.0      39385.3    238.0                           
File Copy 4096 bufsize 8000 maxblocks          5800.0     536897.5    925.7                           
Pipe Throughput                               12440.0    1050143.7    844.2                           
Pipe-based Context Switching                   4000.0     278396.0    696.0                           
Process Creation                                126.0       2823.1    224.1                           
Shell Scripts (1 concurrent)                     42.4       2359.9    556.6                           
Shell Scripts (8 concurrent)                      6.0        340.2    567.1                           
System Call Overhead                          15000.0    1640121.0   1093.4                           
                                                                   ========                           
System Benchmarks Index Score                                         544.5

R1000

========================================================================
   BYTE UNIX Benchmarks (Version 5.1.3)

   System:  GNU/Linux
   OS: GNU/Linux -- 2.6.33-elbrus.033.6.49.rt -- #1 SMP PREEMPT RT Mon Aug 3 20:14:37 MSD 2015
   Machine: sparc64 (R1000)
   Language: en_US.utf8 (charmap="ANSI_X3.4-1968", collate="ANSI_X3.4-1968")
   CPU 0: R1000 (0.0 bogomips)
          
   12:50pm  up 11 days 10:44,  1 user,  load average: 0.33, 0.08, 0.05; runlevel Jul

------------------------------------------------------------------------
Benchmark Run: Mon Jul 24 2017 12:50:01 - 13:18:50
16 CPUs in system; running 1 parallel copy of tests

Dhrystone 2 using register variables        3025875.8 lps   (10.0 s, 7 samples)
Double-Precision Whetstone                      917.8 MWIPS (9.9 s, 7 samples)
Execl Throughput                                804.3 lps   (29.5 s, 2 samples)
File Copy 1024 bufsize 2000 maxblocks         53371.1 KBps  (30.0 s, 2 samples)
File Copy 256 bufsize 500 maxblocks           15319.3 KBps  (30.0 s, 2 samples)
File Copy 4096 bufsize 8000 maxblocks        150715.5 KBps  (30.0 s, 2 samples)
Pipe Throughput                              213427.0 lps   (10.0 s, 7 samples)
Pipe-based Context Switching                  35418.4 lps   (10.0 s, 7 samples)
Process Creation                               1392.4 lps   (30.0 s, 2 samples)
Shell Scripts (1 concurrent)                   1289.2 lpm   (60.0 s, 2 samples)
Shell Scripts (8 concurrent)                    601.4 lpm   (60.1 s, 2 samples)
System Call Overhead                         284014.9 lps   (10.0 s, 7 samples)

System Benchmarks Index Values               BASELINE       RESULT    INDEX
Dhrystone 2 using register variables         116700.0    3025875.8    259.3
Double-Precision Whetstone                       55.0        917.8    166.9
Execl Throughput                                 43.0        804.3    187.0
File Copy 1024 bufsize 2000 maxblocks          3960.0      53371.1    134.8
File Copy 256 bufsize 500 maxblocks            1655.0      15319.3     92.6
File Copy 4096 bufsize 8000 maxblocks          5800.0     150715.5    259.9
Pipe Throughput                               12440.0     213427.0    171.6
Pipe-based Context Switching                   4000.0      35418.4     88.5
Process Creation                                126.0       1392.4    110.5
Shell Scripts (1 concurrent)                     42.4       1289.2    304.1
Shell Scripts (8 concurrent)                      6.0        601.4   1002.3
System Call Overhead                          15000.0     284014.9    189.3
                                                                   ========
System Benchmarks Index Score                                         192.2

------------------------------------------------------------------------
Benchmark Run: Mon Jul 24 2017 13:18:50 - 13:51:45
16 CPUs in system; running 16 parallel copies of tests

Dhrystone 2 using register variables       47917609.0 lps   (10.0 s, 7 samples)
Double-Precision Whetstone                    14677.4 MWIPS (10.0 s, 7 samples)
Execl Throughput                               3214.0 lps   (29.6 s, 2 samples)
File Copy 1024 bufsize 2000 maxblocks         41191.0 KBps  (30.0 s, 2 samples)
File Copy 256 bufsize 500 maxblocks           10876.9 KBps  (30.0 s, 2 samples)
File Copy 4096 bufsize 8000 maxblocks        221690.8 KBps  (30.0 s, 2 samples)
Pipe Throughput                             3390922.6 lps   (10.0 s, 7 samples)
Pipe-based Context Switching                 613211.1 lps   (10.0 s, 7 samples)
Process Creation                               5189.2 lps   (30.0 s, 2 samples)
Shell Scripts (1 concurrent)                   7273.2 lpm   (60.1 s, 2 samples)
Shell Scripts (8 concurrent)                    953.4 lpm   (60.4 s, 2 samples)
System Call Overhead                         794367.9 lps   (10.0 s, 7 samples)

System Benchmarks Index Values               BASELINE       RESULT    INDEX
Dhrystone 2 using register variables         116700.0   47917609.0   4106.1
Double-Precision Whetstone                       55.0      14677.4   2668.6
Execl Throughput                                 43.0       3214.0    747.5
File Copy 1024 bufsize 2000 maxblocks          3960.0      41191.0    104.0
File Copy 256 bufsize 500 maxblocks            1655.0      10876.9     65.7
File Copy 4096 bufsize 8000 maxblocks          5800.0     221690.8    382.2
Pipe Throughput                               12440.0    3390922.6   2725.8
Pipe-based Context Switching                   4000.0     613211.1   1533.0
Process Creation                                126.0       5189.2    411.8
Shell Scripts (1 concurrent)                     42.4       7273.2   1715.4
Shell Scripts (8 concurrent)                      6.0        953.4   1589.0
System Call Overhead                          15000.0     794367.9    529.6
                                                                   ========
System Benchmarks Index Score                                         783.1

★★

Последнее исправление: TomBOY (всего исправлений: 1)

Ответ на: комментарий от robot12

угу, х2 - таки есть VLIW завернутые в транслятор кода.

правда выигрыш неочевиден, в FFT они из-за своей ширині понятно всех разрывают, а вот в чем-то сложном (типа john the ripper - сдуваются. ну и кушают, уверен, нехило...

NiTr0 ★★★★★
()
Ответ на: комментарий от anonymous

(DCO -> VLIW)

т.е. вы приравниваете широкий суперскаляр к vliw?

Вопрос весьма глупый. Тебе надо разобраться, что такое суперскалярность, а что VLIW.

A superscalar processor is a CPU that implements a form of parallelism called instruction-level parallelism within a single processor.

Обычно VLIW реализуется в виде суперскалярной in-order архитектуры.

Что же такое VLIW? Это формат ISA, то как кодируются команды. Процессор оперирует широкими командами (в Itanium/Denver называют их bundles), которые состоят из операций (aka инструкций).

anonymous
()
Ответ на: комментарий от robot12

В документацию тыкнуть не могу - она закрыта и её у меня нет. Но ядра предоставлют потоки, соответственно их можно сделать или больше, или меньше в рантайме(что и делали во всяких тестах). Всё логично. В этих патентах говорится обратное?

Можно ещё отбратиться к форку ядра для эльбрусов, но мне что-то лень фигнёй заниматься.

DeaDDooMER
()

При возможности, ещё тесты на IO проведи. Традиционно Спарки были сильны именно IO - засчёт IOMMU (которое спустя 20 лет появилось и у Интелов с АМД), но в R1000 - собственное IOMMU. Интересно, лучше оно получилось, чем буржуйское или нет.

alt-x ★★★★★
()
Вы не можете добавлять комментарии в эту тему. Тема перемещена в архив.