So it appears Antutu has portions based on nbench. Why not just compile nbench directly and see what the numbers are? So I did:
Exynos 4 Dual (Samsung Galaxy S II, Debian 7)
gcc 4.6.3; compiler options: -mcpu=cortex-a9:
gcc 4.6.3; compiler options: -mcpu=cortex-a9 -mfp=neon:
For comparison on an Intel Core i5 3317U (Ubuntu 12.04, 64-bit)
gcc 4.6.4; compiler options: none
icc 13.1.1; compiler options: none
S4 Pro (APQ8064, Krait 200 @ 1.5 GHz)
Presence of NEON doesn't make much of a difference. Or maybe gcc isn't very good at vectorizing?
Exynos 4 Dual (Samsung Galaxy S II, Debian 7)
gcc 4.6.3; compiler options: -mcpu=cortex-a9:
Code:
TEST : Iterations/sec. : Old Index : New Index
: : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT : 627.56 : 16.09 : 5.29
STRING SORT : 75.44 : 33.71 : 5.22
BITFIELD : 1.9833e+08 : 34.02 : 7.11
FP EMULATION : 81.607 : 39.16 : 9.04
FOURIER : 7411.8 : 8.43 : 4.73
ASSIGNMENT : 9.9088 : 37.70 : 9.78
IDEA : 1789.3 : 27.37 : 8.13
HUFFMAN : 914.15 : 25.35 : 8.09
NEURAL NET : 9.7649 : 15.69 : 6.60
LU DECOMPOSITION : 406.08 : 21.04 : 15.19
gcc 4.6.3; compiler options: -mcpu=cortex-a9 -mfp=neon:
Code:
TEST : Iterations/sec. : Old Index : New Index
: : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT : 604.32 : 15.50 : 5.09
STRING SORT : 75.88 : 33.91 : 5.25
BITFIELD : 1.9742e+08 : 33.86 : 7.07
FP EMULATION : 81.567 : 39.14 : 9.03
FOURIER : 7501.2 : 8.53 : 4.79
ASSIGNMENT : 9.5924 : 36.50 : 9.47
IDEA : 1791.4 : 27.40 : 8.13
HUFFMAN : 914.15 : 25.35 : 8.09
NEURAL NET : 9.8 : 15.74 : 6.62
LU DECOMPOSITION : 411.6 : 21.32 : 15.40
For comparison on an Intel Core i5 3317U (Ubuntu 12.04, 64-bit)
gcc 4.6.4; compiler options: none
Code:
TEST : Iterations/sec. : Old Index : New Index
: : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT : 1191 : 30.54 : 10.03
STRING SORT : 775.68 : 346.60 : 53.65
BITFIELD : 4.655e+08 : 79.85 : 16.68
FP EMULATION : 457.84 : 219.69 : 50.69
FOURIER : 36478 : 41.49 : 23.30
ASSIGNMENT : 44.732 : 170.21 : 44.15
IDEA : 8848 : 135.33 : 40.18
HUFFMAN : 4032.7 : 111.83 : 35.71
NEURAL NET : 79.456 : 127.64 : 53.69
LU DECOMPOSITION : 2089 : 108.22 : 78.14
icc 13.1.1; compiler options: none
Code:
TEST : Iterations/sec. : Old Index : New Index
: : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT : 1316 : 33.75 : 11.08
STRING SORT : 895.92 : 400.32 : 61.96
BITFIELD : 4.8141e+08 : 82.58 : 17.25
FP EMULATION : 433.44 : 207.98 : 47.99
FOURIER : 1.789e+05 : 203.46 : 114.28
ASSIGNMENT : 39.193 : 149.14 : 38.68
IDEA : 9131.6 : 139.66 : 41.47
HUFFMAN : 4011.2 : 111.23 : 35.52
NEURAL NET : 129.12 : 207.42 : 87.25
LU DECOMPOSITION : 3696.7 : 191.51 : 138.29
S4 Pro (APQ8064, Krait 200 @ 1.5 GHz)
Code:
TEST : Iterations/sec. : Old Index : New Index
: : Pentium 90* : AMD K6/233*
--------------------:------------------:-------------:------------
NUMERIC SORT : 714.84 : 18.33 : 6.02
STRING SORT : 104.12 : 46.52 : 7.20
BITFIELD : 1.5008e+08 : 25.74 : 5.38
FP EMULATION : 110.67 : 53.10 : 12.25
FOURIER : 7181.5 : 8.17 : 4.59
ASSIGNMENT : 10.24 : 38.97 : 10.11
IDEA : 2441.2 : 37.34 : 11.09
HUFFMAN : 1289.2 : 35.75 : 11.42
Presence of NEON doesn't make much of a difference. Or maybe gcc isn't very good at vectorizing?
Last edited:
