Information Technology Reference
In-Depth Information
Table 1. Execution time (in seconds) for the symmetric band matrix-matrix product
routines when n =1 , 10 , 20. The bandwidth is expressed as a percentage of the matrix
dimension.
Matrix
Bandwidth
sbmm mkl
sbmm cublas sbmm blk sbmm ms
sbmm blk + ms
Dimension
n =1
0.5%
0.002
0.004
0.011
0.009
0.013
12800
1.0%
0.005
0.006
0.012
0.011
0.017
2.0%
0.006
0.011
0.016
0.014
0.024
0.5%
0.006
0.012
0.022
0.022
0.032
25600
1.0%
0.011
0.024
0.030
0.032
0.048
2.0%
0.020
0.042
0.064
0.047
0.078
0.5%
0.014
0.028
0.040
0.040
0.062
38400
1.0%
0.022
0.054
0.071
0.063
0.099
2.0%
0.039
0.101
0.133
0.096
0.157
0.5%
0.023
0.049
0.060
0.063
0.096
51200
1.0%
0.039
0.092
0.126
0.094
0.156
2.0%
0.070
0.159
0.227
0.147
0.254
0.5%
0.035
0.076
0.106
0.090
0.140
64000
1.0%
0.056
0.130
0.175
0.124
0.200
2.0%
0.103
0.252
0.320
0.231
0.354
n =10
0.5%
0.011
0.016
0.014
0.034
0.015
12800
1.0%
0.029
0.029
0.014
0.039
0.019
2.0%
0.054
0.052
0.019
0.048
0.027
0.5%
0.059
0.058
0.027
0.076
0.038
25600
1.0%
0.115
0.105
0.036
0.094
0.053
2.0%
0.193
0.180
0.070
0.113
0.083
0.5%
0.129
0.124
0.046
0.127
0.068
38400
1.0%
0.224
0.228
0.080
0.173
0.106
2.0%
0.392
0.379
0.132
0.199
0.150
0.5%
0.231
0.211
0.070
0.186
0.099
51200
1.0%
0.388
0.358
0.137
0.226
0.165
2.0%
0.704
0.631
0.237
0.338
0.263
0.5%
0.350
0.317
0.113
0.250
0.150
64000
1.0%
0.624
0.557
0.205
0.319
0.241
2.0%
1.031
0.989
0.357
0.505
0.391
n =20
0.5%
0.020
0.029
0.016
0.057
0.018
12800
1.0%
0.057
0.053
0.017
0.064
0.020
2.0%
0.116
0.097
0.022
0.079
0.029
0.5%
0.117
0.106
0.033
0.127
0.042
25600
1.0%
0.230
0.195
0.042
0.157
0.058
2.0%
0.417
0.328
0.077
0.180
0.089
0.5%
0.258
0.227
0.051
0.203
0.081
38400
1.0%
0.643
0.425
0.092
0.302
0.115
2.0%
0.867
0.706
0.153
0.329
0.171
0.5%
0.461
0.399
0.084
0.310
0.114
51200
1.0%
0.757
0.661
0.144
0.346
0.164
2.0%
1.409
1.138
0.253
0.523
0.273
0.5%
0.699
0.592
0.138
0.434
0.176
64000
1.0%
1.429
1.019
0.225
0.501
0.255
2.0%
2.069
1.840
0.379
0.783
0.407
Search WWH ::




Custom Search