80
80
vhcadd ,
81
81
vand ,
82
82
vbic ,
83
+ vbic_nodt ,
83
84
vorr ,
84
85
veor ,
86
+ veor_nodt ,
85
87
vmulh ,
86
88
vmul_T1 ,
87
89
vmul_T2 ,
100
102
vmulf_T1 ,
101
103
vmulf_T2 ,
102
104
ldrd ,
105
+ ldrd_no_imm ,
103
106
ldrd_with_writeback ,
104
107
ldrd_with_post ,
105
108
strd ,
@@ -308,8 +311,10 @@ def get_min_max_objective(slothy):
308
311
vhcadd : ExecutionUnit .VEC_INT ,
309
312
vand : [ExecutionUnit .VEC_BITWA , ExecutionUnit .VEC_BITWB ],
310
313
vbic : [ExecutionUnit .VEC_BITWA , ExecutionUnit .VEC_BITWB ],
314
+ vbic_nodt : [ExecutionUnit .VEC_BITWA , ExecutionUnit .VEC_BITWB ],
311
315
vorr : [ExecutionUnit .VEC_BITWA , ExecutionUnit .VEC_BITWB ],
312
316
veor : [ExecutionUnit .VEC_BITWA , ExecutionUnit .VEC_BITWB ],
317
+ veor_nodt : [ExecutionUnit .VEC_BITWA , ExecutionUnit .VEC_BITWB ],
313
318
vmulh : ExecutionUnit .VEC_MUL ,
314
319
vmul_T1 : ExecutionUnit .VEC_MUL ,
315
320
vmul_T2 : ExecutionUnit .VEC_MUL ,
@@ -330,6 +335,7 @@ def get_min_max_objective(slothy):
330
335
vmulf_T1 : ExecutionUnit .VEC_FPMUL ,
331
336
vmulf_T2 : ExecutionUnit .VEC_FPMUL ,
332
337
ldrd : ExecutionUnit .LOAD ,
338
+ ldrd_no_imm : ExecutionUnit .LOAD ,
333
339
ldrd_with_writeback : ExecutionUnit .LOAD ,
334
340
ldrd_with_post : ExecutionUnit .LOAD ,
335
341
strd : ExecutionUnit .STORE ,
@@ -416,6 +422,7 @@ def get_min_max_objective(slothy):
416
422
ldr_with_writeback ,
417
423
ldr_with_post ,
418
424
ldrd ,
425
+ ldrd_no_imm ,
419
426
ldrd_with_writeback ,
420
427
ldrd_with_post ,
421
428
strd ,
@@ -453,8 +460,10 @@ def get_min_max_objective(slothy):
453
460
vhcadd ,
454
461
vand ,
455
462
vbic ,
463
+ vbic_nodt ,
456
464
vorr ,
457
465
veor ,
466
+ veor_nodt ,
458
467
vmulh ,
459
468
vmul_T1 ,
460
469
vmul_T2 ,
@@ -535,6 +544,7 @@ def get_min_max_objective(slothy):
535
544
default_latencies = {
536
545
(
537
546
ldrd ,
547
+ ldrd_no_imm ,
538
548
ldrd_with_post ,
539
549
ldrd_with_writeback ,
540
550
): 2 ,
@@ -570,8 +580,10 @@ def get_min_max_objective(slothy):
570
580
vhcadd ,
571
581
vand ,
572
582
vbic ,
583
+ vbic_nodt ,
573
584
vorr ,
574
585
veor ,
586
+ veor_nodt ,
575
587
qsave ,
576
588
save ,
577
589
qrestore ,
@@ -755,8 +767,10 @@ def get_latency(src, out_idx, dst):
755
767
vhcadd ,
756
768
vand ,
757
769
vbic ,
770
+ vbic_nodt ,
758
771
vorr ,
759
772
veor ,
773
+ veor_nodt ,
760
774
vrshr ,
761
775
vshrnb ,
762
776
vshrnt ,
0 commit comments