GNU Linux-libre 4.14.265-gnu1
[releases.git] / arch / sparc / lib / NGbzero.S
1 /* SPDX-License-Identifier: GPL-2.0 */
2 /* NGbzero.S: Niagara optimized memset/clear_user.
3  *
4  * Copyright (C) 2006 David S. Miller (davem@davemloft.net)
5  */
6 #include <asm/asi.h>
7
8 #define EX_ST(x,y)              \
9 98:     x,y;                    \
10         .section __ex_table,"a";\
11         .align 4;               \
12         .word 98b, __retl_o1_asi;\
13         .text;                  \
14         .align 4;
15
16         .text
17
18         .globl          NGmemset
19         .type           NGmemset, #function
20 NGmemset:               /* %o0=buf, %o1=pat, %o2=len */
21         and             %o1, 0xff, %o3
22         mov             %o2, %o1
23         sllx            %o3, 8, %g1
24         or              %g1, %o3, %o2
25         sllx            %o2, 16, %g1
26         or              %g1, %o2, %o2
27         sllx            %o2, 32, %g1
28         ba,pt           %xcc, 1f
29          or             %g1, %o2, %o2
30
31         .globl          NGbzero
32         .type           NGbzero, #function
33 NGbzero:
34         clr             %o2
35 1:      brz,pn          %o1, NGbzero_return
36          mov            %o0, %o3
37
38         /* %o5: saved %asi, restored at NGbzero_done
39          * %g7: store-init %asi to use
40          * %o4: non-store-init %asi to use
41          */
42         rd              %asi, %o5
43         mov             ASI_BLK_INIT_QUAD_LDD_P, %g7
44         mov             ASI_P, %o4
45         wr              %o4, 0x0, %asi
46
47 NGbzero_from_clear_user:
48         cmp             %o1, 15
49         bl,pn           %icc, NGbzero_tiny
50          andcc          %o0, 0x7, %g1
51         be,pt           %xcc, 2f
52          mov            8, %g2
53         sub             %g2, %g1, %g1
54         sub             %o1, %g1, %o1
55 1:      EX_ST(stba %o2, [%o0 + 0x00] %asi)
56         subcc           %g1, 1, %g1
57         bne,pt          %xcc, 1b
58          add            %o0, 1, %o0
59 2:      cmp             %o1, 128
60         bl,pn           %icc, NGbzero_medium
61          andcc          %o0, (64 - 1), %g1
62         be,pt           %xcc, NGbzero_pre_loop
63          mov            64, %g2
64         sub             %g2, %g1, %g1
65         sub             %o1, %g1, %o1
66 1:      EX_ST(stxa %o2, [%o0 + 0x00] %asi)
67         subcc           %g1, 8, %g1
68         bne,pt          %xcc, 1b
69          add            %o0, 8, %o0
70
71 NGbzero_pre_loop:
72         wr              %g7, 0x0, %asi
73         andn            %o1, (64 - 1), %g1
74         sub             %o1, %g1, %o1
75 NGbzero_loop:
76         EX_ST(stxa %o2, [%o0 + 0x00] %asi)
77         EX_ST(stxa %o2, [%o0 + 0x08] %asi)
78         EX_ST(stxa %o2, [%o0 + 0x10] %asi)
79         EX_ST(stxa %o2, [%o0 + 0x18] %asi)
80         EX_ST(stxa %o2, [%o0 + 0x20] %asi)
81         EX_ST(stxa %o2, [%o0 + 0x28] %asi)
82         EX_ST(stxa %o2, [%o0 + 0x30] %asi)
83         EX_ST(stxa %o2, [%o0 + 0x38] %asi)
84         subcc           %g1, 64, %g1
85         bne,pt          %xcc, NGbzero_loop
86          add            %o0, 64, %o0
87
88         membar          #Sync
89         wr              %o4, 0x0, %asi
90         brz,pn          %o1, NGbzero_done
91 NGbzero_medium:
92          andncc         %o1, 0x7, %g1
93         be,pn           %xcc, 2f
94          sub            %o1, %g1, %o1
95 1:      EX_ST(stxa %o2, [%o0 + 0x00] %asi)
96         subcc           %g1, 8, %g1
97         bne,pt          %xcc, 1b
98          add            %o0, 8, %o0
99 2:      brz,pt          %o1, NGbzero_done
100          nop
101
102 NGbzero_tiny:
103 1:      EX_ST(stba %o2, [%o0 + 0x00] %asi)
104         subcc           %o1, 1, %o1
105         bne,pt          %icc, 1b
106          add            %o0, 1, %o0
107
108         /* fallthrough */
109
110 NGbzero_done:
111         wr              %o5, 0x0, %asi
112
113 NGbzero_return:
114         retl
115          mov            %o3, %o0
116         .size           NGbzero, .-NGbzero
117         .size           NGmemset, .-NGmemset
118
119         .globl          NGclear_user
120         .type           NGclear_user, #function
121 NGclear_user:           /* %o0=buf, %o1=len */
122         rd              %asi, %o5
123         brz,pn          %o1, NGbzero_done
124          clr            %o3
125         cmp             %o5, ASI_AIUS
126         bne,pn          %icc, NGbzero
127          clr            %o2
128         mov             ASI_BLK_INIT_QUAD_LDD_AIUS, %g7
129         ba,pt           %xcc, NGbzero_from_clear_user
130          mov            ASI_AIUS, %o4
131         .size           NGclear_user, .-NGclear_user
132
133 #define BRANCH_ALWAYS   0x10680000
134 #define NOP             0x01000000
135 #define NG_DO_PATCH(OLD, NEW)   \
136         sethi   %hi(NEW), %g1; \
137         or      %g1, %lo(NEW), %g1; \
138         sethi   %hi(OLD), %g2; \
139         or      %g2, %lo(OLD), %g2; \
140         sub     %g1, %g2, %g1; \
141         sethi   %hi(BRANCH_ALWAYS), %g3; \
142         sll     %g1, 11, %g1; \
143         srl     %g1, 11 + 2, %g1; \
144         or      %g3, %lo(BRANCH_ALWAYS), %g3; \
145         or      %g3, %g1, %g3; \
146         stw     %g3, [%g2]; \
147         sethi   %hi(NOP), %g3; \
148         or      %g3, %lo(NOP), %g3; \
149         stw     %g3, [%g2 + 0x4]; \
150         flush   %g2;
151
152         .globl  niagara_patch_bzero
153         .type   niagara_patch_bzero,#function
154 niagara_patch_bzero:
155         NG_DO_PATCH(memset, NGmemset)
156         NG_DO_PATCH(__bzero, NGbzero)
157         NG_DO_PATCH(__clear_user, NGclear_user)
158         NG_DO_PATCH(tsb_init, NGtsb_init)
159         retl
160          nop
161         .size   niagara_patch_bzero,.-niagara_patch_bzero