GNU Linux-libre 4.4.283-gnu1
[releases.git] / arch / alpha / lib / checksum.c
1 /*
2  * arch/alpha/lib/checksum.c
3  *
4  * This file contains network checksum routines that are better done
5  * in an architecture-specific manner due to speed..
6  * Comments in other versions indicate that the algorithms are from RFC1071
7  *
8  * accelerated versions (and 21264 assembly versions ) contributed by
9  *      Rick Gorton     <rick.gorton@alpha-processor.com>
10  */
11  
12 #include <linux/module.h>
13 #include <linux/string.h>
14
15 #include <asm/byteorder.h>
16
17 static inline unsigned short from64to16(unsigned long x)
18 {
19         /* Using extract instructions is a bit more efficient
20            than the original shift/bitmask version.  */
21
22         union {
23                 unsigned long   ul;
24                 unsigned int    ui[2];
25                 unsigned short  us[4];
26         } in_v, tmp_v, out_v;
27
28         in_v.ul = x;
29         tmp_v.ul = (unsigned long) in_v.ui[0] + (unsigned long) in_v.ui[1];
30
31         /* Since the bits of tmp_v.sh[3] are going to always be zero,
32            we don't have to bother to add that in.  */
33         out_v.ul = (unsigned long) tmp_v.us[0] + (unsigned long) tmp_v.us[1]
34                         + (unsigned long) tmp_v.us[2];
35
36         /* Similarly, out_v.us[2] is always zero for the final add.  */
37         return out_v.us[0] + out_v.us[1];
38 }
39
40 /*
41  * computes the checksum of the TCP/UDP pseudo-header
42  * returns a 16-bit checksum, already complemented.
43  */
44 __sum16 csum_tcpudp_magic(__be32 saddr, __be32 daddr,
45                                    unsigned short len,
46                                    unsigned short proto,
47                                    __wsum sum)
48 {
49         return (__force __sum16)~from64to16(
50                 (__force u64)saddr + (__force u64)daddr +
51                 (__force u64)sum + ((len + proto) << 8));
52 }
53 EXPORT_SYMBOL(csum_tcpudp_magic);
54
55 __wsum csum_tcpudp_nofold(__be32 saddr, __be32 daddr,
56                                    unsigned short len,
57                                    unsigned short proto,
58                                    __wsum sum)
59 {
60         unsigned long result;
61
62         result = (__force u64)saddr + (__force u64)daddr +
63                  (__force u64)sum + ((len + proto) << 8);
64
65         /* Fold down to 32-bits so we don't lose in the typedef-less 
66            network stack.  */
67         /* 64 to 33 */
68         result = (result & 0xffffffff) + (result >> 32);
69         /* 33 to 32 */
70         result = (result & 0xffffffff) + (result >> 32);
71         return (__force __wsum)result;
72 }
73 EXPORT_SYMBOL(csum_tcpudp_nofold);
74
75 /*
76  * Do a 64-bit checksum on an arbitrary memory area..
77  *
78  * This isn't a great routine, but it's not _horrible_ either. The
79  * inner loop could be unrolled a bit further, and there are better
80  * ways to do the carry, but this is reasonable.
81  */
82 static inline unsigned long do_csum(const unsigned char * buff, int len)
83 {
84         int odd, count;
85         unsigned long result = 0;
86
87         if (len <= 0)
88                 goto out;
89         odd = 1 & (unsigned long) buff;
90         if (odd) {
91                 result = *buff << 8;
92                 len--;
93                 buff++;
94         }
95         count = len >> 1;               /* nr of 16-bit words.. */
96         if (count) {
97                 if (2 & (unsigned long) buff) {
98                         result += *(unsigned short *) buff;
99                         count--;
100                         len -= 2;
101                         buff += 2;
102                 }
103                 count >>= 1;            /* nr of 32-bit words.. */
104                 if (count) {
105                         if (4 & (unsigned long) buff) {
106                                 result += *(unsigned int *) buff;
107                                 count--;
108                                 len -= 4;
109                                 buff += 4;
110                         }
111                         count >>= 1;    /* nr of 64-bit words.. */
112                         if (count) {
113                                 unsigned long carry = 0;
114                                 do {
115                                         unsigned long w = *(unsigned long *) buff;
116                                         count--;
117                                         buff += 8;
118                                         result += carry;
119                                         result += w;
120                                         carry = (w > result);
121                                 } while (count);
122                                 result += carry;
123                                 result = (result & 0xffffffff) + (result >> 32);
124                         }
125                         if (len & 4) {
126                                 result += *(unsigned int *) buff;
127                                 buff += 4;
128                         }
129                 }
130                 if (len & 2) {
131                         result += *(unsigned short *) buff;
132                         buff += 2;
133                 }
134         }
135         if (len & 1)
136                 result += *buff;
137         result = from64to16(result);
138         if (odd)
139                 result = ((result >> 8) & 0xff) | ((result & 0xff) << 8);
140 out:
141         return result;
142 }
143
144 /*
145  *      This is a version of ip_compute_csum() optimized for IP headers,
146  *      which always checksum on 4 octet boundaries.
147  */
148 __sum16 ip_fast_csum(const void *iph, unsigned int ihl)
149 {
150         return (__force __sum16)~do_csum(iph,ihl*4);
151 }
152 EXPORT_SYMBOL(ip_fast_csum);
153
154 /*
155  * computes the checksum of a memory block at buff, length len,
156  * and adds in "sum" (32-bit)
157  *
158  * returns a 32-bit number suitable for feeding into itself
159  * or csum_tcpudp_magic
160  *
161  * this function must be called with even lengths, except
162  * for the last fragment, which may be odd
163  *
164  * it's best to have buff aligned on a 32-bit boundary
165  */
166 __wsum csum_partial(const void *buff, int len, __wsum sum)
167 {
168         unsigned long result = do_csum(buff, len);
169
170         /* add in old sum, and carry.. */
171         result += (__force u32)sum;
172         /* 32+c bits -> 32 bits */
173         result = (result & 0xffffffff) + (result >> 32);
174         return (__force __wsum)result;
175 }
176
177 EXPORT_SYMBOL(csum_partial);
178
179 /*
180  * this routine is used for miscellaneous IP-like checksums, mainly
181  * in icmp.c
182  */
183 __sum16 ip_compute_csum(const void *buff, int len)
184 {
185         return (__force __sum16)~from64to16(do_csum(buff,len));
186 }
187 EXPORT_SYMBOL(ip_compute_csum);