GNU Linux-libre 4.4.284-gnu1
[releases.git] / drivers / net / ppp / pppoe.c
1 /** -*- linux-c -*- ***********************************************************
2  * Linux PPP over Ethernet (PPPoX/PPPoE) Sockets
3  *
4  * PPPoX --- Generic PPP encapsulation socket family
5  * PPPoE --- PPP over Ethernet (RFC 2516)
6  *
7  *
8  * Version:     0.7.0
9  *
10  * 070228 :     Fix to allow multiple sessions with same remote MAC and same
11  *              session id by including the local device ifindex in the
12  *              tuple identifying a session. This also ensures packets can't
13  *              be injected into a session from interfaces other than the one
14  *              specified by userspace. Florian Zumbiehl <florz@florz.de>
15  *              (Oh, BTW, this one is YYMMDD, in case you were wondering ...)
16  * 220102 :     Fix module use count on failure in pppoe_create, pppox_sk -acme
17  * 030700 :     Fixed connect logic to allow for disconnect.
18  * 270700 :     Fixed potential SMP problems; we must protect against
19  *              simultaneous invocation of ppp_input
20  *              and ppp_unregister_channel.
21  * 040800 :     Respect reference count mechanisms on net-devices.
22  * 200800 :     fix kfree(skb) in pppoe_rcv (acme)
23  *              Module reference count is decremented in the right spot now,
24  *              guards against sock_put not actually freeing the sk
25  *              in pppoe_release.
26  * 051000 :     Initialization cleanup.
27  * 111100 :     Fix recvmsg.
28  * 050101 :     Fix PADT procesing.
29  * 140501 :     Use pppoe_rcv_core to handle all backlog. (Alexey)
30  * 170701 :     Do not lock_sock with rwlock held. (DaveM)
31  *              Ignore discovery frames if user has socket
32  *              locked. (DaveM)
33  *              Ignore return value of dev_queue_xmit in __pppoe_xmit
34  *              or else we may kfree an SKB twice. (DaveM)
35  * 190701 :     When doing copies of skb's in __pppoe_xmit, always delete
36  *              the original skb that was passed in on success, never on
37  *              failure.  Delete the copy of the skb on failure to avoid
38  *              a memory leak.
39  * 081001 :     Misc. cleanup (licence string, non-blocking, prevent
40  *              reference of device on close).
41  * 121301 :     New ppp channels interface; cannot unregister a channel
42  *              from interrupts.  Thus, we mark the socket as a ZOMBIE
43  *              and do the unregistration later.
44  * 081002 :     seq_file support for proc stuff -acme
45  * 111602 :     Merge all 2.4 fixes into 2.5/2.6 tree.  Label 2.5/2.6
46  *              as version 0.7.  Spacing cleanup.
47  * Author:      Michal Ostrowski <mostrows@speakeasy.net>
48  * Contributors:
49  *              Arnaldo Carvalho de Melo <acme@conectiva.com.br>
50  *              David S. Miller (davem@redhat.com)
51  *
52  * License:
53  *              This program is free software; you can redistribute it and/or
54  *              modify it under the terms of the GNU General Public License
55  *              as published by the Free Software Foundation; either version
56  *              2 of the License, or (at your option) any later version.
57  *
58  */
59
60 #include <linux/string.h>
61 #include <linux/module.h>
62 #include <linux/kernel.h>
63 #include <linux/slab.h>
64 #include <linux/errno.h>
65 #include <linux/netdevice.h>
66 #include <linux/net.h>
67 #include <linux/inetdevice.h>
68 #include <linux/etherdevice.h>
69 #include <linux/skbuff.h>
70 #include <linux/init.h>
71 #include <linux/if_ether.h>
72 #include <linux/if_pppox.h>
73 #include <linux/ppp_channel.h>
74 #include <linux/ppp_defs.h>
75 #include <linux/ppp-ioctl.h>
76 #include <linux/notifier.h>
77 #include <linux/file.h>
78 #include <linux/proc_fs.h>
79 #include <linux/seq_file.h>
80
81 #include <linux/nsproxy.h>
82 #include <net/net_namespace.h>
83 #include <net/netns/generic.h>
84 #include <net/sock.h>
85
86 #include <asm/uaccess.h>
87
88 #define PPPOE_HASH_BITS 4
89 #define PPPOE_HASH_SIZE (1 << PPPOE_HASH_BITS)
90 #define PPPOE_HASH_MASK (PPPOE_HASH_SIZE - 1)
91
92 static int __pppoe_xmit(struct sock *sk, struct sk_buff *skb);
93
94 static const struct proto_ops pppoe_ops;
95 static const struct ppp_channel_ops pppoe_chan_ops;
96
97 /* per-net private data for this module */
98 static int pppoe_net_id __read_mostly;
99 struct pppoe_net {
100         /*
101          * we could use _single_ hash table for all
102          * nets by injecting net id into the hash but
103          * it would increase hash chains and add
104          * a few additional math comparations messy
105          * as well, moreover in case of SMP less locking
106          * controversy here
107          */
108         struct pppox_sock *hash_table[PPPOE_HASH_SIZE];
109         rwlock_t hash_lock;
110 };
111
112 /*
113  * PPPoE could be in the following stages:
114  * 1) Discovery stage (to obtain remote MAC and Session ID)
115  * 2) Session stage (MAC and SID are known)
116  *
117  * Ethernet frames have a special tag for this but
118  * we use simpler approach based on session id
119  */
120 static inline bool stage_session(__be16 sid)
121 {
122         return sid != 0;
123 }
124
125 static inline struct pppoe_net *pppoe_pernet(struct net *net)
126 {
127         BUG_ON(!net);
128
129         return net_generic(net, pppoe_net_id);
130 }
131
132 static inline int cmp_2_addr(struct pppoe_addr *a, struct pppoe_addr *b)
133 {
134         return a->sid == b->sid && ether_addr_equal(a->remote, b->remote);
135 }
136
137 static inline int cmp_addr(struct pppoe_addr *a, __be16 sid, char *addr)
138 {
139         return a->sid == sid && ether_addr_equal(a->remote, addr);
140 }
141
142 #if 8 % PPPOE_HASH_BITS
143 #error 8 must be a multiple of PPPOE_HASH_BITS
144 #endif
145
146 static int hash_item(__be16 sid, unsigned char *addr)
147 {
148         unsigned char hash = 0;
149         unsigned int i;
150
151         for (i = 0; i < ETH_ALEN; i++)
152                 hash ^= addr[i];
153         for (i = 0; i < sizeof(sid_t) * 8; i += 8)
154                 hash ^= (__force __u32)sid >> i;
155         for (i = 8; (i >>= 1) >= PPPOE_HASH_BITS;)
156                 hash ^= hash >> i;
157
158         return hash & PPPOE_HASH_MASK;
159 }
160
161 /**********************************************************************
162  *
163  *  Set/get/delete/rehash items  (internal versions)
164  *
165  **********************************************************************/
166 static struct pppox_sock *__get_item(struct pppoe_net *pn, __be16 sid,
167                                 unsigned char *addr, int ifindex)
168 {
169         int hash = hash_item(sid, addr);
170         struct pppox_sock *ret;
171
172         ret = pn->hash_table[hash];
173         while (ret) {
174                 if (cmp_addr(&ret->pppoe_pa, sid, addr) &&
175                     ret->pppoe_ifindex == ifindex)
176                         return ret;
177
178                 ret = ret->next;
179         }
180
181         return NULL;
182 }
183
184 static int __set_item(struct pppoe_net *pn, struct pppox_sock *po)
185 {
186         int hash = hash_item(po->pppoe_pa.sid, po->pppoe_pa.remote);
187         struct pppox_sock *ret;
188
189         ret = pn->hash_table[hash];
190         while (ret) {
191                 if (cmp_2_addr(&ret->pppoe_pa, &po->pppoe_pa) &&
192                     ret->pppoe_ifindex == po->pppoe_ifindex)
193                         return -EALREADY;
194
195                 ret = ret->next;
196         }
197
198         po->next = pn->hash_table[hash];
199         pn->hash_table[hash] = po;
200
201         return 0;
202 }
203
204 static void __delete_item(struct pppoe_net *pn, __be16 sid,
205                                         char *addr, int ifindex)
206 {
207         int hash = hash_item(sid, addr);
208         struct pppox_sock *ret, **src;
209
210         ret = pn->hash_table[hash];
211         src = &pn->hash_table[hash];
212
213         while (ret) {
214                 if (cmp_addr(&ret->pppoe_pa, sid, addr) &&
215                     ret->pppoe_ifindex == ifindex) {
216                         *src = ret->next;
217                         break;
218                 }
219
220                 src = &ret->next;
221                 ret = ret->next;
222         }
223 }
224
225 /**********************************************************************
226  *
227  *  Set/get/delete/rehash items
228  *
229  **********************************************************************/
230 static inline struct pppox_sock *get_item(struct pppoe_net *pn, __be16 sid,
231                                         unsigned char *addr, int ifindex)
232 {
233         struct pppox_sock *po;
234
235         read_lock_bh(&pn->hash_lock);
236         po = __get_item(pn, sid, addr, ifindex);
237         if (po)
238                 sock_hold(sk_pppox(po));
239         read_unlock_bh(&pn->hash_lock);
240
241         return po;
242 }
243
244 static inline struct pppox_sock *get_item_by_addr(struct net *net,
245                                                 struct sockaddr_pppox *sp)
246 {
247         struct net_device *dev;
248         struct pppoe_net *pn;
249         struct pppox_sock *pppox_sock = NULL;
250
251         int ifindex;
252
253         rcu_read_lock();
254         dev = dev_get_by_name_rcu(net, sp->sa_addr.pppoe.dev);
255         if (dev) {
256                 ifindex = dev->ifindex;
257                 pn = pppoe_pernet(net);
258                 pppox_sock = get_item(pn, sp->sa_addr.pppoe.sid,
259                                 sp->sa_addr.pppoe.remote, ifindex);
260         }
261         rcu_read_unlock();
262         return pppox_sock;
263 }
264
265 static inline void delete_item(struct pppoe_net *pn, __be16 sid,
266                                         char *addr, int ifindex)
267 {
268         write_lock_bh(&pn->hash_lock);
269         __delete_item(pn, sid, addr, ifindex);
270         write_unlock_bh(&pn->hash_lock);
271 }
272
273 /***************************************************************************
274  *
275  *  Handler for device events.
276  *  Certain device events require that sockets be unconnected.
277  *
278  **************************************************************************/
279
280 static void pppoe_flush_dev(struct net_device *dev)
281 {
282         struct pppoe_net *pn;
283         int i;
284
285         pn = pppoe_pernet(dev_net(dev));
286         write_lock_bh(&pn->hash_lock);
287         for (i = 0; i < PPPOE_HASH_SIZE; i++) {
288                 struct pppox_sock *po = pn->hash_table[i];
289                 struct sock *sk;
290
291                 while (po) {
292                         while (po && po->pppoe_dev != dev) {
293                                 po = po->next;
294                         }
295
296                         if (!po)
297                                 break;
298
299                         sk = sk_pppox(po);
300
301                         /* We always grab the socket lock, followed by the
302                          * hash_lock, in that order.  Since we should hold the
303                          * sock lock while doing any unbinding, we need to
304                          * release the lock we're holding.  Hold a reference to
305                          * the sock so it doesn't disappear as we're jumping
306                          * between locks.
307                          */
308
309                         sock_hold(sk);
310                         write_unlock_bh(&pn->hash_lock);
311                         lock_sock(sk);
312
313                         if (po->pppoe_dev == dev &&
314                             sk->sk_state & (PPPOX_CONNECTED | PPPOX_BOUND | PPPOX_ZOMBIE)) {
315                                 pppox_unbind_sock(sk);
316                                 sk->sk_state_change(sk);
317                                 po->pppoe_dev = NULL;
318                                 dev_put(dev);
319                         }
320
321                         release_sock(sk);
322                         sock_put(sk);
323
324                         /* Restart the process from the start of the current
325                          * hash chain. We dropped locks so the world may have
326                          * change from underneath us.
327                          */
328
329                         BUG_ON(pppoe_pernet(dev_net(dev)) == NULL);
330                         write_lock_bh(&pn->hash_lock);
331                         po = pn->hash_table[i];
332                 }
333         }
334         write_unlock_bh(&pn->hash_lock);
335 }
336
337 static int pppoe_device_event(struct notifier_block *this,
338                               unsigned long event, void *ptr)
339 {
340         struct net_device *dev = netdev_notifier_info_to_dev(ptr);
341
342         /* Only look at sockets that are using this specific device. */
343         switch (event) {
344         case NETDEV_CHANGEADDR:
345         case NETDEV_CHANGEMTU:
346                 /* A change in mtu or address is a bad thing, requiring
347                  * LCP re-negotiation.
348                  */
349
350         case NETDEV_GOING_DOWN:
351         case NETDEV_DOWN:
352                 /* Find every socket on this device and kill it. */
353                 pppoe_flush_dev(dev);
354                 break;
355
356         default:
357                 break;
358         }
359
360         return NOTIFY_DONE;
361 }
362
363 static struct notifier_block pppoe_notifier = {
364         .notifier_call = pppoe_device_event,
365 };
366
367 /************************************************************************
368  *
369  * Do the real work of receiving a PPPoE Session frame.
370  *
371  ***********************************************************************/
372 static int pppoe_rcv_core(struct sock *sk, struct sk_buff *skb)
373 {
374         struct pppox_sock *po = pppox_sk(sk);
375         struct pppox_sock *relay_po;
376
377         /* Backlog receive. Semantics of backlog rcv preclude any code from
378          * executing in lock_sock()/release_sock() bounds; meaning sk->sk_state
379          * can't change.
380          */
381
382         if (skb->pkt_type == PACKET_OTHERHOST)
383                 goto abort_kfree;
384
385         if (sk->sk_state & PPPOX_BOUND) {
386                 ppp_input(&po->chan, skb);
387         } else if (sk->sk_state & PPPOX_RELAY) {
388                 relay_po = get_item_by_addr(sock_net(sk),
389                                             &po->pppoe_relay);
390                 if (relay_po == NULL)
391                         goto abort_kfree;
392
393                 if ((sk_pppox(relay_po)->sk_state & PPPOX_CONNECTED) == 0)
394                         goto abort_put;
395
396                 if (!__pppoe_xmit(sk_pppox(relay_po), skb))
397                         goto abort_put;
398
399                 sock_put(sk_pppox(relay_po));
400         } else {
401                 if (sock_queue_rcv_skb(sk, skb))
402                         goto abort_kfree;
403         }
404
405         return NET_RX_SUCCESS;
406
407 abort_put:
408         sock_put(sk_pppox(relay_po));
409
410 abort_kfree:
411         kfree_skb(skb);
412         return NET_RX_DROP;
413 }
414
415 /************************************************************************
416  *
417  * Receive wrapper called in BH context.
418  *
419  ***********************************************************************/
420 static int pppoe_rcv(struct sk_buff *skb, struct net_device *dev,
421                      struct packet_type *pt, struct net_device *orig_dev)
422 {
423         struct pppoe_hdr *ph;
424         struct pppox_sock *po;
425         struct pppoe_net *pn;
426         int len;
427
428         skb = skb_share_check(skb, GFP_ATOMIC);
429         if (!skb)
430                 goto out;
431
432         if (!pskb_may_pull(skb, sizeof(struct pppoe_hdr)))
433                 goto drop;
434
435         ph = pppoe_hdr(skb);
436         len = ntohs(ph->length);
437
438         skb_pull_rcsum(skb, sizeof(*ph));
439         if (skb->len < len)
440                 goto drop;
441
442         if (pskb_trim_rcsum(skb, len))
443                 goto drop;
444
445         ph = pppoe_hdr(skb);
446         pn = pppoe_pernet(dev_net(dev));
447
448         /* Note that get_item does a sock_hold(), so sk_pppox(po)
449          * is known to be safe.
450          */
451         po = get_item(pn, ph->sid, eth_hdr(skb)->h_source, dev->ifindex);
452         if (!po)
453                 goto drop;
454
455         return sk_receive_skb(sk_pppox(po), skb, 0);
456
457 drop:
458         kfree_skb(skb);
459 out:
460         return NET_RX_DROP;
461 }
462
463 static void pppoe_unbind_sock_work(struct work_struct *work)
464 {
465         struct pppox_sock *po = container_of(work, struct pppox_sock,
466                                              proto.pppoe.padt_work);
467         struct sock *sk = sk_pppox(po);
468
469         lock_sock(sk);
470         if (po->pppoe_dev) {
471                 dev_put(po->pppoe_dev);
472                 po->pppoe_dev = NULL;
473         }
474         pppox_unbind_sock(sk);
475         release_sock(sk);
476         sock_put(sk);
477 }
478
479 /************************************************************************
480  *
481  * Receive a PPPoE Discovery frame.
482  * This is solely for detection of PADT frames
483  *
484  ***********************************************************************/
485 static int pppoe_disc_rcv(struct sk_buff *skb, struct net_device *dev,
486                           struct packet_type *pt, struct net_device *orig_dev)
487
488 {
489         struct pppoe_hdr *ph;
490         struct pppox_sock *po;
491         struct pppoe_net *pn;
492
493         skb = skb_share_check(skb, GFP_ATOMIC);
494         if (!skb)
495                 goto out;
496
497         if (skb->pkt_type != PACKET_HOST)
498                 goto abort;
499
500         if (!pskb_may_pull(skb, sizeof(struct pppoe_hdr)))
501                 goto abort;
502
503         ph = pppoe_hdr(skb);
504         if (ph->code != PADT_CODE)
505                 goto abort;
506
507         pn = pppoe_pernet(dev_net(dev));
508         po = get_item(pn, ph->sid, eth_hdr(skb)->h_source, dev->ifindex);
509         if (po) {
510                 struct sock *sk = sk_pppox(po);
511
512                 bh_lock_sock(sk);
513
514                 /* If the user has locked the socket, just ignore
515                  * the packet.  With the way two rcv protocols hook into
516                  * one socket family type, we cannot (easily) distinguish
517                  * what kind of SKB it is during backlog rcv.
518                  */
519                 if (sock_owned_by_user(sk) == 0) {
520                         /* We're no longer connect at the PPPOE layer,
521                          * and must wait for ppp channel to disconnect us.
522                          */
523                         sk->sk_state = PPPOX_ZOMBIE;
524                 }
525
526                 bh_unlock_sock(sk);
527                 if (!schedule_work(&po->proto.pppoe.padt_work))
528                         sock_put(sk);
529         }
530
531 abort:
532         kfree_skb(skb);
533 out:
534         return NET_RX_SUCCESS; /* Lies... :-) */
535 }
536
537 static struct packet_type pppoes_ptype __read_mostly = {
538         .type   = cpu_to_be16(ETH_P_PPP_SES),
539         .func   = pppoe_rcv,
540 };
541
542 static struct packet_type pppoed_ptype __read_mostly = {
543         .type   = cpu_to_be16(ETH_P_PPP_DISC),
544         .func   = pppoe_disc_rcv,
545 };
546
547 static struct proto pppoe_sk_proto __read_mostly = {
548         .name     = "PPPOE",
549         .owner    = THIS_MODULE,
550         .obj_size = sizeof(struct pppox_sock),
551 };
552
553 /***********************************************************************
554  *
555  * Initialize a new struct sock.
556  *
557  **********************************************************************/
558 static int pppoe_create(struct net *net, struct socket *sock, int kern)
559 {
560         struct sock *sk;
561
562         sk = sk_alloc(net, PF_PPPOX, GFP_KERNEL, &pppoe_sk_proto, kern);
563         if (!sk)
564                 return -ENOMEM;
565
566         sock_init_data(sock, sk);
567
568         sock->state     = SS_UNCONNECTED;
569         sock->ops       = &pppoe_ops;
570
571         sk->sk_backlog_rcv      = pppoe_rcv_core;
572         sk->sk_state            = PPPOX_NONE;
573         sk->sk_type             = SOCK_STREAM;
574         sk->sk_family           = PF_PPPOX;
575         sk->sk_protocol         = PX_PROTO_OE;
576
577         INIT_WORK(&pppox_sk(sk)->proto.pppoe.padt_work,
578                   pppoe_unbind_sock_work);
579
580         return 0;
581 }
582
583 static int pppoe_release(struct socket *sock)
584 {
585         struct sock *sk = sock->sk;
586         struct pppox_sock *po;
587         struct pppoe_net *pn;
588         struct net *net = NULL;
589
590         if (!sk)
591                 return 0;
592
593         lock_sock(sk);
594         if (sock_flag(sk, SOCK_DEAD)) {
595                 release_sock(sk);
596                 return -EBADF;
597         }
598
599         po = pppox_sk(sk);
600
601         if (po->pppoe_dev) {
602                 dev_put(po->pppoe_dev);
603                 po->pppoe_dev = NULL;
604         }
605
606         pppox_unbind_sock(sk);
607
608         /* Signal the death of the socket. */
609         sk->sk_state = PPPOX_DEAD;
610
611         net = sock_net(sk);
612         pn = pppoe_pernet(net);
613
614         /*
615          * protect "po" from concurrent updates
616          * on pppoe_flush_dev
617          */
618         delete_item(pn, po->pppoe_pa.sid, po->pppoe_pa.remote,
619                     po->pppoe_ifindex);
620
621         sock_orphan(sk);
622         sock->sk = NULL;
623
624         skb_queue_purge(&sk->sk_receive_queue);
625         release_sock(sk);
626         sock_put(sk);
627
628         return 0;
629 }
630
631 static int pppoe_connect(struct socket *sock, struct sockaddr *uservaddr,
632                   int sockaddr_len, int flags)
633 {
634         struct sock *sk = sock->sk;
635         struct sockaddr_pppox *sp = (struct sockaddr_pppox *)uservaddr;
636         struct pppox_sock *po = pppox_sk(sk);
637         struct net_device *dev = NULL;
638         struct pppoe_net *pn;
639         struct net *net = NULL;
640         int error;
641
642         lock_sock(sk);
643
644         error = -EINVAL;
645
646         if (sockaddr_len != sizeof(struct sockaddr_pppox))
647                 goto end;
648
649         if (sp->sa_protocol != PX_PROTO_OE)
650                 goto end;
651
652         /* Check for already bound sockets */
653         error = -EBUSY;
654         if ((sk->sk_state & PPPOX_CONNECTED) &&
655              stage_session(sp->sa_addr.pppoe.sid))
656                 goto end;
657
658         /* Check for already disconnected sockets, on attempts to disconnect */
659         error = -EALREADY;
660         if ((sk->sk_state & PPPOX_DEAD) &&
661              !stage_session(sp->sa_addr.pppoe.sid))
662                 goto end;
663
664         error = 0;
665
666         /* Delete the old binding */
667         if (stage_session(po->pppoe_pa.sid)) {
668                 pppox_unbind_sock(sk);
669                 pn = pppoe_pernet(sock_net(sk));
670                 delete_item(pn, po->pppoe_pa.sid,
671                             po->pppoe_pa.remote, po->pppoe_ifindex);
672                 if (po->pppoe_dev) {
673                         dev_put(po->pppoe_dev);
674                         po->pppoe_dev = NULL;
675                 }
676
677                 po->pppoe_ifindex = 0;
678                 memset(&po->pppoe_pa, 0, sizeof(po->pppoe_pa));
679                 memset(&po->pppoe_relay, 0, sizeof(po->pppoe_relay));
680                 memset(&po->chan, 0, sizeof(po->chan));
681                 po->next = NULL;
682                 po->num = 0;
683
684                 sk->sk_state = PPPOX_NONE;
685         }
686
687         /* Re-bind in session stage only */
688         if (stage_session(sp->sa_addr.pppoe.sid)) {
689                 error = -ENODEV;
690                 net = sock_net(sk);
691                 dev = dev_get_by_name(net, sp->sa_addr.pppoe.dev);
692                 if (!dev)
693                         goto err_put;
694
695                 po->pppoe_dev = dev;
696                 po->pppoe_ifindex = dev->ifindex;
697                 pn = pppoe_pernet(net);
698                 if (!(dev->flags & IFF_UP)) {
699                         goto err_put;
700                 }
701
702                 memcpy(&po->pppoe_pa,
703                        &sp->sa_addr.pppoe,
704                        sizeof(struct pppoe_addr));
705
706                 write_lock_bh(&pn->hash_lock);
707                 error = __set_item(pn, po);
708                 write_unlock_bh(&pn->hash_lock);
709                 if (error < 0)
710                         goto err_put;
711
712                 po->chan.hdrlen = (sizeof(struct pppoe_hdr) +
713                                    dev->hard_header_len);
714
715                 po->chan.mtu = dev->mtu - sizeof(struct pppoe_hdr) - 2;
716                 po->chan.private = sk;
717                 po->chan.ops = &pppoe_chan_ops;
718
719                 error = ppp_register_net_channel(dev_net(dev), &po->chan);
720                 if (error) {
721                         delete_item(pn, po->pppoe_pa.sid,
722                                     po->pppoe_pa.remote, po->pppoe_ifindex);
723                         goto err_put;
724                 }
725
726                 sk->sk_state = PPPOX_CONNECTED;
727         }
728
729         po->num = sp->sa_addr.pppoe.sid;
730
731 end:
732         release_sock(sk);
733         return error;
734 err_put:
735         if (po->pppoe_dev) {
736                 dev_put(po->pppoe_dev);
737                 po->pppoe_dev = NULL;
738         }
739         goto end;
740 }
741
742 static int pppoe_getname(struct socket *sock, struct sockaddr *uaddr,
743                   int *usockaddr_len, int peer)
744 {
745         int len = sizeof(struct sockaddr_pppox);
746         struct sockaddr_pppox sp;
747
748         sp.sa_family    = AF_PPPOX;
749         sp.sa_protocol  = PX_PROTO_OE;
750         memcpy(&sp.sa_addr.pppoe, &pppox_sk(sock->sk)->pppoe_pa,
751                sizeof(struct pppoe_addr));
752
753         memcpy(uaddr, &sp, len);
754
755         *usockaddr_len = len;
756
757         return 0;
758 }
759
760 static int pppoe_ioctl(struct socket *sock, unsigned int cmd,
761                 unsigned long arg)
762 {
763         struct sock *sk = sock->sk;
764         struct pppox_sock *po = pppox_sk(sk);
765         int val;
766         int err;
767
768         switch (cmd) {
769         case PPPIOCGMRU:
770                 err = -ENXIO;
771                 if (!(sk->sk_state & PPPOX_CONNECTED))
772                         break;
773
774                 err = -EFAULT;
775                 if (put_user(po->pppoe_dev->mtu -
776                              sizeof(struct pppoe_hdr) -
777                              PPP_HDRLEN,
778                              (int __user *)arg))
779                         break;
780                 err = 0;
781                 break;
782
783         case PPPIOCSMRU:
784                 err = -ENXIO;
785                 if (!(sk->sk_state & PPPOX_CONNECTED))
786                         break;
787
788                 err = -EFAULT;
789                 if (get_user(val, (int __user *)arg))
790                         break;
791
792                 if (val < (po->pppoe_dev->mtu
793                            - sizeof(struct pppoe_hdr)
794                            - PPP_HDRLEN))
795                         err = 0;
796                 else
797                         err = -EINVAL;
798                 break;
799
800         case PPPIOCSFLAGS:
801                 err = -EFAULT;
802                 if (get_user(val, (int __user *)arg))
803                         break;
804                 err = 0;
805                 break;
806
807         case PPPOEIOCSFWD:
808         {
809                 struct pppox_sock *relay_po;
810
811                 err = -EBUSY;
812                 if (sk->sk_state & (PPPOX_BOUND | PPPOX_ZOMBIE | PPPOX_DEAD))
813                         break;
814
815                 err = -ENOTCONN;
816                 if (!(sk->sk_state & PPPOX_CONNECTED))
817                         break;
818
819                 /* PPPoE address from the user specifies an outbound
820                    PPPoE address which frames are forwarded to */
821                 err = -EFAULT;
822                 if (copy_from_user(&po->pppoe_relay,
823                                    (void __user *)arg,
824                                    sizeof(struct sockaddr_pppox)))
825                         break;
826
827                 err = -EINVAL;
828                 if (po->pppoe_relay.sa_family != AF_PPPOX ||
829                     po->pppoe_relay.sa_protocol != PX_PROTO_OE)
830                         break;
831
832                 /* Check that the socket referenced by the address
833                    actually exists. */
834                 relay_po = get_item_by_addr(sock_net(sk), &po->pppoe_relay);
835                 if (!relay_po)
836                         break;
837
838                 sock_put(sk_pppox(relay_po));
839                 sk->sk_state |= PPPOX_RELAY;
840                 err = 0;
841                 break;
842         }
843
844         case PPPOEIOCDFWD:
845                 err = -EALREADY;
846                 if (!(sk->sk_state & PPPOX_RELAY))
847                         break;
848
849                 sk->sk_state &= ~PPPOX_RELAY;
850                 err = 0;
851                 break;
852
853         default:
854                 err = -ENOTTY;
855         }
856
857         return err;
858 }
859
860 static int pppoe_sendmsg(struct socket *sock, struct msghdr *m,
861                          size_t total_len)
862 {
863         struct sk_buff *skb;
864         struct sock *sk = sock->sk;
865         struct pppox_sock *po = pppox_sk(sk);
866         int error;
867         struct pppoe_hdr hdr;
868         struct pppoe_hdr *ph;
869         struct net_device *dev;
870         char *start;
871         int hlen;
872
873         lock_sock(sk);
874         if (sock_flag(sk, SOCK_DEAD) || !(sk->sk_state & PPPOX_CONNECTED)) {
875                 error = -ENOTCONN;
876                 goto end;
877         }
878
879         hdr.ver = 1;
880         hdr.type = 1;
881         hdr.code = 0;
882         hdr.sid = po->num;
883
884         dev = po->pppoe_dev;
885
886         error = -EMSGSIZE;
887         if (total_len > (dev->mtu + dev->hard_header_len))
888                 goto end;
889
890         hlen = LL_RESERVED_SPACE(dev);
891         skb = sock_wmalloc(sk, hlen + sizeof(*ph) + total_len +
892                            dev->needed_tailroom, 0, GFP_KERNEL);
893         if (!skb) {
894                 error = -ENOMEM;
895                 goto end;
896         }
897
898         /* Reserve space for headers. */
899         skb_reserve(skb, hlen);
900         skb_reset_network_header(skb);
901
902         skb->dev = dev;
903
904         skb->priority = sk->sk_priority;
905         skb->protocol = cpu_to_be16(ETH_P_PPP_SES);
906
907         ph = (struct pppoe_hdr *)skb_put(skb, total_len + sizeof(struct pppoe_hdr));
908         start = (char *)&ph->tag[0];
909
910         error = memcpy_from_msg(start, m, total_len);
911         if (error < 0) {
912                 kfree_skb(skb);
913                 goto end;
914         }
915
916         error = total_len;
917         dev_hard_header(skb, dev, ETH_P_PPP_SES,
918                         po->pppoe_pa.remote, NULL, total_len);
919
920         memcpy(ph, &hdr, sizeof(struct pppoe_hdr));
921
922         ph->length = htons(total_len);
923
924         dev_queue_xmit(skb);
925
926 end:
927         release_sock(sk);
928         return error;
929 }
930
931 /************************************************************************
932  *
933  * xmit function for internal use.
934  *
935  ***********************************************************************/
936 static int __pppoe_xmit(struct sock *sk, struct sk_buff *skb)
937 {
938         struct pppox_sock *po = pppox_sk(sk);
939         struct net_device *dev = po->pppoe_dev;
940         struct pppoe_hdr *ph;
941         int data_len = skb->len;
942
943         /* The higher-level PPP code (ppp_unregister_channel()) ensures the PPP
944          * xmit operations conclude prior to an unregistration call.  Thus
945          * sk->sk_state cannot change, so we don't need to do lock_sock().
946          * But, we also can't do a lock_sock since that introduces a potential
947          * deadlock as we'd reverse the lock ordering used when calling
948          * ppp_unregister_channel().
949          */
950
951         if (sock_flag(sk, SOCK_DEAD) || !(sk->sk_state & PPPOX_CONNECTED))
952                 goto abort;
953
954         if (!dev)
955                 goto abort;
956
957         /* Copy the data if there is no space for the header or if it's
958          * read-only.
959          */
960         if (skb_cow_head(skb, LL_RESERVED_SPACE(dev) + sizeof(*ph)))
961                 goto abort;
962
963         __skb_push(skb, sizeof(*ph));
964         skb_reset_network_header(skb);
965
966         ph = pppoe_hdr(skb);
967         ph->ver = 1;
968         ph->type = 1;
969         ph->code = 0;
970         ph->sid = po->num;
971         ph->length = htons(data_len);
972
973         skb->protocol = cpu_to_be16(ETH_P_PPP_SES);
974         skb->dev = dev;
975
976         dev_hard_header(skb, dev, ETH_P_PPP_SES,
977                         po->pppoe_pa.remote, NULL, data_len);
978
979         dev_queue_xmit(skb);
980         return 1;
981
982 abort:
983         kfree_skb(skb);
984         return 1;
985 }
986
987 /************************************************************************
988  *
989  * xmit function called by generic PPP driver
990  * sends PPP frame over PPPoE socket
991  *
992  ***********************************************************************/
993 static int pppoe_xmit(struct ppp_channel *chan, struct sk_buff *skb)
994 {
995         struct sock *sk = (struct sock *)chan->private;
996         return __pppoe_xmit(sk, skb);
997 }
998
999 static const struct ppp_channel_ops pppoe_chan_ops = {
1000         .start_xmit = pppoe_xmit,
1001 };
1002
1003 static int pppoe_recvmsg(struct socket *sock, struct msghdr *m,
1004                          size_t total_len, int flags)
1005 {
1006         struct sock *sk = sock->sk;
1007         struct sk_buff *skb;
1008         int error = 0;
1009
1010         if (sk->sk_state & PPPOX_BOUND) {
1011                 error = -EIO;
1012                 goto end;
1013         }
1014
1015         skb = skb_recv_datagram(sk, flags & ~MSG_DONTWAIT,
1016                                 flags & MSG_DONTWAIT, &error);
1017         if (error < 0)
1018                 goto end;
1019
1020         if (skb) {
1021                 total_len = min_t(size_t, total_len, skb->len);
1022                 error = skb_copy_datagram_msg(skb, 0, m, total_len);
1023                 if (error == 0) {
1024                         consume_skb(skb);
1025                         return total_len;
1026                 }
1027         }
1028
1029         kfree_skb(skb);
1030 end:
1031         return error;
1032 }
1033
1034 #ifdef CONFIG_PROC_FS
1035 static int pppoe_seq_show(struct seq_file *seq, void *v)
1036 {
1037         struct pppox_sock *po;
1038         char *dev_name;
1039
1040         if (v == SEQ_START_TOKEN) {
1041                 seq_puts(seq, "Id       Address              Device\n");
1042                 goto out;
1043         }
1044
1045         po = v;
1046         dev_name = po->pppoe_pa.dev;
1047
1048         seq_printf(seq, "%08X %pM %8s\n",
1049                 po->pppoe_pa.sid, po->pppoe_pa.remote, dev_name);
1050 out:
1051         return 0;
1052 }
1053
1054 static inline struct pppox_sock *pppoe_get_idx(struct pppoe_net *pn, loff_t pos)
1055 {
1056         struct pppox_sock *po;
1057         int i;
1058
1059         for (i = 0; i < PPPOE_HASH_SIZE; i++) {
1060                 po = pn->hash_table[i];
1061                 while (po) {
1062                         if (!pos--)
1063                                 goto out;
1064                         po = po->next;
1065                 }
1066         }
1067
1068 out:
1069         return po;
1070 }
1071
1072 static void *pppoe_seq_start(struct seq_file *seq, loff_t *pos)
1073         __acquires(pn->hash_lock)
1074 {
1075         struct pppoe_net *pn = pppoe_pernet(seq_file_net(seq));
1076         loff_t l = *pos;
1077
1078         read_lock_bh(&pn->hash_lock);
1079         return l ? pppoe_get_idx(pn, --l) : SEQ_START_TOKEN;
1080 }
1081
1082 static void *pppoe_seq_next(struct seq_file *seq, void *v, loff_t *pos)
1083 {
1084         struct pppoe_net *pn = pppoe_pernet(seq_file_net(seq));
1085         struct pppox_sock *po;
1086
1087         ++*pos;
1088         if (v == SEQ_START_TOKEN) {
1089                 po = pppoe_get_idx(pn, 0);
1090                 goto out;
1091         }
1092         po = v;
1093         if (po->next)
1094                 po = po->next;
1095         else {
1096                 int hash = hash_item(po->pppoe_pa.sid, po->pppoe_pa.remote);
1097
1098                 po = NULL;
1099                 while (++hash < PPPOE_HASH_SIZE) {
1100                         po = pn->hash_table[hash];
1101                         if (po)
1102                                 break;
1103                 }
1104         }
1105
1106 out:
1107         return po;
1108 }
1109
1110 static void pppoe_seq_stop(struct seq_file *seq, void *v)
1111         __releases(pn->hash_lock)
1112 {
1113         struct pppoe_net *pn = pppoe_pernet(seq_file_net(seq));
1114         read_unlock_bh(&pn->hash_lock);
1115 }
1116
1117 static const struct seq_operations pppoe_seq_ops = {
1118         .start          = pppoe_seq_start,
1119         .next           = pppoe_seq_next,
1120         .stop           = pppoe_seq_stop,
1121         .show           = pppoe_seq_show,
1122 };
1123
1124 static int pppoe_seq_open(struct inode *inode, struct file *file)
1125 {
1126         return seq_open_net(inode, file, &pppoe_seq_ops,
1127                         sizeof(struct seq_net_private));
1128 }
1129
1130 static const struct file_operations pppoe_seq_fops = {
1131         .owner          = THIS_MODULE,
1132         .open           = pppoe_seq_open,
1133         .read           = seq_read,
1134         .llseek         = seq_lseek,
1135         .release        = seq_release_net,
1136 };
1137
1138 #endif /* CONFIG_PROC_FS */
1139
1140 static const struct proto_ops pppoe_ops = {
1141         .family         = AF_PPPOX,
1142         .owner          = THIS_MODULE,
1143         .release        = pppoe_release,
1144         .bind           = sock_no_bind,
1145         .connect        = pppoe_connect,
1146         .socketpair     = sock_no_socketpair,
1147         .accept         = sock_no_accept,
1148         .getname        = pppoe_getname,
1149         .poll           = datagram_poll,
1150         .listen         = sock_no_listen,
1151         .shutdown       = sock_no_shutdown,
1152         .setsockopt     = sock_no_setsockopt,
1153         .getsockopt     = sock_no_getsockopt,
1154         .sendmsg        = pppoe_sendmsg,
1155         .recvmsg        = pppoe_recvmsg,
1156         .mmap           = sock_no_mmap,
1157         .ioctl          = pppox_ioctl,
1158 #ifdef CONFIG_COMPAT
1159         .compat_ioctl   = pppox_compat_ioctl,
1160 #endif
1161 };
1162
1163 static const struct pppox_proto pppoe_proto = {
1164         .create = pppoe_create,
1165         .ioctl  = pppoe_ioctl,
1166         .owner  = THIS_MODULE,
1167 };
1168
1169 static __net_init int pppoe_init_net(struct net *net)
1170 {
1171         struct pppoe_net *pn = pppoe_pernet(net);
1172         struct proc_dir_entry *pde;
1173
1174         rwlock_init(&pn->hash_lock);
1175
1176         pde = proc_create("pppoe", S_IRUGO, net->proc_net, &pppoe_seq_fops);
1177 #ifdef CONFIG_PROC_FS
1178         if (!pde)
1179                 return -ENOMEM;
1180 #endif
1181
1182         return 0;
1183 }
1184
1185 static __net_exit void pppoe_exit_net(struct net *net)
1186 {
1187         remove_proc_entry("pppoe", net->proc_net);
1188 }
1189
1190 static struct pernet_operations pppoe_net_ops = {
1191         .init = pppoe_init_net,
1192         .exit = pppoe_exit_net,
1193         .id   = &pppoe_net_id,
1194         .size = sizeof(struct pppoe_net),
1195 };
1196
1197 static int __init pppoe_init(void)
1198 {
1199         int err;
1200
1201         err = register_pernet_device(&pppoe_net_ops);
1202         if (err)
1203                 goto out;
1204
1205         err = proto_register(&pppoe_sk_proto, 0);
1206         if (err)
1207                 goto out_unregister_net_ops;
1208
1209         err = register_pppox_proto(PX_PROTO_OE, &pppoe_proto);
1210         if (err)
1211                 goto out_unregister_pppoe_proto;
1212
1213         dev_add_pack(&pppoes_ptype);
1214         dev_add_pack(&pppoed_ptype);
1215         register_netdevice_notifier(&pppoe_notifier);
1216
1217         return 0;
1218
1219 out_unregister_pppoe_proto:
1220         proto_unregister(&pppoe_sk_proto);
1221 out_unregister_net_ops:
1222         unregister_pernet_device(&pppoe_net_ops);
1223 out:
1224         return err;
1225 }
1226
1227 static void __exit pppoe_exit(void)
1228 {
1229         unregister_netdevice_notifier(&pppoe_notifier);
1230         dev_remove_pack(&pppoed_ptype);
1231         dev_remove_pack(&pppoes_ptype);
1232         unregister_pppox_proto(PX_PROTO_OE);
1233         proto_unregister(&pppoe_sk_proto);
1234         unregister_pernet_device(&pppoe_net_ops);
1235 }
1236
1237 module_init(pppoe_init);
1238 module_exit(pppoe_exit);
1239
1240 MODULE_AUTHOR("Michal Ostrowski <mostrows@speakeasy.net>");
1241 MODULE_DESCRIPTION("PPP over Ethernet driver");
1242 MODULE_LICENSE("GPL");
1243 MODULE_ALIAS_NETPROTO(PF_PPPOX);