GNU Linux-libre 4.9.288-gnu1
[releases.git] / include / net / sch_generic.h
1 #ifndef __NET_SCHED_GENERIC_H
2 #define __NET_SCHED_GENERIC_H
3
4 #include <linux/netdevice.h>
5 #include <linux/types.h>
6 #include <linux/rcupdate.h>
7 #include <linux/pkt_sched.h>
8 #include <linux/pkt_cls.h>
9 #include <linux/percpu.h>
10 #include <linux/dynamic_queue_limits.h>
11 #include <net/gen_stats.h>
12 #include <net/rtnetlink.h>
13
14 struct Qdisc_ops;
15 struct qdisc_walker;
16 struct tcf_walker;
17 struct module;
18
19 struct qdisc_rate_table {
20         struct tc_ratespec rate;
21         u32             data[256];
22         struct qdisc_rate_table *next;
23         int             refcnt;
24 };
25
26 enum qdisc_state_t {
27         __QDISC_STATE_SCHED,
28         __QDISC_STATE_DEACTIVATED,
29 };
30
31 struct qdisc_size_table {
32         struct rcu_head         rcu;
33         struct list_head        list;
34         struct tc_sizespec      szopts;
35         int                     refcnt;
36         u16                     data[];
37 };
38
39 /* similar to sk_buff_head, but skb->prev pointer is undefined. */
40 struct qdisc_skb_head {
41         struct sk_buff  *head;
42         struct sk_buff  *tail;
43         __u32           qlen;
44         spinlock_t      lock;
45 };
46
47 struct Qdisc {
48         int                     (*enqueue)(struct sk_buff *skb,
49                                            struct Qdisc *sch,
50                                            struct sk_buff **to_free);
51         struct sk_buff *        (*dequeue)(struct Qdisc *sch);
52         unsigned int            flags;
53 #define TCQ_F_BUILTIN           1
54 #define TCQ_F_INGRESS           2
55 #define TCQ_F_CAN_BYPASS        4
56 #define TCQ_F_MQROOT            8
57 #define TCQ_F_ONETXQUEUE        0x10 /* dequeue_skb() can assume all skbs are for
58                                       * q->dev_queue : It can test
59                                       * netif_xmit_frozen_or_stopped() before
60                                       * dequeueing next packet.
61                                       * Its true for MQ/MQPRIO slaves, or non
62                                       * multiqueue device.
63                                       */
64 #define TCQ_F_WARN_NONWC        (1 << 16)
65 #define TCQ_F_CPUSTATS          0x20 /* run using percpu statistics */
66 #define TCQ_F_NOPARENT          0x40 /* root of its hierarchy :
67                                       * qdisc_tree_decrease_qlen() should stop.
68                                       */
69         u32                     limit;
70         const struct Qdisc_ops  *ops;
71         struct qdisc_size_table __rcu *stab;
72         struct hlist_node       hash;
73         u32                     handle;
74         u32                     parent;
75         void                    *u32_node;
76
77         struct netdev_queue     *dev_queue;
78
79         struct gnet_stats_rate_est64    rate_est;
80         struct gnet_stats_basic_cpu __percpu *cpu_bstats;
81         struct gnet_stats_queue __percpu *cpu_qstats;
82
83         /*
84          * For performance sake on SMP, we put highly modified fields at the end
85          */
86         struct sk_buff          *gso_skb ____cacheline_aligned_in_smp;
87         struct qdisc_skb_head   q;
88         struct gnet_stats_basic_packed bstats;
89         seqcount_t              running;
90         struct gnet_stats_queue qstats;
91         unsigned long           state;
92         struct Qdisc            *next_sched;
93         struct sk_buff          *skb_bad_txq;
94         struct rcu_head         rcu_head;
95         int                     padded;
96         atomic_t                refcnt;
97
98         spinlock_t              busylock ____cacheline_aligned_in_smp;
99 };
100
101 static inline bool qdisc_is_running(const struct Qdisc *qdisc)
102 {
103         return (raw_read_seqcount(&qdisc->running) & 1) ? true : false;
104 }
105
106 static inline bool qdisc_run_begin(struct Qdisc *qdisc)
107 {
108         if (qdisc_is_running(qdisc))
109                 return false;
110         /* Variant of write_seqcount_begin() telling lockdep a trylock
111          * was attempted.
112          */
113         raw_write_seqcount_begin(&qdisc->running);
114         seqcount_acquire(&qdisc->running.dep_map, 0, 1, _RET_IP_);
115         return true;
116 }
117
118 static inline void qdisc_run_end(struct Qdisc *qdisc)
119 {
120         write_seqcount_end(&qdisc->running);
121 }
122
123 static inline bool qdisc_may_bulk(const struct Qdisc *qdisc)
124 {
125         return qdisc->flags & TCQ_F_ONETXQUEUE;
126 }
127
128 static inline int qdisc_avail_bulklimit(const struct netdev_queue *txq)
129 {
130 #ifdef CONFIG_BQL
131         /* Non-BQL migrated drivers will return 0, too. */
132         return dql_avail(&txq->dql);
133 #else
134         return 0;
135 #endif
136 }
137
138 struct Qdisc_class_ops {
139         /* Child qdisc manipulation */
140         struct netdev_queue *   (*select_queue)(struct Qdisc *, struct tcmsg *);
141         int                     (*graft)(struct Qdisc *, unsigned long cl,
142                                         struct Qdisc *, struct Qdisc **);
143         struct Qdisc *          (*leaf)(struct Qdisc *, unsigned long cl);
144         void                    (*qlen_notify)(struct Qdisc *, unsigned long);
145
146         /* Class manipulation routines */
147         unsigned long           (*get)(struct Qdisc *, u32 classid);
148         void                    (*put)(struct Qdisc *, unsigned long);
149         int                     (*change)(struct Qdisc *, u32, u32,
150                                         struct nlattr **, unsigned long *);
151         int                     (*delete)(struct Qdisc *, unsigned long);
152         void                    (*walk)(struct Qdisc *, struct qdisc_walker * arg);
153
154         /* Filter manipulation */
155         struct tcf_proto __rcu ** (*tcf_chain)(struct Qdisc *, unsigned long);
156         bool                    (*tcf_cl_offload)(u32 classid);
157         unsigned long           (*bind_tcf)(struct Qdisc *, unsigned long,
158                                         u32 classid);
159         void                    (*unbind_tcf)(struct Qdisc *, unsigned long);
160
161         /* rtnetlink specific */
162         int                     (*dump)(struct Qdisc *, unsigned long,
163                                         struct sk_buff *skb, struct tcmsg*);
164         int                     (*dump_stats)(struct Qdisc *, unsigned long,
165                                         struct gnet_dump *);
166 };
167
168 struct Qdisc_ops {
169         struct Qdisc_ops        *next;
170         const struct Qdisc_class_ops    *cl_ops;
171         char                    id[IFNAMSIZ];
172         int                     priv_size;
173
174         int                     (*enqueue)(struct sk_buff *skb,
175                                            struct Qdisc *sch,
176                                            struct sk_buff **to_free);
177         struct sk_buff *        (*dequeue)(struct Qdisc *);
178         struct sk_buff *        (*peek)(struct Qdisc *);
179
180         int                     (*init)(struct Qdisc *, struct nlattr *arg);
181         void                    (*reset)(struct Qdisc *);
182         void                    (*destroy)(struct Qdisc *);
183         int                     (*change)(struct Qdisc *, struct nlattr *arg);
184         void                    (*attach)(struct Qdisc *);
185
186         int                     (*dump)(struct Qdisc *, struct sk_buff *);
187         int                     (*dump_stats)(struct Qdisc *, struct gnet_dump *);
188
189         struct module           *owner;
190 };
191
192
193 struct tcf_result {
194         unsigned long   class;
195         u32             classid;
196 };
197
198 struct tcf_proto_ops {
199         struct list_head        head;
200         char                    kind[IFNAMSIZ];
201
202         int                     (*classify)(struct sk_buff *,
203                                             const struct tcf_proto *,
204                                             struct tcf_result *);
205         int                     (*init)(struct tcf_proto*);
206         bool                    (*destroy)(struct tcf_proto*, bool);
207
208         unsigned long           (*get)(struct tcf_proto*, u32 handle);
209         int                     (*change)(struct net *net, struct sk_buff *,
210                                         struct tcf_proto*, unsigned long,
211                                         u32 handle, struct nlattr **,
212                                         unsigned long *, bool);
213         int                     (*delete)(struct tcf_proto*, unsigned long);
214         void                    (*walk)(struct tcf_proto*, struct tcf_walker *arg);
215
216         /* rtnetlink specific */
217         int                     (*dump)(struct net*, struct tcf_proto*, unsigned long,
218                                         struct sk_buff *skb, struct tcmsg*);
219
220         struct module           *owner;
221 };
222
223 struct tcf_proto {
224         /* Fast access part */
225         struct tcf_proto __rcu  *next;
226         void __rcu              *root;
227         int                     (*classify)(struct sk_buff *,
228                                             const struct tcf_proto *,
229                                             struct tcf_result *);
230         __be16                  protocol;
231
232         /* All the rest */
233         u32                     prio;
234         u32                     classid;
235         struct Qdisc            *q;
236         void                    *data;
237         const struct tcf_proto_ops      *ops;
238         struct rcu_head         rcu;
239 };
240
241 struct qdisc_skb_cb {
242         unsigned int            pkt_len;
243         u16                     slave_dev_queue_mapping;
244         u16                     tc_classid;
245 #define QDISC_CB_PRIV_LEN 20
246         unsigned char           data[QDISC_CB_PRIV_LEN];
247 };
248
249 static inline void qdisc_cb_private_validate(const struct sk_buff *skb, int sz)
250 {
251         struct qdisc_skb_cb *qcb;
252
253         BUILD_BUG_ON(sizeof(skb->cb) < offsetof(struct qdisc_skb_cb, data) + sz);
254         BUILD_BUG_ON(sizeof(qcb->data) < sz);
255 }
256
257 static inline int qdisc_qlen(const struct Qdisc *q)
258 {
259         return q->q.qlen;
260 }
261
262 static inline struct qdisc_skb_cb *qdisc_skb_cb(const struct sk_buff *skb)
263 {
264         return (struct qdisc_skb_cb *)skb->cb;
265 }
266
267 static inline spinlock_t *qdisc_lock(struct Qdisc *qdisc)
268 {
269         return &qdisc->q.lock;
270 }
271
272 static inline struct Qdisc *qdisc_root(const struct Qdisc *qdisc)
273 {
274         struct Qdisc *q = rcu_dereference_rtnl(qdisc->dev_queue->qdisc);
275
276         return q;
277 }
278
279 static inline struct Qdisc *qdisc_root_bh(const struct Qdisc *qdisc)
280 {
281         return rcu_dereference_bh(qdisc->dev_queue->qdisc);
282 }
283
284 static inline struct Qdisc *qdisc_root_sleeping(const struct Qdisc *qdisc)
285 {
286         return qdisc->dev_queue->qdisc_sleeping;
287 }
288
289 /* The qdisc root lock is a mechanism by which to top level
290  * of a qdisc tree can be locked from any qdisc node in the
291  * forest.  This allows changing the configuration of some
292  * aspect of the qdisc tree while blocking out asynchronous
293  * qdisc access in the packet processing paths.
294  *
295  * It is only legal to do this when the root will not change
296  * on us.  Otherwise we'll potentially lock the wrong qdisc
297  * root.  This is enforced by holding the RTNL semaphore, which
298  * all users of this lock accessor must do.
299  */
300 static inline spinlock_t *qdisc_root_lock(const struct Qdisc *qdisc)
301 {
302         struct Qdisc *root = qdisc_root(qdisc);
303
304         ASSERT_RTNL();
305         return qdisc_lock(root);
306 }
307
308 static inline spinlock_t *qdisc_root_sleeping_lock(const struct Qdisc *qdisc)
309 {
310         struct Qdisc *root = qdisc_root_sleeping(qdisc);
311
312         ASSERT_RTNL();
313         return qdisc_lock(root);
314 }
315
316 static inline seqcount_t *qdisc_root_sleeping_running(const struct Qdisc *qdisc)
317 {
318         struct Qdisc *root = qdisc_root_sleeping(qdisc);
319
320         ASSERT_RTNL();
321         return &root->running;
322 }
323
324 static inline struct net_device *qdisc_dev(const struct Qdisc *qdisc)
325 {
326         return qdisc->dev_queue->dev;
327 }
328
329 static inline void sch_tree_lock(const struct Qdisc *q)
330 {
331         spin_lock_bh(qdisc_root_sleeping_lock(q));
332 }
333
334 static inline void sch_tree_unlock(const struct Qdisc *q)
335 {
336         spin_unlock_bh(qdisc_root_sleeping_lock(q));
337 }
338
339 #define tcf_tree_lock(tp)       sch_tree_lock((tp)->q)
340 #define tcf_tree_unlock(tp)     sch_tree_unlock((tp)->q)
341
342 extern struct Qdisc noop_qdisc;
343 extern struct Qdisc_ops noop_qdisc_ops;
344 extern struct Qdisc_ops pfifo_fast_ops;
345 extern struct Qdisc_ops mq_qdisc_ops;
346 extern struct Qdisc_ops noqueue_qdisc_ops;
347 extern const struct Qdisc_ops *default_qdisc_ops;
348 static inline const struct Qdisc_ops *
349 get_default_qdisc_ops(const struct net_device *dev, int ntx)
350 {
351         return ntx < dev->real_num_tx_queues ?
352                         default_qdisc_ops : &pfifo_fast_ops;
353 }
354
355 struct Qdisc_class_common {
356         u32                     classid;
357         struct hlist_node       hnode;
358 };
359
360 struct Qdisc_class_hash {
361         struct hlist_head       *hash;
362         unsigned int            hashsize;
363         unsigned int            hashmask;
364         unsigned int            hashelems;
365 };
366
367 static inline unsigned int qdisc_class_hash(u32 id, u32 mask)
368 {
369         id ^= id >> 8;
370         id ^= id >> 4;
371         return id & mask;
372 }
373
374 static inline struct Qdisc_class_common *
375 qdisc_class_find(const struct Qdisc_class_hash *hash, u32 id)
376 {
377         struct Qdisc_class_common *cl;
378         unsigned int h;
379
380         h = qdisc_class_hash(id, hash->hashmask);
381         hlist_for_each_entry(cl, &hash->hash[h], hnode) {
382                 if (cl->classid == id)
383                         return cl;
384         }
385         return NULL;
386 }
387
388 int qdisc_class_hash_init(struct Qdisc_class_hash *);
389 void qdisc_class_hash_insert(struct Qdisc_class_hash *,
390                              struct Qdisc_class_common *);
391 void qdisc_class_hash_remove(struct Qdisc_class_hash *,
392                              struct Qdisc_class_common *);
393 void qdisc_class_hash_grow(struct Qdisc *, struct Qdisc_class_hash *);
394 void qdisc_class_hash_destroy(struct Qdisc_class_hash *);
395
396 void dev_init_scheduler(struct net_device *dev);
397 void dev_shutdown(struct net_device *dev);
398 void dev_activate(struct net_device *dev);
399 void dev_deactivate(struct net_device *dev);
400 void dev_deactivate_many(struct list_head *head);
401 struct Qdisc *dev_graft_qdisc(struct netdev_queue *dev_queue,
402                               struct Qdisc *qdisc);
403 void qdisc_reset(struct Qdisc *qdisc);
404 void qdisc_destroy(struct Qdisc *qdisc);
405 void qdisc_tree_reduce_backlog(struct Qdisc *qdisc, unsigned int n,
406                                unsigned int len);
407 struct Qdisc *qdisc_alloc(struct netdev_queue *dev_queue,
408                           const struct Qdisc_ops *ops);
409 struct Qdisc *qdisc_create_dflt(struct netdev_queue *dev_queue,
410                                 const struct Qdisc_ops *ops, u32 parentid);
411 void __qdisc_calculate_pkt_len(struct sk_buff *skb,
412                                const struct qdisc_size_table *stab);
413 bool tcf_destroy(struct tcf_proto *tp, bool force);
414 void tcf_destroy_chain(struct tcf_proto __rcu **fl);
415 int skb_do_redirect(struct sk_buff *);
416
417 static inline bool skb_at_tc_ingress(const struct sk_buff *skb)
418 {
419 #ifdef CONFIG_NET_CLS_ACT
420         return G_TC_AT(skb->tc_verd) & AT_INGRESS;
421 #else
422         return false;
423 #endif
424 }
425
426 /* Reset all TX qdiscs greater then index of a device.  */
427 static inline void qdisc_reset_all_tx_gt(struct net_device *dev, unsigned int i)
428 {
429         struct Qdisc *qdisc;
430
431         for (; i < dev->num_tx_queues; i++) {
432                 qdisc = rtnl_dereference(netdev_get_tx_queue(dev, i)->qdisc);
433                 if (qdisc) {
434                         spin_lock_bh(qdisc_lock(qdisc));
435                         qdisc_reset(qdisc);
436                         spin_unlock_bh(qdisc_lock(qdisc));
437                 }
438         }
439 }
440
441 static inline void qdisc_reset_all_tx(struct net_device *dev)
442 {
443         qdisc_reset_all_tx_gt(dev, 0);
444 }
445
446 /* Are all TX queues of the device empty?  */
447 static inline bool qdisc_all_tx_empty(const struct net_device *dev)
448 {
449         unsigned int i;
450
451         rcu_read_lock();
452         for (i = 0; i < dev->num_tx_queues; i++) {
453                 struct netdev_queue *txq = netdev_get_tx_queue(dev, i);
454                 const struct Qdisc *q = rcu_dereference(txq->qdisc);
455
456                 if (q->q.qlen) {
457                         rcu_read_unlock();
458                         return false;
459                 }
460         }
461         rcu_read_unlock();
462         return true;
463 }
464
465 /* Are any of the TX qdiscs changing?  */
466 static inline bool qdisc_tx_changing(const struct net_device *dev)
467 {
468         unsigned int i;
469
470         for (i = 0; i < dev->num_tx_queues; i++) {
471                 struct netdev_queue *txq = netdev_get_tx_queue(dev, i);
472                 if (rcu_access_pointer(txq->qdisc) != txq->qdisc_sleeping)
473                         return true;
474         }
475         return false;
476 }
477
478 /* Is the device using the noop qdisc on all queues?  */
479 static inline bool qdisc_tx_is_noop(const struct net_device *dev)
480 {
481         unsigned int i;
482
483         for (i = 0; i < dev->num_tx_queues; i++) {
484                 struct netdev_queue *txq = netdev_get_tx_queue(dev, i);
485                 if (rcu_access_pointer(txq->qdisc) != &noop_qdisc)
486                         return false;
487         }
488         return true;
489 }
490
491 static inline unsigned int qdisc_pkt_len(const struct sk_buff *skb)
492 {
493         return qdisc_skb_cb(skb)->pkt_len;
494 }
495
496 /* additional qdisc xmit flags (NET_XMIT_MASK in linux/netdevice.h) */
497 enum net_xmit_qdisc_t {
498         __NET_XMIT_STOLEN = 0x00010000,
499         __NET_XMIT_BYPASS = 0x00020000,
500 };
501
502 #ifdef CONFIG_NET_CLS_ACT
503 #define net_xmit_drop_count(e)  ((e) & __NET_XMIT_STOLEN ? 0 : 1)
504 #else
505 #define net_xmit_drop_count(e)  (1)
506 #endif
507
508 static inline void qdisc_calculate_pkt_len(struct sk_buff *skb,
509                                            const struct Qdisc *sch)
510 {
511 #ifdef CONFIG_NET_SCHED
512         struct qdisc_size_table *stab = rcu_dereference_bh(sch->stab);
513
514         if (stab)
515                 __qdisc_calculate_pkt_len(skb, stab);
516 #endif
517 }
518
519 static inline int qdisc_enqueue(struct sk_buff *skb, struct Qdisc *sch,
520                                 struct sk_buff **to_free)
521 {
522         qdisc_calculate_pkt_len(skb, sch);
523         return sch->enqueue(skb, sch, to_free);
524 }
525
526 static inline bool qdisc_is_percpu_stats(const struct Qdisc *q)
527 {
528         return q->flags & TCQ_F_CPUSTATS;
529 }
530
531 static inline void _bstats_update(struct gnet_stats_basic_packed *bstats,
532                                   __u64 bytes, __u32 packets)
533 {
534         bstats->bytes += bytes;
535         bstats->packets += packets;
536 }
537
538 static inline void bstats_update(struct gnet_stats_basic_packed *bstats,
539                                  const struct sk_buff *skb)
540 {
541         _bstats_update(bstats,
542                        qdisc_pkt_len(skb),
543                        skb_is_gso(skb) ? skb_shinfo(skb)->gso_segs : 1);
544 }
545
546 static inline void _bstats_cpu_update(struct gnet_stats_basic_cpu *bstats,
547                                       __u64 bytes, __u32 packets)
548 {
549         u64_stats_update_begin(&bstats->syncp);
550         _bstats_update(&bstats->bstats, bytes, packets);
551         u64_stats_update_end(&bstats->syncp);
552 }
553
554 static inline void bstats_cpu_update(struct gnet_stats_basic_cpu *bstats,
555                                      const struct sk_buff *skb)
556 {
557         u64_stats_update_begin(&bstats->syncp);
558         bstats_update(&bstats->bstats, skb);
559         u64_stats_update_end(&bstats->syncp);
560 }
561
562 static inline void qdisc_bstats_cpu_update(struct Qdisc *sch,
563                                            const struct sk_buff *skb)
564 {
565         bstats_cpu_update(this_cpu_ptr(sch->cpu_bstats), skb);
566 }
567
568 static inline void qdisc_bstats_update(struct Qdisc *sch,
569                                        const struct sk_buff *skb)
570 {
571         bstats_update(&sch->bstats, skb);
572 }
573
574 static inline void qdisc_qstats_backlog_dec(struct Qdisc *sch,
575                                             const struct sk_buff *skb)
576 {
577         sch->qstats.backlog -= qdisc_pkt_len(skb);
578 }
579
580 static inline void qdisc_qstats_backlog_inc(struct Qdisc *sch,
581                                             const struct sk_buff *skb)
582 {
583         sch->qstats.backlog += qdisc_pkt_len(skb);
584 }
585
586 static inline void __qdisc_qstats_drop(struct Qdisc *sch, int count)
587 {
588         sch->qstats.drops += count;
589 }
590
591 static inline void qstats_drop_inc(struct gnet_stats_queue *qstats)
592 {
593         qstats->drops++;
594 }
595
596 static inline void qstats_overlimit_inc(struct gnet_stats_queue *qstats)
597 {
598         qstats->overlimits++;
599 }
600
601 static inline void qdisc_qstats_drop(struct Qdisc *sch)
602 {
603         qstats_drop_inc(&sch->qstats);
604 }
605
606 static inline void qdisc_qstats_cpu_drop(struct Qdisc *sch)
607 {
608         this_cpu_inc(sch->cpu_qstats->drops);
609 }
610
611 static inline void qdisc_qstats_overlimit(struct Qdisc *sch)
612 {
613         sch->qstats.overlimits++;
614 }
615
616 static inline void qdisc_skb_head_init(struct qdisc_skb_head *qh)
617 {
618         qh->head = NULL;
619         qh->tail = NULL;
620         qh->qlen = 0;
621 }
622
623 static inline int __qdisc_enqueue_tail(struct sk_buff *skb, struct Qdisc *sch,
624                                        struct qdisc_skb_head *qh)
625 {
626         struct sk_buff *last = qh->tail;
627
628         if (last) {
629                 skb->next = NULL;
630                 last->next = skb;
631                 qh->tail = skb;
632         } else {
633                 qh->tail = skb;
634                 qh->head = skb;
635         }
636         qh->qlen++;
637         qdisc_qstats_backlog_inc(sch, skb);
638
639         return NET_XMIT_SUCCESS;
640 }
641
642 static inline int qdisc_enqueue_tail(struct sk_buff *skb, struct Qdisc *sch)
643 {
644         return __qdisc_enqueue_tail(skb, sch, &sch->q);
645 }
646
647 static inline struct sk_buff *__qdisc_dequeue_head(struct qdisc_skb_head *qh)
648 {
649         struct sk_buff *skb = qh->head;
650
651         if (likely(skb != NULL)) {
652                 qh->head = skb->next;
653                 qh->qlen--;
654                 if (qh->head == NULL)
655                         qh->tail = NULL;
656                 skb->next = NULL;
657         }
658
659         return skb;
660 }
661
662 static inline struct sk_buff *qdisc_dequeue_head(struct Qdisc *sch)
663 {
664         struct sk_buff *skb = __qdisc_dequeue_head(&sch->q);
665
666         if (likely(skb != NULL)) {
667                 qdisc_qstats_backlog_dec(sch, skb);
668                 qdisc_bstats_update(sch, skb);
669         }
670
671         return skb;
672 }
673
674 /* Instead of calling kfree_skb() while root qdisc lock is held,
675  * queue the skb for future freeing at end of __dev_xmit_skb()
676  */
677 static inline void __qdisc_drop(struct sk_buff *skb, struct sk_buff **to_free)
678 {
679         skb->next = *to_free;
680         *to_free = skb;
681 }
682
683 static inline void __qdisc_drop_all(struct sk_buff *skb,
684                                     struct sk_buff **to_free)
685 {
686         if (skb->prev)
687                 skb->prev->next = *to_free;
688         else
689                 skb->next = *to_free;
690         *to_free = skb;
691 }
692
693 static inline unsigned int __qdisc_queue_drop_head(struct Qdisc *sch,
694                                                    struct qdisc_skb_head *qh,
695                                                    struct sk_buff **to_free)
696 {
697         struct sk_buff *skb = __qdisc_dequeue_head(qh);
698
699         if (likely(skb != NULL)) {
700                 unsigned int len = qdisc_pkt_len(skb);
701
702                 qdisc_qstats_backlog_dec(sch, skb);
703                 __qdisc_drop(skb, to_free);
704                 return len;
705         }
706
707         return 0;
708 }
709
710 static inline unsigned int qdisc_queue_drop_head(struct Qdisc *sch,
711                                                  struct sk_buff **to_free)
712 {
713         return __qdisc_queue_drop_head(sch, &sch->q, to_free);
714 }
715
716 static inline struct sk_buff *qdisc_peek_head(struct Qdisc *sch)
717 {
718         const struct qdisc_skb_head *qh = &sch->q;
719
720         return qh->head;
721 }
722
723 /* generic pseudo peek method for non-work-conserving qdisc */
724 static inline struct sk_buff *qdisc_peek_dequeued(struct Qdisc *sch)
725 {
726         /* we can reuse ->gso_skb because peek isn't called for root qdiscs */
727         if (!sch->gso_skb) {
728                 sch->gso_skb = sch->dequeue(sch);
729                 if (sch->gso_skb) {
730                         /* it's still part of the queue */
731                         qdisc_qstats_backlog_inc(sch, sch->gso_skb);
732                         sch->q.qlen++;
733                 }
734         }
735
736         return sch->gso_skb;
737 }
738
739 /* use instead of qdisc->dequeue() for all qdiscs queried with ->peek() */
740 static inline struct sk_buff *qdisc_dequeue_peeked(struct Qdisc *sch)
741 {
742         struct sk_buff *skb = sch->gso_skb;
743
744         if (skb) {
745                 sch->gso_skb = NULL;
746                 qdisc_qstats_backlog_dec(sch, skb);
747                 sch->q.qlen--;
748         } else {
749                 skb = sch->dequeue(sch);
750         }
751
752         return skb;
753 }
754
755 static inline void __qdisc_reset_queue(struct qdisc_skb_head *qh)
756 {
757         /*
758          * We do not know the backlog in bytes of this list, it
759          * is up to the caller to correct it
760          */
761         ASSERT_RTNL();
762         if (qh->qlen) {
763                 rtnl_kfree_skbs(qh->head, qh->tail);
764
765                 qh->head = NULL;
766                 qh->tail = NULL;
767                 qh->qlen = 0;
768         }
769 }
770
771 static inline void qdisc_reset_queue(struct Qdisc *sch)
772 {
773         __qdisc_reset_queue(&sch->q);
774         sch->qstats.backlog = 0;
775 }
776
777 static inline struct Qdisc *qdisc_replace(struct Qdisc *sch, struct Qdisc *new,
778                                           struct Qdisc **pold)
779 {
780         struct Qdisc *old;
781
782         sch_tree_lock(sch);
783         old = *pold;
784         *pold = new;
785         if (old != NULL) {
786                 unsigned int qlen = old->q.qlen;
787                 unsigned int backlog = old->qstats.backlog;
788
789                 qdisc_reset(old);
790                 qdisc_tree_reduce_backlog(old, qlen, backlog);
791         }
792         sch_tree_unlock(sch);
793
794         return old;
795 }
796
797 static inline void rtnl_qdisc_drop(struct sk_buff *skb, struct Qdisc *sch)
798 {
799         rtnl_kfree_skbs(skb, skb);
800         qdisc_qstats_drop(sch);
801 }
802
803
804 static inline int qdisc_drop(struct sk_buff *skb, struct Qdisc *sch,
805                              struct sk_buff **to_free)
806 {
807         __qdisc_drop(skb, to_free);
808         qdisc_qstats_drop(sch);
809
810         return NET_XMIT_DROP;
811 }
812
813 static inline int qdisc_drop_all(struct sk_buff *skb, struct Qdisc *sch,
814                                  struct sk_buff **to_free)
815 {
816         __qdisc_drop_all(skb, to_free);
817         qdisc_qstats_drop(sch);
818
819         return NET_XMIT_DROP;
820 }
821
822 /* Length to Time (L2T) lookup in a qdisc_rate_table, to determine how
823    long it will take to send a packet given its size.
824  */
825 static inline u32 qdisc_l2t(struct qdisc_rate_table* rtab, unsigned int pktlen)
826 {
827         int slot = pktlen + rtab->rate.cell_align + rtab->rate.overhead;
828         if (slot < 0)
829                 slot = 0;
830         slot >>= rtab->rate.cell_log;
831         if (slot > 255)
832                 return rtab->data[255]*(slot >> 8) + rtab->data[slot & 0xFF];
833         return rtab->data[slot];
834 }
835
836 struct psched_ratecfg {
837         u64     rate_bytes_ps; /* bytes per second */
838         u32     mult;
839         u16     overhead;
840         u8      linklayer;
841         u8      shift;
842 };
843
844 static inline u64 psched_l2t_ns(const struct psched_ratecfg *r,
845                                 unsigned int len)
846 {
847         len += r->overhead;
848
849         if (unlikely(r->linklayer == TC_LINKLAYER_ATM))
850                 return ((u64)(DIV_ROUND_UP(len,48)*53) * r->mult) >> r->shift;
851
852         return ((u64)len * r->mult) >> r->shift;
853 }
854
855 void psched_ratecfg_precompute(struct psched_ratecfg *r,
856                                const struct tc_ratespec *conf,
857                                u64 rate64);
858
859 static inline void psched_ratecfg_getrate(struct tc_ratespec *res,
860                                           const struct psched_ratecfg *r)
861 {
862         memset(res, 0, sizeof(*res));
863
864         /* legacy struct tc_ratespec has a 32bit @rate field
865          * Qdisc using 64bit rate should add new attributes
866          * in order to maintain compatibility.
867          */
868         res->rate = min_t(u64, r->rate_bytes_ps, ~0U);
869
870         res->overhead = r->overhead;
871         res->linklayer = (r->linklayer & TC_LINKLAYER_MASK);
872 }
873
874 #endif