d737a6a2600be802672bdcd119a782aad1a5ec9d
[releases.git] / sch_generic.h
1 /* SPDX-License-Identifier: GPL-2.0 */
2 #ifndef __NET_SCHED_GENERIC_H
3 #define __NET_SCHED_GENERIC_H
4
5 #include <linux/netdevice.h>
6 #include <linux/types.h>
7 #include <linux/rcupdate.h>
8 #include <linux/pkt_sched.h>
9 #include <linux/pkt_cls.h>
10 #include <linux/percpu.h>
11 #include <linux/dynamic_queue_limits.h>
12 #include <linux/list.h>
13 #include <linux/refcount.h>
14 #include <linux/workqueue.h>
15 #include <net/gen_stats.h>
16 #include <net/rtnetlink.h>
17
18 struct Qdisc_ops;
19 struct qdisc_walker;
20 struct tcf_walker;
21 struct module;
22
23 typedef int tc_setup_cb_t(enum tc_setup_type type,
24                           void *type_data, void *cb_priv);
25
26 struct qdisc_rate_table {
27         struct tc_ratespec rate;
28         u32             data[256];
29         struct qdisc_rate_table *next;
30         int             refcnt;
31 };
32
33 enum qdisc_state_t {
34         __QDISC_STATE_SCHED,
35         __QDISC_STATE_DEACTIVATED,
36 };
37
38 struct qdisc_size_table {
39         struct rcu_head         rcu;
40         struct list_head        list;
41         struct tc_sizespec      szopts;
42         int                     refcnt;
43         u16                     data[];
44 };
45
46 /* similar to sk_buff_head, but skb->prev pointer is undefined. */
47 struct qdisc_skb_head {
48         struct sk_buff  *head;
49         struct sk_buff  *tail;
50         union {
51                 u32             qlen;
52                 atomic_t        atomic_qlen;
53         };
54         spinlock_t      lock;
55 };
56
57 struct Qdisc {
58         int                     (*enqueue)(struct sk_buff *skb,
59                                            struct Qdisc *sch,
60                                            struct sk_buff **to_free);
61         struct sk_buff *        (*dequeue)(struct Qdisc *sch);
62         unsigned int            flags;
63 #define TCQ_F_BUILTIN           1
64 #define TCQ_F_INGRESS           2
65 #define TCQ_F_CAN_BYPASS        4
66 #define TCQ_F_MQROOT            8
67 #define TCQ_F_ONETXQUEUE        0x10 /* dequeue_skb() can assume all skbs are for
68                                       * q->dev_queue : It can test
69                                       * netif_xmit_frozen_or_stopped() before
70                                       * dequeueing next packet.
71                                       * Its true for MQ/MQPRIO slaves, or non
72                                       * multiqueue device.
73                                       */
74 #define TCQ_F_WARN_NONWC        (1 << 16)
75 #define TCQ_F_CPUSTATS          0x20 /* run using percpu statistics */
76 #define TCQ_F_NOPARENT          0x40 /* root of its hierarchy :
77                                       * qdisc_tree_decrease_qlen() should stop.
78                                       */
79 #define TCQ_F_INVISIBLE         0x80 /* invisible by default in dump */
80 #define TCQ_F_NOLOCK            0x100 /* qdisc does not require locking */
81 #define TCQ_F_OFFLOADED         0x200 /* qdisc is offloaded to HW */
82         u32                     limit;
83         const struct Qdisc_ops  *ops;
84         struct qdisc_size_table __rcu *stab;
85         struct hlist_node       hash;
86         u32                     handle;
87         u32                     parent;
88
89         struct netdev_queue     *dev_queue;
90
91         struct net_rate_estimator __rcu *rate_est;
92         struct gnet_stats_basic_cpu __percpu *cpu_bstats;
93         struct gnet_stats_queue __percpu *cpu_qstats;
94         int                     padded;
95         refcount_t              refcnt;
96
97         /*
98          * For performance sake on SMP, we put highly modified fields at the end
99          */
100         struct sk_buff_head     gso_skb ____cacheline_aligned_in_smp;
101         struct qdisc_skb_head   q;
102         struct gnet_stats_basic_packed bstats;
103         seqcount_t              running;
104         struct gnet_stats_queue qstats;
105         unsigned long           state;
106         struct Qdisc            *next_sched;
107         struct sk_buff_head     skb_bad_txq;
108
109         spinlock_t              busylock ____cacheline_aligned_in_smp;
110         spinlock_t              seqlock;
111 };
112
113 static inline void qdisc_refcount_inc(struct Qdisc *qdisc)
114 {
115         if (qdisc->flags & TCQ_F_BUILTIN)
116                 return;
117         refcount_inc(&qdisc->refcnt);
118 }
119
120 static inline bool qdisc_is_running(struct Qdisc *qdisc)
121 {
122         if (qdisc->flags & TCQ_F_NOLOCK)
123                 return spin_is_locked(&qdisc->seqlock);
124         return (raw_read_seqcount(&qdisc->running) & 1) ? true : false;
125 }
126
127 static inline bool qdisc_run_begin(struct Qdisc *qdisc)
128 {
129         if (qdisc->flags & TCQ_F_NOLOCK) {
130                 if (!spin_trylock(&qdisc->seqlock))
131                         return false;
132         } else if (qdisc_is_running(qdisc)) {
133                 return false;
134         }
135         /* Variant of write_seqcount_begin() telling lockdep a trylock
136          * was attempted.
137          */
138         raw_write_seqcount_begin(&qdisc->running);
139         seqcount_acquire(&qdisc->running.dep_map, 0, 1, _RET_IP_);
140         return true;
141 }
142
143 static inline void qdisc_run_end(struct Qdisc *qdisc)
144 {
145         write_seqcount_end(&qdisc->running);
146         if (qdisc->flags & TCQ_F_NOLOCK)
147                 spin_unlock(&qdisc->seqlock);
148 }
149
150 static inline bool qdisc_may_bulk(const struct Qdisc *qdisc)
151 {
152         return qdisc->flags & TCQ_F_ONETXQUEUE;
153 }
154
155 static inline int qdisc_avail_bulklimit(const struct netdev_queue *txq)
156 {
157 #ifdef CONFIG_BQL
158         /* Non-BQL migrated drivers will return 0, too. */
159         return dql_avail(&txq->dql);
160 #else
161         return 0;
162 #endif
163 }
164
165 struct Qdisc_class_ops {
166         /* Child qdisc manipulation */
167         struct netdev_queue *   (*select_queue)(struct Qdisc *, struct tcmsg *);
168         int                     (*graft)(struct Qdisc *, unsigned long cl,
169                                         struct Qdisc *, struct Qdisc **,
170                                         struct netlink_ext_ack *extack);
171         struct Qdisc *          (*leaf)(struct Qdisc *, unsigned long cl);
172         void                    (*qlen_notify)(struct Qdisc *, unsigned long);
173
174         /* Class manipulation routines */
175         unsigned long           (*find)(struct Qdisc *, u32 classid);
176         int                     (*change)(struct Qdisc *, u32, u32,
177                                         struct nlattr **, unsigned long *,
178                                         struct netlink_ext_ack *);
179         int                     (*delete)(struct Qdisc *, unsigned long);
180         void                    (*walk)(struct Qdisc *, struct qdisc_walker * arg);
181
182         /* Filter manipulation */
183         struct tcf_block *      (*tcf_block)(struct Qdisc *sch,
184                                              unsigned long arg,
185                                              struct netlink_ext_ack *extack);
186         unsigned long           (*bind_tcf)(struct Qdisc *, unsigned long,
187                                         u32 classid);
188         void                    (*unbind_tcf)(struct Qdisc *, unsigned long);
189
190         /* rtnetlink specific */
191         int                     (*dump)(struct Qdisc *, unsigned long,
192                                         struct sk_buff *skb, struct tcmsg*);
193         int                     (*dump_stats)(struct Qdisc *, unsigned long,
194                                         struct gnet_dump *);
195 };
196
197 struct Qdisc_ops {
198         struct Qdisc_ops        *next;
199         const struct Qdisc_class_ops    *cl_ops;
200         char                    id[IFNAMSIZ];
201         int                     priv_size;
202         unsigned int            static_flags;
203
204         int                     (*enqueue)(struct sk_buff *skb,
205                                            struct Qdisc *sch,
206                                            struct sk_buff **to_free);
207         struct sk_buff *        (*dequeue)(struct Qdisc *);
208         struct sk_buff *        (*peek)(struct Qdisc *);
209
210         int                     (*init)(struct Qdisc *sch, struct nlattr *arg,
211                                         struct netlink_ext_ack *extack);
212         void                    (*reset)(struct Qdisc *);
213         void                    (*destroy)(struct Qdisc *);
214         int                     (*change)(struct Qdisc *sch,
215                                           struct nlattr *arg,
216                                           struct netlink_ext_ack *extack);
217         void                    (*attach)(struct Qdisc *sch);
218         int                     (*change_tx_queue_len)(struct Qdisc *, unsigned int);
219
220         int                     (*dump)(struct Qdisc *, struct sk_buff *);
221         int                     (*dump_stats)(struct Qdisc *, struct gnet_dump *);
222
223         void                    (*ingress_block_set)(struct Qdisc *sch,
224                                                      u32 block_index);
225         void                    (*egress_block_set)(struct Qdisc *sch,
226                                                     u32 block_index);
227         u32                     (*ingress_block_get)(struct Qdisc *sch);
228         u32                     (*egress_block_get)(struct Qdisc *sch);
229
230         struct module           *owner;
231 };
232
233
234 struct tcf_result {
235         union {
236                 struct {
237                         unsigned long   class;
238                         u32             classid;
239                 };
240                 const struct tcf_proto *goto_tp;
241
242                 /* used by the TC_ACT_REINSERT action */
243                 struct {
244                         bool            ingress;
245                         struct gnet_stats_queue *qstats;
246                 };
247         };
248 };
249
250 struct tcf_chain;
251
252 struct tcf_proto_ops {
253         struct list_head        head;
254         char                    kind[IFNAMSIZ];
255
256         int                     (*classify)(struct sk_buff *,
257                                             const struct tcf_proto *,
258                                             struct tcf_result *);
259         int                     (*init)(struct tcf_proto*);
260         void                    (*destroy)(struct tcf_proto *tp,
261                                            struct netlink_ext_ack *extack);
262
263         void*                   (*get)(struct tcf_proto*, u32 handle);
264         int                     (*change)(struct net *net, struct sk_buff *,
265                                         struct tcf_proto*, unsigned long,
266                                         u32 handle, struct nlattr **,
267                                         void **, bool,
268                                         struct netlink_ext_ack *);
269         int                     (*delete)(struct tcf_proto *tp, void *arg,
270                                           bool *last,
271                                           struct netlink_ext_ack *);
272         void                    (*walk)(struct tcf_proto*, struct tcf_walker *arg);
273         int                     (*reoffload)(struct tcf_proto *tp, bool add,
274                                              tc_setup_cb_t *cb, void *cb_priv,
275                                              struct netlink_ext_ack *extack);
276         void                    (*bind_class)(void *, u32, unsigned long,
277                                               void *, unsigned long);
278         void *                  (*tmplt_create)(struct net *net,
279                                                 struct tcf_chain *chain,
280                                                 struct nlattr **tca,
281                                                 struct netlink_ext_ack *extack);
282         void                    (*tmplt_destroy)(void *tmplt_priv);
283
284         /* rtnetlink specific */
285         int                     (*dump)(struct net*, struct tcf_proto*, void *,
286                                         struct sk_buff *skb, struct tcmsg*);
287         int                     (*tmplt_dump)(struct sk_buff *skb,
288                                               struct net *net,
289                                               void *tmplt_priv);
290
291         struct module           *owner;
292 };
293
294 struct tcf_proto {
295         /* Fast access part */
296         struct tcf_proto __rcu  *next;
297         void __rcu              *root;
298
299         /* called under RCU BH lock*/
300         int                     (*classify)(struct sk_buff *,
301                                             const struct tcf_proto *,
302                                             struct tcf_result *);
303         __be16                  protocol;
304
305         /* All the rest */
306         u32                     prio;
307         void                    *data;
308         const struct tcf_proto_ops      *ops;
309         struct tcf_chain        *chain;
310         struct rcu_head         rcu;
311 };
312
313 struct qdisc_skb_cb {
314         unsigned int            pkt_len;
315         u16                     slave_dev_queue_mapping;
316         u16                     tc_classid;
317 #define QDISC_CB_PRIV_LEN 20
318         unsigned char           data[QDISC_CB_PRIV_LEN];
319 };
320
321 typedef void tcf_chain_head_change_t(struct tcf_proto *tp_head, void *priv);
322
323 struct tcf_chain {
324         struct tcf_proto __rcu *filter_chain;
325         struct list_head list;
326         struct tcf_block *block;
327         u32 index; /* chain index */
328         unsigned int refcnt;
329         unsigned int action_refcnt;
330         bool explicitly_created;
331         const struct tcf_proto_ops *tmplt_ops;
332         void *tmplt_priv;
333 };
334
335 struct tcf_block {
336         struct list_head chain_list;
337         u32 index; /* block index for shared blocks */
338         unsigned int refcnt;
339         struct net *net;
340         struct Qdisc *q;
341         struct list_head cb_list;
342         struct list_head owner_list;
343         bool keep_dst;
344         unsigned int offloadcnt; /* Number of oddloaded filters */
345         unsigned int nooffloaddevcnt; /* Number of devs unable to do offload */
346         struct {
347                 struct tcf_chain *chain;
348                 struct list_head filter_chain_list;
349         } chain0;
350 };
351
352 static inline void tcf_block_offload_inc(struct tcf_block *block, u32 *flags)
353 {
354         if (*flags & TCA_CLS_FLAGS_IN_HW)
355                 return;
356         *flags |= TCA_CLS_FLAGS_IN_HW;
357         block->offloadcnt++;
358 }
359
360 static inline void tcf_block_offload_dec(struct tcf_block *block, u32 *flags)
361 {
362         if (!(*flags & TCA_CLS_FLAGS_IN_HW))
363                 return;
364         *flags &= ~TCA_CLS_FLAGS_IN_HW;
365         block->offloadcnt--;
366 }
367
368 static inline void
369 tc_cls_offload_cnt_update(struct tcf_block *block, unsigned int *cnt,
370                           u32 *flags, bool add)
371 {
372         if (add) {
373                 if (!*cnt)
374                         tcf_block_offload_inc(block, flags);
375                 (*cnt)++;
376         } else {
377                 (*cnt)--;
378                 if (!*cnt)
379                         tcf_block_offload_dec(block, flags);
380         }
381 }
382
383 static inline void qdisc_cb_private_validate(const struct sk_buff *skb, int sz)
384 {
385         struct qdisc_skb_cb *qcb;
386
387         BUILD_BUG_ON(sizeof(skb->cb) < offsetof(struct qdisc_skb_cb, data) + sz);
388         BUILD_BUG_ON(sizeof(qcb->data) < sz);
389 }
390
391 static inline int qdisc_qlen(const struct Qdisc *q)
392 {
393         return q->q.qlen;
394 }
395
396 static inline u32 qdisc_qlen_sum(const struct Qdisc *q)
397 {
398         u32 qlen = q->qstats.qlen;
399
400         if (q->flags & TCQ_F_NOLOCK)
401                 qlen += atomic_read(&q->q.atomic_qlen);
402         else
403                 qlen += q->q.qlen;
404
405         return qlen;
406 }
407
408 static inline struct qdisc_skb_cb *qdisc_skb_cb(const struct sk_buff *skb)
409 {
410         return (struct qdisc_skb_cb *)skb->cb;
411 }
412
413 static inline spinlock_t *qdisc_lock(struct Qdisc *qdisc)
414 {
415         return &qdisc->q.lock;
416 }
417
418 static inline struct Qdisc *qdisc_root(const struct Qdisc *qdisc)
419 {
420         struct Qdisc *q = rcu_dereference_rtnl(qdisc->dev_queue->qdisc);
421
422         return q;
423 }
424
425 static inline struct Qdisc *qdisc_root_bh(const struct Qdisc *qdisc)
426 {
427         return rcu_dereference_bh(qdisc->dev_queue->qdisc);
428 }
429
430 static inline struct Qdisc *qdisc_root_sleeping(const struct Qdisc *qdisc)
431 {
432         return qdisc->dev_queue->qdisc_sleeping;
433 }
434
435 /* The qdisc root lock is a mechanism by which to top level
436  * of a qdisc tree can be locked from any qdisc node in the
437  * forest.  This allows changing the configuration of some
438  * aspect of the qdisc tree while blocking out asynchronous
439  * qdisc access in the packet processing paths.
440  *
441  * It is only legal to do this when the root will not change
442  * on us.  Otherwise we'll potentially lock the wrong qdisc
443  * root.  This is enforced by holding the RTNL semaphore, which
444  * all users of this lock accessor must do.
445  */
446 static inline spinlock_t *qdisc_root_lock(const struct Qdisc *qdisc)
447 {
448         struct Qdisc *root = qdisc_root(qdisc);
449
450         ASSERT_RTNL();
451         return qdisc_lock(root);
452 }
453
454 static inline spinlock_t *qdisc_root_sleeping_lock(const struct Qdisc *qdisc)
455 {
456         struct Qdisc *root = qdisc_root_sleeping(qdisc);
457
458         ASSERT_RTNL();
459         return qdisc_lock(root);
460 }
461
462 static inline seqcount_t *qdisc_root_sleeping_running(const struct Qdisc *qdisc)
463 {
464         struct Qdisc *root = qdisc_root_sleeping(qdisc);
465
466         ASSERT_RTNL();
467         return &root->running;
468 }
469
470 static inline struct net_device *qdisc_dev(const struct Qdisc *qdisc)
471 {
472         return qdisc->dev_queue->dev;
473 }
474
475 static inline void sch_tree_lock(const struct Qdisc *q)
476 {
477         spin_lock_bh(qdisc_root_sleeping_lock(q));
478 }
479
480 static inline void sch_tree_unlock(const struct Qdisc *q)
481 {
482         spin_unlock_bh(qdisc_root_sleeping_lock(q));
483 }
484
485 extern struct Qdisc noop_qdisc;
486 extern struct Qdisc_ops noop_qdisc_ops;
487 extern struct Qdisc_ops pfifo_fast_ops;
488 extern struct Qdisc_ops mq_qdisc_ops;
489 extern struct Qdisc_ops noqueue_qdisc_ops;
490 extern const struct Qdisc_ops *default_qdisc_ops;
491 static inline const struct Qdisc_ops *
492 get_default_qdisc_ops(const struct net_device *dev, int ntx)
493 {
494         return ntx < dev->real_num_tx_queues ?
495                         default_qdisc_ops : &pfifo_fast_ops;
496 }
497
498 struct Qdisc_class_common {
499         u32                     classid;
500         struct hlist_node       hnode;
501 };
502
503 struct Qdisc_class_hash {
504         struct hlist_head       *hash;
505         unsigned int            hashsize;
506         unsigned int            hashmask;
507         unsigned int            hashelems;
508 };
509
510 static inline unsigned int qdisc_class_hash(u32 id, u32 mask)
511 {
512         id ^= id >> 8;
513         id ^= id >> 4;
514         return id & mask;
515 }
516
517 static inline struct Qdisc_class_common *
518 qdisc_class_find(const struct Qdisc_class_hash *hash, u32 id)
519 {
520         struct Qdisc_class_common *cl;
521         unsigned int h;
522
523         if (!id)
524                 return NULL;
525
526         h = qdisc_class_hash(id, hash->hashmask);
527         hlist_for_each_entry(cl, &hash->hash[h], hnode) {
528                 if (cl->classid == id)
529                         return cl;
530         }
531         return NULL;
532 }
533
534 static inline int tc_classid_to_hwtc(struct net_device *dev, u32 classid)
535 {
536         u32 hwtc = TC_H_MIN(classid) - TC_H_MIN_PRIORITY;
537
538         return (hwtc < netdev_get_num_tc(dev)) ? hwtc : -EINVAL;
539 }
540
541 int qdisc_class_hash_init(struct Qdisc_class_hash *);
542 void qdisc_class_hash_insert(struct Qdisc_class_hash *,
543                              struct Qdisc_class_common *);
544 void qdisc_class_hash_remove(struct Qdisc_class_hash *,
545                              struct Qdisc_class_common *);
546 void qdisc_class_hash_grow(struct Qdisc *, struct Qdisc_class_hash *);
547 void qdisc_class_hash_destroy(struct Qdisc_class_hash *);
548
549 int dev_qdisc_change_tx_queue_len(struct net_device *dev);
550 void dev_init_scheduler(struct net_device *dev);
551 void dev_shutdown(struct net_device *dev);
552 void dev_activate(struct net_device *dev);
553 void dev_deactivate(struct net_device *dev);
554 void dev_deactivate_many(struct list_head *head);
555 struct Qdisc *dev_graft_qdisc(struct netdev_queue *dev_queue,
556                               struct Qdisc *qdisc);
557 void qdisc_reset(struct Qdisc *qdisc);
558 void qdisc_destroy(struct Qdisc *qdisc);
559 void qdisc_tree_reduce_backlog(struct Qdisc *qdisc, unsigned int n,
560                                unsigned int len);
561 struct Qdisc *qdisc_alloc(struct netdev_queue *dev_queue,
562                           const struct Qdisc_ops *ops,
563                           struct netlink_ext_ack *extack);
564 void qdisc_free(struct Qdisc *qdisc);
565 struct Qdisc *qdisc_create_dflt(struct netdev_queue *dev_queue,
566                                 const struct Qdisc_ops *ops, u32 parentid,
567                                 struct netlink_ext_ack *extack);
568 void __qdisc_calculate_pkt_len(struct sk_buff *skb,
569                                const struct qdisc_size_table *stab);
570 int skb_do_redirect(struct sk_buff *);
571
572 static inline void skb_reset_tc(struct sk_buff *skb)
573 {
574 #ifdef CONFIG_NET_CLS_ACT
575         skb->tc_redirected = 0;
576 #endif
577 }
578
579 static inline bool skb_is_tc_redirected(const struct sk_buff *skb)
580 {
581 #ifdef CONFIG_NET_CLS_ACT
582         return skb->tc_redirected;
583 #else
584         return false;
585 #endif
586 }
587
588 static inline bool skb_at_tc_ingress(const struct sk_buff *skb)
589 {
590 #ifdef CONFIG_NET_CLS_ACT
591         return skb->tc_at_ingress;
592 #else
593         return false;
594 #endif
595 }
596
597 static inline bool skb_skip_tc_classify(struct sk_buff *skb)
598 {
599 #ifdef CONFIG_NET_CLS_ACT
600         if (skb->tc_skip_classify) {
601                 skb->tc_skip_classify = 0;
602                 return true;
603         }
604 #endif
605         return false;
606 }
607
608 /* Reset all TX qdiscs greater than index of a device.  */
609 static inline void qdisc_reset_all_tx_gt(struct net_device *dev, unsigned int i)
610 {
611         struct Qdisc *qdisc;
612
613         for (; i < dev->num_tx_queues; i++) {
614                 qdisc = rtnl_dereference(netdev_get_tx_queue(dev, i)->qdisc);
615                 if (qdisc) {
616                         spin_lock_bh(qdisc_lock(qdisc));
617                         qdisc_reset(qdisc);
618                         spin_unlock_bh(qdisc_lock(qdisc));
619                 }
620         }
621 }
622
623 static inline void qdisc_reset_all_tx(struct net_device *dev)
624 {
625         qdisc_reset_all_tx_gt(dev, 0);
626 }
627
628 /* Are all TX queues of the device empty?  */
629 static inline bool qdisc_all_tx_empty(const struct net_device *dev)
630 {
631         unsigned int i;
632
633         rcu_read_lock();
634         for (i = 0; i < dev->num_tx_queues; i++) {
635                 struct netdev_queue *txq = netdev_get_tx_queue(dev, i);
636                 const struct Qdisc *q = rcu_dereference(txq->qdisc);
637
638                 if (q->q.qlen) {
639                         rcu_read_unlock();
640                         return false;
641                 }
642         }
643         rcu_read_unlock();
644         return true;
645 }
646
647 /* Are any of the TX qdiscs changing?  */
648 static inline bool qdisc_tx_changing(const struct net_device *dev)
649 {
650         unsigned int i;
651
652         for (i = 0; i < dev->num_tx_queues; i++) {
653                 struct netdev_queue *txq = netdev_get_tx_queue(dev, i);
654                 if (rcu_access_pointer(txq->qdisc) != txq->qdisc_sleeping)
655                         return true;
656         }
657         return false;
658 }
659
660 /* Is the device using the noop qdisc on all queues?  */
661 static inline bool qdisc_tx_is_noop(const struct net_device *dev)
662 {
663         unsigned int i;
664
665         for (i = 0; i < dev->num_tx_queues; i++) {
666                 struct netdev_queue *txq = netdev_get_tx_queue(dev, i);
667                 if (rcu_access_pointer(txq->qdisc) != &noop_qdisc)
668                         return false;
669         }
670         return true;
671 }
672
673 static inline unsigned int qdisc_pkt_len(const struct sk_buff *skb)
674 {
675         return qdisc_skb_cb(skb)->pkt_len;
676 }
677
678 /* additional qdisc xmit flags (NET_XMIT_MASK in linux/netdevice.h) */
679 enum net_xmit_qdisc_t {
680         __NET_XMIT_STOLEN = 0x00010000,
681         __NET_XMIT_BYPASS = 0x00020000,
682 };
683
684 #ifdef CONFIG_NET_CLS_ACT
685 #define net_xmit_drop_count(e)  ((e) & __NET_XMIT_STOLEN ? 0 : 1)
686 #else
687 #define net_xmit_drop_count(e)  (1)
688 #endif
689
690 static inline void qdisc_calculate_pkt_len(struct sk_buff *skb,
691                                            const struct Qdisc *sch)
692 {
693 #ifdef CONFIG_NET_SCHED
694         struct qdisc_size_table *stab = rcu_dereference_bh(sch->stab);
695
696         if (stab)
697                 __qdisc_calculate_pkt_len(skb, stab);
698 #endif
699 }
700
701 static inline int qdisc_enqueue(struct sk_buff *skb, struct Qdisc *sch,
702                                 struct sk_buff **to_free)
703 {
704         qdisc_calculate_pkt_len(skb, sch);
705         return sch->enqueue(skb, sch, to_free);
706 }
707
708 static inline bool qdisc_is_percpu_stats(const struct Qdisc *q)
709 {
710         return q->flags & TCQ_F_CPUSTATS;
711 }
712
713 static inline void _bstats_update(struct gnet_stats_basic_packed *bstats,
714                                   __u64 bytes, __u32 packets)
715 {
716         bstats->bytes += bytes;
717         bstats->packets += packets;
718 }
719
720 static inline void bstats_update(struct gnet_stats_basic_packed *bstats,
721                                  const struct sk_buff *skb)
722 {
723         _bstats_update(bstats,
724                        qdisc_pkt_len(skb),
725                        skb_is_gso(skb) ? skb_shinfo(skb)->gso_segs : 1);
726 }
727
728 static inline void _bstats_cpu_update(struct gnet_stats_basic_cpu *bstats,
729                                       __u64 bytes, __u32 packets)
730 {
731         u64_stats_update_begin(&bstats->syncp);
732         _bstats_update(&bstats->bstats, bytes, packets);
733         u64_stats_update_end(&bstats->syncp);
734 }
735
736 static inline void bstats_cpu_update(struct gnet_stats_basic_cpu *bstats,
737                                      const struct sk_buff *skb)
738 {
739         u64_stats_update_begin(&bstats->syncp);
740         bstats_update(&bstats->bstats, skb);
741         u64_stats_update_end(&bstats->syncp);
742 }
743
744 static inline void qdisc_bstats_cpu_update(struct Qdisc *sch,
745                                            const struct sk_buff *skb)
746 {
747         bstats_cpu_update(this_cpu_ptr(sch->cpu_bstats), skb);
748 }
749
750 static inline void qdisc_bstats_update(struct Qdisc *sch,
751                                        const struct sk_buff *skb)
752 {
753         bstats_update(&sch->bstats, skb);
754 }
755
756 static inline void qdisc_qstats_backlog_dec(struct Qdisc *sch,
757                                             const struct sk_buff *skb)
758 {
759         sch->qstats.backlog -= qdisc_pkt_len(skb);
760 }
761
762 static inline void qdisc_qstats_cpu_backlog_dec(struct Qdisc *sch,
763                                                 const struct sk_buff *skb)
764 {
765         this_cpu_sub(sch->cpu_qstats->backlog, qdisc_pkt_len(skb));
766 }
767
768 static inline void qdisc_qstats_backlog_inc(struct Qdisc *sch,
769                                             const struct sk_buff *skb)
770 {
771         sch->qstats.backlog += qdisc_pkt_len(skb);
772 }
773
774 static inline void qdisc_qstats_cpu_backlog_inc(struct Qdisc *sch,
775                                                 const struct sk_buff *skb)
776 {
777         this_cpu_add(sch->cpu_qstats->backlog, qdisc_pkt_len(skb));
778 }
779
780 static inline void qdisc_qstats_atomic_qlen_inc(struct Qdisc *sch)
781 {
782         atomic_inc(&sch->q.atomic_qlen);
783 }
784
785 static inline void qdisc_qstats_atomic_qlen_dec(struct Qdisc *sch)
786 {
787         atomic_dec(&sch->q.atomic_qlen);
788 }
789
790 static inline void qdisc_qstats_cpu_requeues_inc(struct Qdisc *sch)
791 {
792         this_cpu_inc(sch->cpu_qstats->requeues);
793 }
794
795 static inline void __qdisc_qstats_drop(struct Qdisc *sch, int count)
796 {
797         sch->qstats.drops += count;
798 }
799
800 static inline void qstats_drop_inc(struct gnet_stats_queue *qstats)
801 {
802         qstats->drops++;
803 }
804
805 static inline void qstats_overlimit_inc(struct gnet_stats_queue *qstats)
806 {
807         qstats->overlimits++;
808 }
809
810 static inline void qdisc_qstats_drop(struct Qdisc *sch)
811 {
812         qstats_drop_inc(&sch->qstats);
813 }
814
815 static inline void qdisc_qstats_cpu_drop(struct Qdisc *sch)
816 {
817         this_cpu_inc(sch->cpu_qstats->drops);
818 }
819
820 static inline void qdisc_qstats_overlimit(struct Qdisc *sch)
821 {
822         sch->qstats.overlimits++;
823 }
824
825 static inline void qdisc_skb_head_init(struct qdisc_skb_head *qh)
826 {
827         qh->head = NULL;
828         qh->tail = NULL;
829         qh->qlen = 0;
830 }
831
832 static inline int __qdisc_enqueue_tail(struct sk_buff *skb, struct Qdisc *sch,
833                                        struct qdisc_skb_head *qh)
834 {
835         struct sk_buff *last = qh->tail;
836
837         if (last) {
838                 skb->next = NULL;
839                 last->next = skb;
840                 qh->tail = skb;
841         } else {
842                 qh->tail = skb;
843                 qh->head = skb;
844         }
845         qh->qlen++;
846         qdisc_qstats_backlog_inc(sch, skb);
847
848         return NET_XMIT_SUCCESS;
849 }
850
851 static inline int qdisc_enqueue_tail(struct sk_buff *skb, struct Qdisc *sch)
852 {
853         return __qdisc_enqueue_tail(skb, sch, &sch->q);
854 }
855
856 static inline struct sk_buff *__qdisc_dequeue_head(struct qdisc_skb_head *qh)
857 {
858         struct sk_buff *skb = qh->head;
859
860         if (likely(skb != NULL)) {
861                 qh->head = skb->next;
862                 qh->qlen--;
863                 if (qh->head == NULL)
864                         qh->tail = NULL;
865                 skb->next = NULL;
866         }
867
868         return skb;
869 }
870
871 static inline struct sk_buff *qdisc_dequeue_head(struct Qdisc *sch)
872 {
873         struct sk_buff *skb = __qdisc_dequeue_head(&sch->q);
874
875         if (likely(skb != NULL)) {
876                 qdisc_qstats_backlog_dec(sch, skb);
877                 qdisc_bstats_update(sch, skb);
878         }
879
880         return skb;
881 }
882
883 /* Instead of calling kfree_skb() while root qdisc lock is held,
884  * queue the skb for future freeing at end of __dev_xmit_skb()
885  */
886 static inline void __qdisc_drop(struct sk_buff *skb, struct sk_buff **to_free)
887 {
888         skb->next = *to_free;
889         *to_free = skb;
890 }
891
892 static inline void __qdisc_drop_all(struct sk_buff *skb,
893                                     struct sk_buff **to_free)
894 {
895         if (skb->prev)
896                 skb->prev->next = *to_free;
897         else
898                 skb->next = *to_free;
899         *to_free = skb;
900 }
901
902 static inline unsigned int __qdisc_queue_drop_head(struct Qdisc *sch,
903                                                    struct qdisc_skb_head *qh,
904                                                    struct sk_buff **to_free)
905 {
906         struct sk_buff *skb = __qdisc_dequeue_head(qh);
907
908         if (likely(skb != NULL)) {
909                 unsigned int len = qdisc_pkt_len(skb);
910
911                 qdisc_qstats_backlog_dec(sch, skb);
912                 __qdisc_drop(skb, to_free);
913                 return len;
914         }
915
916         return 0;
917 }
918
919 static inline unsigned int qdisc_queue_drop_head(struct Qdisc *sch,
920                                                  struct sk_buff **to_free)
921 {
922         return __qdisc_queue_drop_head(sch, &sch->q, to_free);
923 }
924
925 static inline struct sk_buff *qdisc_peek_head(struct Qdisc *sch)
926 {
927         const struct qdisc_skb_head *qh = &sch->q;
928
929         return qh->head;
930 }
931
932 /* generic pseudo peek method for non-work-conserving qdisc */
933 static inline struct sk_buff *qdisc_peek_dequeued(struct Qdisc *sch)
934 {
935         struct sk_buff *skb = skb_peek(&sch->gso_skb);
936
937         /* we can reuse ->gso_skb because peek isn't called for root qdiscs */
938         if (!skb) {
939                 skb = sch->dequeue(sch);
940
941                 if (skb) {
942                         __skb_queue_head(&sch->gso_skb, skb);
943                         /* it's still part of the queue */
944                         qdisc_qstats_backlog_inc(sch, skb);
945                         sch->q.qlen++;
946                 }
947         }
948
949         return skb;
950 }
951
952 /* use instead of qdisc->dequeue() for all qdiscs queried with ->peek() */
953 static inline struct sk_buff *qdisc_dequeue_peeked(struct Qdisc *sch)
954 {
955         struct sk_buff *skb = skb_peek(&sch->gso_skb);
956
957         if (skb) {
958                 skb = __skb_dequeue(&sch->gso_skb);
959                 qdisc_qstats_backlog_dec(sch, skb);
960                 sch->q.qlen--;
961         } else {
962                 skb = sch->dequeue(sch);
963         }
964
965         return skb;
966 }
967
968 static inline void __qdisc_reset_queue(struct qdisc_skb_head *qh)
969 {
970         /*
971          * We do not know the backlog in bytes of this list, it
972          * is up to the caller to correct it
973          */
974         ASSERT_RTNL();
975         if (qh->qlen) {
976                 rtnl_kfree_skbs(qh->head, qh->tail);
977
978                 qh->head = NULL;
979                 qh->tail = NULL;
980                 qh->qlen = 0;
981         }
982 }
983
984 static inline void qdisc_reset_queue(struct Qdisc *sch)
985 {
986         __qdisc_reset_queue(&sch->q);
987         sch->qstats.backlog = 0;
988 }
989
990 static inline struct Qdisc *qdisc_replace(struct Qdisc *sch, struct Qdisc *new,
991                                           struct Qdisc **pold)
992 {
993         struct Qdisc *old;
994
995         sch_tree_lock(sch);
996         old = *pold;
997         *pold = new;
998         if (old != NULL) {
999                 unsigned int qlen = old->q.qlen;
1000                 unsigned int backlog = old->qstats.backlog;
1001
1002                 qdisc_reset(old);
1003                 qdisc_tree_reduce_backlog(old, qlen, backlog);
1004         }
1005         sch_tree_unlock(sch);
1006
1007         return old;
1008 }
1009
1010 static inline void rtnl_qdisc_drop(struct sk_buff *skb, struct Qdisc *sch)
1011 {
1012         rtnl_kfree_skbs(skb, skb);
1013         qdisc_qstats_drop(sch);
1014 }
1015
1016 static inline int qdisc_drop_cpu(struct sk_buff *skb, struct Qdisc *sch,
1017                                  struct sk_buff **to_free)
1018 {
1019         __qdisc_drop(skb, to_free);
1020         qdisc_qstats_cpu_drop(sch);
1021
1022         return NET_XMIT_DROP;
1023 }
1024
1025 static inline int qdisc_drop(struct sk_buff *skb, struct Qdisc *sch,
1026                              struct sk_buff **to_free)
1027 {
1028         __qdisc_drop(skb, to_free);
1029         qdisc_qstats_drop(sch);
1030
1031         return NET_XMIT_DROP;
1032 }
1033
1034 static inline int qdisc_drop_all(struct sk_buff *skb, struct Qdisc *sch,
1035                                  struct sk_buff **to_free)
1036 {
1037         __qdisc_drop_all(skb, to_free);
1038         qdisc_qstats_drop(sch);
1039
1040         return NET_XMIT_DROP;
1041 }
1042
1043 /* Length to Time (L2T) lookup in a qdisc_rate_table, to determine how
1044    long it will take to send a packet given its size.
1045  */
1046 static inline u32 qdisc_l2t(struct qdisc_rate_table* rtab, unsigned int pktlen)
1047 {
1048         int slot = pktlen + rtab->rate.cell_align + rtab->rate.overhead;
1049         if (slot < 0)
1050                 slot = 0;
1051         slot >>= rtab->rate.cell_log;
1052         if (slot > 255)
1053                 return rtab->data[255]*(slot >> 8) + rtab->data[slot & 0xFF];
1054         return rtab->data[slot];
1055 }
1056
1057 struct psched_ratecfg {
1058         u64     rate_bytes_ps; /* bytes per second */
1059         u32     mult;
1060         u16     overhead;
1061         u8      linklayer;
1062         u8      shift;
1063 };
1064
1065 static inline u64 psched_l2t_ns(const struct psched_ratecfg *r,
1066                                 unsigned int len)
1067 {
1068         len += r->overhead;
1069
1070         if (unlikely(r->linklayer == TC_LINKLAYER_ATM))
1071                 return ((u64)(DIV_ROUND_UP(len,48)*53) * r->mult) >> r->shift;
1072
1073         return ((u64)len * r->mult) >> r->shift;
1074 }
1075
1076 void psched_ratecfg_precompute(struct psched_ratecfg *r,
1077                                const struct tc_ratespec *conf,
1078                                u64 rate64);
1079
1080 static inline void psched_ratecfg_getrate(struct tc_ratespec *res,
1081                                           const struct psched_ratecfg *r)
1082 {
1083         memset(res, 0, sizeof(*res));
1084
1085         /* legacy struct tc_ratespec has a 32bit @rate field
1086          * Qdisc using 64bit rate should add new attributes
1087          * in order to maintain compatibility.
1088          */
1089         res->rate = min_t(u64, r->rate_bytes_ps, ~0U);
1090
1091         res->overhead = r->overhead;
1092         res->linklayer = (r->linklayer & TC_LINKLAYER_MASK);
1093 }
1094
1095 /* Mini Qdisc serves for specific needs of ingress/clsact Qdisc.
1096  * The fast path only needs to access filter list and to update stats
1097  */
1098 struct mini_Qdisc {
1099         struct tcf_proto *filter_list;
1100         struct gnet_stats_basic_cpu __percpu *cpu_bstats;
1101         struct gnet_stats_queue __percpu *cpu_qstats;
1102         struct rcu_head rcu;
1103 };
1104
1105 static inline void mini_qdisc_bstats_cpu_update(struct mini_Qdisc *miniq,
1106                                                 const struct sk_buff *skb)
1107 {
1108         bstats_cpu_update(this_cpu_ptr(miniq->cpu_bstats), skb);
1109 }
1110
1111 static inline void mini_qdisc_qstats_cpu_drop(struct mini_Qdisc *miniq)
1112 {
1113         this_cpu_inc(miniq->cpu_qstats->drops);
1114 }
1115
1116 struct mini_Qdisc_pair {
1117         struct mini_Qdisc miniq1;
1118         struct mini_Qdisc miniq2;
1119         struct mini_Qdisc __rcu **p_miniq;
1120 };
1121
1122 void mini_qdisc_pair_swap(struct mini_Qdisc_pair *miniqp,
1123                           struct tcf_proto *tp_head);
1124 void mini_qdisc_pair_init(struct mini_Qdisc_pair *miniqp, struct Qdisc *qdisc,
1125                           struct mini_Qdisc __rcu **p_miniq);
1126
1127 static inline void skb_tc_reinsert(struct sk_buff *skb, struct tcf_result *res)
1128 {
1129         struct gnet_stats_queue *stats = res->qstats;
1130         int ret;
1131
1132         if (res->ingress)
1133                 ret = netif_receive_skb(skb);
1134         else
1135                 ret = dev_queue_xmit(skb);
1136         if (ret && stats)
1137                 qstats_overlimit_inc(res->qstats);
1138 }
1139
1140 #endif