GNU Linux-libre 5.4.241-gnu1
[releases.git] / drivers / pci / iov.c
1 // SPDX-License-Identifier: GPL-2.0
2 /*
3  * PCI Express I/O Virtualization (IOV) support
4  *   Single Root IOV 1.0
5  *   Address Translation Service 1.0
6  *
7  * Copyright (C) 2009 Intel Corporation, Yu Zhao <yu.zhao@intel.com>
8  */
9
10 #include <linux/pci.h>
11 #include <linux/slab.h>
12 #include <linux/mutex.h>
13 #include <linux/export.h>
14 #include <linux/string.h>
15 #include <linux/delay.h>
16 #include "pci.h"
17
18 #define VIRTFN_ID_LEN   16
19
20 int pci_iov_virtfn_bus(struct pci_dev *dev, int vf_id)
21 {
22         if (!dev->is_physfn)
23                 return -EINVAL;
24         return dev->bus->number + ((dev->devfn + dev->sriov->offset +
25                                     dev->sriov->stride * vf_id) >> 8);
26 }
27
28 int pci_iov_virtfn_devfn(struct pci_dev *dev, int vf_id)
29 {
30         if (!dev->is_physfn)
31                 return -EINVAL;
32         return (dev->devfn + dev->sriov->offset +
33                 dev->sriov->stride * vf_id) & 0xff;
34 }
35
36 /*
37  * Per SR-IOV spec sec 3.3.10 and 3.3.11, First VF Offset and VF Stride may
38  * change when NumVFs changes.
39  *
40  * Update iov->offset and iov->stride when NumVFs is written.
41  */
42 static inline void pci_iov_set_numvfs(struct pci_dev *dev, int nr_virtfn)
43 {
44         struct pci_sriov *iov = dev->sriov;
45
46         pci_write_config_word(dev, iov->pos + PCI_SRIOV_NUM_VF, nr_virtfn);
47         pci_read_config_word(dev, iov->pos + PCI_SRIOV_VF_OFFSET, &iov->offset);
48         pci_read_config_word(dev, iov->pos + PCI_SRIOV_VF_STRIDE, &iov->stride);
49 }
50
51 /*
52  * The PF consumes one bus number.  NumVFs, First VF Offset, and VF Stride
53  * determine how many additional bus numbers will be consumed by VFs.
54  *
55  * Iterate over all valid NumVFs, validate offset and stride, and calculate
56  * the maximum number of bus numbers that could ever be required.
57  */
58 static int compute_max_vf_buses(struct pci_dev *dev)
59 {
60         struct pci_sriov *iov = dev->sriov;
61         int nr_virtfn, busnr, rc = 0;
62
63         for (nr_virtfn = iov->total_VFs; nr_virtfn; nr_virtfn--) {
64                 pci_iov_set_numvfs(dev, nr_virtfn);
65                 if (!iov->offset || (nr_virtfn > 1 && !iov->stride)) {
66                         rc = -EIO;
67                         goto out;
68                 }
69
70                 busnr = pci_iov_virtfn_bus(dev, nr_virtfn - 1);
71                 if (busnr > iov->max_VF_buses)
72                         iov->max_VF_buses = busnr;
73         }
74
75 out:
76         pci_iov_set_numvfs(dev, 0);
77         return rc;
78 }
79
80 static struct pci_bus *virtfn_add_bus(struct pci_bus *bus, int busnr)
81 {
82         struct pci_bus *child;
83
84         if (bus->number == busnr)
85                 return bus;
86
87         child = pci_find_bus(pci_domain_nr(bus), busnr);
88         if (child)
89                 return child;
90
91         child = pci_add_new_bus(bus, NULL, busnr);
92         if (!child)
93                 return NULL;
94
95         pci_bus_insert_busn_res(child, busnr, busnr);
96
97         return child;
98 }
99
100 static void virtfn_remove_bus(struct pci_bus *physbus, struct pci_bus *virtbus)
101 {
102         if (physbus != virtbus && list_empty(&virtbus->devices))
103                 pci_remove_bus(virtbus);
104 }
105
106 resource_size_t pci_iov_resource_size(struct pci_dev *dev, int resno)
107 {
108         if (!dev->is_physfn)
109                 return 0;
110
111         return dev->sriov->barsz[resno - PCI_IOV_RESOURCES];
112 }
113
114 static void pci_read_vf_config_common(struct pci_dev *virtfn)
115 {
116         struct pci_dev *physfn = virtfn->physfn;
117
118         /*
119          * Some config registers are the same across all associated VFs.
120          * Read them once from VF0 so we can skip reading them from the
121          * other VFs.
122          *
123          * PCIe r4.0, sec 9.3.4.1, technically doesn't require all VFs to
124          * have the same Revision ID and Subsystem ID, but we assume they
125          * do.
126          */
127         pci_read_config_dword(virtfn, PCI_CLASS_REVISION,
128                               &physfn->sriov->class);
129         pci_read_config_byte(virtfn, PCI_HEADER_TYPE,
130                              &physfn->sriov->hdr_type);
131         pci_read_config_word(virtfn, PCI_SUBSYSTEM_VENDOR_ID,
132                              &physfn->sriov->subsystem_vendor);
133         pci_read_config_word(virtfn, PCI_SUBSYSTEM_ID,
134                              &physfn->sriov->subsystem_device);
135 }
136
137 int pci_iov_add_virtfn(struct pci_dev *dev, int id)
138 {
139         int i;
140         int rc = -ENOMEM;
141         u64 size;
142         char buf[VIRTFN_ID_LEN];
143         struct pci_dev *virtfn;
144         struct resource *res;
145         struct pci_sriov *iov = dev->sriov;
146         struct pci_bus *bus;
147
148         bus = virtfn_add_bus(dev->bus, pci_iov_virtfn_bus(dev, id));
149         if (!bus)
150                 goto failed;
151
152         virtfn = pci_alloc_dev(bus);
153         if (!virtfn)
154                 goto failed0;
155
156         virtfn->devfn = pci_iov_virtfn_devfn(dev, id);
157         virtfn->vendor = dev->vendor;
158         virtfn->device = iov->vf_device;
159         virtfn->is_virtfn = 1;
160         virtfn->physfn = pci_dev_get(dev);
161         virtfn->no_command_memory = 1;
162
163         if (id == 0)
164                 pci_read_vf_config_common(virtfn);
165
166         rc = pci_setup_device(virtfn);
167         if (rc)
168                 goto failed1;
169
170         virtfn->dev.parent = dev->dev.parent;
171         virtfn->multifunction = 0;
172
173         for (i = 0; i < PCI_SRIOV_NUM_BARS; i++) {
174                 res = &dev->resource[i + PCI_IOV_RESOURCES];
175                 if (!res->parent)
176                         continue;
177                 virtfn->resource[i].name = pci_name(virtfn);
178                 virtfn->resource[i].flags = res->flags;
179                 size = pci_iov_resource_size(dev, i + PCI_IOV_RESOURCES);
180                 virtfn->resource[i].start = res->start + size * id;
181                 virtfn->resource[i].end = virtfn->resource[i].start + size - 1;
182                 rc = request_resource(res, &virtfn->resource[i]);
183                 BUG_ON(rc);
184         }
185
186         pci_device_add(virtfn, virtfn->bus);
187
188         sprintf(buf, "virtfn%u", id);
189         rc = sysfs_create_link(&dev->dev.kobj, &virtfn->dev.kobj, buf);
190         if (rc)
191                 goto failed1;
192         rc = sysfs_create_link(&virtfn->dev.kobj, &dev->dev.kobj, "physfn");
193         if (rc)
194                 goto failed2;
195
196         kobject_uevent(&virtfn->dev.kobj, KOBJ_CHANGE);
197
198         pci_bus_add_device(virtfn);
199
200         return 0;
201
202 failed2:
203         sysfs_remove_link(&dev->dev.kobj, buf);
204 failed1:
205         pci_stop_and_remove_bus_device(virtfn);
206         pci_dev_put(dev);
207 failed0:
208         virtfn_remove_bus(dev->bus, bus);
209 failed:
210
211         return rc;
212 }
213
214 void pci_iov_remove_virtfn(struct pci_dev *dev, int id)
215 {
216         char buf[VIRTFN_ID_LEN];
217         struct pci_dev *virtfn;
218
219         virtfn = pci_get_domain_bus_and_slot(pci_domain_nr(dev->bus),
220                                              pci_iov_virtfn_bus(dev, id),
221                                              pci_iov_virtfn_devfn(dev, id));
222         if (!virtfn)
223                 return;
224
225         sprintf(buf, "virtfn%u", id);
226         sysfs_remove_link(&dev->dev.kobj, buf);
227         /*
228          * pci_stop_dev() could have been called for this virtfn already,
229          * so the directory for the virtfn may have been removed before.
230          * Double check to avoid spurious sysfs warnings.
231          */
232         if (virtfn->dev.kobj.sd)
233                 sysfs_remove_link(&virtfn->dev.kobj, "physfn");
234
235         pci_stop_and_remove_bus_device(virtfn);
236         virtfn_remove_bus(dev->bus, virtfn->bus);
237
238         /* balance pci_get_domain_bus_and_slot() */
239         pci_dev_put(virtfn);
240         pci_dev_put(dev);
241 }
242
243 static ssize_t sriov_totalvfs_show(struct device *dev,
244                                    struct device_attribute *attr,
245                                    char *buf)
246 {
247         struct pci_dev *pdev = to_pci_dev(dev);
248
249         return sprintf(buf, "%u\n", pci_sriov_get_totalvfs(pdev));
250 }
251
252 static ssize_t sriov_numvfs_show(struct device *dev,
253                                  struct device_attribute *attr,
254                                  char *buf)
255 {
256         struct pci_dev *pdev = to_pci_dev(dev);
257         u16 num_vfs;
258
259         /* Serialize vs sriov_numvfs_store() so readers see valid num_VFs */
260         device_lock(&pdev->dev);
261         num_vfs = pdev->sriov->num_VFs;
262         device_unlock(&pdev->dev);
263
264         return sprintf(buf, "%u\n", num_vfs);
265 }
266
267 /*
268  * num_vfs > 0; number of VFs to enable
269  * num_vfs = 0; disable all VFs
270  *
271  * Note: SRIOV spec does not allow partial VF
272  *       disable, so it's all or none.
273  */
274 static ssize_t sriov_numvfs_store(struct device *dev,
275                                   struct device_attribute *attr,
276                                   const char *buf, size_t count)
277 {
278         struct pci_dev *pdev = to_pci_dev(dev);
279         int ret;
280         u16 num_vfs;
281
282         ret = kstrtou16(buf, 0, &num_vfs);
283         if (ret < 0)
284                 return ret;
285
286         if (num_vfs > pci_sriov_get_totalvfs(pdev))
287                 return -ERANGE;
288
289         device_lock(&pdev->dev);
290
291         if (num_vfs == pdev->sriov->num_VFs)
292                 goto exit;
293
294         /* is PF driver loaded w/callback */
295         if (!pdev->driver || !pdev->driver->sriov_configure) {
296                 pci_info(pdev, "Driver does not support SRIOV configuration via sysfs\n");
297                 ret = -ENOENT;
298                 goto exit;
299         }
300
301         if (num_vfs == 0) {
302                 /* disable VFs */
303                 ret = pdev->driver->sriov_configure(pdev, 0);
304                 goto exit;
305         }
306
307         /* enable VFs */
308         if (pdev->sriov->num_VFs) {
309                 pci_warn(pdev, "%d VFs already enabled. Disable before enabling %d VFs\n",
310                          pdev->sriov->num_VFs, num_vfs);
311                 ret = -EBUSY;
312                 goto exit;
313         }
314
315         ret = pdev->driver->sriov_configure(pdev, num_vfs);
316         if (ret < 0)
317                 goto exit;
318
319         if (ret != num_vfs)
320                 pci_warn(pdev, "%d VFs requested; only %d enabled\n",
321                          num_vfs, ret);
322
323 exit:
324         device_unlock(&pdev->dev);
325
326         if (ret < 0)
327                 return ret;
328
329         return count;
330 }
331
332 static ssize_t sriov_offset_show(struct device *dev,
333                                  struct device_attribute *attr,
334                                  char *buf)
335 {
336         struct pci_dev *pdev = to_pci_dev(dev);
337
338         return sprintf(buf, "%u\n", pdev->sriov->offset);
339 }
340
341 static ssize_t sriov_stride_show(struct device *dev,
342                                  struct device_attribute *attr,
343                                  char *buf)
344 {
345         struct pci_dev *pdev = to_pci_dev(dev);
346
347         return sprintf(buf, "%u\n", pdev->sriov->stride);
348 }
349
350 static ssize_t sriov_vf_device_show(struct device *dev,
351                                     struct device_attribute *attr,
352                                     char *buf)
353 {
354         struct pci_dev *pdev = to_pci_dev(dev);
355
356         return sprintf(buf, "%x\n", pdev->sriov->vf_device);
357 }
358
359 static ssize_t sriov_drivers_autoprobe_show(struct device *dev,
360                                             struct device_attribute *attr,
361                                             char *buf)
362 {
363         struct pci_dev *pdev = to_pci_dev(dev);
364
365         return sprintf(buf, "%u\n", pdev->sriov->drivers_autoprobe);
366 }
367
368 static ssize_t sriov_drivers_autoprobe_store(struct device *dev,
369                                              struct device_attribute *attr,
370                                              const char *buf, size_t count)
371 {
372         struct pci_dev *pdev = to_pci_dev(dev);
373         bool drivers_autoprobe;
374
375         if (kstrtobool(buf, &drivers_autoprobe) < 0)
376                 return -EINVAL;
377
378         pdev->sriov->drivers_autoprobe = drivers_autoprobe;
379
380         return count;
381 }
382
383 static DEVICE_ATTR_RO(sriov_totalvfs);
384 static DEVICE_ATTR_RW(sriov_numvfs);
385 static DEVICE_ATTR_RO(sriov_offset);
386 static DEVICE_ATTR_RO(sriov_stride);
387 static DEVICE_ATTR_RO(sriov_vf_device);
388 static DEVICE_ATTR_RW(sriov_drivers_autoprobe);
389
390 static struct attribute *sriov_dev_attrs[] = {
391         &dev_attr_sriov_totalvfs.attr,
392         &dev_attr_sriov_numvfs.attr,
393         &dev_attr_sriov_offset.attr,
394         &dev_attr_sriov_stride.attr,
395         &dev_attr_sriov_vf_device.attr,
396         &dev_attr_sriov_drivers_autoprobe.attr,
397         NULL,
398 };
399
400 static umode_t sriov_attrs_are_visible(struct kobject *kobj,
401                                        struct attribute *a, int n)
402 {
403         struct device *dev = kobj_to_dev(kobj);
404
405         if (!dev_is_pf(dev))
406                 return 0;
407
408         return a->mode;
409 }
410
411 const struct attribute_group sriov_dev_attr_group = {
412         .attrs = sriov_dev_attrs,
413         .is_visible = sriov_attrs_are_visible,
414 };
415
416 int __weak pcibios_sriov_enable(struct pci_dev *pdev, u16 num_vfs)
417 {
418         return 0;
419 }
420
421 int __weak pcibios_sriov_disable(struct pci_dev *pdev)
422 {
423         return 0;
424 }
425
426 static int sriov_add_vfs(struct pci_dev *dev, u16 num_vfs)
427 {
428         unsigned int i;
429         int rc;
430
431         if (dev->no_vf_scan)
432                 return 0;
433
434         for (i = 0; i < num_vfs; i++) {
435                 rc = pci_iov_add_virtfn(dev, i);
436                 if (rc)
437                         goto failed;
438         }
439         return 0;
440 failed:
441         while (i--)
442                 pci_iov_remove_virtfn(dev, i);
443
444         return rc;
445 }
446
447 static int sriov_enable(struct pci_dev *dev, int nr_virtfn)
448 {
449         int rc;
450         int i;
451         int nres;
452         u16 initial;
453         struct resource *res;
454         struct pci_dev *pdev;
455         struct pci_sriov *iov = dev->sriov;
456         int bars = 0;
457         int bus;
458
459         if (!nr_virtfn)
460                 return 0;
461
462         if (iov->num_VFs)
463                 return -EINVAL;
464
465         pci_read_config_word(dev, iov->pos + PCI_SRIOV_INITIAL_VF, &initial);
466         if (initial > iov->total_VFs ||
467             (!(iov->cap & PCI_SRIOV_CAP_VFM) && (initial != iov->total_VFs)))
468                 return -EIO;
469
470         if (nr_virtfn < 0 || nr_virtfn > iov->total_VFs ||
471             (!(iov->cap & PCI_SRIOV_CAP_VFM) && (nr_virtfn > initial)))
472                 return -EINVAL;
473
474         nres = 0;
475         for (i = 0; i < PCI_SRIOV_NUM_BARS; i++) {
476                 bars |= (1 << (i + PCI_IOV_RESOURCES));
477                 res = &dev->resource[i + PCI_IOV_RESOURCES];
478                 if (res->parent)
479                         nres++;
480         }
481         if (nres != iov->nres) {
482                 pci_err(dev, "not enough MMIO resources for SR-IOV\n");
483                 return -ENOMEM;
484         }
485
486         bus = pci_iov_virtfn_bus(dev, nr_virtfn - 1);
487         if (bus > dev->bus->busn_res.end) {
488                 pci_err(dev, "can't enable %d VFs (bus %02x out of range of %pR)\n",
489                         nr_virtfn, bus, &dev->bus->busn_res);
490                 return -ENOMEM;
491         }
492
493         if (pci_enable_resources(dev, bars)) {
494                 pci_err(dev, "SR-IOV: IOV BARS not allocated\n");
495                 return -ENOMEM;
496         }
497
498         if (iov->link != dev->devfn) {
499                 pdev = pci_get_slot(dev->bus, iov->link);
500                 if (!pdev)
501                         return -ENODEV;
502
503                 if (!pdev->is_physfn) {
504                         pci_dev_put(pdev);
505                         return -ENOSYS;
506                 }
507
508                 rc = sysfs_create_link(&dev->dev.kobj,
509                                         &pdev->dev.kobj, "dep_link");
510                 pci_dev_put(pdev);
511                 if (rc)
512                         return rc;
513         }
514
515         iov->initial_VFs = initial;
516         if (nr_virtfn < initial)
517                 initial = nr_virtfn;
518
519         rc = pcibios_sriov_enable(dev, initial);
520         if (rc) {
521                 pci_err(dev, "failure %d from pcibios_sriov_enable()\n", rc);
522                 goto err_pcibios;
523         }
524
525         pci_iov_set_numvfs(dev, nr_virtfn);
526         iov->ctrl |= PCI_SRIOV_CTRL_VFE | PCI_SRIOV_CTRL_MSE;
527         pci_cfg_access_lock(dev);
528         pci_write_config_word(dev, iov->pos + PCI_SRIOV_CTRL, iov->ctrl);
529         msleep(100);
530         pci_cfg_access_unlock(dev);
531
532         rc = sriov_add_vfs(dev, initial);
533         if (rc)
534                 goto err_pcibios;
535
536         kobject_uevent(&dev->dev.kobj, KOBJ_CHANGE);
537         iov->num_VFs = nr_virtfn;
538
539         return 0;
540
541 err_pcibios:
542         iov->ctrl &= ~(PCI_SRIOV_CTRL_VFE | PCI_SRIOV_CTRL_MSE);
543         pci_cfg_access_lock(dev);
544         pci_write_config_word(dev, iov->pos + PCI_SRIOV_CTRL, iov->ctrl);
545         ssleep(1);
546         pci_cfg_access_unlock(dev);
547
548         pcibios_sriov_disable(dev);
549
550         if (iov->link != dev->devfn)
551                 sysfs_remove_link(&dev->dev.kobj, "dep_link");
552
553         pci_iov_set_numvfs(dev, 0);
554         return rc;
555 }
556
557 static void sriov_del_vfs(struct pci_dev *dev)
558 {
559         struct pci_sriov *iov = dev->sriov;
560         int i;
561
562         if (dev->no_vf_scan)
563                 return;
564
565         for (i = 0; i < iov->num_VFs; i++)
566                 pci_iov_remove_virtfn(dev, i);
567 }
568
569 static void sriov_disable(struct pci_dev *dev)
570 {
571         struct pci_sriov *iov = dev->sriov;
572
573         if (!iov->num_VFs)
574                 return;
575
576         sriov_del_vfs(dev);
577         iov->ctrl &= ~(PCI_SRIOV_CTRL_VFE | PCI_SRIOV_CTRL_MSE);
578         pci_cfg_access_lock(dev);
579         pci_write_config_word(dev, iov->pos + PCI_SRIOV_CTRL, iov->ctrl);
580         ssleep(1);
581         pci_cfg_access_unlock(dev);
582
583         pcibios_sriov_disable(dev);
584
585         if (iov->link != dev->devfn)
586                 sysfs_remove_link(&dev->dev.kobj, "dep_link");
587
588         iov->num_VFs = 0;
589         pci_iov_set_numvfs(dev, 0);
590 }
591
592 static int sriov_init(struct pci_dev *dev, int pos)
593 {
594         int i, bar64;
595         int rc;
596         int nres;
597         u32 pgsz;
598         u16 ctrl, total;
599         struct pci_sriov *iov;
600         struct resource *res;
601         struct pci_dev *pdev;
602
603         pci_read_config_word(dev, pos + PCI_SRIOV_CTRL, &ctrl);
604         if (ctrl & PCI_SRIOV_CTRL_VFE) {
605                 pci_write_config_word(dev, pos + PCI_SRIOV_CTRL, 0);
606                 ssleep(1);
607         }
608
609         ctrl = 0;
610         list_for_each_entry(pdev, &dev->bus->devices, bus_list)
611                 if (pdev->is_physfn)
612                         goto found;
613
614         pdev = NULL;
615         if (pci_ari_enabled(dev->bus))
616                 ctrl |= PCI_SRIOV_CTRL_ARI;
617
618 found:
619         pci_write_config_word(dev, pos + PCI_SRIOV_CTRL, ctrl);
620
621         pci_read_config_word(dev, pos + PCI_SRIOV_TOTAL_VF, &total);
622         if (!total)
623                 return 0;
624
625         pci_read_config_dword(dev, pos + PCI_SRIOV_SUP_PGSIZE, &pgsz);
626         i = PAGE_SHIFT > 12 ? PAGE_SHIFT - 12 : 0;
627         pgsz &= ~((1 << i) - 1);
628         if (!pgsz)
629                 return -EIO;
630
631         pgsz &= ~(pgsz - 1);
632         pci_write_config_dword(dev, pos + PCI_SRIOV_SYS_PGSIZE, pgsz);
633
634         iov = kzalloc(sizeof(*iov), GFP_KERNEL);
635         if (!iov)
636                 return -ENOMEM;
637
638         nres = 0;
639         for (i = 0; i < PCI_SRIOV_NUM_BARS; i++) {
640                 res = &dev->resource[i + PCI_IOV_RESOURCES];
641                 /*
642                  * If it is already FIXED, don't change it, something
643                  * (perhaps EA or header fixups) wants it this way.
644                  */
645                 if (res->flags & IORESOURCE_PCI_FIXED)
646                         bar64 = (res->flags & IORESOURCE_MEM_64) ? 1 : 0;
647                 else
648                         bar64 = __pci_read_base(dev, pci_bar_unknown, res,
649                                                 pos + PCI_SRIOV_BAR + i * 4);
650                 if (!res->flags)
651                         continue;
652                 if (resource_size(res) & (PAGE_SIZE - 1)) {
653                         rc = -EIO;
654                         goto failed;
655                 }
656                 iov->barsz[i] = resource_size(res);
657                 res->end = res->start + resource_size(res) * total - 1;
658                 pci_info(dev, "VF(n) BAR%d space: %pR (contains BAR%d for %d VFs)\n",
659                          i, res, i, total);
660                 i += bar64;
661                 nres++;
662         }
663
664         iov->pos = pos;
665         iov->nres = nres;
666         iov->ctrl = ctrl;
667         iov->total_VFs = total;
668         iov->driver_max_VFs = total;
669         pci_read_config_word(dev, pos + PCI_SRIOV_VF_DID, &iov->vf_device);
670         iov->pgsz = pgsz;
671         iov->self = dev;
672         iov->drivers_autoprobe = true;
673         pci_read_config_dword(dev, pos + PCI_SRIOV_CAP, &iov->cap);
674         pci_read_config_byte(dev, pos + PCI_SRIOV_FUNC_LINK, &iov->link);
675         if (pci_pcie_type(dev) == PCI_EXP_TYPE_RC_END)
676                 iov->link = PCI_DEVFN(PCI_SLOT(dev->devfn), iov->link);
677
678         if (pdev)
679                 iov->dev = pci_dev_get(pdev);
680         else
681                 iov->dev = dev;
682
683         dev->sriov = iov;
684         dev->is_physfn = 1;
685         rc = compute_max_vf_buses(dev);
686         if (rc)
687                 goto fail_max_buses;
688
689         return 0;
690
691 fail_max_buses:
692         dev->sriov = NULL;
693         dev->is_physfn = 0;
694 failed:
695         for (i = 0; i < PCI_SRIOV_NUM_BARS; i++) {
696                 res = &dev->resource[i + PCI_IOV_RESOURCES];
697                 res->flags = 0;
698         }
699
700         kfree(iov);
701         return rc;
702 }
703
704 static void sriov_release(struct pci_dev *dev)
705 {
706         BUG_ON(dev->sriov->num_VFs);
707
708         if (dev != dev->sriov->dev)
709                 pci_dev_put(dev->sriov->dev);
710
711         kfree(dev->sriov);
712         dev->sriov = NULL;
713 }
714
715 static void sriov_restore_state(struct pci_dev *dev)
716 {
717         int i;
718         u16 ctrl;
719         struct pci_sriov *iov = dev->sriov;
720
721         pci_read_config_word(dev, iov->pos + PCI_SRIOV_CTRL, &ctrl);
722         if (ctrl & PCI_SRIOV_CTRL_VFE)
723                 return;
724
725         /*
726          * Restore PCI_SRIOV_CTRL_ARI before pci_iov_set_numvfs() because
727          * it reads offset & stride, which depend on PCI_SRIOV_CTRL_ARI.
728          */
729         ctrl &= ~PCI_SRIOV_CTRL_ARI;
730         ctrl |= iov->ctrl & PCI_SRIOV_CTRL_ARI;
731         pci_write_config_word(dev, iov->pos + PCI_SRIOV_CTRL, ctrl);
732
733         for (i = 0; i < PCI_SRIOV_NUM_BARS; i++)
734                 pci_update_resource(dev, i + PCI_IOV_RESOURCES);
735
736         pci_write_config_dword(dev, iov->pos + PCI_SRIOV_SYS_PGSIZE, iov->pgsz);
737         pci_iov_set_numvfs(dev, iov->num_VFs);
738         pci_write_config_word(dev, iov->pos + PCI_SRIOV_CTRL, iov->ctrl);
739         if (iov->ctrl & PCI_SRIOV_CTRL_VFE)
740                 msleep(100);
741 }
742
743 /**
744  * pci_iov_init - initialize the IOV capability
745  * @dev: the PCI device
746  *
747  * Returns 0 on success, or negative on failure.
748  */
749 int pci_iov_init(struct pci_dev *dev)
750 {
751         int pos;
752
753         if (!pci_is_pcie(dev))
754                 return -ENODEV;
755
756         pos = pci_find_ext_capability(dev, PCI_EXT_CAP_ID_SRIOV);
757         if (pos)
758                 return sriov_init(dev, pos);
759
760         return -ENODEV;
761 }
762
763 /**
764  * pci_iov_release - release resources used by the IOV capability
765  * @dev: the PCI device
766  */
767 void pci_iov_release(struct pci_dev *dev)
768 {
769         if (dev->is_physfn)
770                 sriov_release(dev);
771 }
772
773 /**
774  * pci_iov_remove - clean up SR-IOV state after PF driver is detached
775  * @dev: the PCI device
776  */
777 void pci_iov_remove(struct pci_dev *dev)
778 {
779         struct pci_sriov *iov = dev->sriov;
780
781         if (!dev->is_physfn)
782                 return;
783
784         iov->driver_max_VFs = iov->total_VFs;
785         if (iov->num_VFs)
786                 pci_warn(dev, "driver left SR-IOV enabled after remove\n");
787 }
788
789 /**
790  * pci_iov_update_resource - update a VF BAR
791  * @dev: the PCI device
792  * @resno: the resource number
793  *
794  * Update a VF BAR in the SR-IOV capability of a PF.
795  */
796 void pci_iov_update_resource(struct pci_dev *dev, int resno)
797 {
798         struct pci_sriov *iov = dev->is_physfn ? dev->sriov : NULL;
799         struct resource *res = dev->resource + resno;
800         int vf_bar = resno - PCI_IOV_RESOURCES;
801         struct pci_bus_region region;
802         u16 cmd;
803         u32 new;
804         int reg;
805
806         /*
807          * The generic pci_restore_bars() path calls this for all devices,
808          * including VFs and non-SR-IOV devices.  If this is not a PF, we
809          * have nothing to do.
810          */
811         if (!iov)
812                 return;
813
814         pci_read_config_word(dev, iov->pos + PCI_SRIOV_CTRL, &cmd);
815         if ((cmd & PCI_SRIOV_CTRL_VFE) && (cmd & PCI_SRIOV_CTRL_MSE)) {
816                 dev_WARN(&dev->dev, "can't update enabled VF BAR%d %pR\n",
817                          vf_bar, res);
818                 return;
819         }
820
821         /*
822          * Ignore unimplemented BARs, unused resource slots for 64-bit
823          * BARs, and non-movable resources, e.g., those described via
824          * Enhanced Allocation.
825          */
826         if (!res->flags)
827                 return;
828
829         if (res->flags & IORESOURCE_UNSET)
830                 return;
831
832         if (res->flags & IORESOURCE_PCI_FIXED)
833                 return;
834
835         pcibios_resource_to_bus(dev->bus, &region, res);
836         new = region.start;
837         new |= res->flags & ~PCI_BASE_ADDRESS_MEM_MASK;
838
839         reg = iov->pos + PCI_SRIOV_BAR + 4 * vf_bar;
840         pci_write_config_dword(dev, reg, new);
841         if (res->flags & IORESOURCE_MEM_64) {
842                 new = region.start >> 16 >> 16;
843                 pci_write_config_dword(dev, reg + 4, new);
844         }
845 }
846
847 resource_size_t __weak pcibios_iov_resource_alignment(struct pci_dev *dev,
848                                                       int resno)
849 {
850         return pci_iov_resource_size(dev, resno);
851 }
852
853 /**
854  * pci_sriov_resource_alignment - get resource alignment for VF BAR
855  * @dev: the PCI device
856  * @resno: the resource number
857  *
858  * Returns the alignment of the VF BAR found in the SR-IOV capability.
859  * This is not the same as the resource size which is defined as
860  * the VF BAR size multiplied by the number of VFs.  The alignment
861  * is just the VF BAR size.
862  */
863 resource_size_t pci_sriov_resource_alignment(struct pci_dev *dev, int resno)
864 {
865         return pcibios_iov_resource_alignment(dev, resno);
866 }
867
868 /**
869  * pci_restore_iov_state - restore the state of the IOV capability
870  * @dev: the PCI device
871  */
872 void pci_restore_iov_state(struct pci_dev *dev)
873 {
874         if (dev->is_physfn)
875                 sriov_restore_state(dev);
876 }
877
878 /**
879  * pci_vf_drivers_autoprobe - set PF property drivers_autoprobe for VFs
880  * @dev: the PCI device
881  * @auto_probe: set VF drivers auto probe flag
882  */
883 void pci_vf_drivers_autoprobe(struct pci_dev *dev, bool auto_probe)
884 {
885         if (dev->is_physfn)
886                 dev->sriov->drivers_autoprobe = auto_probe;
887 }
888
889 /**
890  * pci_iov_bus_range - find bus range used by Virtual Function
891  * @bus: the PCI bus
892  *
893  * Returns max number of buses (exclude current one) used by Virtual
894  * Functions.
895  */
896 int pci_iov_bus_range(struct pci_bus *bus)
897 {
898         int max = 0;
899         struct pci_dev *dev;
900
901         list_for_each_entry(dev, &bus->devices, bus_list) {
902                 if (!dev->is_physfn)
903                         continue;
904                 if (dev->sriov->max_VF_buses > max)
905                         max = dev->sriov->max_VF_buses;
906         }
907
908         return max ? max - bus->number : 0;
909 }
910
911 /**
912  * pci_enable_sriov - enable the SR-IOV capability
913  * @dev: the PCI device
914  * @nr_virtfn: number of virtual functions to enable
915  *
916  * Returns 0 on success, or negative on failure.
917  */
918 int pci_enable_sriov(struct pci_dev *dev, int nr_virtfn)
919 {
920         might_sleep();
921
922         if (!dev->is_physfn)
923                 return -ENOSYS;
924
925         return sriov_enable(dev, nr_virtfn);
926 }
927 EXPORT_SYMBOL_GPL(pci_enable_sriov);
928
929 /**
930  * pci_disable_sriov - disable the SR-IOV capability
931  * @dev: the PCI device
932  */
933 void pci_disable_sriov(struct pci_dev *dev)
934 {
935         might_sleep();
936
937         if (!dev->is_physfn)
938                 return;
939
940         sriov_disable(dev);
941 }
942 EXPORT_SYMBOL_GPL(pci_disable_sriov);
943
944 /**
945  * pci_num_vf - return number of VFs associated with a PF device_release_driver
946  * @dev: the PCI device
947  *
948  * Returns number of VFs, or 0 if SR-IOV is not enabled.
949  */
950 int pci_num_vf(struct pci_dev *dev)
951 {
952         if (!dev->is_physfn)
953                 return 0;
954
955         return dev->sriov->num_VFs;
956 }
957 EXPORT_SYMBOL_GPL(pci_num_vf);
958
959 /**
960  * pci_vfs_assigned - returns number of VFs are assigned to a guest
961  * @dev: the PCI device
962  *
963  * Returns number of VFs belonging to this device that are assigned to a guest.
964  * If device is not a physical function returns 0.
965  */
966 int pci_vfs_assigned(struct pci_dev *dev)
967 {
968         struct pci_dev *vfdev;
969         unsigned int vfs_assigned = 0;
970         unsigned short dev_id;
971
972         /* only search if we are a PF */
973         if (!dev->is_physfn)
974                 return 0;
975
976         /*
977          * determine the device ID for the VFs, the vendor ID will be the
978          * same as the PF so there is no need to check for that one
979          */
980         dev_id = dev->sriov->vf_device;
981
982         /* loop through all the VFs to see if we own any that are assigned */
983         vfdev = pci_get_device(dev->vendor, dev_id, NULL);
984         while (vfdev) {
985                 /*
986                  * It is considered assigned if it is a virtual function with
987                  * our dev as the physical function and the assigned bit is set
988                  */
989                 if (vfdev->is_virtfn && (vfdev->physfn == dev) &&
990                         pci_is_dev_assigned(vfdev))
991                         vfs_assigned++;
992
993                 vfdev = pci_get_device(dev->vendor, dev_id, vfdev);
994         }
995
996         return vfs_assigned;
997 }
998 EXPORT_SYMBOL_GPL(pci_vfs_assigned);
999
1000 /**
1001  * pci_sriov_set_totalvfs -- reduce the TotalVFs available
1002  * @dev: the PCI PF device
1003  * @numvfs: number that should be used for TotalVFs supported
1004  *
1005  * Should be called from PF driver's probe routine with
1006  * device's mutex held.
1007  *
1008  * Returns 0 if PF is an SRIOV-capable device and
1009  * value of numvfs valid. If not a PF return -ENOSYS;
1010  * if numvfs is invalid return -EINVAL;
1011  * if VFs already enabled, return -EBUSY.
1012  */
1013 int pci_sriov_set_totalvfs(struct pci_dev *dev, u16 numvfs)
1014 {
1015         if (!dev->is_physfn)
1016                 return -ENOSYS;
1017
1018         if (numvfs > dev->sriov->total_VFs)
1019                 return -EINVAL;
1020
1021         /* Shouldn't change if VFs already enabled */
1022         if (dev->sriov->ctrl & PCI_SRIOV_CTRL_VFE)
1023                 return -EBUSY;
1024
1025         dev->sriov->driver_max_VFs = numvfs;
1026         return 0;
1027 }
1028 EXPORT_SYMBOL_GPL(pci_sriov_set_totalvfs);
1029
1030 /**
1031  * pci_sriov_get_totalvfs -- get total VFs supported on this device
1032  * @dev: the PCI PF device
1033  *
1034  * For a PCIe device with SRIOV support, return the PCIe
1035  * SRIOV capability value of TotalVFs or the value of driver_max_VFs
1036  * if the driver reduced it.  Otherwise 0.
1037  */
1038 int pci_sriov_get_totalvfs(struct pci_dev *dev)
1039 {
1040         if (!dev->is_physfn)
1041                 return 0;
1042
1043         return dev->sriov->driver_max_VFs;
1044 }
1045 EXPORT_SYMBOL_GPL(pci_sriov_get_totalvfs);
1046
1047 /**
1048  * pci_sriov_configure_simple - helper to configure SR-IOV
1049  * @dev: the PCI device
1050  * @nr_virtfn: number of virtual functions to enable, 0 to disable
1051  *
1052  * Enable or disable SR-IOV for devices that don't require any PF setup
1053  * before enabling SR-IOV.  Return value is negative on error, or number of
1054  * VFs allocated on success.
1055  */
1056 int pci_sriov_configure_simple(struct pci_dev *dev, int nr_virtfn)
1057 {
1058         int rc;
1059
1060         might_sleep();
1061
1062         if (!dev->is_physfn)
1063                 return -ENODEV;
1064
1065         if (pci_vfs_assigned(dev)) {
1066                 pci_warn(dev, "Cannot modify SR-IOV while VFs are assigned\n");
1067                 return -EPERM;
1068         }
1069
1070         if (nr_virtfn == 0) {
1071                 sriov_disable(dev);
1072                 return 0;
1073         }
1074
1075         rc = sriov_enable(dev, nr_virtfn);
1076         if (rc < 0)
1077                 return rc;
1078
1079         return nr_virtfn;
1080 }
1081 EXPORT_SYMBOL_GPL(pci_sriov_configure_simple);