GNU Linux-libre 4.9.331-gnu1
[releases.git] / fs / btrfs / root-tree.c
1 /*
2  * Copyright (C) 2007 Oracle.  All rights reserved.
3  *
4  * This program is free software; you can redistribute it and/or
5  * modify it under the terms of the GNU General Public
6  * License v2 as published by the Free Software Foundation.
7  *
8  * This program is distributed in the hope that it will be useful,
9  * but WITHOUT ANY WARRANTY; without even the implied warranty of
10  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
11  * General Public License for more details.
12  *
13  * You should have received a copy of the GNU General Public
14  * License along with this program; if not, write to the
15  * Free Software Foundation, Inc., 59 Temple Place - Suite 330,
16  * Boston, MA 021110-1307, USA.
17  */
18
19 #include <linux/err.h>
20 #include <linux/uuid.h>
21 #include "ctree.h"
22 #include "transaction.h"
23 #include "disk-io.h"
24 #include "print-tree.h"
25
26 /*
27  * Read a root item from the tree. In case we detect a root item smaller then
28  * sizeof(root_item), we know it's an old version of the root structure and
29  * initialize all new fields to zero. The same happens if we detect mismatching
30  * generation numbers as then we know the root was once mounted with an older
31  * kernel that was not aware of the root item structure change.
32  */
33 static void btrfs_read_root_item(struct extent_buffer *eb, int slot,
34                                 struct btrfs_root_item *item)
35 {
36         uuid_le uuid;
37         int len;
38         int need_reset = 0;
39
40         len = btrfs_item_size_nr(eb, slot);
41         read_extent_buffer(eb, item, btrfs_item_ptr_offset(eb, slot),
42                         min_t(int, len, (int)sizeof(*item)));
43         if (len < sizeof(*item))
44                 need_reset = 1;
45         if (!need_reset && btrfs_root_generation(item)
46                 != btrfs_root_generation_v2(item)) {
47                 if (btrfs_root_generation_v2(item) != 0) {
48                         btrfs_warn(eb->fs_info,
49                                         "mismatching generation and generation_v2 found in root item. This root was probably mounted with an older kernel. Resetting all new fields.");
50                 }
51                 need_reset = 1;
52         }
53         if (need_reset) {
54                 memset(&item->generation_v2, 0,
55                         sizeof(*item) - offsetof(struct btrfs_root_item,
56                                         generation_v2));
57
58                 uuid_le_gen(&uuid);
59                 memcpy(item->uuid, uuid.b, BTRFS_UUID_SIZE);
60         }
61 }
62
63 /*
64  * btrfs_find_root - lookup the root by the key.
65  * root: the root of the root tree
66  * search_key: the key to search
67  * path: the path we search
68  * root_item: the root item of the tree we look for
69  * root_key: the root key of the tree we look for
70  *
71  * If ->offset of 'search_key' is -1ULL, it means we are not sure the offset
72  * of the search key, just lookup the root with the highest offset for a
73  * given objectid.
74  *
75  * If we find something return 0, otherwise > 0, < 0 on error.
76  */
77 int btrfs_find_root(struct btrfs_root *root, struct btrfs_key *search_key,
78                     struct btrfs_path *path, struct btrfs_root_item *root_item,
79                     struct btrfs_key *root_key)
80 {
81         struct btrfs_key found_key;
82         struct extent_buffer *l;
83         int ret;
84         int slot;
85
86         ret = btrfs_search_slot(NULL, root, search_key, path, 0, 0);
87         if (ret < 0)
88                 return ret;
89
90         if (search_key->offset != -1ULL) {      /* the search key is exact */
91                 if (ret > 0)
92                         goto out;
93         } else {
94                 BUG_ON(ret == 0);               /* Logical error */
95                 if (path->slots[0] == 0)
96                         goto out;
97                 path->slots[0]--;
98                 ret = 0;
99         }
100
101         l = path->nodes[0];
102         slot = path->slots[0];
103
104         btrfs_item_key_to_cpu(l, &found_key, slot);
105         if (found_key.objectid != search_key->objectid ||
106             found_key.type != BTRFS_ROOT_ITEM_KEY) {
107                 ret = 1;
108                 goto out;
109         }
110
111         if (root_item)
112                 btrfs_read_root_item(l, slot, root_item);
113         if (root_key)
114                 memcpy(root_key, &found_key, sizeof(found_key));
115 out:
116         btrfs_release_path(path);
117         return ret;
118 }
119
120 void btrfs_set_root_node(struct btrfs_root_item *item,
121                          struct extent_buffer *node)
122 {
123         btrfs_set_root_bytenr(item, node->start);
124         btrfs_set_root_level(item, btrfs_header_level(node));
125         btrfs_set_root_generation(item, btrfs_header_generation(node));
126 }
127
128 /*
129  * copy the data in 'item' into the btree
130  */
131 int btrfs_update_root(struct btrfs_trans_handle *trans, struct btrfs_root
132                       *root, struct btrfs_key *key, struct btrfs_root_item
133                       *item)
134 {
135         struct btrfs_path *path;
136         struct extent_buffer *l;
137         int ret;
138         int slot;
139         unsigned long ptr;
140         u32 old_len;
141
142         path = btrfs_alloc_path();
143         if (!path)
144                 return -ENOMEM;
145
146         ret = btrfs_search_slot(trans, root, key, path, 0, 1);
147         if (ret < 0)
148                 goto out;
149
150         if (ret != 0) {
151                 btrfs_print_leaf(root, path->nodes[0]);
152                 btrfs_crit(root->fs_info,
153                            "unable to update root key %llu %u %llu",
154                            key->objectid, key->type, key->offset);
155                 BUG_ON(1);
156         }
157
158         l = path->nodes[0];
159         slot = path->slots[0];
160         ptr = btrfs_item_ptr_offset(l, slot);
161         old_len = btrfs_item_size_nr(l, slot);
162
163         /*
164          * If this is the first time we update the root item which originated
165          * from an older kernel, we need to enlarge the item size to make room
166          * for the added fields.
167          */
168         if (old_len < sizeof(*item)) {
169                 btrfs_release_path(path);
170                 ret = btrfs_search_slot(trans, root, key, path,
171                                 -1, 1);
172                 if (ret < 0) {
173                         btrfs_abort_transaction(trans, ret);
174                         goto out;
175                 }
176
177                 ret = btrfs_del_item(trans, root, path);
178                 if (ret < 0) {
179                         btrfs_abort_transaction(trans, ret);
180                         goto out;
181                 }
182                 btrfs_release_path(path);
183                 ret = btrfs_insert_empty_item(trans, root, path,
184                                 key, sizeof(*item));
185                 if (ret < 0) {
186                         btrfs_abort_transaction(trans, ret);
187                         goto out;
188                 }
189                 l = path->nodes[0];
190                 slot = path->slots[0];
191                 ptr = btrfs_item_ptr_offset(l, slot);
192         }
193
194         /*
195          * Update generation_v2 so at the next mount we know the new root
196          * fields are valid.
197          */
198         btrfs_set_root_generation_v2(item, btrfs_root_generation(item));
199
200         write_extent_buffer(l, item, ptr, sizeof(*item));
201         btrfs_mark_buffer_dirty(path->nodes[0]);
202 out:
203         btrfs_free_path(path);
204         return ret;
205 }
206
207 int btrfs_insert_root(struct btrfs_trans_handle *trans, struct btrfs_root *root,
208                       struct btrfs_key *key, struct btrfs_root_item *item)
209 {
210         /*
211          * Make sure generation v1 and v2 match. See update_root for details.
212          */
213         btrfs_set_root_generation_v2(item, btrfs_root_generation(item));
214         return btrfs_insert_item(trans, root, key, item, sizeof(*item));
215 }
216
217 int btrfs_find_orphan_roots(struct btrfs_root *tree_root)
218 {
219         struct extent_buffer *leaf;
220         struct btrfs_path *path;
221         struct btrfs_key key;
222         struct btrfs_key root_key;
223         struct btrfs_root *root;
224         int err = 0;
225         int ret;
226         bool can_recover = true;
227
228         if (tree_root->fs_info->sb->s_flags & MS_RDONLY)
229                 can_recover = false;
230
231         path = btrfs_alloc_path();
232         if (!path)
233                 return -ENOMEM;
234
235         key.objectid = BTRFS_ORPHAN_OBJECTID;
236         key.type = BTRFS_ORPHAN_ITEM_KEY;
237         key.offset = 0;
238
239         root_key.type = BTRFS_ROOT_ITEM_KEY;
240         root_key.offset = (u64)-1;
241
242         while (1) {
243                 ret = btrfs_search_slot(NULL, tree_root, &key, path, 0, 0);
244                 if (ret < 0) {
245                         err = ret;
246                         break;
247                 }
248
249                 leaf = path->nodes[0];
250                 if (path->slots[0] >= btrfs_header_nritems(leaf)) {
251                         ret = btrfs_next_leaf(tree_root, path);
252                         if (ret < 0)
253                                 err = ret;
254                         if (ret != 0)
255                                 break;
256                         leaf = path->nodes[0];
257                 }
258
259                 btrfs_item_key_to_cpu(leaf, &key, path->slots[0]);
260                 btrfs_release_path(path);
261
262                 if (key.objectid != BTRFS_ORPHAN_OBJECTID ||
263                     key.type != BTRFS_ORPHAN_ITEM_KEY)
264                         break;
265
266                 root_key.objectid = key.offset;
267                 key.offset++;
268
269                 /*
270                  * The root might have been inserted already, as before we look
271                  * for orphan roots, log replay might have happened, which
272                  * triggers a transaction commit and qgroup accounting, which
273                  * in turn reads and inserts fs roots while doing backref
274                  * walking.
275                  */
276                 root = btrfs_lookup_fs_root(tree_root->fs_info,
277                                             root_key.objectid);
278                 if (root) {
279                         WARN_ON(!test_bit(BTRFS_ROOT_ORPHAN_ITEM_INSERTED,
280                                           &root->state));
281                         if (btrfs_root_refs(&root->root_item) == 0)
282                                 btrfs_add_dead_root(root);
283                         continue;
284                 }
285
286                 root = btrfs_read_fs_root(tree_root, &root_key);
287                 err = PTR_ERR_OR_ZERO(root);
288                 if (err && err != -ENOENT) {
289                         break;
290                 } else if (err == -ENOENT) {
291                         struct btrfs_trans_handle *trans;
292
293                         btrfs_release_path(path);
294
295                         trans = btrfs_join_transaction(tree_root);
296                         if (IS_ERR(trans)) {
297                                 err = PTR_ERR(trans);
298                                 btrfs_handle_fs_error(tree_root->fs_info, err,
299                                             "Failed to start trans to delete orphan item");
300                                 break;
301                         }
302                         err = btrfs_del_orphan_item(trans, tree_root,
303                                                     root_key.objectid);
304                         btrfs_end_transaction(trans, tree_root);
305                         if (err) {
306                                 btrfs_handle_fs_error(tree_root->fs_info, err,
307                                             "Failed to delete root orphan item");
308                                 break;
309                         }
310                         continue;
311                 }
312
313                 err = btrfs_init_fs_root(root);
314                 if (err) {
315                         btrfs_free_fs_root(root);
316                         break;
317                 }
318
319                 set_bit(BTRFS_ROOT_ORPHAN_ITEM_INSERTED, &root->state);
320
321                 err = btrfs_insert_fs_root(root->fs_info, root);
322                 if (err) {
323                         BUG_ON(err == -EEXIST);
324                         btrfs_free_fs_root(root);
325                         break;
326                 }
327
328                 if (btrfs_root_refs(&root->root_item) == 0)
329                         btrfs_add_dead_root(root);
330         }
331
332         btrfs_free_path(path);
333         return err;
334 }
335
336 /* drop the root item for 'key' from 'root' */
337 int btrfs_del_root(struct btrfs_trans_handle *trans, struct btrfs_root *root,
338                    struct btrfs_key *key)
339 {
340         struct btrfs_path *path;
341         int ret;
342
343         path = btrfs_alloc_path();
344         if (!path)
345                 return -ENOMEM;
346         ret = btrfs_search_slot(trans, root, key, path, -1, 1);
347         if (ret < 0)
348                 goto out;
349
350         BUG_ON(ret != 0);
351
352         ret = btrfs_del_item(trans, root, path);
353 out:
354         btrfs_free_path(path);
355         return ret;
356 }
357
358 int btrfs_del_root_ref(struct btrfs_trans_handle *trans,
359                        struct btrfs_root *tree_root,
360                        u64 root_id, u64 ref_id, u64 dirid, u64 *sequence,
361                        const char *name, int name_len)
362
363 {
364         struct btrfs_path *path;
365         struct btrfs_root_ref *ref;
366         struct extent_buffer *leaf;
367         struct btrfs_key key;
368         unsigned long ptr;
369         int err = 0;
370         int ret;
371
372         path = btrfs_alloc_path();
373         if (!path)
374                 return -ENOMEM;
375
376         key.objectid = root_id;
377         key.type = BTRFS_ROOT_BACKREF_KEY;
378         key.offset = ref_id;
379 again:
380         ret = btrfs_search_slot(trans, tree_root, &key, path, -1, 1);
381         BUG_ON(ret < 0);
382         if (ret == 0) {
383                 leaf = path->nodes[0];
384                 ref = btrfs_item_ptr(leaf, path->slots[0],
385                                      struct btrfs_root_ref);
386
387                 WARN_ON(btrfs_root_ref_dirid(leaf, ref) != dirid);
388                 WARN_ON(btrfs_root_ref_name_len(leaf, ref) != name_len);
389                 ptr = (unsigned long)(ref + 1);
390                 WARN_ON(memcmp_extent_buffer(leaf, name, ptr, name_len));
391                 *sequence = btrfs_root_ref_sequence(leaf, ref);
392
393                 ret = btrfs_del_item(trans, tree_root, path);
394                 if (ret) {
395                         err = ret;
396                         goto out;
397                 }
398         } else
399                 err = -ENOENT;
400
401         if (key.type == BTRFS_ROOT_BACKREF_KEY) {
402                 btrfs_release_path(path);
403                 key.objectid = ref_id;
404                 key.type = BTRFS_ROOT_REF_KEY;
405                 key.offset = root_id;
406                 goto again;
407         }
408
409 out:
410         btrfs_free_path(path);
411         return err;
412 }
413
414 /*
415  * add a btrfs_root_ref item.  type is either BTRFS_ROOT_REF_KEY
416  * or BTRFS_ROOT_BACKREF_KEY.
417  *
418  * The dirid, sequence, name and name_len refer to the directory entry
419  * that is referencing the root.
420  *
421  * For a forward ref, the root_id is the id of the tree referencing
422  * the root and ref_id is the id of the subvol  or snapshot.
423  *
424  * For a back ref the root_id is the id of the subvol or snapshot and
425  * ref_id is the id of the tree referencing it.
426  *
427  * Will return 0, -ENOMEM, or anything from the CoW path
428  */
429 int btrfs_add_root_ref(struct btrfs_trans_handle *trans,
430                        struct btrfs_root *tree_root,
431                        u64 root_id, u64 ref_id, u64 dirid, u64 sequence,
432                        const char *name, int name_len)
433 {
434         struct btrfs_key key;
435         int ret;
436         struct btrfs_path *path;
437         struct btrfs_root_ref *ref;
438         struct extent_buffer *leaf;
439         unsigned long ptr;
440
441         path = btrfs_alloc_path();
442         if (!path)
443                 return -ENOMEM;
444
445         key.objectid = root_id;
446         key.type = BTRFS_ROOT_BACKREF_KEY;
447         key.offset = ref_id;
448 again:
449         ret = btrfs_insert_empty_item(trans, tree_root, path, &key,
450                                       sizeof(*ref) + name_len);
451         if (ret) {
452                 btrfs_abort_transaction(trans, ret);
453                 btrfs_free_path(path);
454                 return ret;
455         }
456
457         leaf = path->nodes[0];
458         ref = btrfs_item_ptr(leaf, path->slots[0], struct btrfs_root_ref);
459         btrfs_set_root_ref_dirid(leaf, ref, dirid);
460         btrfs_set_root_ref_sequence(leaf, ref, sequence);
461         btrfs_set_root_ref_name_len(leaf, ref, name_len);
462         ptr = (unsigned long)(ref + 1);
463         write_extent_buffer(leaf, name, ptr, name_len);
464         btrfs_mark_buffer_dirty(leaf);
465
466         if (key.type == BTRFS_ROOT_BACKREF_KEY) {
467                 btrfs_release_path(path);
468                 key.objectid = ref_id;
469                 key.type = BTRFS_ROOT_REF_KEY;
470                 key.offset = root_id;
471                 goto again;
472         }
473
474         btrfs_free_path(path);
475         return 0;
476 }
477
478 /*
479  * Old btrfs forgets to init root_item->flags and root_item->byte_limit
480  * for subvolumes. To work around this problem, we steal a bit from
481  * root_item->inode_item->flags, and use it to indicate if those fields
482  * have been properly initialized.
483  */
484 void btrfs_check_and_init_root_item(struct btrfs_root_item *root_item)
485 {
486         u64 inode_flags = btrfs_stack_inode_flags(&root_item->inode);
487
488         if (!(inode_flags & BTRFS_INODE_ROOT_ITEM_INIT)) {
489                 inode_flags |= BTRFS_INODE_ROOT_ITEM_INIT;
490                 btrfs_set_stack_inode_flags(&root_item->inode, inode_flags);
491                 btrfs_set_root_flags(root_item, 0);
492                 btrfs_set_root_limit(root_item, 0);
493         }
494 }
495
496 void btrfs_update_root_times(struct btrfs_trans_handle *trans,
497                              struct btrfs_root *root)
498 {
499         struct btrfs_root_item *item = &root->root_item;
500         struct timespec ct = current_fs_time(root->fs_info->sb);
501
502         spin_lock(&root->root_item_lock);
503         btrfs_set_root_ctransid(item, trans->transid);
504         btrfs_set_stack_timespec_sec(&item->ctime, ct.tv_sec);
505         btrfs_set_stack_timespec_nsec(&item->ctime, ct.tv_nsec);
506         spin_unlock(&root->root_item_lock);
507 }