Documentation/translations/zh_TW/process/coding-style.rst

   1 .. SPDX-License-Identifier: GPL-2.0
   2
   3 .. include:: ../disclaimer-zh_TW.rst
   4
   5 :Original: Documentation/process/coding-style.rst
   6
   7 .. _tw_codingstyle:
   8
   9 :譯者:
  10  - 張樂 Zhang Le <r0bertz@gentoo.org>
  11  - Andy Deng <theandy.deng@gmail.com>
  12  - 吳想成 <bobwxc@email.cn>
  13
  14 :校譯:
  15  - 王聰 Wang Cong <xiyou.wangcong@gmail.com>
  16  - wheelz <kernel.zeng@gmail.com>
  17  - 管旭東 Xudong Guan <xudong.guan@gmail.com>
  18  - Li Zefan <lizf@cn.fujitsu.com>
  19  - Wang Chen <wangchen@cn.fujitsu.com>
  20  - Hu Haowen <src.res.211@gmail.com>
  21
  22 Linux 內核代碼風格
  23 ==================
  24
  25 這是一個簡短的文檔，描述了 linux 內核的首選代碼風格。代碼風格是因人而異的，
  26 而且我不願意把自己的觀點強加給任何人，但這就像我去做任何事情都必須遵循的原則
  27 那樣，我也希望在絕大多數事上保持這種的態度。請 (在寫代碼時) 至少考慮一下這裏
  28 的代碼風格。
  29
  30 首先，我建議你打印一份 GNU 代碼規範，然後不要讀。燒了它，這是一個具有重大象徵
  31 性意義的動作。
  32
  33 不管怎樣，現在我們開始：
  34
  35
  36 1) 縮進
  37 -------
  38
  39 製表符是 8 個字符，所以縮進也是 8 個字符。有些異端運動試圖將縮進變爲 4 (甚至
  40 2！) 字符深，這幾乎相當於嘗試將圓周率的值定義爲 3。
  41
  42 理由：縮進的全部意義就在於清楚的定義一個控制塊起止於何處。尤其是當你盯着你的
  43 屏幕連續看了 20 小時之後，你將會發現大一點的縮進會使你更容易分辨縮進。
  44
  45 現在，有些人會抱怨 8 個字符的縮進會使代碼向右邊移動的太遠，在 80 個字符的終端
  46 屏幕上就很難讀這樣的代碼。這個問題的答案是，如果你需要 3 級以上的縮進，不管用
  47 何種方式你的代碼已經有問題了，應該修正你的程序。
  48
  49 簡而言之，8 個字符的縮進可以讓代碼更容易閱讀，還有一個好處是當你的函數嵌套太
  50 深的時候可以給你警告。留心這個警告。
  51
  52 在 switch 語句中消除多級縮進的首選的方式是讓 ``switch`` 和從屬於它的 ``case``
  53 標籤對齊於同一列，而不要 ``兩次縮進`` ``case`` 標籤。比如：
  54
  55 .. code-block:: c
  56
  57         switch (suffix) {
  58         case 'G':
  59         case 'g':
  60                 mem <<= 30;
  61                 break;
  62         case 'M':
  63         case 'm':
  64                 mem <<= 20;
  65                 break;
  66         case 'K':
  67         case 'k':
  68                 mem <<= 10;
  69                 fallthrough;
  70         default:
  71                 break;
  72         }
  73
  74 不要把多個語句放在一行裏，除非你有什麼東西要隱藏：
  75
  76 .. code-block:: c
  77
  78         if (condition) do_this;
  79           do_something_everytime;
  80
  81 不要使用逗號來避免使用大括號：
  82
  83 .. code-block:: c
  84
  85         if (condition)
  86                 do_this(), do_that();
  87
  88 使用大括號包裹多語句：
  89
  90 .. code-block:: c
  91
  92         if (condition) {
  93                 do_this();
  94                 do_that();
  95         }
  96
  97 也不要在一行裏放多個賦值語句。內核代碼風格超級簡單。就是避免可能導致別人誤讀
  98 的表達式。
  99
 100 除了註釋、文檔和 Kconfig 之外，不要使用空格來縮進，前面的例子是例外，是有意爲
 101 之。
 102
 103 選用一個好的編輯器，不要在行尾留空格。
 104
 105
 106 2) 把長的行和字符串打散
 107 -----------------------
 108
 109 代碼風格的意義就在於使用平常使用的工具來維持代碼的可讀性和可維護性。
 110
 111 每一行的長度的限制是 80 列，我們強烈建議您遵守這個慣例。
 112
 113 長於 80 列的語句要打散成有意義的片段。除非超過 80 列能顯著增加可讀性，並且不
 114 會隱藏信息。
 115
 116 子片段要明顯短於母片段，並明顯靠右。一種非常常用的樣式是將子體與函數左括號對齊。
 117
 118 這同樣適用於有着很長參數列表的函數頭。
 119
 120 然而，絕對不要打散對用戶可見的字符串，例如 printk 信息，因爲這樣就
 121 很難對它們 grep。
 122
 123
 124 3) 大括號和空格的放置
 125 ---------------------
 126
 127 C 語言風格中另外一個常見問題是大括號的放置。和縮進大小不同，選擇或棄用某種放
 128 置策略並沒有多少技術上的原因，不過首選的方式，就像 Kernighan 和 Ritchie 展示
 129 給我們的，是把起始大括號放在行尾，而把結束大括號放在行首，所以：
 130
 131 .. code-block:: c
 132
 133         if (x is true) {
 134                 we do y
 135         }
 136
 137 這適用於所有的非函數語句塊 (if, switch, for, while, do)。比如：
 138
 139 .. code-block:: c
 140
 141         switch (action) {
 142         case KOBJ_ADD:
 143                 return "add";
 144         case KOBJ_REMOVE:
 145                 return "remove";
 146         case KOBJ_CHANGE:
 147                 return "change";
 148         default:
 149                 return NULL;
 150         }
 151
 152 不過，有一個例外，那就是函數：函數的起始大括號放置於下一行的開頭，所以：
 153
 154 .. code-block:: c
 155
 156         int function(int x)
 157         {
 158                 body of function
 159         }
 160
 161 全世界的異端可能會抱怨這個不一致性是……呃……不一致，不過所有思維健全的人
 162 都知道 (a) K&R 是 **正確的** 並且 (b) K&R 是正確的。此外，不管怎樣函數都是特
 163 殊的 (C 函數是不能嵌套的)。
 164
 165 注意結束大括號獨自佔據一行，除非它後面跟着同一個語句的剩餘部分，也就是 do 語
 166 句中的 ``while`` 或者 if 語句中的 ``else`` ，像這樣：
 167
 168 .. code-block:: c
 169
 170         do {
 171                 body of do-loop
 172         } while (condition);
 173
 174 和
 175
 176 .. code-block:: c
 177
 178         if (x == y) {
 179                 ..
 180         } else if (x > y) {
 181                 ...
 182         } else {
 183                 ....
 184         }
 185
 186 理由：K&R。
 187
 188 也請注意這種大括號的放置方式也能使空 (或者差不多空的) 行的數量最小化，同時不
 189 失可讀性。因此，由於你的屏幕上的新行是不可再生資源 (想想 25 行的終端屏幕)，你
 190 將會有更多的空行來放置註釋。
 191
 192 當只有一個單獨的語句的時候，不用加不必要的大括號。
 193
 194 .. code-block:: c
 195
 196         if (condition)
 197                 action();
 198
 199 和
 200
 201 .. code-block:: c
 202
 203         if (condition)
 204                 do_this();
 205         else
 206                 do_that();
 207
 208 這並不適用於只有一個條件分支是單語句的情況；這時所有分支都要使用大括號：
 209
 210 .. code-block:: c
 211
 212         if (condition) {
 213                 do_this();
 214                 do_that();
 215         } else {
 216                 otherwise();
 217         }
 218
 219 3.1) 空格
 220 *********
 221
 222 Linux 內核的空格使用方式 (主要) 取決於它是用於函數還是關鍵字。(大多數) 關鍵字
 223 後要加一個空格。值得注意的例外是 sizeof, typeof, alignof 和 __attribute__，這
 224 些關鍵字某些程度上看起來更像函數 (它們在 Linux 裏也常常伴隨小括號而使用，儘管
 225 在 C 裏這樣的小括號不是必需的，就像 ``struct fileinfo info;`` 聲明過後的
 226 ``sizeof info``)。
 227
 228 所以在這些關鍵字之後放一個空格::
 229
 230         if, switch, case, for, do, while
 231
 232 但是不要在 sizeof, typeof, alignof 或者 __attribute__ 這些關鍵字之後放空格。
 233 例如，
 234
 235 .. code-block:: c
 236
 237         s = sizeof(struct file);
 238
 239 不要在小括號裏的表達式兩側加空格。這是一個 **反例** ：
 240
 241 .. code-block:: c
 242
 243         s = sizeof( struct file );
 244
 245 當聲明指針類型或者返回指針類型的函數時， ``*`` 的首選使用方式是使之靠近變量名
 246 或者函數名，而不是靠近類型名。例子：
 247
 248 .. code-block:: c
 249
 250         char *linux_banner;
 251         unsigned long long memparse(char *ptr, char **retptr);
 252         char *match_strdup(substring_t *s);
 253
 254 在大多數二元和三元操作符兩側使用一個空格，例如下面所有這些操作符::
 255
 256         =  +  -  <  >  *  /  %  |  &  ^  <=  >=  ==  !=  ?  :
 257
 258 但是一元操作符後不要加空格::
 259
 260         &  *  +  -  ~  !  sizeof  typeof  alignof  __attribute__  defined
 261
 262 後綴自加和自減一元操作符前不加空格::
 263
 264         ++  --
 265
 266 前綴自加和自減一元操作符後不加空格::
 267
 268         ++  --
 269
 270 ``.`` 和 ``->`` 結構體成員操作符前後不加空格。
 271
 272 不要在行尾留空白。有些可以自動縮進的編輯器會在新行的行首加入適量的空白，然後
 273 你就可以直接在那一行輸入代碼。不過假如你最後沒有在那一行輸入代碼，有些編輯器
 274 就不會移除已經加入的空白，就像你故意留下一個只有空白的行。包含行尾空白的行就
 275 這樣產生了。
 276
 277 當 git 發現補丁包含了行尾空白的時候會警告你，並且可以應你的要求去掉行尾空白；
 278 不過如果你是正在打一系列補丁，這樣做會導致後面的補丁失敗，因爲你改變了補丁的
 279 上下文。
 280
 281
 282 4) 命名
 283 -------
 284
 285 C 是一個簡樸的語言，你的命名也應該這樣。和 Modula-2 和 Pascal 程序員不同，
 286 C 程序員不使用類似 ThisVariableIsATemporaryCounter 這樣華麗的名字。C 程序員會
 287 稱那個變量爲 ``tmp`` ，這樣寫起來會更容易，而且至少不會令其難於理解。
 288
 289 不過，雖然混用大小寫的名字是不提倡使用的，但是全局變量還是需要一個具描述性的
 290 名字。稱一個全局函數爲 ``foo`` 是一個難以饒恕的錯誤。
 291
 292 全局變量 (只有當你 **真正** 需要它們的時候再用它) 需要有一個具描述性的名字，就
 293 像全局函數。如果你有一個可以計算活動用戶數量的函數，你應該叫它
 294 ``count_active_users()`` 或者類似的名字，你不應該叫它 ``cntuser()`` 。
 295
 296 在函數名中包含函數類型 (所謂的匈牙利命名法) 是腦子出了問題——編譯器知道那些類
 297 型而且能夠檢查那些類型，這樣做只能把程序員弄糊塗了。
 298
 299 本地變量名應該簡短，而且能夠表達相關的含義。如果你有一些隨機的整數型的循環計
 300 數器，它應該被稱爲 ``i`` 。叫它 ``loop_counter`` 並無益處，如果它沒有被誤解的
 301 可能的話。類似的， ``tmp`` 可以用來稱呼任意類型的臨時變量。
 302
 303 如果你怕混淆了你的本地變量名，你就遇到另一個問題了，叫做函數增長荷爾蒙失衡綜
 304 合徵。請看第六章 (函數)。
 305
 306 對於符號名稱和文檔，避免引入新的“master/slave”（或獨立於“master”的“slave”）
 307 和“blacklist/whitelist”。
 308
 309 “master/slave”推薦替換爲：
 310     '{primary,main} / {secondary,replica,subordinate}'
 311     '{initiator,requester} / {target,responder}'
 312     '{controller,host} / {device,worker,proxy}'
 313     'leader/follower'
 314     'director/performer'
 315
 316 “blacklist/whitelist”推薦替換爲：
 317     'denylist/allowlist'
 318     'blocklist/passlist'
 319
 320 引入新用法的例外情況是：維護用戶空間ABI/API，或更新現有（截至2020年）硬件或
 321 協議規範的代碼時要求這些術語。對於新規範，儘可能將術語的規範用法轉換爲內核
 322 編碼標準。
 323
 324 .. warning::
 325         以上主從、黑白名單規則不適用於中文文檔，請勿更改中文術語！
 326
 327 5) Typedef
 328 ----------
 329
 330 不要使用類似 ``vps_t`` 之類的東西。
 331
 332 對結構體和指針使用 typedef 是一個 **錯誤** 。當你在代碼裏看到：
 333
 334 .. code-block:: c
 335
 336         vps_t a;
 337
 338 這代表什麼意思呢？
 339
 340 相反，如果是這樣
 341
 342 .. code-block:: c
 343
 344         struct virtual_container *a;
 345
 346 你就知道 ``a`` 是什麼了。
 347
 348 很多人認爲 typedef ``能提高可讀性`` 。實際不是這樣的。它們只在下列情況下有用：
 349
 350  (a) 完全不透明的對象 (這種情況下要主動使用 typedef 來 **隱藏** 這個對象實際上
 351      是什麼)。
 352
 353      例如： ``pte_t`` 等不透明對象，你只能用合適的訪問函數來訪問它們。
 354
 355      .. note::
 356
 357        不透明性和“訪問函數”本身是不好的。我們使用 pte_t 等類型的原因在於真
 358        的是完全沒有任何共用的可訪問信息。
 359
 360  (b) 清楚的整數類型，如此，這層抽象就可以 **幫助** 消除到底是 ``int`` 還是
 361      ``long`` 的混淆。
 362
 363      u8/u16/u32 是完全沒有問題的 typedef，不過它們更符合類別 (d) 而不是這裏。
 364
 365      .. note::
 366
 367        要這樣做，必須事出有因。如果某個變量是 ``unsigned long`` ，那麼沒有必要
 368
 369         typedef unsigned long myflags_t;
 370
 371      不過如果有一個明確的原因，比如它在某種情況下可能會是一個 ``unsigned int``
 372      而在其他情況下可能爲 ``unsigned long`` ，那麼就不要猶豫，請務必使用
 373      typedef。
 374
 375  (c) 當你使用 sparse 按字面的創建一個 **新** 類型來做類型檢查的時候。
 376
 377  (d) 和標準 C99 類型相同的類型，在某些例外的情況下。
 378
 379      雖然讓眼睛和腦筋來適應新的標準類型比如 ``uint32_t`` 不需要花很多時間，可
 380      是有些人仍然拒絕使用它們。
 381
 382      因此，Linux 特有的等同於標準類型的 ``u8/u16/u32/u64`` 類型和它們的有符號
 383      類型是被允許的——儘管在你自己的新代碼中，它們不是強制要求要使用的。
 384
 385      當編輯已經使用了某個類型集的已有代碼時，你應該遵循那些代碼中已經做出的選
 386      擇。
 387
 388  (e) 可以在用戶空間安全使用的類型。
 389
 390      在某些用戶空間可見的結構體裏，我們不能要求 C99 類型而且不能用上面提到的
 391      ``u32`` 類型。因此，我們在與用戶空間共享的所有結構體中使用 __u32 和類似
 392      的類型。
 393
 394 可能還有其他的情況，不過基本的規則是 **永遠不要** 使用 typedef，除非你可以明
 395 確的應用上述某個規則中的一個。
 396
 397 總的來說，如果一個指針或者一個結構體裏的元素可以合理的被直接訪問到，那麼它們
 398 就不應該是一個 typedef。
 399
 400
 401 6) 函數
 402 -------
 403
 404 函數應該簡短而漂亮，並且只完成一件事情。函數應該可以一屏或者兩屏顯示完 (我們
 405 都知道 ISO/ANSI 屏幕大小是 80x24)，只做一件事情，而且把它做好。
 406
 407 一個函數的最大長度是和該函數的複雜度和縮進級數成反比的。所以，如果你有一個理
 408 論上很簡單的只有一個很長 (但是簡單) 的 case 語句的函數，而且你需要在每個 case
 409 裏做很多很小的事情，這樣的函數儘管很長，但也是可以的。
 410
 411 不過，如果你有一個複雜的函數，而且你懷疑一個天分不是很高的高中一年級學生可能
 412 甚至搞不清楚這個函數的目的，你應該嚴格遵守前面提到的長度限制。使用輔助函數，
 413 併爲之取個具描述性的名字 (如果你覺得它們的性能很重要的話，可以讓編譯器內聯它
 414 們，這樣的效果往往會比你寫一個複雜函數的效果要好。)
 415
 416 函數的另外一個衡量標準是本地變量的數量。此數量不應超過 5－10 個，否則你的函數
 417 就有問題了。重新考慮一下你的函數，把它分拆成更小的函數。人的大腦一般可以輕鬆
 418 的同時跟蹤 7 個不同的事物，如果再增多的話，就會糊塗了。即便你聰穎過人，你也可
 419 能會記不清你 2 個星期前做過的事情。
 420
 421 在源文件裏，使用空行隔開不同的函數。如果該函數需要被導出，它的 **EXPORT** 宏
 422 應該緊貼在它的結束大括號之下。比如：
 423
 424 .. code-block:: c
 425
 426         int system_is_up(void)
 427         {
 428                 return system_state == SYSTEM_RUNNING;
 429         }
 430         EXPORT_SYMBOL(system_is_up);
 431
 432 6.1) 函數原型
 433 *************
 434
 435 在函數原型中包含參數名和它們的數據類型。雖然 C 語言裏沒有這樣的要求，但在
 436 Linux 裏這是提倡的做法，因爲這樣可以很簡單的給讀者提供更多的有價值的信息。
 437
 438 不要在函數聲明裏使用 ``extern`` 關鍵字，因爲這會導致代碼行變長，並且不是嚴格
 439 必需的。
 440
 441 寫函數原型時，請保持 `元素順序規則 <https://lore.kernel.org/mm-commits/CAHk-=wiOCLRny5aifWNhr621kYrJwhfURsa0vFPeUEm8mF0ufg@mail.gmail.com/>`_ 。
 442 例如下列函數聲明::
 443
 444  __init void * __must_check action(enum magic value, size_t size, u8 count,
 445                                    char *fmt, ...) __printf(4, 5) __malloc;
 446
 447 推薦的函數原型元素順序是：
 448
 449 - 儲存類型（下方的 ``static __always_inline`` ，注意 ``__always_inline``
 450   技術上來講是個屬性但被當做 ``inline`` ）
 451 - 儲存類型屬性（上方的 ``__init`` ——即節聲明，但也像 ``__cold`` ）
 452 - 返回類型（上方的 ``void *`` ）
 453 - 返回類型屬性（上方的 ``__must_check`` ）
 454 - 函數名（上方的 ``action`` ）
 455 - 函數參數（上方的 ``(enum magic value, size_t size, u8 count, char *fmt, ...)`` ，
 456   注意必須寫上參數名）
 457 - 函數參數屬性（上方的 ``__printf(4, 5)`` ）
 458 - 函數行爲屬性（上方的 ``__malloc`` ）
 459
 460 請注意，對於函數 **定義** （即實際函數體），編譯器不允許在函數參數之後添加函
 461 數參數屬性。在這種情況下，它們應該跟隨存儲類型屬性（例如，與上面的 **聲明**
 462 示例相比，請注意下面的 ``__printf(4, 5)`` 的位置發生了變化）::
 463
 464  static __always_inline __init __printf(4, 5) void * __must_check action(enum magic value,
 465                 size_t size, u8 count, char *fmt, ...) __malloc
 466  {
 467         ...
 468  }
 469
 470 7) 集中的函數退出途徑
 471 ---------------------
 472
 473 雖然被某些人聲稱已經過時，但是 goto 語句的等價物還是經常被編譯器所使用，具體
 474 形式是無條件跳轉指令。
 475
 476 當一個函數從多個位置退出，並且需要做一些類似清理的常見操作時，goto 語句就很方
 477 便了。如果並不需要清理操作，那麼直接 return 即可。
 478
 479 選擇一個能夠說明 goto 行爲或它爲何存在的標籤名。如果 goto 要釋放 ``buffer``,
 480 一個不錯的名字可以是 ``out_free_buffer:`` 。別去使用像 ``err1:`` 和 ``err2:``
 481 這樣的GW_BASIC 名稱，因爲一旦你添加或刪除了 (函數的) 退出路徑，你就必須對它們
 482 重新編號，這樣會難以去檢驗正確性。
 483
 484 使用 goto 的理由是：
 485
 486 - 無條件語句容易理解和跟蹤
 487 - 嵌套程度減小
 488 - 可以避免由於修改時忘記更新個別的退出點而導致錯誤
 489 - 讓編譯器省去刪除冗餘代碼的工作 ;)
 490
 491 .. code-block:: c
 492
 493         int fun(int a)
 494         {
 495                 int result = 0;
 496                 char *buffer;
 497
 498                 buffer = kmalloc(SIZE, GFP_KERNEL);
 499                 if (!buffer)
 500                         return -ENOMEM;
 501
 502                 if (condition1) {
 503                         while (loop1) {
 504                                 ...
 505                         }
 506                         result = 1;
 507                         goto out_free_buffer;
 508                 }
 509                 ...
 510         out_free_buffer:
 511                 kfree(buffer);
 512                 return result;
 513         }
 514
 515 一個需要注意的常見錯誤是 ``單 err 錯誤`` ，就像這樣：
 516
 517 .. code-block:: c
 518
 519         err:
 520                 kfree(foo->bar);
 521                 kfree(foo);
 522                 return ret;
 523
 524 這段代碼的錯誤是，在某些退出路徑上 ``foo`` 是 NULL。通常情況下，通過把它分離
 525 成兩個錯誤標籤 ``err_free_bar:`` 和 ``err_free_foo:`` 來修復這個錯誤：
 526
 527 .. code-block:: c
 528
 529          err_free_bar:
 530                 kfree(foo->bar);
 531          err_free_foo:
 532                 kfree(foo);
 533                 return ret;
 534
 535 理想情況下，你應該模擬錯誤來測試所有退出路徑。
 536
 537
 538 8) 註釋
 539 -------
 540
 541 註釋是好的，不過有過度註釋的危險。永遠不要在註釋裏解釋你的代碼是如何運作的：
 542 更好的做法是讓別人一看你的代碼就可以明白，解釋寫的很差的代碼是浪費時間。
 543
 544 一般來說你用註釋告訴別人你的代碼做了什麼，而不是怎麼做的。也請你不要把
 545 註釋放在一個函數體內部：如果函數複雜到你需要獨立的註釋其中的一部分，你很可能
 546 需要回到第六章看一看。你可以做一些小注釋來註明或警告某些很聰明 (或者槽糕) 的
 547 做法，但不要加太多。你應該做的，是把註釋放在函數的頭部，告訴人們它做了什麼，
 548 也可以加上它做這些事情的原因。
 549
 550 當註釋內核 API 函數時，請使用 kernel-doc 格式。詳見
 551 Documentation/translations/zh_CN/doc-guide/index.rst 和 scripts/kernel-doc 。
 552
 553 長 (多行) 註釋的首選風格是：
 554
 555 .. code-block:: c
 556
 557         /*
 558          * This is the preferred style for multi-line
 559          * comments in the Linux kernel source code.
 560          * Please use it consistently.
 561          *
 562          * Description:  A column of asterisks on the left side,
 563          * with beginning and ending almost-blank lines.
 564          */
 565
 566 對於在 net/ 和 drivers/net/ 的文件，首選的長 (多行) 註釋風格有些不同。
 567
 568 .. code-block:: c
 569
 570         /* The preferred comment style for files in net/ and drivers/net
 571          * looks like this.
 572          *
 573          * It is nearly the same as the generally preferred comment style,
 574          * but there is no initial almost-blank line.
 575          */
 576
 577 註釋數據也是很重要的，不管是基本類型還是衍生類型。爲了方便實現這一點，每一行
 578 應只聲明一個數據 (不要使用逗號來一次聲明多個數據)。這樣你就有空間來爲每個數據
 579 寫一段小注釋來解釋它們的用途了。
 580
 581
 582 9) 你已經把事情弄糟了
 583 ---------------------
 584
 585 這沒什麼，我們都是這樣。可能你長期使用 Unix 的朋友已經告訴你
 586 ``GNU emacs`` 能自動幫你格式化 C 源代碼，而且你也注意到了，確實是這樣，不過它
 587 所使用的默認值和我們想要的相去甚遠 (實際上，甚至比隨機打的還要差——無數個猴子
 588 在 GNU emacs 裏打字永遠不會創造出一個好程序)
 589 *(譯註：Infinite Monkey Theorem)*
 590
 591 所以你要麼放棄 GNU emacs，要麼改變它讓它使用更合理的設定。要採用後一個方案，
 592 你可以把下面這段粘貼到你的 .emacs 文件裏。
 593
 594 .. code-block:: elisp
 595
 596   (defun c-lineup-arglist-tabs-only (ignored)
 597     "Line up argument lists by tabs, not spaces"
 598     (let* ((anchor (c-langelem-pos c-syntactic-element))
 599            (column (c-langelem-2nd-pos c-syntactic-element))
 600            (offset (- (1+ column) anchor))
 601            (steps (floor offset c-basic-offset)))
 602       (* (max steps 1)
 603          c-basic-offset)))
 604
 605   (dir-locals-set-class-variables
 606    'linux-kernel
 607    '((c-mode . (
 608           (c-basic-offset . 8)
 609           (c-label-minimum-indentation . 0)
 610           (c-offsets-alist . (
 611                   (arglist-close         . c-lineup-arglist-tabs-only)
 612                   (arglist-cont-nonempty .
 613                       (c-lineup-gcc-asm-reg c-lineup-arglist-tabs-only))
 614                   (arglist-intro         . +)
 615                   (brace-list-intro      . +)
 616                   (c                     . c-lineup-C-comments)
 617                   (case-label            . 0)
 618                   (comment-intro         . c-lineup-comment)
 619                   (cpp-define-intro      . +)
 620                   (cpp-macro             . -1000)
 621                   (cpp-macro-cont        . +)
 622                   (defun-block-intro     . +)
 623                   (else-clause           . 0)
 624                   (func-decl-cont        . +)
 625                   (inclass               . +)
 626                   (inher-cont            . c-lineup-multi-inher)
 627                   (knr-argdecl-intro     . 0)
 628                   (label                 . -1000)
 629                   (statement             . 0)
 630                   (statement-block-intro . +)
 631                   (statement-case-intro  . +)
 632                   (statement-cont        . +)
 633                   (substatement          . +)
 634                   ))
 635           (indent-tabs-mode . t)
 636           (show-trailing-whitespace . t)
 637           ))))
 638
 639   (dir-locals-set-directory-class
 640    (expand-file-name "~/src/linux-trees")
 641    'linux-kernel)
 642
 643 這會讓 emacs 在 ``~/src/linux-trees`` 下的 C 源文件獲得更好的內核代碼風格。
 644
 645 不過就算你嘗試讓 emacs 正確的格式化代碼失敗了，也並不意味着你失去了一切：還可
 646 以用 ``indent`` 。
 647
 648 不過，GNU indent 也有和 GNU emacs 一樣有問題的設定，所以你需要給它一些命令選
 649 項。不過，這還不算太糟糕，因爲就算是 GNU indent 的作者也認同 K&R 的權威性
 650 (GNU 的人並不是壞人，他們只是在這個問題上被嚴重的誤導了)，所以你只要給 indent
 651 指定選項 ``-kr -i8`` (代表 ``K&R，8 字符縮進``)，或使用 ``scripts/Lindent``
 652 這樣就可以以最時髦的方式縮進源代碼。
 653
 654 ``indent`` 有很多選項，特別是重新格式化註釋的時候，你可能需要看一下它的手冊。
 655 不過記住： ``indent`` 不能修正壞的編程習慣。
 656
 657 請注意，您還可以使用 ``clang-format`` 工具幫助您處理這些規則，快速自動重新格
 658 式化部分代碼，並審閱整個文件以發現代碼風格錯誤、打字錯誤和可能的改進。它還可
 659 以方便地排序 ``#include`` ，對齊變量/宏，重排文本和其他類似任務。
 660 詳見 Documentation/process/clang-format.rst 。
 661
 662
 663 10) Kconfig 配置文件
 664 --------------------
 665
 666 對於遍佈源碼樹的所有 Kconfig* 配置文件來說，它們縮進方式有所不同。緊挨着
 667 ``config`` 定義的行，用一個製表符縮進，然而 help 信息的縮進則額外增加 2 個空
 668 格。舉個例子::
 669
 670   config AUDIT
 671         bool "Auditing support"
 672         depends on NET
 673         help
 674           Enable auditing infrastructure that can be used with another
 675           kernel subsystem, such as SELinux (which requires this for
 676           logging of avc messages output).  Does not do system-call
 677           auditing without CONFIG_AUDITSYSCALL.
 678
 679 而那些危險的功能 (比如某些文件系統的寫支持) 應該在它們的提示字符串裏顯著的聲
 680 明這一點::
 681
 682   config ADFS_FS_RW
 683         bool "ADFS write support (DANGEROUS)"
 684         depends on ADFS_FS
 685         ...
 686
 687 要查看配置文件的完整文檔，請看 Documentation/kbuild/kconfig-language.rst 。
 688
 689
 690 11) 數據結構
 691 ------------
 692
 693 如果一個數據結構，在創建和銷燬它的單線執行環境之外可見，那麼它必須要有一個引
 694 用計數器。內核裏沒有垃圾收集 (並且內核之外的垃圾收集慢且效率低下)，這意味着你
 695 絕對需要記錄你對這種數據結構的使用情況。
 696
 697 引用計數意味着你能夠避免上鎖，並且允許多個用戶並行訪問這個數據結構——而不需要
 698 擔心這個數據結構僅僅因爲暫時不被使用就消失了，那些用戶可能不過是沉睡了一陣或
 699 者做了一些其他事情而已。
 700
 701 注意上鎖 **不能** 取代引用計數。上鎖是爲了保持數據結構的一致性，而引用計數是一
 702 個內存管理技巧。通常二者都需要，不要把兩個搞混了。
 703
 704 很多數據結構實際上有 2 級引用計數，它們通常有不同 ``類`` 的用戶。子類計數器統
 705 計子類用戶的數量，每當子類計數器減至零時，全局計數器減一。
 706
 707 這種 ``多級引用計數`` 的例子可以在內存管理 (``struct mm_struct``: mm_users 和
 708 mm_count)，和文件系統 (``struct super_block``: s_count 和 s_active) 中找到。
 709
 710 記住：如果另一個執行線索可以找到你的數據結構，但這個數據結構沒有引用計數器，
 711 這裏幾乎肯定是一個 bug。
 712
 713
 714 12) 宏，枚舉和RTL
 715 -----------------
 716
 717 用於定義常量的宏的名字及枚舉裏的標籤需要大寫。
 718
 719 .. code-block:: c
 720
 721         #define CONSTANT 0x12345
 722
 723 在定義幾個相關的常量時，最好用枚舉。
 724
 725 宏的名字請用大寫字母，不過形如函數的宏的名字可以用小寫字母。
 726
 727 通常如果能寫成內聯函數就不要寫成像函數的宏。
 728
 729 含有多個語句的宏應該被包含在一個 do-while 代碼塊裏：
 730
 731 .. code-block:: c
 732
 733         #define macrofun(a, b, c)                       \
 734                 do {                                    \
 735                         if (a == 5)                     \
 736                                 do_this(b, c);          \
 737                 } while (0)
 738
 739 使用宏的時候應避免的事情：
 740
 741 1) 影響控制流程的宏：
 742
 743 .. code-block:: c
 744
 745         #define FOO(x)                                  \
 746                 do {                                    \
 747                         if (blah(x) < 0)                \
 748                                 return -EBUGGERED;      \
 749                 } while (0)
 750
 751 **非常** 不好。它看起來像一個函數，不過卻能導致 ``調用`` 它的函數退出；不要打
 752 亂讀者大腦裏的語法分析器。
 753
 754 2) 依賴於一個固定名字的本地變量的宏：
 755
 756 .. code-block:: c
 757
 758         #define FOO(val) bar(index, val)
 759
 760 可能看起來像是個不錯的東西，不過它非常容易把讀代碼的人搞糊塗，而且容易導致看起
 761 來不相關的改動帶來錯誤。
 762
 763 3) 作爲左值的帶參數的宏： FOO(x) = y；如果有人把 FOO 變成一個內聯函數的話，這
 764    種用法就會出錯了。
 765
 766 4) 忘記了優先級：使用表達式定義常量的宏必須將表達式置於一對小括號之內。帶參數
 767    的宏也要注意此類問題。
 768
 769 .. code-block:: c
 770
 771         #define CONSTANT 0x4000
 772         #define CONSTEXP (CONSTANT | 3)
 773
 774 5) 在宏裏定義類似函數的本地變量時命名衝突：
 775
 776 .. code-block:: c
 777
 778         #define FOO(x)                          \
 779         ({                                      \
 780                 typeof(x) ret;                  \
 781                 ret = calc_ret(x);              \
 782                 (ret);                          \
 783         })
 784
 785 ret 是本地變量的通用名字—— __foo_ret 更不容易與一個已存在的變量衝突。
 786
 787 cpp 手冊對宏的講解很詳細。gcc internals 手冊也詳細講解了 RTL，內核裏的彙編語
 788 言經常用到它。
 789
 790
 791 13) 打印內核消息
 792 ----------------
 793
 794 內核開發者應該看起來有文化。請一定注意內核信息的拼寫，以給人良好的印象。
 795 不要用不規範的單詞比如 ``dont``，而要用 ``do not`` 或者 ``don't`` 。保證這些信
 796 息簡單明瞭、無歧義。
 797
 798 內核信息不必以英文句號結束。
 799
 800 在小括號裏打印數字 (%d) 沒有任何價值，應該避免這樣做。
 801
 802 <linux/device.h> 裏有一些驅動模型診斷宏，你應該使用它們，以確保信息對應於正確
 803 的設備和驅動，並且被標記了正確的消息級別。這些宏有：dev_err(), dev_warn(),
 804 dev_info() 等等。對於那些不和某個特定設備相關連的信息，<linux/printk.h> 定義
 805 了 pr_notice(), pr_info(), pr_warn(), pr_err() 和其他。
 806
 807 寫出好的調試信息可以是一個很大的挑戰；一旦你寫出後，這些信息在遠程除錯時能提
 808 供極大的幫助。然而打印調試信息的處理方式同打印非調試信息不同。其他 pr_XXX()
 809 函數能無條件地打印，pr_debug() 卻不；默認情況下它不會被編譯，除非定義了 DEBUG
 810 或設定了 CONFIG_DYNAMIC_DEBUG。實際這同樣是爲了 dev_dbg()，一個相關約定是在一
 811 個已經開啓了 DEBUG 時，使用 VERBOSE_DEBUG 來添加 dev_vdbg()。
 812
 813 許多子系統擁有 Kconfig 調試選項來開啓對應 Makefile 裏面的 -DDEBUG；在其他
 814 情況下，特殊文件使用 #define DEBUG。當一條調試信息需要被無條件打印時，例如，
 815 如果已經包含一個調試相關的 #ifdef 條件，printk(KERN_DEBUG ...) 就可被使用。
 816
 817
 818 14) 分配內存
 819 ------------
 820
 821 內核提供了下面的一般用途的內存分配函數：
 822 kmalloc(), kzalloc(), kmalloc_array(), kcalloc(), vmalloc() 和 vzalloc()。
 823 請參考 API 文檔以獲取有關它們的詳細信息：
 824 Documentation/translations/zh_CN/core-api/memory-allocation.rst 。
 825
 826 傳遞結構體大小的首選形式是這樣的：
 827
 828 .. code-block:: c
 829
 830         p = kmalloc(sizeof(*p), ...);
 831
 832 另外一種傳遞方式中，sizeof 的操作數是結構體的名字，這樣會降低可讀性，並且可能
 833 會引入 bug。有可能指針變量類型被改變時，而對應的傳遞給內存分配函數的 sizeof
 834 的結果不變。
 835
 836 強制轉換一個 void 指針返回值是多餘的。C 語言本身保證了從 void 指針到其他任何
 837 指針類型的轉換是沒有問題的。
 838
 839 分配一個數組的首選形式是這樣的：
 840
 841 .. code-block:: c
 842
 843         p = kmalloc_array(n, sizeof(...), ...);
 844
 845 分配一個零長數組的首選形式是這樣的：
 846
 847 .. code-block:: c
 848
 849         p = kcalloc(n, sizeof(...), ...);
 850
 851 兩種形式都會檢查分配 n * sizeof(...) 大小時內存的溢出，如果溢出返回 NULL。
 852
 853 在沒有 __GFP_NOWARN 的情況下使用時，這些通用分配函數都會在失敗時發起堆棧轉儲，
 854 因此當返回NULL時，沒有必要發出額外的失敗消息。
 855
 856 15) 內聯弊病
 857 ------------
 858
 859 有一個常見的誤解是 ``內聯`` 是 gcc 提供的可以讓代碼運行更快的一個選項。雖然使
 860 用內聯函數有時候是恰當的 (比如作爲一種替代宏的方式，請看第十二章)，不過很多情
 861 況下不是這樣。inline 的過度使用會使內核變大，從而使整個系統運行速度變慢。
 862 因爲體積大內核會佔用更多的指令高速緩存，而且會導致 pagecache 的可用內存減少。
 863 想象一下，一次 pagecache 未命中就會導致一次磁盤尋址，將耗時 5 毫秒。5 毫秒的
 864 時間內 CPU 能執行很多很多指令。
 865
 866 一個基本的原則是如果一個函數有 3 行以上，就不要把它變成內聯函數。這個原則的一
 867 個例外是，如果你知道某個參數是一個編譯時常量，而且因爲這個常量你確定編譯器在
 868 編譯時能優化掉你的函數的大部分代碼，那仍然可以給它加上 inline 關鍵字。
 869 kmalloc() 內聯函數就是一個很好的例子。
 870
 871 人們經常主張給 static 的而且只用了一次的函數加上 inline，如此不會有任何損失，
 872 因爲沒有什麼好權衡的。雖然從技術上說這是正確的，但是實際上這種情況下即使不加
 873 inline gcc 也可以自動使其內聯。而且其他用戶可能會要求移除 inline，由此而來的
 874 爭論會抵消 inline 自身的潛在價值，得不償失。
 875
 876
 877 16) 函數返回值及命名
 878 --------------------
 879
 880 函數可以返回多種不同類型的值，最常見的一種是表明函數執行成功或者失敗的值。這樣
 881 的一個值可以表示爲一個錯誤代碼整數 (-Exxx＝失敗，0＝成功) 或者一個 ``成功``
 882 布爾值 (0＝失敗，非0＝成功)。
 883
 884 混合使用這兩種表達方式是難於發現的 bug 的來源。如果 C 語言本身嚴格區分整形和
 885 布爾型變量，那麼編譯器就能夠幫我們發現這些錯誤... 不過 C 語言不區分。爲了避免
 886 產生這種 bug，請遵循下面的慣例::
 887
 888         如果函數的名字是一個動作或者強制性的命令，那麼這個函數應該返回錯誤代
 889         碼整數。如果是一個判斷，那麼函數應該返回一個“成功”布爾值。
 890
 891 比如， ``add work`` 是一個命令，所以 add_work() 在成功時返回 0，在失敗時返回
 892 -EBUSY。類似的，因爲 ``PCI device present`` 是一個判斷，所以 pci_dev_present()
 893 在成功找到一個匹配的設備時應該返回 1，如果找不到時應該返回 0。
 894
 895 所有 EXPORTed 函數都必須遵守這個慣例，所有的公共函數也都應該如此。私有
 896 (static) 函數不需要如此，但是我們也推薦這樣做。
 897
 898 返回值是實際計算結果而不是計算是否成功的標誌的函數不受此慣例的限制。通常
 899 他們通過返回一些正常值範圍之外的結果來表示出錯。典型的例子是返回指針的函數，
 900 他們使用 NULL 或者 ERR_PTR 機制來報告錯誤。
 901
 902 17) 使用布爾類型
 903 ----------------
 904
 905 Linux內核布爾（bool）類型是C99 _Bool類型的別名。布爾值只能爲0或1，而對布爾的
 906 隱式或顯式轉換將自動將值轉換爲true或false。在使用布爾類型時 **不需要** 構造，
 907 它會消除一類錯誤。
 908
 909 使用布爾值時，應使用true和false定義，而不是1和0。
 910
 911 布爾函數返回類型和堆棧變量總是可以在適當的時候使用。鼓勵使用布爾來提高可讀性，
 912 並且布爾值在存儲時通常比“int”更好。
 913
 914 如果緩存行佈局或值的大小很重要，請不要使用布爾，因爲其大小和對齊方式根據編譯
 915 的體系結構而不同。針對對齊和大小進行優化的結構體不應使用布爾。
 916
 917 如果一個結構體有多個true/false值，請考慮將它們合併爲具有1比特成員的位域，或使
 918 用適當的固定寬度類型，如u8。
 919
 920 類似地，對於函數參數，多個true/false值可以合併爲單個按位的“標誌”參數，如果調
 921 用點具有裸true/false常量，“標誌”參數通常是更具可讀性的替代方法。
 922
 923 總之，在結構體和參數中有限地使用布爾可以提高可讀性。
 924
 925 18) 不要重新發明內核宏
 926 ----------------------
 927
 928 頭文件 include/linux/kernel.h 包含了一些宏，你應該使用它們，而不要自己寫一些
 929 它們的變種。比如，如果你需要計算一個數組的長度，使用這個宏
 930
 931 .. code-block:: c
 932
 933         #define ARRAY_SIZE(x) (sizeof(x) / sizeof((x)[0]))
 934
 935 類似的，如果你要計算某結構體成員的大小，使用
 936
 937 .. code-block:: c
 938
 939         #define sizeof_field(t, f) (sizeof(((t*)0)->f))
 940
 941 還有可以做嚴格的類型檢查的 min() 和 max() 宏，如果你需要可以使用它們。你可以
 942 自己看看那個頭文件裏還定義了什麼你可以拿來用的東西，如果有定義的話，你就不應
 943 在你的代碼裏自己重新定義。
 944
 945
 946 19) 編輯器模式行和其他需要羅嗦的事情
 947 ------------------------------------
 948
 949 有一些編輯器可以解釋嵌入在源文件裏的由一些特殊標記標明的配置信息。比如，emacs
 950 能夠解析被標記成這樣的行：
 951
 952 .. code-block:: c
 953
 954         -*- mode: c -*-
 955
 956 或者這樣的：
 957
 958 .. code-block:: c
 959
 960         /*
 961         Local Variables:
 962         compile-command: "gcc -DMAGIC_DEBUG_FLAG foo.c"
 963         End:
 964         */
 965
 966 Vim 能夠解析這樣的標記：
 967
 968 .. code-block:: c
 969
 970         /* vim:set sw=8 noet */
 971
 972 不要在源代碼中包含任何這樣的內容。每個人都有他自己的編輯器配置，你的源文件不
 973 應該覆蓋別人的配置。這包括有關縮進和模式配置的標記。人們可以使用他們自己定製
 974 的模式，或者使用其他可以產生正確的縮進的巧妙方法。
 975
 976
 977 20) 內聯彙編
 978 ------------
 979
 980 在特定架構的代碼中，你可能需要內聯彙編與 CPU 和平臺相關功能連接。需要這麼做時
 981 就不要猶豫。然而，當 C 可以完成工作時，不要平白無故地使用內聯彙編。在可能的情
 982 況下，你可以並且應該用 C 和硬件溝通。
 983
 984 請考慮去寫捆綁通用位元 (wrap common bits) 的內聯彙編的簡單輔助函數，別去重複
 985 地寫下只有細微差異內聯彙編。記住內聯彙編可以使用 C 參數。
 986
 987 大型，有一定複雜度的彙編函數應該放在 .S 文件內，用相應的 C 原型定義在 C 頭文
 988 件中。彙編函數的 C 原型應該使用 ``asmlinkage`` 。
 989
 990 你可能需要把彙編語句標記爲 volatile，用來阻止 GCC 在沒發現任何副作用後就把它
 991 移除了。你不必總是這樣做，儘管，這不必要的舉動會限制優化。
 992
 993 在寫一個包含多條指令的單個內聯彙編語句時，把每條指令用引號分割而且各佔一行，
 994 除了最後一條指令外，在每個指令結尾加上 ``\n\t`` ，讓彙編輸出時可以正確地縮進
 995 下一條指令：
 996
 997 .. code-block:: c
 998
 999         asm ("magic %reg1, #42\n\t"
1000              "more_magic %reg2, %reg3"
1001              : /* outputs */ : /* inputs */ : /* clobbers */);
1002
1003
1004 21) 條件編譯
1005 ------------
1006
1007 只要可能，就不要在 .c 文件裏面使用預處理條件 (#if, #ifdef)；這樣做會讓代碼更難
1008 閱讀並且更難去跟蹤邏輯。替代方案是，在頭文件中用預處理條件提供給那些 .c 文件
1009 使用，再給 #else 提供一個空樁 (no-op stub) 版本，然後在 .c 文件內無條件地調用
1010 那些 (定義在頭文件內的) 函數。這樣做，編譯器會避免爲樁函數 (stub) 的調用生成
1011 任何代碼，產生的結果是相同的，但邏輯將更加清晰。
1012
1013 最好傾向於編譯整個函數，而不是函數的一部分或表達式的一部分。與其放一個 ifdef
1014 在表達式內，不如分解出部分或全部表達式，放進一個單獨的輔助函數，並應用預處理
1015 條件到這個輔助函數內。
1016
1017 如果你有一個在特定配置中，可能變成未使用的函數或變量，編譯器會警告它定義了但
1018 未使用，請把它標記爲 __maybe_unused 而不是將它包含在一個預處理條件中。(然而，
1019 如果一個函數或變量總是未使用，就直接刪除它。)
1020
1021 在代碼中，儘可能地使用 IS_ENABLED 宏來轉化某個 Kconfig 標記爲 C 的布爾
1022 表達式，並在一般的 C 條件中使用它：
1023
1024 .. code-block:: c
1025
1026         if (IS_ENABLED(CONFIG_SOMETHING)) {
1027                 ...
1028         }
1029
1030 編譯器會做常量摺疊，然後就像使用 #ifdef 那樣去包含或排除代碼塊，所以這不會帶
1031 來任何運行時開銷。然而，這種方法依舊允許 C 編譯器查看塊內的代碼，並檢查它的正
1032 確性 (語法，類型，符號引用，等等)。因此，如果條件不滿足，代碼塊內的引用符號就
1033 不存在時，你還是必須去用 #ifdef。
1034
1035 在任何有意義的 #if 或 #ifdef 塊的末尾 (超過幾行的)，在 #endif 同一行的後面寫下
1036 註解，註釋這個條件表達式。例如：
1037
1038 .. code-block:: c
1039
1040         #ifdef CONFIG_SOMETHING
1041         ...
1042         #endif /* CONFIG_SOMETHING */
1043
1044
1045 附錄 I) 參考資料
1046 ----------------
1047
1048 The C Programming Language, 2nd Edition
1049 作者：Brian W. Kernighan 和 Denni M. Ritchie.
1050 Prentice Hall, Inc., 1988.
1051 ISBN 0-13-110362-8 (平裝), 0-13-110370-9 (精裝).
1052
1053 .. note::
1054
1055     《C程序設計語言（第2版）》
1056     作者：[美] Brian W. Kernighan / [美] Dennis M. Ritchie
1057     譯者：徐寶文 / 李志 / 尤晉元（審校）
1058     出版社：機械工業出版社，2019
1059     ISBN：9787111617945
1060
1061 The Practice of Programming
1062 作者：Brian W. Kernighan 和 Rob Pike.
1063 Addison-Wesley, Inc., 1999.
1064 ISBN 0-201-61586-X.
1065
1066 .. note::
1067
1068     《程序設計實踐》
1069     作者：[美] Brian W. Kernighan / [美] Rob Pike
1070     出版社：機械工業出版社，2005
1071     ISBN：9787111091578
1072
1073     《程序設計實踐》
1074     作者：[美] Brian W. Kernighan / Rob Pike
1075     譯者：裘宗燕
1076     出版社：機械工業出版社，2000
1077     ISBN：9787111075738
1078
1079 GNU 手冊 - 遵循 K&R 標準和此文本 - cpp, gcc, gcc internals and indent,
1080 都可以從 https://www.gnu.org/manual/ 找到
1081
1082 WG14 是 C 語言的國際標準化工作組，URL: http://www.open-std.org/JTC1/SC22/WG14/
1083
1084 內核文檔 Documentation/process/coding-style.rst，
1085 作者 greg@kroah.com 發表於 OLS 2002：
1086 http://www.kroah.com/linux/talks/ols_2002_kernel_codingstyle_talk/html/
1087