Under oldstyle, mangled echoed unknown text to simulate old behavior.
[open-adventure.git] / notes.adoc
1 = Open Adventure Maintainer's Notes =
2 by Eric S. Raymond
3
4 In which we explain what has been done to this code since Don Woods
5 authorized us to ship it under an open-source license.  There's a
6 separate link:history.html[history] describing how it came to us.
7
8 == Who we are ==
9
10 The principal maintainers of this code are Eric S. Raymond and Jason
11 Ninneman.  Eric received Don Woods's encouragement to update and ship
12 the game; Jason signed on early in the process to help. The assistance
13 of Peje Nilsson in restructuring some particularly grotty gotos is
14 gratefully acknowledged. Petr Voropaev contributed fuzz testing. Aaron
15 Traas did a lot of painstaking work to improve test coverage.
16
17 == Nomenclature ==
18
19 This project is called "Open Adventure" because it's not at all clear
20 to number Adventure past 2.5 without misleading or causing
21 collisions. Various of the non-mainline versions have claimed to be
22 versions 3, 4, 5, 6, 7 and for all I know higher than that.  It seems
23 best just to start a new numbering series while acknowledging the
24 links back.
25
26 We have reverted to "advent" for the binary to avoid a name collision
27 with the BSD Games version.
28
29 == Philosophy ==
30
31 Extreme care has been taken not to make changes that would alter the
32 logic of the game as we received it from Don Woods, except to fix
33 glitches that were clearly bugs.  By policy, all user-visible
34 changes to gameplay must be revertible with the -o (oldstyle) option.
35
36 It is a goal of this project to exactly preserve the *intended
37 behavior* of 430-point Adventure, but the implementation of it is fair
38 game for improvement. In particular, we are concerned to move it to a
39 form that is (a) readable, and (b) friendly to forward translation to
40 future languages.  It has already survived a move from FORTRAN to C; a
41 future as a Python or Go translation seems possible, even probable.
42
43 == Functional changes ==
44
45 Bug fixes:
46
47 * Reading the relocated Witt's End sign in the endgame didn't work right.
48
49 * Behavior when saying the giant's magic words outside his room wasn't
50   quite correct - the game responded as though the player were in
51   the room.
52  
53 * Attempting to extinguish an unlit urn caused it to lose its oil.
54
55 * Unrecognized words are no longer truncated to 5 characters and
56   uppercased when they are echoed. (This behavior is restored by the
57   oldstyle switch.)
58
59 * "A crystal bridge now spans the fissure." (progressive present) was
60   incorrect most places it appeared and has been replaced by "A crystal 
61   bridge spans the fissure." (timeless present).
62
63 By default, advent issues "> " as a command prompt.  This feature
64 became common in many variants after the original 350-point version,
65 but was never backported into Crowther & Woods's main line before now.
66 The "-o" (oldstyle) option reverts the behavior.
67
68 There is a set of standard one-letter command aliases conventional in modern
69 text adventure games; 'l' and 'x'; for 'look' (or 'examine'), 'z' to do nothing
70 for a turn, 'i' for 'inventory', 'g' for 'get', and 'd' for 'drop'.  The 'd'
71 alias collides with 'd' for 'down', but the others have been implemented.
72 The "-o" (oldstyle) option disables them.
73
74 A "seed" command has been added.  This is not intended for human use
75 but as a way for game logs to set the PRNG (pseudorandom-number generator) so
76 that random events (dwarf & pirate appearances, the bird's magic word)
77 will be reproducible.
78
79 A -l command-line option has been added. When this is given (with a
80 file path argument) each command entered will be logged to the
81 specified file.  Additionally, a generated "seed" command will be put
82 early in the file capturing the randomized start state of the PRNG
83 so that replays of the log will be reproducible.
84
85 Using "seed" and -l, the distribution now includes a regression-test
86 suite for the game.  Any log captured with -l (and thus containing
87 a "seed" command) will replay reliably, including random events.
88
89 The adventure.text file is no longer required at runtime.  Instead, an
90 adventure.yaml file is compiled at build time to a source module
91 containing C structures, which is then linked to the advent
92 binary.  The YAML is drastically easier to read and edit than
93 the old ad-hoc format of adventure.txt.
94
95 The game-save format has changed.  This was done to simplify the
96 FORTRAN-derived code that formerly implemented the save/restore
97 functions; without C's fread(3)/fwrite() and structs it was
98 necessarily pretty ugly by modern standards. Encryption and
99 checksumming have been discarded - it's pointless to try
100 tamper-proofing saves when everyone has the source code.
101
102 A -r command-line been added. When it is given (with a file path
103 argument) it is functionally equivalent to a RESTORE command.
104
105 == Translation ==
106
107 The 2.5 code was a mechanical C translation of a FORTRAN original.
108 There were gotos everywhere and the code was, though functional,
109 ugly and quite unreadable.
110
111 Jason Ninneman and I have moved it to what is almost, but not quite,
112 idiomatic modern C.  We refactored the right way, checking correctness
113 against a comprehensive test suite that we built first and verified
114 with coverage tools (we have over 95% coverage, with the remaining
115 confined to exception cases that are very difficult to reach). This is
116 what you are running when you do "make check".
117
118 The move to modern C entailed some structural changes.  The most
119 important was the refactoring of over 350 gotos into if/loop/break
120 structures.  We also abolished almost all shared globals; the main one
121 left is a struct holding the game's saveable/restorable state.
122
123 The original code was greatly complicated by a kind of bit-packing
124 that was performed because the FORTRAN it was written in had no string
125 type.  Text from the adventure.text file was compiled into sequences
126 of sixbit code points in a restricted character set, packed 5 to a
127 32-bit word (it seems clear from the code that words were originally
128 *6* chars each packed into a PDP-10 36-bit word).  A command noun or
129 verb was one of these words, and what would be string operations in a
130 more recent language were all done on sequences of these words.
131
132 We have removed all this bit-packing cruft in favor of proper C
133 strings.  C strings may be a weak and leaky abstraction, but this is
134 one of the rare cases in which they are an obvious improvement over
135 what they're displacing...
136
137 We have also conducted extensive fuzz testing on the game using
138 afl (American Fuzzy Lop).  We've found and fixed some crashers in
139 our new code (which occasionally uses malloc(3)), but none as yet
140 in Don's old code (which didn't).
141
142 The code falls short of being fully modern C in the following
143 ways:
144
145 * We have not attempted to translate the old code to pointer-based
146   idioms (as opposed, in particular, to integer-based array indexing).
147   We don't need whatever minor performance gains this might collect,
148   and the choice to refrain will make forward translation into future
149   languages easier.
150
151 * There are a few gotos left that resist restructuring; all are in the
152   principal command interpreter function implementing its state
153   machine.
154
155 * Linked lists (for objects at a location) are implemented using an array
156   of link indices. This is a surviving FORTRANism that is quite unlike
157   normal practice in C or any more modern language.  We have not tried
158   to fix it because doing so would (a) be quite difficult, and (b)
159   compromise forward-portability to other languages.
160
161 * Much of the code still assumes one-origin array indexing.  Thus,
162   arrays are a cell larger than they strictly need to be and cell 0 is
163   unused.
164
165 * The code is still mostly typeless, slinging around machine longs
166   like a FORTRAN or BCPL program.  Some (incomplete) effort has been made
167   to introduce semantic types.
168
169 We have made exactly one minor architectural change.  In addition to the
170 old code's per-object state-description messages, we now have a per-object
171 message series for state *changes*.  This makes it possible to pull a fair
172 amount of text out of the arbitrary-messages list and associate those
173 mesages with the objects that conceptually own them.
174
175 // end