217807b9c6a3fd6dddba5dac25823d33c724c502
[mes.git] / src / reader.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016,2017,2018 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #include <ctype.h>
22
23 SCM
24 read_input_file_env_ (SCM e, SCM a)
25 {
26   if (e == cell_nil) return e;
27   return cons (e, read_input_file_env_ (read_env (a), a));
28 }
29
30 SCM
31 read_input_file_env (SCM a)
32 {
33   r0 = a;
34   if (assq_ref_env (cell_symbol_read_input_file, r0) != cell_undefined)
35     return apply (cell_symbol_read_input_file, cell_nil, r0);
36   return read_input_file_env_ (read_env (r0), r0);
37 }
38
39 int
40 read_line_comment (int c)
41 {
42   if (c == '\n') return c;
43   return read_line_comment (getchar ());
44 }
45
46 #if MES_C_READER
47 SCM read_block_comment (int s, int c);
48 SCM read_hash (int c, SCM w, SCM a);
49 #endif
50
51 SCM
52 read_word_ (int c, SCM w, SCM a)
53 {
54   if (c == EOF && w == cell_nil) return cell_nil;
55   if (c == '\t') return read_word_ ('\n', w, a);
56   if (c == '\f') return read_word_ ('\n', w, a);
57   if (c == '\n' && w == cell_nil) return read_word_ (getchar (), w, a);
58   if (c == '\n' && VALUE (car (w)) == '.' && cdr (w) == cell_nil) return cell_dot;
59   if (c == ' ') return read_word_ ('\n', w, a);
60   if (c == EOF || c == '\n') return lookup_ (w, a);
61
62   if (c == '(' && w == cell_nil) return read_list (a);
63   if (c == '(') {ungetchar (c); return lookup_ (w, a);}
64   if (c == ')' && w == cell_nil) {ungetchar (c); return cell_nil;}
65   if (c == ')') {ungetchar (c); return lookup_ (w, a);}
66   if (c == ';') {read_line_comment (c); return read_word_ ('\n', w, a);}
67
68 #if MES_C_READER
69   if (c == '"' && w == cell_nil) return read_string ();
70   if (c == '"') {ungetchar (c); return lookup_ (w, a);}
71   if (c == ',' && peekchar () == '@') {getchar (); return cons (cell_symbol_unquote_splicing,
72                                                                 cons (read_word_ (getchar (), w, a),
73                                                                       cell_nil));}
74   if (c == '\'') return cons (cell_symbol_quote, cons (read_word_ (getchar (), w, a), cell_nil));
75   if (c == '`') return cons (cell_symbol_quasiquote, cons (read_word_ (getchar (), w, a), cell_nil));
76   if (c == ',') return cons (cell_symbol_unquote, cons (read_word_ (getchar (), w, a), cell_nil));
77
78   if (c == '#' && peekchar () == '!') {c = getchar (); read_block_comment (c, getchar ()); return read_word_ (getchar (), w, a);}
79   if (c == '#' && peekchar () == '|') {c = getchar (); read_block_comment (c, getchar ()); return read_word_ (getchar (), w, a);}
80   if (c == '#' && peekchar () == 'f') return read_word_ (getchar (), append2 (w, cons (MAKE_CHAR (c), cell_nil)), a);
81   if (c == '#' && peekchar () == 't') return read_word_ (getchar (), append2 (w, cons (MAKE_CHAR (c), cell_nil)), a);
82   if (c == '#') return read_hash (getchar (), w, a);
83 #endif //MES_C_READER
84
85   return read_word_ (getchar (), append2 (w, cons (MAKE_CHAR (c), cell_nil)), a);
86 }
87
88 int
89 eat_whitespace (int c)
90 {
91   while (c == ' ' || c == '\t' || c == '\n' || c == '\f') c = getchar ();
92   if (c == ';') return eat_whitespace (read_line_comment (c));
93 #if MES_C_READER
94   if (c == '#' && (peekchar () == '!' || peekchar () == '|')) {c=getchar (); read_block_comment (c, getchar ()); return eat_whitespace (getchar ());}
95 #endif
96   return c;
97 }
98
99 SCM
100 read_list (SCM a)
101 {
102   int c = getchar ();
103   c = eat_whitespace (c);
104   if (c == ')') return cell_nil;
105   SCM w = read_word_ (c, cell_nil, a);
106   if (w == cell_dot)
107     return car (read_list (a));
108   return cons (w, read_list (a));
109 }
110
111 SCM
112 read_env (SCM a)
113 {
114   return read_word_ (getchar (), cell_nil, a);
115 }
116
117 SCM
118 lookup_ (SCM s, SCM a)
119 {
120   if (isdigit (VALUE (car (s))) || (VALUE (car (s)) == '-' && cdr (s) != cell_nil)) {
121     SCM p = s;
122     int sign = 1;
123     if (VALUE (car (s)) == '-') {
124       sign = -1;
125       p = cdr (s);
126     }
127     int n = 0;
128     while (p != cell_nil && isdigit (VALUE (car (p)))) {
129       n *= 10;
130       n += VALUE (car (p)) - '0';
131       p = cdr (p);
132     }
133     if (p == cell_nil) return MAKE_NUMBER (n * sign);
134   }
135
136   return lookup_symbol_ (s);
137 }
138
139 #if MES_C_READER
140 SCM
141 read_block_comment (int s, int c)
142 {
143   if (c == s && peekchar () == '#') return getchar ();
144   return read_block_comment (s, getchar ());
145 }
146
147 SCM
148 read_hash (int c, SCM w, SCM a)
149 {
150   if (c == ',')
151     {
152       if (peekchar () == '@')
153         {
154           getchar ();
155           return cons (cell_symbol_unsyntax_splicing, cons (read_word_ (getchar (), w, a), cell_nil));
156         }
157       return cons (cell_symbol_unsyntax, cons (read_word_ (getchar (), w, a), cell_nil));
158     }
159   if (c == '\'') return cons (cell_symbol_syntax, cons (read_word_ (getchar (), w, a), cell_nil));
160   if (c == '`') return cons (cell_symbol_quasisyntax, cons (read_word_ (getchar (), w, a), cell_nil));
161   if (c == ':') return MAKE_KEYWORD (CAR (read_word_ (getchar (), cell_nil, a)));
162   if (c == 'o') return read_octal ();
163   if (c == 'x') return read_hex ();
164   if (c == '\\') return read_character ();
165   if (c == '(') return list_to_vector (read_list (a));
166   if (c == ';') read_word_ (getchar (), w, a); return read_word_ (getchar (), w, a);
167   if (c == '!') {read_block_comment (c, getchar ()); return read_word_ (getchar (), w, a);}
168   if (c == '|') {read_block_comment (c, getchar ()); return read_word_ (getchar (), w, a);}
169   if (c == 'f') return cell_f;
170   if (c == 't') return cell_t;
171
172   return read_word_ (getchar (), append2 (w, cons (MAKE_CHAR (c), cell_nil)), a);
173 }
174
175 SCM
176 read_word (SCM c, SCM w, SCM a)
177 {
178   return read_word_ (VALUE (c), w, a);
179 }
180
181 SCM
182 read_character ()
183 {
184   int c = getchar ();
185   if (c >= '0' && c <= '7'
186       && peekchar () >= '0' && peekchar () <= '7')
187     {
188       c = c - '0';
189       while (peekchar () >= '0' && peekchar () <= '7')
190         {
191           c <<= 3;
192           c += getchar () - '0';
193         }
194     }
195   else if (((c >= 'a' && c <= 'z')
196             || c == '*')
197            && ((peekchar () >= 'a' && peekchar () <= 'z')
198                || peekchar () == '*'))
199     {
200       char buf[10];
201       char *p = buf;
202       *p++ = c;
203       while ((peekchar () >= 'a' && peekchar () <= 'z')
204              || peekchar () == '*')
205         {
206           *p++ = getchar ();
207         }
208       *p = 0;
209       if (!strcmp (buf, "*eof*")) c = EOF;
210       else if (!strcmp (buf, "nul")) c = '\0';
211       else if (!strcmp (buf, "alarm")) c = '\a';
212       else if (!strcmp (buf, "backspace")) c = '\b';
213       else if (!strcmp (buf, "tab")) c = '\t';
214       else if (!strcmp (buf, "linefeed")) c = '\n';
215       else if (!strcmp (buf, "newline")) c = '\n';
216       else if (!strcmp (buf, "vtab")) c = '\v';
217       else if (!strcmp (buf, "page")) c = '\f';
218 #if __MESC__
219       //Nyacc bug
220       else if (!strcmp (buf, "return")) c = 13;
221       else if (!strcmp (buf, "esc")) c = 27;
222 #else
223       else if (!strcmp (buf, "return")) c = '\r';
224       //Nyacc crash else if (!strcmp (buf, "esc")) c = '\e';
225 #endif
226       else if (!strcmp (buf, "space")) c = ' ';
227
228 #if 1 // Nyacc uses old abbrevs
229       else if (!strcmp (buf, "bel")) c = '\a';
230       else if (!strcmp (buf, "bs")) c = '\b';
231       else if (!strcmp (buf, "ht")) c = '\t';
232       else if (!strcmp (buf, "vt")) c = '\v';
233
234 #if __MESC__
235       //Nyacc bug
236       else if (!strcmp (buf, "cr")) c = 13;
237 #else
238       else if (!strcmp (buf, "cr")) c = '\r';
239 #endif
240 #endif // Nyacc uses old abbrevs
241
242       else
243         {
244           eputs ("char not supported: ");
245           eputs (buf);
246           eputs ("\n");
247 #if !__MESC__
248           assert (!"char not supported");
249 #endif
250         }
251     }
252   return MAKE_CHAR (c);
253 }
254
255 SCM
256 read_octal ()
257 {
258   int n = 0;
259   int c = peekchar ();
260   int s = 1;
261   if (c == '-') {s = -1;getchar (); c = peekchar ();}
262   while (c >= '0' && c <= '7')
263     {
264       n <<= 3;
265       n+= c - '0';
266       getchar ();
267       c = peekchar ();
268     }
269   return MAKE_NUMBER (s*n);
270 }
271
272 SCM
273 read_hex ()
274 {
275   int n = 0;
276   int c = peekchar ();
277   int s = 1;
278   if (c == '-') {s = -1;getchar (); c = peekchar ();}
279   while ((c >= '0' && c <= '9')
280          || (c >= 'A' && c <= 'F')
281          || (c >= 'a' && c <= 'f'))
282     {
283       n <<= 4;
284       if (c >= 'a') n += c - 'a' + 10;
285       else if (c >= 'A') n += c - 'A' + 10;
286       else n+= c - '0';
287       getchar ();
288       c = peekchar ();
289     }
290   return MAKE_NUMBER (s*n);
291 }
292
293 SCM
294 append_char (SCM x, int i)
295 {
296   return append2 (x, cons (MAKE_CHAR (i), cell_nil));
297 }
298
299 SCM
300 read_string ()
301 {
302   SCM p = cell_nil;
303   int c = getchar ();
304   while (1) {
305     if (c == '"') break;
306     if (c == '\\' && peekchar () == '\\') p = append_char (p, getchar ());
307     else if (c == '\\' && peekchar () == '"') p = append_char (p, getchar ());
308     else if (c == '\\' && peekchar () == 'n') {getchar (); p = append_char (p, '\n');}
309     else if (c == '\\' && peekchar () == 't') {getchar (); p = append_char (p, '\t');}
310 #if !__MESC__
311     else if (c == EOF) assert (!"EOF in string");
312 #endif
313     else p = append_char (p, c);
314     c = getchar ();
315   }
316   return MAKE_STRING (p);
317 }
318 #else // !MES_C_READER
319 SCM read_word (SCM c,SCM w,SCM a) {}
320 SCM read_character () {}
321 SCM read_octal () {}
322 SCM read_hex () {}
323 SCM read_string () {}
324 #endif // MES_C_READER
325
326 int g_tiny = 0;
327
328 int
329 dump ()
330 {
331   r1 = g_symbols;
332   gc_push_frame ();
333   gc ();
334   gc_peek_frame ();
335   char *p = (char*)g_cells;
336   putchar ('M');
337   putchar ('E');
338   putchar ('S');
339   putchar (g_stack >> 8);
340   putchar (g_stack % 256);
341   eputs ("dumping\n");
342   if (g_debug > 1)
343     {
344       eputs ("program r2=");
345       display_error_ (r2);
346       eputs ("\n");
347     }
348
349   for (int i=0; i<g_free * sizeof(struct scm); i++)
350     putchar (*p++);
351   return 0;
352 }