06e18021d288b82575e339fd7b8b15425dc727b0
[mes.git] / src / reader.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016,2017,2018 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #include <ctype.h>
22
23 SCM
24 read_input_file_env_ (SCM e, SCM a)
25 {
26   if (e == cell_nil)
27     return e;
28   return cons (e, read_input_file_env_ (read_env (a), a));
29 }
30
31 SCM
32 read_input_file_env (SCM a)
33 {
34   r0 = a;
35 #if 0
36   if (assq_ref_env (cell_symbol_read_input_file, r0) != cell_undefined)
37     return apply (cell_symbol_read_input_file, cell_nil, r0);
38 #endif
39   return read_input_file_env_ (read_env (r0), r0);
40 }
41
42 int
43 reader_read_line_comment (int c)
44 {
45   if (c == '\n') return c;
46   return reader_read_line_comment (getchar ());
47 }
48
49 SCM reader_read_block_comment (int s, int c);
50 SCM read_hash (int c, SCM w, SCM a);
51
52 SCM
53 reader_read_word_ (int c, SCM w, SCM a)
54 {
55   if (c == EOF && w == cell_nil) return cell_nil;
56   if (c == '\t') return reader_read_word_ ('\n', w, a);
57   if (c == '\f') return reader_read_word_ ('\n', w, a);
58   if (c == '\n' && w == cell_nil) return reader_read_word_ (getchar (), w, a);
59   if (c == '\n' && VALUE (car (w)) == '.' && cdr (w) == cell_nil) return cell_dot;
60   if (c == ' ') return reader_read_word_ ('\n', w, a);
61   if (c == EOF || c == '\n') return reader_lookup_ (w, a);
62
63   if (c == '(' && w == cell_nil) return reader_read_list (a);
64   if (c == '(') {ungetchar (c); return reader_lookup_ (w, a);}
65   if (c == ')' && w == cell_nil) {ungetchar (c); return cell_nil;}
66   if (c == ')') {ungetchar (c); return reader_lookup_ (w, a);}
67   if (c == ';') {reader_read_line_comment (c); return reader_read_word_ ('\n', w, a);}
68
69   if (c == '"' && w == cell_nil) return reader_read_string ();
70   if (c == '"') {ungetchar (c); return reader_lookup_ (w, a);}
71   if (c == ',' && peekchar () == '@') {getchar (); return cons (cell_symbol_unquote_splicing,
72                                                                 cons (reader_read_word_ (getchar (), w, a),
73                                                                       cell_nil));}
74   if (c == '\'') return cons (cell_symbol_quote, cons (reader_read_word_ (getchar (), w, a), cell_nil));
75   if (c == '`') return cons (cell_symbol_quasiquote, cons (reader_read_word_ (getchar (), w, a), cell_nil));
76   if (c == ',') return cons (cell_symbol_unquote, cons (reader_read_word_ (getchar (), w, a), cell_nil));
77
78   if (c == '#' && peekchar () == '!') {c = getchar (); reader_read_block_comment (c, getchar ()); return reader_read_word_ (getchar (), w, a);}
79   if (c == '#' && peekchar () == '|') {c = getchar (); reader_read_block_comment (c, getchar ()); return reader_read_word_ (getchar (), w, a);}
80   if (c == '#' && peekchar () == 'f') return reader_read_word_ (getchar (), append2 (w, cons (MAKE_CHAR (c), cell_nil)), a);
81   if (c == '#' && peekchar () == 't') return reader_read_word_ (getchar (), append2 (w, cons (MAKE_CHAR (c), cell_nil)), a);
82   if (c == '#') return read_hash (getchar (), w, a);
83
84   return reader_read_word_ (getchar (), append2 (w, cons (MAKE_CHAR (c), cell_nil)), a);
85 }
86
87 int
88 eat_whitespace (int c)
89 {
90   while (c == ' ' || c == '\t' || c == '\n' || c == '\f') c = getchar ();
91   if (c == ';') return eat_whitespace (reader_read_line_comment (c));
92   if (c == '#' && (peekchar () == '!' || peekchar () == '|')) {c=getchar (); reader_read_block_comment (c, getchar ()); return eat_whitespace (getchar ());}
93   return c;
94 }
95
96 SCM
97 reader_read_list (SCM a)
98 {
99   int c = getchar ();
100   c = eat_whitespace (c);
101   if (c == ')') return cell_nil;
102   SCM w = reader_read_word_ (c, cell_nil, a);
103   if (w == cell_dot)
104     return car (reader_read_list (a));
105   return cons (w, reader_read_list (a));
106 }
107
108 SCM
109 read_env (SCM a)
110 {
111   return reader_read_word_ (getchar (), cell_nil, a);
112 }
113
114 SCM
115 reader_lookup_ (SCM s, SCM a)
116 {
117   if (isdigit (VALUE (car (s))) || (VALUE (car (s)) == '-' && cdr (s) != cell_nil)) {
118     SCM p = s;
119     int sign = 1;
120     if (VALUE (car (s)) == '-') {
121       sign = -1;
122       p = cdr (s);
123     }
124     int n = 0;
125     while (p != cell_nil && isdigit (VALUE (car (p)))) {
126       n *= 10;
127       n += VALUE (car (p)) - '0';
128       p = cdr (p);
129     }
130     if (p == cell_nil) return MAKE_NUMBER (n * sign);
131   }
132
133   return lookup_symbol_ (s);
134 }
135
136 SCM
137 reader_read_block_comment (int s, int c)
138 {
139   if (c == s && peekchar () == '#') return getchar ();
140   return reader_read_block_comment (s, getchar ());
141 }
142
143 SCM
144 read_hash (int c, SCM w, SCM a)
145 {
146   if (c == ',')
147     {
148       if (peekchar () == '@')
149         {
150           getchar ();
151           return cons (cell_symbol_unsyntax_splicing, cons (reader_read_word_ (getchar (), w, a), cell_nil));
152         }
153       return cons (cell_symbol_unsyntax, cons (reader_read_word_ (getchar (), w, a), cell_nil));
154     }
155   if (c == '\'') return cons (cell_symbol_syntax, cons (reader_read_word_ (getchar (), w, a), cell_nil));
156   if (c == '`') return cons (cell_symbol_quasisyntax, cons (reader_read_word_ (getchar (), w, a), cell_nil));
157   if (c == ':') return MAKE_KEYWORD (CAR (reader_read_word_ (getchar (), cell_nil, a)));
158   if (c == 'o') return reader_read_octal ();
159   if (c == 'x') return reader_read_hex ();
160   if (c == '\\') return reader_read_character ();
161   if (c == '(') return list_to_vector (reader_read_list (a));
162   if (c == ';') reader_read_word_ (getchar (), w, a); return reader_read_word_ (getchar (), w, a);
163   if (c == '!') {reader_read_block_comment (c, getchar ()); return reader_read_word_ (getchar (), w, a);}
164   if (c == '|') {reader_read_block_comment (c, getchar ()); return reader_read_word_ (getchar (), w, a);}
165   if (c == 'f') return cell_f;
166   if (c == 't') return cell_t;
167
168   return reader_read_word_ (getchar (), append2 (w, cons (MAKE_CHAR (c), cell_nil)), a);
169 }
170
171 SCM
172 reader_read_word (SCM c, SCM w, SCM a)
173 {
174   return reader_read_word_ (VALUE (c), w, a);
175 }
176
177 SCM
178 reader_read_character ()
179 {
180   int c = getchar ();
181   if (c >= '0' && c <= '7'
182       && peekchar () >= '0' && peekchar () <= '7')
183     {
184       c = c - '0';
185       while (peekchar () >= '0' && peekchar () <= '7')
186         {
187           c <<= 3;
188           c += getchar () - '0';
189         }
190     }
191   else if (((c >= 'a' && c <= 'z')
192             || c == '*')
193            && ((peekchar () >= 'a' && peekchar () <= 'z')
194                || peekchar () == '*'))
195     {
196       char buf[10];
197       char *p = buf;
198       *p++ = c;
199       while ((peekchar () >= 'a' && peekchar () <= 'z')
200              || peekchar () == '*')
201         {
202           *p++ = getchar ();
203         }
204       *p = 0;
205       if (!strcmp (buf, "*eof*")) c = EOF;
206       else if (!strcmp (buf, "nul")) c = '\0';
207       else if (!strcmp (buf, "alarm")) c = '\a';
208       else if (!strcmp (buf, "backspace")) c = '\b';
209       else if (!strcmp (buf, "tab")) c = '\t';
210       else if (!strcmp (buf, "linefeed")) c = '\n';
211       else if (!strcmp (buf, "newline")) c = '\n';
212       else if (!strcmp (buf, "vtab")) c = '\v';
213       else if (!strcmp (buf, "page")) c = '\f';
214 #if __MESC__
215       //Nyacc bug
216       else if (!strcmp (buf, "return")) c = 13;
217       else if (!strcmp (buf, "esc")) c = 27;
218 #else
219       else if (!strcmp (buf, "return")) c = '\r';
220       //Nyacc crash else if (!strcmp (buf, "esc")) c = '\e';
221 #endif
222       else if (!strcmp (buf, "space")) c = ' ';
223
224 #if 1 // Nyacc uses old abbrevs
225       else if (!strcmp (buf, "bel")) c = '\a';
226       else if (!strcmp (buf, "bs")) c = '\b';
227       else if (!strcmp (buf, "ht")) c = '\t';
228       else if (!strcmp (buf, "vt")) c = '\v';
229
230 #if __MESC__
231       //Nyacc bug
232       else if (!strcmp (buf, "cr")) c = 13;
233 #else
234       else if (!strcmp (buf, "cr")) c = '\r';
235 #endif
236 #endif // Nyacc uses old abbrevs
237
238       else
239         {
240           eputs ("char not supported: ");
241           eputs (buf);
242           eputs ("\n");
243 #if !__MESC__
244           assert (!"char not supported");
245 #endif
246         }
247     }
248   return MAKE_CHAR (c);
249 }
250
251 SCM
252 reader_read_octal ()
253 {
254   int n = 0;
255   int c = peekchar ();
256   int s = 1;
257   if (c == '-') {s = -1;getchar (); c = peekchar ();}
258   while (c >= '0' && c <= '7')
259     {
260       n <<= 3;
261       n+= c - '0';
262       getchar ();
263       c = peekchar ();
264     }
265   return MAKE_NUMBER (s*n);
266 }
267
268 SCM
269 reader_read_hex ()
270 {
271   int n = 0;
272   int c = peekchar ();
273   int s = 1;
274   if (c == '-') {s = -1;getchar (); c = peekchar ();}
275   while ((c >= '0' && c <= '9')
276          || (c >= 'A' && c <= 'F')
277          || (c >= 'a' && c <= 'f'))
278     {
279       n <<= 4;
280       if (c >= 'a') n += c - 'a' + 10;
281       else if (c >= 'A') n += c - 'A' + 10;
282       else n+= c - '0';
283       getchar ();
284       c = peekchar ();
285     }
286   return MAKE_NUMBER (s*n);
287 }
288
289 SCM
290 append_char (SCM x, int i)
291 {
292   return append2 (x, cons (MAKE_CHAR (i), cell_nil));
293 }
294
295 SCM
296 reader_read_string ()
297 {
298   SCM p = cell_nil;
299   int c = getchar ();
300   while (1) {
301     if (c == '"') break;
302     if (c == '\\' && peekchar () == '\\') p = append_char (p, getchar ());
303     else if (c == '\\' && peekchar () == '"') p = append_char (p, getchar ());
304     else if (c == '\\' && peekchar () == 'n') {getchar (); p = append_char (p, '\n');}
305     else if (c == '\\' && peekchar () == 't') {getchar (); p = append_char (p, '\t');}
306 #if !__MESC__
307     else if (c == EOF) assert (!"EOF in string");
308 #endif
309     else p = append_char (p, c);
310     c = getchar ();
311   }
312   return MAKE_STRING (p);
313 }
314
315 int g_tiny = 0;
316
317 int
318 dump ()
319 {
320   r1 = g_symbols;
321   gc_push_frame ();
322   gc ();
323   gc_peek_frame ();
324   char *p = (char*)g_cells;
325   putchar ('M');
326   putchar ('E');
327   putchar ('S');
328   putchar (g_stack >> 8);
329   putchar (g_stack % 256);
330   eputs ("dumping\n");
331   if (g_debug > 1)
332     {
333       eputs ("program r2=");
334       display_error_ (r2);
335       eputs ("\n");
336     }
337
338   for (int i=0; i<g_free * sizeof (struct scm); i++)
339     putchar (*p++);
340   return 0;
341 }