8210cb30a1722b94bf0ec1d095369aefe3ef1e9d
[mes.git] / src / reader.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016,2017,2018 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #include <ctype.h>
22
23 SCM
24 read_input_file_env_ (SCM e, SCM a)
25 {
26   if (e == cell_nil) return e;
27   return cons (e, read_input_file_env_ (read_env (a), a));
28 }
29
30 SCM
31 read_input_file_env (SCM a)
32 {
33   r0 = a;
34   if (assq_ref_env (cell_symbol_read_input_file, r0) != cell_undefined)
35     return apply (cell_symbol_read_input_file, cell_nil, r0);
36   return read_input_file_env_ (read_env (r0), r0);
37 }
38
39 int
40 reader_read_line_comment (int c)
41 {
42   if (c == '\n') return c;
43   return reader_read_line_comment (getchar ());
44 }
45
46 SCM reader_read_block_comment (int s, int c);
47 SCM read_hash (int c, SCM w, SCM a);
48
49 SCM
50 reader_read_word_ (int c, SCM w, SCM a)
51 {
52   if (c == EOF && w == cell_nil) return cell_nil;
53   if (c == '\t') return reader_read_word_ ('\n', w, a);
54   if (c == '\f') return reader_read_word_ ('\n', w, a);
55   if (c == '\n' && w == cell_nil) return reader_read_word_ (getchar (), w, a);
56   if (c == '\n' && VALUE (car (w)) == '.' && cdr (w) == cell_nil) return cell_dot;
57   if (c == ' ') return reader_read_word_ ('\n', w, a);
58   if (c == EOF || c == '\n') return reader_lookup_ (w, a);
59
60   if (c == '(' && w == cell_nil) return reader_read_list (a);
61   if (c == '(') {ungetchar (c); return reader_lookup_ (w, a);}
62   if (c == ')' && w == cell_nil) {ungetchar (c); return cell_nil;}
63   if (c == ')') {ungetchar (c); return reader_lookup_ (w, a);}
64   if (c == ';') {reader_read_line_comment (c); return reader_read_word_ ('\n', w, a);}
65
66   if (c == '"' && w == cell_nil) return reader_read_string ();
67   if (c == '"') {ungetchar (c); return reader_lookup_ (w, a);}
68   if (c == ',' && peekchar () == '@') {getchar (); return cons (cell_symbol_unquote_splicing,
69                                                                 cons (reader_read_word_ (getchar (), w, a),
70                                                                       cell_nil));}
71   if (c == '\'') return cons (cell_symbol_quote, cons (reader_read_word_ (getchar (), w, a), cell_nil));
72   if (c == '`') return cons (cell_symbol_quasiquote, cons (reader_read_word_ (getchar (), w, a), cell_nil));
73   if (c == ',') return cons (cell_symbol_unquote, cons (reader_read_word_ (getchar (), w, a), cell_nil));
74
75   if (c == '#' && peekchar () == '!') {c = getchar (); reader_read_block_comment (c, getchar ()); return reader_read_word_ (getchar (), w, a);}
76   if (c == '#' && peekchar () == '|') {c = getchar (); reader_read_block_comment (c, getchar ()); return reader_read_word_ (getchar (), w, a);}
77   if (c == '#' && peekchar () == 'f') return reader_read_word_ (getchar (), append2 (w, cons (MAKE_CHAR (c), cell_nil)), a);
78   if (c == '#' && peekchar () == 't') return reader_read_word_ (getchar (), append2 (w, cons (MAKE_CHAR (c), cell_nil)), a);
79   if (c == '#') return read_hash (getchar (), w, a);
80
81   return reader_read_word_ (getchar (), append2 (w, cons (MAKE_CHAR (c), cell_nil)), a);
82 }
83
84 int
85 eat_whitespace (int c)
86 {
87   while (c == ' ' || c == '\t' || c == '\n' || c == '\f') c = getchar ();
88   if (c == ';') return eat_whitespace (reader_read_line_comment (c));
89   if (c == '#' && (peekchar () == '!' || peekchar () == '|')) {c=getchar (); reader_read_block_comment (c, getchar ()); return eat_whitespace (getchar ());}
90   return c;
91 }
92
93 SCM
94 reader_read_list (SCM a)
95 {
96   int c = getchar ();
97   c = eat_whitespace (c);
98   if (c == ')') return cell_nil;
99   SCM w = reader_read_word_ (c, cell_nil, a);
100   if (w == cell_dot)
101     return car (reader_read_list (a));
102   return cons (w, reader_read_list (a));
103 }
104
105 SCM
106 read_env (SCM a)
107 {
108   return reader_read_word_ (getchar (), cell_nil, a);
109 }
110
111 SCM
112 reader_lookup_ (SCM s, SCM a)
113 {
114   if (isdigit (VALUE (car (s))) || (VALUE (car (s)) == '-' && cdr (s) != cell_nil)) {
115     SCM p = s;
116     int sign = 1;
117     if (VALUE (car (s)) == '-') {
118       sign = -1;
119       p = cdr (s);
120     }
121     int n = 0;
122     while (p != cell_nil && isdigit (VALUE (car (p)))) {
123       n *= 10;
124       n += VALUE (car (p)) - '0';
125       p = cdr (p);
126     }
127     if (p == cell_nil) return MAKE_NUMBER (n * sign);
128   }
129
130   return lookup_symbol_ (s);
131 }
132
133 SCM
134 reader_read_block_comment (int s, int c)
135 {
136   if (c == s && peekchar () == '#') return getchar ();
137   return reader_read_block_comment (s, getchar ());
138 }
139
140 SCM
141 read_hash (int c, SCM w, SCM a)
142 {
143   if (c == ',')
144     {
145       if (peekchar () == '@')
146         {
147           getchar ();
148           return cons (cell_symbol_unsyntax_splicing, cons (reader_read_word_ (getchar (), w, a), cell_nil));
149         }
150       return cons (cell_symbol_unsyntax, cons (reader_read_word_ (getchar (), w, a), cell_nil));
151     }
152   if (c == '\'') return cons (cell_symbol_syntax, cons (reader_read_word_ (getchar (), w, a), cell_nil));
153   if (c == '`') return cons (cell_symbol_quasisyntax, cons (reader_read_word_ (getchar (), w, a), cell_nil));
154   if (c == ':') return MAKE_KEYWORD (CAR (reader_read_word_ (getchar (), cell_nil, a)));
155   if (c == 'o') return reader_read_octal ();
156   if (c == 'x') return reader_read_hex ();
157   if (c == '\\') return reader_read_character ();
158   if (c == '(') return list_to_vector (reader_read_list (a));
159   if (c == ';') reader_read_word_ (getchar (), w, a); return reader_read_word_ (getchar (), w, a);
160   if (c == '!') {reader_read_block_comment (c, getchar ()); return reader_read_word_ (getchar (), w, a);}
161   if (c == '|') {reader_read_block_comment (c, getchar ()); return reader_read_word_ (getchar (), w, a);}
162   if (c == 'f') return cell_f;
163   if (c == 't') return cell_t;
164
165   return reader_read_word_ (getchar (), append2 (w, cons (MAKE_CHAR (c), cell_nil)), a);
166 }
167
168 SCM
169 reader_read_word (SCM c, SCM w, SCM a)
170 {
171   return reader_read_word_ (VALUE (c), w, a);
172 }
173
174 SCM
175 reader_read_character ()
176 {
177   int c = getchar ();
178   if (c >= '0' && c <= '7'
179       && peekchar () >= '0' && peekchar () <= '7')
180     {
181       c = c - '0';
182       while (peekchar () >= '0' && peekchar () <= '7')
183         {
184           c <<= 3;
185           c += getchar () - '0';
186         }
187     }
188   else if (((c >= 'a' && c <= 'z')
189             || c == '*')
190            && ((peekchar () >= 'a' && peekchar () <= 'z')
191                || peekchar () == '*'))
192     {
193       char buf[10];
194       char *p = buf;
195       *p++ = c;
196       while ((peekchar () >= 'a' && peekchar () <= 'z')
197              || peekchar () == '*')
198         {
199           *p++ = getchar ();
200         }
201       *p = 0;
202       if (!strcmp (buf, "*eof*")) c = EOF;
203       else if (!strcmp (buf, "nul")) c = '\0';
204       else if (!strcmp (buf, "alarm")) c = '\a';
205       else if (!strcmp (buf, "backspace")) c = '\b';
206       else if (!strcmp (buf, "tab")) c = '\t';
207       else if (!strcmp (buf, "linefeed")) c = '\n';
208       else if (!strcmp (buf, "newline")) c = '\n';
209       else if (!strcmp (buf, "vtab")) c = '\v';
210       else if (!strcmp (buf, "page")) c = '\f';
211 #if __MESC__
212       //Nyacc bug
213       else if (!strcmp (buf, "return")) c = 13;
214       else if (!strcmp (buf, "esc")) c = 27;
215 #else
216       else if (!strcmp (buf, "return")) c = '\r';
217       //Nyacc crash else if (!strcmp (buf, "esc")) c = '\e';
218 #endif
219       else if (!strcmp (buf, "space")) c = ' ';
220
221 #if 1 // Nyacc uses old abbrevs
222       else if (!strcmp (buf, "bel")) c = '\a';
223       else if (!strcmp (buf, "bs")) c = '\b';
224       else if (!strcmp (buf, "ht")) c = '\t';
225       else if (!strcmp (buf, "vt")) c = '\v';
226
227 #if __MESC__
228       //Nyacc bug
229       else if (!strcmp (buf, "cr")) c = 13;
230 #else
231       else if (!strcmp (buf, "cr")) c = '\r';
232 #endif
233 #endif // Nyacc uses old abbrevs
234
235       else
236         {
237           eputs ("char not supported: ");
238           eputs (buf);
239           eputs ("\n");
240 #if !__MESC__
241           assert (!"char not supported");
242 #endif
243         }
244     }
245   return MAKE_CHAR (c);
246 }
247
248 SCM
249 reader_read_octal ()
250 {
251   int n = 0;
252   int c = peekchar ();
253   int s = 1;
254   if (c == '-') {s = -1;getchar (); c = peekchar ();}
255   while (c >= '0' && c <= '7')
256     {
257       n <<= 3;
258       n+= c - '0';
259       getchar ();
260       c = peekchar ();
261     }
262   return MAKE_NUMBER (s*n);
263 }
264
265 SCM
266 reader_read_hex ()
267 {
268   int n = 0;
269   int c = peekchar ();
270   int s = 1;
271   if (c == '-') {s = -1;getchar (); c = peekchar ();}
272   while ((c >= '0' && c <= '9')
273          || (c >= 'A' && c <= 'F')
274          || (c >= 'a' && c <= 'f'))
275     {
276       n <<= 4;
277       if (c >= 'a') n += c - 'a' + 10;
278       else if (c >= 'A') n += c - 'A' + 10;
279       else n+= c - '0';
280       getchar ();
281       c = peekchar ();
282     }
283   return MAKE_NUMBER (s*n);
284 }
285
286 SCM
287 append_char (SCM x, int i)
288 {
289   return append2 (x, cons (MAKE_CHAR (i), cell_nil));
290 }
291
292 SCM
293 reader_read_string ()
294 {
295   SCM p = cell_nil;
296   int c = getchar ();
297   while (1) {
298     if (c == '"') break;
299     if (c == '\\' && peekchar () == '\\') p = append_char (p, getchar ());
300     else if (c == '\\' && peekchar () == '"') p = append_char (p, getchar ());
301     else if (c == '\\' && peekchar () == 'n') {getchar (); p = append_char (p, '\n');}
302     else if (c == '\\' && peekchar () == 't') {getchar (); p = append_char (p, '\t');}
303 #if !__MESC__
304     else if (c == EOF) assert (!"EOF in string");
305 #endif
306     else p = append_char (p, c);
307     c = getchar ();
308   }
309   return MAKE_STRING (p);
310 }
311
312 int g_tiny = 0;
313
314 int
315 dump ()
316 {
317   r1 = g_symbols;
318   gc_push_frame ();
319   gc ();
320   gc_peek_frame ();
321   char *p = (char*)g_cells;
322   putchar ('M');
323   putchar ('E');
324   putchar ('S');
325   putchar (g_stack >> 8);
326   putchar (g_stack % 256);
327   eputs ("dumping\n");
328   if (g_debug > 1)
329     {
330       eputs ("program r2=");
331       display_error_ (r2);
332       eputs ("\n");
333     }
334
335   for (int i=0; i<g_free * sizeof(struct scm); i++)
336     putchar (*p++);
337   return 0;
338 }