core: Remove most of reader.
[mes.git] / reader.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 SCM
22 peek_char ()
23 {
24   return make_char (peekchar ());
25 }
26
27 SCM
28 read_char ()
29 {
30   return make_char (getchar ());
31 }
32
33 SCM
34 unread_char (SCM c)
35 {
36   return ungetchar (VALUE (c));
37 }
38
39 int
40 read_line_comment (int c)
41 {
42   if (c == '\n') return c;
43   return read_line_comment (getchar ());
44 }
45
46
47 SCM lookup_char (int c, SCM a);
48
49 SCM
50 read_word (int c, SCM w, SCM a)
51 {
52   if (c == EOF && w == cell_nil) return cell_nil;
53   if (c == '\t') return read_word ('\n', w, a);
54   if (c == '\f') return read_word ('\n', w, a);
55   if (c == '\n' && w == cell_nil) return read_word (getchar (), w, a);
56   if (c == '\n' && VALUE (car (w)) == '.' && cdr (w) == cell_nil) return cell_dot;
57   if (c == EOF || c == '\n') return lookup (w, a);
58   if (c == ' ') return read_word ('\n', w, a);
59   if (c == '(' && w == cell_nil) return read_list (a);
60   if (c == '(') {ungetchar (c); return lookup (w, a);}
61   if (c == ')' && w == cell_nil) {ungetchar (c); return cell_nil;}
62   if (c == ')') {ungetchar (c); return lookup (w, a);}
63   if (c == ';') {read_line_comment (c); return read_word ('\n', w, a);}
64   return read_word (getchar (), append2 (w, cons (make_char (c), cell_nil)), a);
65 }
66
67 int
68 eat_whitespace (int c)
69 {
70   while (c == ' ' || c == '\t' || c == '\n' || c == '\f') c = getchar ();
71   if (c == ';') return eat_whitespace (read_line_comment (c));
72   return c;
73 }
74
75 SCM
76 read_list (SCM a)
77 {
78   int c = getchar ();
79   c = eat_whitespace (c);
80   if (c == ')') return cell_nil;
81   SCM w = read_word (c, cell_nil, a);
82   if (w == cell_dot)
83     return car (read_list (a));
84   return cons (w, read_list (a));
85 }
86
87 SCM
88 read_env (SCM a)
89 {
90   return read_word (getchar (), cell_nil, a);
91 }
92
93 SCM
94 lookup (SCM s, SCM a)
95 {
96   if (isdigit (VALUE (car (s))) || (VALUE (car (s)) == '-' && cdr (s) != cell_nil)) {
97     SCM p = s;
98     int sign = 1;
99     if (VALUE (car (s)) == '-') {
100       sign = -1;
101       p = cdr (s);
102     }
103     int n = 0;
104     while (p != cell_nil && isdigit (VALUE (car (p)))) {
105       n *= 10;
106       n += VALUE (car (p)) - '0';
107       p = cdr (p);
108     }
109     if (p == cell_nil) return make_number (n * sign);
110   }
111
112   if (VALUE (car (s)) == '#' && VALUE (cadr (s)) == ':') return make_keyword (cddr (s));
113
114   SCM x = internal_lookup_symbol (s);
115   if (x) return x;
116
117   if (cdr (s) == cell_nil) {
118     if (VALUE (car (s)) == '\'') return cell_symbol_quote;
119     if (VALUE (car (s)) == '`') return cell_symbol_quasiquote;
120     if (VALUE (car (s)) == ',') return cell_symbol_unquote;
121   }
122   else if (cddr (s) == cell_nil) {
123     if (VALUE (car (s)) == ',' && VALUE (cadr (s)) == '@') return cell_symbol_unquote_splicing;
124     if (VALUE (car (s)) == '#' && VALUE (cadr (s)) == '\'') return cell_symbol_syntax;
125     if (VALUE (car (s)) == '#' && VALUE (cadr (s)) == '`') return cell_symbol_quasisyntax;
126     if (VALUE (car (s)) == '#' && VALUE (cadr (s)) == ',') return cell_symbol_unsyntax;
127   }
128   else if (cdddr (s) == cell_nil) {
129     if (VALUE (car (s)) == '#' && VALUE (cadr (s)) == ',' && VALUE (caddr (s)) == '@') return cell_symbol_unsyntax_splicing;
130         if (VALUE (car (s)) == 'E' && VALUE (cadr (s)) == 'O' && VALUE (caddr (s)) == 'F') {
131       fprintf (stderr, "mes: got EOF\n");
132       return cell_nil; // `EOF': eval program, which may read stdin
133     }
134   }
135
136   return internal_make_symbol (s);
137 }
138
139 SCM
140 lookup_char (int c, SCM a)
141 {
142   return lookup (cons (make_char (c), cell_nil), a);
143 }
144
145 SCM
146 list_of_char_equal_p (SCM a, SCM b)
147 {
148   while (a != cell_nil && b != cell_nil && VALUE (car (a)) == VALUE (car (b))) {
149     assert (TYPE (car (a)) == CHAR);
150     assert (TYPE (car (b)) == CHAR);
151     a = cdr (a);
152     b = cdr (b);
153   }
154   return (a == cell_nil && b == cell_nil) ? cell_t : cell_f;
155 }
156
157 SCM
158 internal_lookup_symbol (SCM s)
159 {
160   SCM x = g_symbols;
161   while (x) {
162     // .string and .name is the same field; .name is used as a handy
163     // static field initializer.  A string can only be mistaken for a
164     // cell with type == PAIR for the one character long, zero-padded
165     // #\etx.
166     SCM p = STRING (car (x));
167     if (p < 0 || p >= g_free.value || TYPE (p) != PAIR)
168       STRING (car (x)) = cstring_to_list (NAME (car (x)));
169     if (list_of_char_equal_p (STRING (car (x)), s) == cell_t) break;
170     x = cdr (x);
171   }
172   if (x) x = car (x);
173   return x;
174 }