core: Cleanup macro expansion.
[mes.git] / mes.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #define _GNU_SOURCE
22 #include <assert.h>
23 #include <ctype.h>
24 #include <limits.h>
25 #include <stdio.h>
26 #include <string.h>
27 #include <stdlib.h>
28 #include <stdbool.h>
29
30 #define DEBUG 0
31 #define QUASIQUOTE 1
32 //#define QUASISYNTAX 0
33
34 enum type {CHAR, MACRO, NUMBER, PAIR, SCM, STRING, SYMBOL, REF, VALUES, VECTOR,
35            FUNCTION0, FUNCTION1, FUNCTION2, FUNCTION3, FUNCTIONn};
36 struct scm_t;
37 typedef struct scm_t* (*function0_t) (void);
38 typedef struct scm_t* (*function1_t) (struct scm_t*);
39 typedef struct scm_t* (*function2_t) (struct scm_t*, struct scm_t*);
40 typedef struct scm_t* (*function3_t) (struct scm_t*, struct scm_t*, struct scm_t*);
41 typedef struct scm_t* (*functionn_t) (struct scm_t*);
42
43 typedef struct scm_t {
44   enum type type;
45   union {
46     char const *name;
47     struct scm_t* string;
48     struct scm_t* car;
49     struct scm_t* ref;
50     int length;
51   };
52   union {
53     int value;
54     function0_t function0;
55     function1_t function1;
56     function2_t function2;
57     function3_t function3;
58     functionn_t functionn;
59     struct scm_t* cdr;
60     struct scm_t* macro;
61     struct scm_t* vector;
62     int hits;
63   };
64 } scm;
65
66 #include "define.environment.h"
67 #include "lib.environment.h"
68 #include "math.environment.h"
69 #include "mes.environment.h"
70 #include "posix.environment.h"
71 #include "quasiquote.environment.h"
72 #include "string.environment.h"
73 #include "type.environment.h"
74
75 scm *display_ (FILE* f, scm *x);
76 scm *display_helper (FILE*, scm*, bool, char const*, bool);
77
78 scm scm_nil = {SCM, "()"};
79 scm scm_dot = {SCM, "."};
80 scm scm_f = {SCM, "#f"};
81 scm scm_t = {SCM, "#t"};
82 scm scm_undefined = {SCM, "*undefined*"};
83 scm scm_unspecified = {SCM, "*unspecified*"};
84 scm scm_closure = {SCM, "*closure*"};
85 scm scm_circular = {SCM, "*circular*"};
86 #if BOOT
87 scm scm_label = {
88   SCM, "label"};
89 #endif
90 scm scm_begin = {SCM, "begin"};
91
92 scm symbol_lambda = {SYMBOL, "lambda"};
93 scm symbol_begin = {SYMBOL, "begin"};
94 scm symbol_if = {SYMBOL, "if"};
95 scm symbol_define = {SYMBOL, "define"};
96 scm symbol_define_macro = {SCM, "define-macro"};
97 scm symbol_set_x = {SYMBOL, "set!"};
98
99 scm symbol_quote = {SYMBOL, "quote"};
100 scm symbol_quasiquote = {SYMBOL, "quasiquote"};
101 scm symbol_unquote = {SYMBOL, "unquote"};
102 scm symbol_unquote_splicing = {SYMBOL, "unquote-splicing"};
103
104 scm symbol_sc_expand = {SYMBOL, "sc-expand"};
105 scm symbol_expand_macro = {SYMBOL, "expand-macro"};
106 scm symbol_sc_expander_alist = {SYMBOL, "*sc-expander-alist*"};
107 scm symbol_noexpand = {SYMBOL, "noexpand"};
108 scm symbol_syntax = {SYMBOL, "syntax"};
109 scm symbol_quasisyntax = {SYMBOL, "quasisyntax"};
110 scm symbol_unsyntax = {SYMBOL, "unsyntax"};
111 scm symbol_unsyntax_splicing = {SYMBOL, "unsyntax-splicing"};
112
113 scm symbol_call_with_values = {SYMBOL, "call-with-values"};
114 scm symbol_current_module = {SYMBOL, "current-module"};
115 scm symbol_primitive_load = {SYMBOL, "primitive-load"};
116
117 scm char_nul = {CHAR, .name="nul", .value=0};
118 scm char_backspace = {CHAR, .name="backspace", .value=8};
119 scm char_tab = {CHAR, .name="tab", .value=9};
120 scm char_newline = {CHAR, .name="newline", .value=10};
121 scm char_vt = {CHAR, .name="vt", .value=11};
122 scm char_page = {CHAR, .name="page", .value=12};
123 scm char_return = {CHAR, .name="return", .value=13};
124 scm char_space = {CHAR, .name="space", .value=32};
125
126 // PRIMITIVES
127
128 scm *
129 car (scm *x)
130 {
131   assert (x->type == PAIR);
132   return x->car;
133 }
134
135 scm *
136 cdr (scm *x)
137 {
138   assert (x->type == PAIR);
139   return x->cdr;
140 }
141
142 scm *
143 alloc (int n)
144 {
145   return (scm*)malloc (n * sizeof (scm));
146 }
147
148 scm *
149 make_cell (scm *type, scm *car, scm *cdr)
150 {
151   scm *x = alloc (1);
152   assert (type->type == NUMBER);
153   x->type = type->value;
154   if (type->value == CHAR || type->value == NUMBER) {
155     if (car) x->car = car->car;
156     if (cdr) x->cdr = cdr->cdr;
157   } else {
158     x->car = car;
159     x->cdr = cdr;
160   }
161   return x;
162 }
163
164 scm *
165 cons (scm *x, scm *y)
166 {
167   scm t = {NUMBER, .value=PAIR};
168   return make_cell (&t, x, y);
169 }
170
171 scm *
172 eq_p (scm *x, scm *y)
173 {
174   return (x == y
175           || (x->type == CHAR && y->type == CHAR
176               && x->value == y->value)
177           || (x->type == NUMBER && y->type == NUMBER
178               && x->value == y->value))
179     ? &scm_t : &scm_f;
180 }
181
182 scm *
183 set_car_x (scm *x, scm *e)
184 {
185   assert (x->type == PAIR);
186   x->car = e;
187   return &scm_unspecified;
188 }
189
190 scm *
191 set_cdr_x (scm *x, scm *e)
192 {
193   assert (x->type == PAIR);
194   cache_invalidate (x->cdr);
195   x->cdr = e;
196   return &scm_unspecified;
197 }
198
199 scm *
200 set_env_x (scm *x, scm *e, scm *a)
201 {
202   cache_invalidate (x);
203   scm *p = assert_defined (assq (x, a));
204   return set_cdr_x (p, e);
205 }
206
207 scm *
208 quote (scm *x)
209 {
210   return cons (&symbol_quote, x);
211 }
212
213 scm *
214 quasiquote (scm *x)
215 {
216   return cons (&symbol_quasiquote, x);
217 }
218
219 scm *
220 quasisyntax (scm *x)
221 {
222   return cons (&symbol_quasisyntax, x);
223 }
224
225 scm *
226 pairlis (scm *x, scm *y, scm *a)
227 {
228   if (x == &scm_nil)
229     return a;
230   if (pair_p (x) == &scm_f)
231     return cons (cons (x, y), a);
232   return cons (cons (car (x), car (y)),
233                pairlis (cdr (x), cdr (y), a));
234 }
235
236 scm *
237 assq (scm *x, scm *a)
238 {
239   while (a != &scm_nil && eq_p (x, a->car->car) == &scm_f) a = a->cdr;
240   return a != &scm_nil ? a->car : &scm_f;
241 }
242
243 #define ENV_CACHE 1
244 #define CACHE_SIZE 30
245 #define ENV_HEAD 15
246
247 #if !ENV_CACHE
248 scm *
249 assq_ref_cache (scm *x, scm *a)
250 {
251   x = assq (x, a);
252   if (x == &scm_f) return &scm_undefined;
253   return x->cdr;
254 }
255 scm*cache_invalidate (scm*x){}
256 scm*cache_invalidate_range (scm*p,scm*a){}
257 scm*cache_save (scm*p){}
258 scm*cache_lookup (scm*x){}
259
260 #else // ENV_CACHE
261
262 scm *env_cache_cars[CACHE_SIZE];
263 scm *env_cache_cdrs[CACHE_SIZE];
264 int cache_threshold = 0;
265 scm *
266 cache_save (scm *p)
267 {
268   int n = p->car->hits;
269   if (n < cache_threshold) return &scm_unspecified;
270   int j = -1;
271   for (int i=0; i < CACHE_SIZE; i++) {
272     if (!env_cache_cars[i]) {
273       j = i;
274       break;
275     }
276     if (env_cache_cars[i] == p->car) return &scm_unspecified;
277     if (n > env_cache_cars[i]->hits) {
278       n = env_cache_cars[i]->hits;
279       j = i;
280     }
281   }
282   if (j >= 0) {
283     cache_threshold = p->car->hits;
284     env_cache_cars[j] = p->car;
285     env_cache_cdrs[j] = p->cdr;
286   }
287   return &scm_unspecified;
288 }
289
290 scm *
291 cache_lookup (scm *x)
292 {
293   for (int i=0; i < CACHE_SIZE; i++) {
294     if (!env_cache_cars[i]) break;
295     if (env_cache_cars[i] == x) return env_cache_cdrs[i];
296   }
297   return &scm_undefined;
298 }
299
300 scm *
301 cache_invalidate (scm *x)
302 {
303   for (int i=0; i < CACHE_SIZE; i++) {
304     if (env_cache_cars[i] == x) {
305       env_cache_cars[i] = 0;
306       break;
307     }
308   }
309   return &scm_unspecified;
310 }
311
312 scm *
313 cache_invalidate_range (scm *p, scm *a)
314 {
315   do {
316     cache_invalidate (p->car->car);
317     p = p->cdr;
318   } while (p != a);
319   return &scm_unspecified;
320 }
321
322 scm *
323 assq_ref_cache (scm *x, scm *a)
324 {
325   x->hits++;
326   scm *c = cache_lookup (x);
327   if (c != &scm_undefined) return c;
328   int i = 0;
329   while (a != &scm_nil && x != a->car->car) {i++;a = a->cdr;}
330   if (a == &scm_nil) return &scm_undefined;
331   if (i>ENV_HEAD) cache_save (a->car);
332   return a->car->cdr;
333 }
334 #endif // ENV_CACHE
335
336 scm *
337 assert_defined (scm *e)
338 {
339   if (e == &scm_undefined)
340     {
341       fprintf (stderr, "eval: unbound variable:");
342       display_ (stderr, e);
343       fprintf (stderr, "\n");
344       assert (!"unbound variable");
345     }
346   return e;
347 }
348
349 scm *
350 evlis_env (scm *m, scm *a)
351 {
352   if (m == &scm_nil) return &scm_nil;
353   if (m->type != PAIR) return builtin_eval (m, a);
354   scm *e = builtin_eval (car (m), a);
355   return cons (e, evlis_env (cdr (m), a));
356 }
357
358 scm *
359 apply_env (scm *fn, scm *x, scm *a)
360 {
361   if (fn->type != PAIR)
362     {
363       if (fn == &scm_car) return x->car->car;
364       if (fn == &scm_cdr) return x->car->cdr;
365       if (builtin_p (fn) == &scm_t)
366         return call (fn, x);
367       if (eq_p (fn, &symbol_call_with_values) == &scm_t)
368         return call (&scm_call_with_values_env, append2 (x, cons (a, &scm_nil)));
369       if (fn == &symbol_current_module) return a;
370     }
371   else if (fn->car == &symbol_lambda) {
372     scm *p = pairlis (cadr (fn), x, a);
373     cache_invalidate_range (p, a->cdr);
374     scm *r = begin_env (cddr (fn), cons (cons (&scm_closure, p), p));
375     cache_invalidate_range (p, a->cdr);
376     return r;
377   }
378   else if (fn->car == &scm_closure) {
379     scm *args = caddr (fn);
380     scm *body = cdddr (fn);
381     a = cdadr (fn);
382     a = cdr (a);
383     scm *p = pairlis (args, x, a);
384     cache_invalidate_range (p, a->cdr);
385     scm *r = begin_env (body, cons (cons (&scm_closure, p), p));
386     cache_invalidate_range (p, a->cdr);
387     return r;
388   }
389 #if BOOT
390   else if (fn->car == &scm_label)
391     return apply_env (caddr (fn), x, cons (cons (cadr (fn), caddr (fn)), a));
392 #endif
393   scm *efn = builtin_eval (fn, a);
394   if (efn == &scm_f || efn == &scm_t) assert (!"apply bool");
395   if (efn->type == NUMBER) assert (!"apply number");
396   if (efn->type == STRING) assert (!"apply string");
397   if (efn == &scm_unspecified) assert (!"apply *unspecified*");
398   return apply_env (efn, x, a);
399 }
400
401 scm *
402 builtin_eval (scm *e, scm *a)
403 {
404   if (builtin_p (e) == &scm_t) return e;
405   if (e->type == SCM) return e;
406   if (e->type == SYMBOL) return assert_defined (assq_ref_cache (e, a));
407   if (e->type != PAIR) return e;
408   if (e->car->type != PAIR)
409     {
410       if (e->car == &symbol_quote)
411         return cadr (e);
412 #if QUASISYNTAX
413       if (e->car == &symbol_syntax)
414         return e;
415 #endif
416       if (e->car == &symbol_begin)
417         return begin_env (e, a);
418       if (e->car == &symbol_lambda)
419         return make_closure (cadr (e), cddr (e), assq (&scm_closure, a));
420       if (e->car == &scm_closure)
421         return e;
422       if (e->car == &symbol_if)
423         return builtin_if (cdr (e), a);
424 #if !BOOT
425       if (e->car == &symbol_define)
426         return define_env (e, a);
427       if (e->car == &symbol_define_macro)
428         return define_env (e, a);
429       if (e->car == &symbol_primitive_load)
430         return load_env (a);
431 #else
432       if (e->car == &symbol_define) {
433         fprintf (stderr, "C DEFINE: ");
434         display_ (stderr,
435                   e->cdr->car->type == SYMBOL
436                   ? e->cdr->car->string
437                   : e->cdr->car->car->string);
438         fprintf (stderr, "\n");
439       }
440       assert (e->car != &symbol_define);
441       assert (e->car != &symbol_define_macro);
442 #endif
443       if (e->car == &symbol_set_x)
444         return set_env_x (cadr (e), builtin_eval (caddr (e), a), a);
445 #if QUASIQUOTE
446       if (e->car == &symbol_unquote)
447         return builtin_eval (cadr (e), a);
448       if (e->car == &symbol_quasiquote)
449         return eval_quasiquote (cadr (e), add_unquoters (a));
450 #endif //QUASIQUOTE
451 #if QUASISYNTAX
452       if (e->car == &symbol_unsyntax)
453         return builtin_eval (cadr (e), a);
454       if (e->car == &symbol_quasisyntax)
455         return eval_quasisyntax (cadr (e), add_unsyntaxers (a));
456 #endif //QUASISYNTAX
457       scm *x = expand_macro_env (e, a);
458       if (x != e) return builtin_eval (x, a);
459     }
460   return apply_env (e->car, evlis_env (e->cdr, a), a);
461 }
462
463 scm *
464 expand_macro_env (scm *e, scm *a)
465 {
466   if (car (e)->type == STRING && string_to_symbol (car (e)) == &symbol_noexpand)
467     return cadr (e);
468
469   scm *macro;
470   if (e->type == PAIR
471       && (macro = lookup_macro (e->car, a)) != &scm_f)
472     return apply_env (macro, e->cdr, a);
473
474   scm *expanders;
475   if (e->type == PAIR
476     && car (e)->type == SYMBOL
477     && ((expanders = assq_ref_cache (&symbol_sc_expander_alist, a)) != &scm_undefined)
478     && ((macro = assq (car (e), expanders)) != &scm_f))
479     {
480       scm *sc_expand = assq_ref_cache (&symbol_expand_macro, a);
481       if (sc_expand != &scm_undefined && sc_expand != &scm_f)
482         e = apply_env (sc_expand, cons (e, &scm_nil), a);
483     }
484   return e;
485 }
486
487 scm *
488 begin_env (scm *e, scm *a)
489 {
490   scm *r = &scm_unspecified;
491   while (e != &scm_nil) {
492     r = builtin_eval (e->car, a);
493     e = e->cdr;
494   }
495   return r;
496 }
497
498 scm *
499 builtin_if (scm *e, scm *a)
500 {
501   if (builtin_eval (car (e), a) != &scm_f)
502     return builtin_eval (cadr (e), a);
503   if (cddr (e) != &scm_nil)
504     return builtin_eval (caddr (e), a);
505   return &scm_unspecified;
506 }
507
508 //Helpers
509
510 scm *
511 display (scm *x) ///((args . n))
512 {
513   scm *e = car (x);
514   scm *p = cdr (x);
515   int fd = 1;
516   if (p->type == PAIR && p->car->type == NUMBER) fd = p->car->hits;
517   FILE *f = fd == 1 ? stdout : stderr;
518   return display_helper (f, e, false, "", false);
519 }
520
521 scm *
522 display_ (FILE* f, scm *x)
523 {
524   return display_helper (f, x, false, "", false);
525 }
526
527 scm *
528 call (scm *fn, scm *x)
529 {
530   if (fn->type == FUNCTION0)
531     return fn->function0 ();
532   if (x != &scm_nil && x->car->type == VALUES)
533     x = cons (x->car->cdr->car, x->cdr);
534   if (fn->type == FUNCTION1)
535     return fn->function1 (car (x));
536   if (x != &scm_nil && x->cdr->car->type == VALUES)
537     x = cons (x->car, cons (x->cdr->car->cdr->car, x->cdr));
538   if (fn->type == FUNCTION2)
539     return fn->function2 (car (x), cadr (x));
540   if (fn->type == FUNCTION3)
541     return fn->function3 (car (x), cadr (x), caddr (x));
542   if (fn->type == FUNCTIONn)
543     return fn->functionn (x);
544   return &scm_unspecified;
545 }
546
547 scm *
548 append2 (scm *x, scm *y)
549 {
550   if (x == &scm_nil) return y;
551   assert (x->type == PAIR);
552   return cons (car (x), append2 (cdr (x), y));
553 }
554
555 scm *
556 append (scm *x) ///((args . n))
557  {
558   if (x == &scm_nil) return &scm_nil;
559   return append2 (car (x), append (cdr (x)));
560  }
561
562 scm *
563 make_char (int x)
564 {
565   scm t = {NUMBER, .value=CHAR};
566   scm n = {NUMBER, .value=x};  
567   return make_cell (&t, &n, &n);
568 }
569
570 scm *
571 make_macro (scm *name, scm *x)
572 {
573   scm t = {NUMBER, .value=MACRO};
574   return make_cell (&t, name->string, x);
575 }
576
577 scm *
578 make_number (int x)
579 {
580   scm t = {NUMBER, .value=NUMBER};
581   scm n = {NUMBER, .value=x};  
582   return make_cell (&t, &n, &n);
583 }
584
585 scm *
586 make_ref (scm *x)
587 {
588   scm t = {NUMBER, .value=REF};
589   return make_cell (&t, x, x);
590 }
591
592 scm *
593 make_string (scm *x)
594 {
595   scm t = {NUMBER, .value=STRING};
596   return make_cell (&t, x, 0);
597 }
598
599 scm *
600 cstring_to_list (char const* s)
601 {
602   scm *p = &scm_nil;
603   while (s && *s)
604     p = append2 (p, cons (make_char (*s++), &scm_nil));
605   return p;
606 }
607
608 scm *symbols = 0;
609
610 scm *
611 list_of_char_equal_p (scm *a, scm *b)
612 {
613   while (a != &scm_nil && b != &scm_nil && a->car->value == b->car->value) {
614     assert (a->car->type == CHAR);
615     assert (b->car->type == CHAR);
616     a = a->cdr;
617     b = b->cdr;
618   }
619   return (a == &scm_nil && b == &scm_nil) ? &scm_t : &scm_f;
620 }
621
622 scm *
623 internal_lookup_symbol (scm *s)
624 {
625   scm *x = symbols;
626   while (x) {
627     // .string and .name is the same field; .name is used as a handy
628     // static field initializer.  A string can only be mistaken for a
629     // cell with type == PAIR for the one character long, zero-padded
630     // #\etx.
631     if (x->car->string->type != PAIR)
632       x->car->string = cstring_to_list (x->car->name);
633     if (list_of_char_equal_p (x->car->string, s) == &scm_t) break;
634     x = x->cdr;
635   }
636   if (x) x = x->car;
637   return x;
638 }
639
640 scm *
641 internal_make_symbol (scm *s)
642 {
643   scm t = {NUMBER, .value=SYMBOL};
644   scm *x = make_cell (&t, s, 0);
645   symbols = cons (x, symbols);
646   return x;
647 }
648
649 scm *
650 make_symbol (scm *s)
651 {
652   scm *x = internal_lookup_symbol (s);
653   return x ? x : internal_make_symbol (s);
654 }
655
656 scm *
657 make_vector (scm *n)
658 {
659   scm t = {NUMBER, .value=VECTOR};
660   scm *v = alloc (n->value);
661   scm *x = make_cell (&t, (scm*)(long)n->value, v);
662   for (int i=0; i<n->value; i++) x->vector[i] = *vector_entry (&scm_unspecified);
663   return x;
664 }
665
666 scm *
667 values (scm *x) ///((args . n))
668 {
669   scm *v = cons (0, x);
670   v->type = VALUES;
671   return v;
672 }
673
674 scm *
675 call_with_values_env (scm *producer, scm *consumer, scm *a)
676 {
677   scm *v = apply_env (producer, &scm_nil, a);
678   if (v->type == VALUES)
679     v = v->cdr;
680   return apply_env (consumer, v, a);
681 }
682
683 scm *
684 vector_length (scm *x)
685 {
686   assert (x->type == VECTOR);
687   return make_number (x->length);
688 }
689
690 scm *
691 vector_ref (scm *x, scm *i)
692 {
693   assert (x->type == VECTOR);
694   assert (i->value < x->length);
695   scm *e = &x->vector[i->value];
696   if (e->type == REF) e = e->ref;
697   if (e->type == CHAR) e = make_char (e->value);
698   if (e->type == NUMBER) e = make_number (e->value);
699   return e;
700 }
701
702 scm *
703 vector_entry (scm *x) {
704   if (x->type == PAIR || x->type == SCM || x->type == STRING || x->type == SYMBOL || x->type == VECTOR) x = make_ref (x);
705   return x;
706 }
707
708 scm *
709 vector_set_x (scm *x, scm *i, scm *e)
710 {
711   assert (x->type == VECTOR);
712   assert (i->value < x->length);
713   x->vector[i->value] = *vector_entry (e);
714   return &scm_unspecified;
715 }
716
717 scm *
718 lookup (scm *s, scm *a)
719 {
720   if (isdigit (s->car->value) || (s->car->value == '-' && s->cdr != &scm_nil)) {
721     scm *p = s;
722     int sign = 1;
723     if (s->car->value == '-') {
724       sign = -1;
725       p = s->cdr;
726     }
727     int n = 0;
728     while (p != &scm_nil && isdigit (p->car->value)) {
729       n *= 10;
730       n += p->car->value - '0';
731       p = p->cdr;
732     }
733     if (p == &scm_nil) return make_number (n * sign);
734   }
735   
736   scm *x = internal_lookup_symbol (s);
737   if (x) return x;
738
739   if (s->cdr == &scm_nil) {
740     if (s->car->value == '\'') return &symbol_quote;
741     if (s->car->value == '`') return &symbol_quasiquote;
742     if (s->car->value == ',') return &symbol_unquote;
743   }
744   else if (s->cdr->cdr == &scm_nil) {
745     if (s->car->value == ',' && s->cdr->car->value == '@') return &symbol_unquote_splicing;
746     if (s->car->value == '#' && s->cdr->car->value == '\'') return &symbol_syntax;
747     if (s->car->value == '#' && s->cdr->car->value == '`') return &symbol_quasisyntax;
748     if (s->car->value == '#' && s->cdr->car->value == ',') return &symbol_unsyntax;
749   }
750   else if (s->cdr->cdr->cdr == &scm_nil) {
751     if (s->car->value == '#' && s->cdr->car->value == ',' && s->cdr->cdr->car->value == '@') return &symbol_unsyntax_splicing;
752     if (s->car->value == 'E' && s->cdr->car->value == 'O' && s->cdr->cdr->car->value == 'F') {
753       fprintf (stderr, "mes: got EOF\n");
754       return &scm_nil; // `EOF': eval program, which may read stdin
755     }
756   }
757
758   return internal_make_symbol (s);
759 }
760
761 scm *
762 lookup_char (int c, scm *a)
763 {
764   return lookup (cons (make_char (c), &scm_nil), a);
765 }
766
767 scm *
768 list_to_vector (scm *x)
769 {
770   scm n = {NUMBER, .value=length (x)->value};
771   scm *v = make_vector (&n);
772   scm *p = v->vector;
773   while (x != &scm_nil)
774     {
775       *p++ = *vector_entry (car (x));
776       x = cdr (x);
777     }
778   return v;
779 }
780
781 scm *
782 newline (scm *p) ///((args . n))
783 {
784   int fd = 1;
785   if (p->type == PAIR && p->car->type == NUMBER) fd = p->car->value;
786   FILE *f = fd == 1 ? stdout : stderr;
787   fputs ("\n", f);
788   return &scm_unspecified;
789 }
790
791 scm *
792 force_output (scm *p) ///((args . n))
793 {
794   int fd = 1;
795   if (p->type == PAIR && p->car->type == NUMBER) fd = p->car->value;
796   FILE *f = fd == 1 ? stdout : stderr;
797   fflush (f);
798 }
799
800 scm *
801 display_helper (FILE* f, scm *x, bool cont, char const *sep, bool quote)
802 {
803   scm *r;
804   fprintf (f, "%s", sep);
805   if (x->type == CHAR && x->value == char_nul.value) fprintf (f, "#\\%s", char_nul.name);
806   else if (x->type == CHAR && x->value == char_backspace.value) fprintf (f, "#\\%s", char_backspace.name);
807   else if (x->type == CHAR && x->value == char_tab.value) fprintf (f, "#\\%s", char_tab.name);
808   else if (x->type == CHAR && x->value == char_newline.value) fprintf (f, "#\\%s", char_newline.name);
809   else if (x->type == CHAR && x->value == char_vt.value) fprintf (f, "#\\%s", char_vt.name);
810   else if (x->type == CHAR && x->value == char_page.value) fprintf (f, "#\\%s", char_page.name);
811   else if (x->type == CHAR && x->value == char_return.value) fprintf (f, "#\\%s", char_return.name);
812   else if (x->type == CHAR && x->value == char_space.value) fprintf (f, "#\\%s", char_space.name);
813   else if (x->type == CHAR) fprintf (f, "#\\%c", x->value);
814   else if (x->type == MACRO) {
815     fprintf (f, "(*macro* ");
816     display_helper (f, x->macro, cont, sep, quote);
817     fprintf (f, ")");
818   }
819   else if (x->type == NUMBER) fprintf (f, "%d", x->value);
820   else if (x->type == PAIR) {
821     if (car (x) == &scm_circular) {
822       fprintf (f, "(*circ* . #-1#)");
823       return &scm_unspecified;
824     }
825     if (car (x) == &scm_closure) {
826       fprintf (f, "(*closure* . #-1#)");
827       return &scm_unspecified;
828     }
829     if (car (x) == &scm_quote) {
830       fprintf (f, "'");
831       return display_helper (f, car (cdr (x)), cont, "", true);
832     }
833     if (!cont) fprintf (f, "(");
834     display_ (f, car (x));
835     if (cdr (x)->type == PAIR)
836       display_helper (f, cdr (x), true, " ", false);
837     else if (cdr (x) != &scm_nil) {
838       fprintf (f, " . ");
839       display_ (f, cdr (x));
840     }
841     if (!cont) fprintf (f, ")");
842   }
843   else if (x->type == VECTOR) {
844     fprintf (f, "#(", x->length);
845     for (int i = 0; i < x->length; i++) {
846       if (x->vector[i].type == VECTOR
847           || (x->vector[i].type == REF
848               && x->vector[i].ref->type == VECTOR))
849         fprintf (f, "%s#(...)", i ? " " : "");
850       else
851         display_helper (f, &x->vector[i], false, i ? " " : "", false);
852     }
853     fprintf (f, ")");
854   }
855   else if (x->type == REF) display_helper (f, x->ref, cont, "", true);
856   else if (builtin_p (x) == &scm_t) fprintf (f, "#<procedure %s>", x->name);
857   else if (x->type != PAIR && x->string) {
858     scm *p = x->string;
859     assert (p);
860     while (p != &scm_nil) {
861       assert (p->car->type == CHAR);
862       fputc (p->car->value, f);
863       p = p->cdr;
864     }
865   }
866   else if (x->type != PAIR && x->name) fprintf (f, "%s", x->name);
867
868   return &scm_unspecified;
869 }
870
871 // READ
872
873 FILE *g_stdin;
874 int
875 getchar ()
876 {
877   return getc (g_stdin);
878 }
879
880 int
881 ungetchar (int c)
882 {
883   return ungetc (c, g_stdin);
884 }
885
886 int
887 peekchar ()
888 {
889   int c = getchar ();
890   ungetchar (c);
891   return c;
892 }
893
894 scm *
895 peek_char ()
896 {
897   return make_char (peekchar ());
898 }
899
900 scm *
901 read_char ()
902 {
903   return make_char (getchar ());
904 }
905
906 scm *
907 write_char (scm *x) ///((args . n))
908 {
909   scm *c = car (x);
910   scm *p = cdr (x);
911   int fd = 1;
912   if (p->type == PAIR && p->car->type == NUMBER) fd = p->car->value;
913   FILE *f = fd == 1 ? stdout : stderr;
914   assert (c->type == NUMBER || c->type == CHAR);
915   fputc (c->value, f);
916   return c;
917 }
918
919 scm *
920 unget_char (scm *c)
921 {
922   assert (c->type == NUMBER || c->type == CHAR);
923   ungetchar (c->value);
924   return c;
925 }
926
927 int
928 readcomment (int c)
929 {
930   if (c == '\n') return c;
931   return readcomment (getchar ());
932 }
933
934 int
935 readblock (int c)
936 {
937   if (c == '!' && peekchar () == '#') return getchar ();
938   return readblock (getchar ());
939 }
940
941 scm *
942 readword (int c, scm *w, scm *a)
943 {
944   if (c == EOF && w == &scm_nil) return &scm_nil;
945   if (c == '\n' && w == &scm_nil) return readword (getchar (), w, a);
946   if (c == '\n' && w->car->value == '.' && w->cdr == &scm_nil) return &scm_dot;
947   if (c == EOF || c == '\n') return lookup (w, a);
948   if (c == ' ') return readword ('\n', w, a);
949   if (c == '"' && w == &scm_nil) return readstring ();
950   if (c == '"') {ungetchar (c); return lookup (w, a);}
951   if (c == '(' && w == &scm_nil) return readlist (a);
952   if (c == '(') {ungetchar (c); return lookup (w, a);}
953   if (c == ')' && w == &scm_nil) {ungetchar (c); return &scm_nil;}
954   if (c == ')') {ungetchar (c); return lookup (w, a);}
955   if (c == ',' && peekchar () == '@') {getchar (); return cons (lookup (symbol_unquote_splicing.string, a),
956                                                                    cons (readword (getchar (), w, a),
957                                                                          &scm_nil));}
958   if ((c == '\''
959        || c == '`'
960        || c == ',')
961       && w == &scm_nil) {return cons (lookup_char (c, a),
962                                      cons (readword (getchar (), w, a),
963                                            &scm_nil));}
964   if (c == '#' && peekchar () == ',' && w == &scm_nil) {
965     getchar ();
966     if (peekchar () == '@'){getchar (); return cons (lookup (symbol_unsyntax_splicing.string, a),
967                                                      cons (readword (getchar (), w, a),
968                                                            &scm_nil));}
969     return cons (lookup (symbol_unsyntax.string, a), cons (readword (getchar (), w, a), &scm_nil));
970   }
971   if (c == '#' && (peekchar () == '\'' || peekchar () == '`') && w == &scm_nil) {
972     c = getchar ();
973     return cons (lookup (cons (make_char ('#'), cons (make_char (c), &scm_nil)), a),
974                  cons (readword (getchar (), w, a), &scm_nil));}
975   if (c == ';') {readcomment (c); return readword ('\n', w, a);}
976   if (c == '#' && peekchar () == 'x') {getchar (); return read_hex ();}
977   if (c == '#' && peekchar () == '\\') {getchar (); return read_character ();}
978   if (c == '#' && w == &scm_nil && peekchar () == '(') {getchar (); return list_to_vector (readlist (a));}
979   if (c == '#' && peekchar () == '(') {ungetchar (c); return lookup (w, a);}
980   if (c == '#' && peekchar () == '!') {getchar (); readblock (getchar ()); return readword (getchar (), w, a);}
981   return readword (getchar (), append2 (w, cons (make_char (c), &scm_nil)), a);
982 }
983
984 scm *
985 read_hex ()
986 {
987   int n = 0;
988   int c = peekchar ();
989   while ((c >= '0' && c <= '9')
990          || (c >= 'A' && c <= 'F')
991          || (c >= 'a' && c <= 'f')) {
992     n <<= 4;
993     if (c >= 'a') n += c - 'a' + 10;
994     else if (c >= 'A') n += c - 'A' + 10;
995     else n+= c - '0';
996     getchar ();
997     c = peekchar ();
998   }
999   return make_number (n);
1000 }
1001
1002 scm *
1003 read_character ()
1004 {
1005   int c = getchar ();
1006   if (c >= '0' && c <= '7'
1007       && peekchar () >= '0' && peekchar () <= '7') {
1008     c = c - '0';
1009     while (peekchar () >= '0' && peekchar () <= '7') {
1010       c <<= 3;
1011       c += getchar () - '0';
1012     }
1013   }
1014   else if (c >= 'a' && c <= 'z'
1015       && peekchar () >= 'a' && peekchar () <= 'z') {
1016     char buf[10];
1017     char *p = buf;
1018     *p++ = c;
1019     while (peekchar () >= 'a' && peekchar () <= 'z') {
1020       *p++ = getchar ();
1021     }
1022     *p = 0;
1023     if (!strcmp (buf, char_nul.name)) c = char_nul.value;
1024     else if (!strcmp (buf, char_backspace.name)) c = char_backspace.value;
1025     else if (!strcmp (buf, char_tab.name)) c = char_tab.value;
1026     else if (!strcmp (buf, char_newline.name)) c = char_newline.value;
1027     else if (!strcmp (buf, char_vt.name)) c = char_vt.value;
1028     else if (!strcmp (buf, char_page.name)) c = char_page.value;
1029     else if (!strcmp (buf, char_return.name)) c = char_return.value;
1030     else if (!strcmp (buf, char_space.name)) c = char_space.value;
1031     else {
1032       fprintf (stderr, "char not supported: %s\n", buf);
1033       assert (!"char not supported");
1034     }
1035   }
1036   return make_char (c);
1037 }
1038
1039 scm *
1040 append_char (scm *x, int i)
1041 {
1042   return append2 (x, cons (make_char (i), &scm_nil));
1043 }
1044
1045 scm *
1046 readstring ()
1047 {
1048   scm *p = &scm_nil;
1049   int c = getchar ();
1050   while (true) {
1051     if (c == '"') break;
1052     if (c == '\\' && peekchar () == '"') p = append_char (p, getchar ());
1053     else if (c == '\\' && peekchar () == 'n') {getchar (); p = append_char (p, '\n');}
1054     else if (c == EOF) assert (!"EOF in string");
1055     else p = append_char (p, c);
1056     c = getchar ();
1057   }
1058   return make_string (p);
1059 }
1060
1061 int
1062 eat_whitespace (int c)
1063 {
1064   while (c == ' ' || c == '\t' || c == '\n') c = getchar ();
1065   if (c == ';') return eat_whitespace (readcomment (c));
1066   if (c == '#' && peekchar () == '!') {getchar (); readblock (getchar ()); return eat_whitespace (getchar ());}
1067   return c;
1068 }
1069
1070 scm *
1071 readlist (scm *a)
1072 {
1073   int c = getchar ();
1074   c = eat_whitespace (c);
1075   if (c == ')') return &scm_nil;
1076   scm *w = readword (c, &scm_nil, a);
1077   if (w == &scm_dot)
1078     return car (readlist (a));
1079   return cons (w, readlist (a));
1080 }
1081
1082 scm *
1083 read_env (scm *a)
1084 {
1085   return readword (getchar (), &scm_nil, a);
1086 }
1087
1088 scm *
1089 add_environment (scm *a, char const *name, scm *x)
1090 {
1091   return cons (cons (make_symbol (cstring_to_list (name)), x), a);
1092 }
1093
1094 scm *
1095 mes_environment () ///((internal))
1096 {
1097   scm *a = &scm_nil;
1098
1099   #include "mes.symbols.i"
1100
1101 #if BOOT
1102   symbols = cons (&scm_label, symbols);
1103   a = cons (cons (&scm_label, &scm_t), a);
1104 #endif
1105   a = cons (cons (&symbol_begin, &scm_begin), a);
1106
1107 #include "posix.environment.i"
1108 #include "string.environment.i"
1109 #include "math.environment.i"
1110 #include "lib.environment.i"
1111 #include "mes.environment.i"
1112 //#include "quasiquote.environment.i"
1113 #include "define.environment.i"
1114 #include "type.environment.i"
1115
1116   a = add_environment (a, "sc-expand", &scm_f);
1117
1118   a = cons (cons (&scm_closure, a), a);
1119   return a;
1120 }
1121
1122 scm *
1123 make_lambda (scm *args, scm *body)
1124 {
1125   return cons (&symbol_lambda, cons (args, body));
1126 }
1127
1128 scm *
1129 make_closure (scm *args, scm *body, scm *a)
1130 {
1131   return cons (&scm_closure, cons (cons (&scm_circular, a), cons (args, body)));
1132 }
1133
1134 scm *
1135 lookup_macro (scm *x, scm *a)
1136 {
1137   if (x->type != SYMBOL) return &scm_f;
1138   scm *m = assq_ref_cache (x, a);
1139   if (macro_p (m) == &scm_t) return m->macro;
1140   return &scm_f;
1141 }
1142
1143 scm *
1144 read_input_file_env (scm *e, scm *a)
1145 {
1146   if (e == &scm_nil) return e;
1147   return cons (e, read_input_file_env (read_env (a), a));
1148 }
1149
1150 scm *
1151 load_env (scm *a)
1152 {
1153   return begin_env (read_input_file_env (read_env (a), a), a);
1154 }
1155
1156 #include "type.c"
1157 #include "define.c"
1158 #include "lib.c"
1159 #include "math.c"
1160 #include "posix.c"
1161 #include "quasiquote.c"
1162 #include "string.c"
1163
1164 int
1165 main (int argc, char *argv[])
1166 {
1167   if (argc > 1 && !strcmp (argv[1], "--help")) return puts ("Usage: mes < FILE\n");
1168   if (argc > 1 && !strcmp (argv[1], "--version")) return puts ("Mes 0.1\n");
1169   g_stdin = stdin;
1170   scm *a = mes_environment ();
1171   display_ (stderr, load_env (a));
1172   fputs ("", stderr);
1173   return 0;
1174 }