Initial psyntax integration.
[mes.git] / mes.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #define _GNU_SOURCE
22 #include <assert.h>
23 #include <ctype.h>
24 #include <limits.h>
25 #include <stdio.h>
26 #include <string.h>
27 #include <stdlib.h>
28 #include <stdbool.h>
29
30 #define DEBUG 0
31 #define QUASIQUOTE 1
32 //#define QUASISYNTAX 0
33
34 enum type {CHAR, MACRO, NUMBER, PAIR, SCM, STRING, SYMBOL, REF, VALUES, VECTOR,
35            FUNCTION0, FUNCTION1, FUNCTION2, FUNCTION3, FUNCTIONn};
36 struct scm_t;
37 typedef struct scm_t* (*function0_t) (void);
38 typedef struct scm_t* (*function1_t) (struct scm_t*);
39 typedef struct scm_t* (*function2_t) (struct scm_t*, struct scm_t*);
40 typedef struct scm_t* (*function3_t) (struct scm_t*, struct scm_t*, struct scm_t*);
41 typedef struct scm_t* (*functionn_t) (struct scm_t*);
42
43 typedef struct scm_t {
44   enum type type;
45   union {
46     char const *name;
47     struct scm_t* string;
48     struct scm_t* car;
49     struct scm_t* ref;
50     int length;
51   };
52   union {
53     int value;
54     function0_t function0;
55     function1_t function1;
56     function2_t function2;
57     function3_t function3;
58     functionn_t functionn;
59     struct scm_t* cdr;
60     struct scm_t* macro;
61     struct scm_t* vector;
62     int hits;
63   };
64 } scm;
65
66 #include "define.environment.h"
67 #include "lib.environment.h"
68 #include "math.environment.h"
69 #include "mes.environment.h"
70 #include "quasiquote.environment.h"
71 #include "string.environment.h"
72 #include "type.environment.h"
73
74 scm *display_ (FILE* f, scm *x);
75 scm *display_helper (FILE*, scm*, bool, char const*, bool);
76
77 scm scm_nil = {SCM, "()"};
78 scm scm_dot = {SCM, "."};
79 scm scm_f = {SCM, "#f"};
80 scm scm_t = {SCM, "#t"};
81 scm scm_undefined = {SCM, "*undefined*"};
82 scm scm_unspecified = {SCM, "*unspecified*"};
83 scm scm_closure = {SCM, "*closure*"};
84 scm scm_circular = {SCM, "*circular*"};
85 #if BOOT
86 scm scm_label = {
87   SCM, "label"};
88 #endif
89 scm scm_lambda = {SCM, "lambda"};
90
91 scm symbol_begin = {SCM, "begin"};
92 scm symbol_if = {SCM, "if"};
93 scm symbol_define = {SCM, "define"};
94 scm symbol_define_macro = {SCM, "define-macro"};
95 scm symbol_set_x = {SCM, "set!"};
96
97 scm symbol_quote = {SYMBOL, "quote"};
98 scm symbol_quasiquote = {SYMBOL, "quasiquote"};
99 scm symbol_unquote = {SYMBOL, "unquote"};
100 scm symbol_unquote_splicing = {SYMBOL, "unquote-splicing"};
101
102 scm symbol_sc_expand = {SYMBOL, "sc-expand"};
103 scm symbol_sc_expander_alist = {SYMBOL, "*sc-expander-alist*"};
104 scm symbol_noexpand = {SYMBOL, "noexpand"};
105 scm symbol_syntax = {SYMBOL, "syntax"};
106 scm symbol_quasisyntax = {SYMBOL, "quasisyntax"};
107 scm symbol_unsyntax = {SYMBOL, "unsyntax"};
108 scm symbol_unsyntax_splicing = {SYMBOL, "unsyntax-splicing"};
109
110 scm symbol_call_with_values = {SYMBOL, "call-with-values"};
111 scm symbol_current_module = {SYMBOL, "current-module"};
112
113
114 scm char_nul = {CHAR, .name="nul", .value=0};
115 scm char_backspace = {CHAR, .name="backspace", .value=8};
116 scm char_tab = {CHAR, .name="tab", .value=9};
117 scm char_newline = {CHAR, .name="newline", .value=10};
118 scm char_vt = {CHAR, .name="vt", .value=11};
119 scm char_page = {CHAR, .name="page", .value=12};
120 scm char_return = {CHAR, .name="return", .value=13};
121 scm char_space = {CHAR, .name="space", .value=32};
122
123 // PRIMITIVES
124
125 scm *
126 car (scm *x)
127 {
128   assert (x->type == PAIR);
129   return x->car;
130 }
131
132 scm *
133 cdr (scm *x)
134 {
135   assert (x->type == PAIR);
136   return x->cdr;
137 }
138
139 scm *
140 alloc (int n)
141 {
142   return (scm*)malloc (n * sizeof (scm));
143 }
144
145 scm *
146 make_cell (scm *type, scm *car, scm *cdr)
147 {
148   scm *x = alloc (1);
149   assert (type->type == NUMBER);
150   x->type = type->value;
151   if (type->value == CHAR || type->value == NUMBER) {
152     if (car) x->car = car->car;
153     if (cdr) x->cdr = cdr->cdr;
154   } else {
155     x->car = car;
156     x->cdr = cdr;
157   }
158   return x;
159 }
160
161 scm *
162 cons (scm *x, scm *y)
163 {
164   scm t = {NUMBER, .value=PAIR};
165   return make_cell (&t, x, y);
166 }
167
168 scm *
169 eq_p (scm *x, scm *y)
170 {
171   return (x == y
172           || (x->type == CHAR && y->type == CHAR
173               && x->value == y->value)
174           || (x->type == NUMBER && y->type == NUMBER
175               && x->value == y->value))
176     ? &scm_t : &scm_f;
177 }
178
179 scm *
180 set_car_x (scm *x, scm *e)
181 {
182   assert (x->type == PAIR);
183   x->car = e;
184   return &scm_unspecified;
185 }
186
187 scm *
188 set_cdr_x (scm *x, scm *e)
189 {
190   assert (x->type == PAIR);
191   cache_invalidate (x->cdr);
192   x->cdr = e;
193   return &scm_unspecified;
194 }
195
196 scm *
197 set_env_x (scm *x, scm *e, scm *a)
198 {
199   cache_invalidate (x);
200   scm *p = assq (x, a);
201   if (p->type != PAIR)
202     {
203       fprintf (stderr, "set!: unbound variable:");
204       display_ (stderr, x);
205       fprintf (stderr, "\n");
206       assert (!"unbound variable");
207     }
208   return set_cdr_x (p, e);
209 }
210
211 scm *
212 quote (scm *x)
213 {
214   return cons (&symbol_quote, x);
215 }
216
217 scm *
218 quasiquote (scm *x)
219 {
220   return cons (&symbol_quasiquote, x);
221 }
222
223 scm *
224 quasisyntax (scm *x)
225 {
226   return cons (&symbol_quasisyntax, x);
227 }
228
229 scm *
230 pairlis (scm *x, scm *y, scm *a)
231 {
232   if (x == &scm_nil)
233     return a;
234   if (pair_p (x) == &scm_f)
235     return cons (cons (x, y), a);
236   return cons (cons (car (x), car (y)),
237                pairlis (cdr (x), cdr (y), a));
238 }
239
240 scm *
241 assq (scm *x, scm *a)
242 {
243   while (a != &scm_nil && eq_p (x, a->car->car) == &scm_f) a = a->cdr;
244   return a != &scm_nil ? a->car : &scm_f;
245 }
246
247 #define ENV_CACHE 1
248 #define CACHE_SIZE 30
249 #define ENV_HEAD 15
250
251 #if !ENV_CACHE
252 scm *
253 assq_ref_cache (scm *x, scm *a)
254 {
255   x = assq (x, a);
256   if (x == &scm_f) return &scm_undefined;
257   return x->cdr;
258 }
259 scm*cache_invalidate (scm*x){}
260 scm*cache_invalidate_range (scm*p,scm*a){}
261 scm*cache_save (scm*p){}
262 scm*cache_lookup (scm*x){}
263
264 #else // ENV_CACHE
265
266 scm *env_cache_cars[CACHE_SIZE];
267 scm *env_cache_cdrs[CACHE_SIZE];
268 int cache_threshold = 0;
269 scm *
270 cache_save (scm *p)
271 {
272   int n = p->car->hits;
273   if (n < cache_threshold) return &scm_unspecified;
274   int j = -1;
275   for (int i=0; i < CACHE_SIZE; i++) {
276     if (!env_cache_cars[i]) {
277       j = i;
278       break;
279     }
280     if (env_cache_cars[i] == p->car) return &scm_unspecified;
281     if (n > env_cache_cars[i]->hits) {
282       n = env_cache_cars[i]->hits;
283       j = i;
284     }
285   }
286   if (j >= 0) {
287     cache_threshold = p->car->hits;
288     env_cache_cars[j] = p->car;
289     env_cache_cdrs[j] = p->cdr;
290   }
291   return &scm_unspecified;
292 }
293
294 scm *
295 cache_lookup (scm *x)
296 {
297   for (int i=0; i < CACHE_SIZE; i++) {
298     if (!env_cache_cars[i]) break;
299     if (env_cache_cars[i] == x) return env_cache_cdrs[i];
300   }
301   return &scm_undefined;
302 }
303
304 scm *
305 cache_invalidate (scm *x)
306 {
307   for (int i=0; i < CACHE_SIZE; i++) {
308     if (env_cache_cars[i] == x) {
309       env_cache_cars[i] = 0;
310       break;
311     }
312   }
313   return &scm_unspecified;
314 }
315
316 scm *
317 cache_invalidate_range (scm *p, scm *a)
318 {
319   do {
320     cache_invalidate (p->car->car);
321     p = p->cdr;
322   } while (p != a);
323   return &scm_unspecified;
324 }
325
326 scm *
327 assq_ref_cache (scm *x, scm *a)
328 {
329   x->hits++;
330   scm *c = cache_lookup (x);
331   if (c != &scm_undefined) return c;
332   int i = 0;
333   while (a != &scm_nil && x != a->car->car) {i++;a = a->cdr;}
334   if (a == &scm_nil) return &scm_undefined;
335   if (i>ENV_HEAD) cache_save (a->car);
336   return a->car->cdr;
337 }
338 #endif // ENV_CACHE
339
340 scm *
341 evlis_env (scm *m, scm *a)
342 {
343   if (m == &scm_nil) return &scm_nil;
344   if (m->type != PAIR) return builtin_eval (m, a);
345   scm *e = builtin_eval (car (m), a);
346   return cons (e, evlis_env (cdr (m), a));
347 }
348
349 scm *
350 apply_env (scm *fn, scm *x, scm *a)
351 {
352   if (fn->type != PAIR)
353     {
354       if (fn == &scm_car) return x->car->car;
355       if (fn == &scm_cdr) return x->car->cdr;
356       if (builtin_p (fn) == &scm_t)
357         return call (fn, x);
358       if (eq_p (fn, &symbol_call_with_values) == &scm_t)
359         return call (&scm_call_with_values_env, append2 (x, cons (a, &scm_nil)));
360       if (fn == &symbol_current_module) return a;
361     }
362   else if (fn->car == &scm_lambda) {
363     scm *p = pairlis (cadr (fn), x, a);
364     cache_invalidate_range (p, a->cdr);
365     scm *r = begin (cddr (fn), cons (cons (&scm_closure, p), p));
366     cache_invalidate_range (p, a->cdr);
367     return r;
368   }
369   else if (fn->car == &scm_closure) {
370     scm *args = caddr (fn);
371     scm *body = cdddr (fn);
372     a = cdadr (fn);
373     a = cdr (a);
374     scm *p = pairlis (args, x, a);
375     cache_invalidate_range (p, a->cdr);
376     scm *r = begin (body, cons (cons (&scm_closure, p), p));
377     cache_invalidate_range (p, a->cdr);
378     return r;
379   }
380 #if BOOT
381   else if (fn->car == &scm_label)
382     return apply_env (caddr (fn), x, cons (cons (cadr (fn), caddr (fn)), a));
383 #endif
384   scm *efn = builtin_eval (fn, a);
385   if (efn == &scm_f || efn == &scm_t) assert (!"apply bool");
386   if (efn->type == NUMBER) assert (!"apply number");
387   if (efn->type == STRING) assert (!"apply string");
388   if (efn == &scm_unspecified) assert (!"apply *unspecified*");
389   return apply_env (efn, x, a);
390 }
391
392 scm *
393 builtin_eval (scm *e, scm *a)
394 {
395   if (builtin_p (e) == &scm_t) return e;
396   if (e->type == SCM) return e;
397
398   e = expand_macro_env (e, a);
399
400   if (e->type == SYMBOL) {
401     scm *y = assq_ref_cache (e, a);
402     if (y == &scm_undefined) {
403       fprintf (stderr, "eval: unbound variable:");
404       display_ (stderr, e);
405       fprintf (stderr, "\n");
406       assert (!"unbound variable");
407     }
408     return y;
409   }
410   else if (e->type != PAIR)
411     return e;
412   else if (e->car->type != PAIR)
413     {
414       if (e->car->type == STRING && string_to_symbol (e->car) == &symbol_noexpand)
415         e = cadr (e);
416       else
417         e = sc_expand_env (e, a);
418       if (e->car == &symbol_quote)
419         return cadr (e);
420 #if QUASISYNTAX
421       if (e->car == &symbol_syntax)
422         return e;
423 #endif
424       if (e->car == &symbol_begin)
425         return begin (e, a);
426       if (e->car == &scm_lambda)
427         return make_closure (cadr (e), cddr (e), assq (&scm_closure, a));
428       if (e->car == &scm_closure)
429         return e;
430       if (e->car == &symbol_if)
431         return builtin_if (cdr (e), a);
432 #if !BOOT
433       if (e->car == &symbol_define)
434         return define (e, a);
435       if (e->car == &symbol_define_macro)
436         return define (e, a);
437 #else
438       if (e->car == &symbol_define) {
439         fprintf (stderr, "C DEFINE: ");
440         display_ (stderr,
441                   e->cdr->car->type == SYMBOL
442                   ? e->cdr->car->string
443                   : e->cdr->car->car->string);
444         fprintf (stderr, "\n");
445       }
446       assert (e->car != &symbol_define);
447       assert (e->car != &symbol_define_macro);
448 #endif
449       if (e->car == &symbol_set_x)
450         return set_env_x (cadr (e), builtin_eval (caddr (e), a), a);
451 #if QUASIQUOTE
452       if (e->car == &symbol_unquote)
453         return builtin_eval (cadr (e), a);
454       if (e->car == &symbol_quasiquote)
455         return eval_quasiquote (cadr (e), add_unquoters (a));
456 #endif //QUASIQUOTE
457 #if QUASISYNTAX
458       if (e->car == &symbol_unsyntax)
459         return builtin_eval (cadr (e), a);
460       if (e->car == &symbol_quasisyntax)
461         return eval_quasisyntax (cadr (e), add_unsyntaxers (a));
462 #endif //QUASISYNTAX
463     }
464   return apply_env (e->car, evlis_env (e->cdr, a), a);
465 }
466
467 scm *
468 expand_macro_env (scm *e, scm *a)
469 {
470   scm *macro;
471   if (e->type == PAIR
472       && (macro = lookup_macro (e->car, a)) != &scm_f)
473     return expand_macro_env (apply_env (macro, e->cdr, a), a);
474   return e;
475 }
476
477 scm *
478 sc_expand_env (scm *e, scm *a)
479 {
480   scm *expanders;
481   scm *macro;
482   if (e->type == PAIR
483     && car (e)->type == SYMBOL
484     && car (e) != &symbol_quasiquote
485     && car (e) != &symbol_quote
486     && car (e) != &symbol_unquote
487     && car (e) != &symbol_unquote_splicing
488     && ((expanders = assq_ref_cache (&symbol_sc_expander_alist, a)) != &scm_undefined)
489     && ((macro = assq (car (e), expanders)) != &scm_f))
490     {
491       scm *sc_expand = assq_ref_cache (&symbol_sc_expand, a);
492       if (sc_expand != &scm_undefined)
493         return apply_env (sc_expand, cons (e, &scm_nil), a);
494     }
495   return e;
496 }
497
498 scm *
499 begin (scm *e, scm *a)
500 {
501   scm *r = &scm_unspecified;
502   while (e != &scm_nil) {
503     r = builtin_eval (e->car, a);
504     e = e->cdr;
505   }
506   return r;
507 }
508
509 scm *
510 builtin_if (scm *e, scm *a)
511 {
512   if (builtin_eval (car (e), a) != &scm_f)
513     return builtin_eval (cadr (e), a);
514   if (cddr (e) != &scm_nil)
515     return builtin_eval (caddr (e), a);
516   return &scm_unspecified;
517 }
518
519 //Helpers
520
521 scm *
522 display (scm *x) ///((args . n))
523 {
524   scm *e = car (x);
525   scm *p = cdr (x);
526   int fd = 1;
527   if (p->type == PAIR && p->car->type == NUMBER) fd = p->car->hits;
528   FILE *f = fd == 1 ? stdout : stderr;
529   return display_helper (f, e, false, "", false);
530 }
531
532 scm *
533 display_ (FILE* f, scm *x)
534 {
535   return display_helper (f, x, false, "", false);
536 }
537
538 scm *
539 call (scm *fn, scm *x)
540 {
541   if (fn->type == FUNCTION0)
542     return fn->function0 ();
543   if (x != &scm_nil && x->car->type == VALUES)
544     x = cons (x->car->cdr->car, x->cdr);
545   if (fn->type == FUNCTION1)
546     return fn->function1 (car (x));
547   if (x != &scm_nil && x->cdr->car->type == VALUES)
548     x = cons (x->car, cons (x->cdr->car->cdr->car, x->cdr));
549   if (fn->type == FUNCTION2)
550     return fn->function2 (car (x), cadr (x));
551   if (fn->type == FUNCTION3)
552     return fn->function3 (car (x), cadr (x), caddr (x));
553   if (fn->type == FUNCTIONn)
554     return fn->functionn (x);
555   return &scm_unspecified;
556 }
557
558 scm *
559 append2 (scm *x, scm *y)
560 {
561   if (x == &scm_nil) return y;
562   assert (x->type == PAIR);
563   return cons (car (x), append2 (cdr (x), y));
564 }
565
566 scm *
567 append (scm *x) ///((args . n))
568  {
569   if (x == &scm_nil) return &scm_nil;
570   return append2 (car (x), append (cdr (x)));
571  }
572
573 scm *
574 make_char (int x)
575 {
576   scm t = {NUMBER, .value=CHAR};
577   scm n = {NUMBER, .value=x};  
578   return make_cell (&t, &n, &n);
579 }
580
581 scm *
582 make_macro (scm *name, scm *x)
583 {
584   scm t = {NUMBER, .value=MACRO};
585   return make_cell (&t, name->string, x);
586 }
587
588 scm *
589 make_number (int x)
590 {
591   scm t = {NUMBER, .value=NUMBER};
592   scm n = {NUMBER, .value=x};  
593   return make_cell (&t, &n, &n);
594 }
595
596 scm *
597 make_ref (scm *x)
598 {
599   scm t = {NUMBER, .value=REF};
600   return make_cell (&t, x, x);
601 }
602
603 scm *
604 make_string (scm *x)
605 {
606   scm t = {NUMBER, .value=STRING};
607   return make_cell (&t, x, 0);
608 }
609
610 scm *
611 cstring_to_list (char const* s)
612 {
613   scm *p = &scm_nil;
614   while (s && *s)
615     p = append2 (p, cons (make_char (*s++), &scm_nil));
616   return p;
617 }
618
619 scm *symbols = 0;
620
621 scm *
622 list_of_char_equal_p (scm *a, scm *b)
623 {
624   while (a != &scm_nil && b != &scm_nil && a->car->value == b->car->value) {
625     assert (a->car->type == CHAR);
626     assert (b->car->type == CHAR);
627     a = a->cdr;
628     b = b->cdr;
629   }
630   return (a == &scm_nil && b == &scm_nil) ? &scm_t : &scm_f;
631 }
632
633 scm *
634 internal_lookup_symbol (scm *s)
635 {
636   scm *x = symbols;
637   while (x) {
638     // .string and .name is the same field; .name is used as a handy
639     // static field initializer.  A string can only be mistaken for a
640     // cell with type == PAIR for the one character long, zero-padded
641     // #\etx.
642     if (x->car->string->type != PAIR)
643       x->car->string = cstring_to_list (x->car->name);
644     if (list_of_char_equal_p (x->car->string, s) == &scm_t) break;
645     x = x->cdr;
646   }
647   if (x) x = x->car;
648   return x;
649 }
650
651 scm *
652 internal_make_symbol (scm *s)
653 {
654   scm t = {NUMBER, .value=SYMBOL};
655   scm *x = make_cell (&t, s, 0);
656   symbols = cons (x, symbols);
657   return x;
658 }
659
660 scm *
661 make_symbol (scm *s)
662 {
663   scm *x = internal_lookup_symbol (s);
664   return x ? x : internal_make_symbol (s);
665 }
666
667 scm *
668 make_vector (scm *n)
669 {
670   scm t = {NUMBER, .value=VECTOR};
671   scm *v = alloc (n->value);
672   scm *x = make_cell (&t, (scm*)(long)n->value, v);
673   for (int i=0; i<n->value; i++) x->vector[i] = *vector_entry (&scm_unspecified);
674   return x;
675 }
676
677 scm *
678 values (scm *x) ///((args . n))
679 {
680   scm *v = cons (0, x);
681   v->type = VALUES;
682   return v;
683 }
684
685 scm *
686 call_with_values_env (scm *producer, scm *consumer, scm *a)
687 {
688   scm *v = apply_env (producer, &scm_nil, a);
689   if (v->type == VALUES)
690     v = v->cdr;
691   return apply_env (consumer, v, a);
692 }
693
694 scm *
695 vector_length (scm *x)
696 {
697   assert (x->type == VECTOR);
698   return make_number (x->length);
699 }
700
701 scm *
702 vector_ref (scm *x, scm *i)
703 {
704   assert (x->type == VECTOR);
705   assert (i->value < x->length);
706   scm *e = &x->vector[i->value];
707   if (e->type == REF) e = e->ref;
708   if (e->type == CHAR) e = make_char (e->value);
709   if (e->type == NUMBER) e = make_number (e->value);
710   return e;
711 }
712
713 scm *
714 vector_entry (scm *x) {
715   if (x->type == PAIR || x->type == SCM || x->type == STRING || x->type == SYMBOL || x->type == VECTOR) x = make_ref (x);
716   return x;
717 }
718
719 scm *
720 vector_set_x (scm *x, scm *i, scm *e)
721 {
722   assert (x->type == VECTOR);
723   assert (i->value < x->length);
724   x->vector[i->value] = *vector_entry (e);
725   return &scm_unspecified;
726 }
727
728 scm *
729 lookup (scm *s, scm *a)
730 {
731   if (isdigit (s->car->value) || (s->car->value == '-' && s->cdr != &scm_nil)) {
732     scm *p = s;
733     int sign = 1;
734     if (s->car->value == '-') {
735       sign = -1;
736       p = s->cdr;
737     }
738     int n = 0;
739     while (p != &scm_nil && isdigit (p->car->value)) {
740       n *= 10;
741       n += p->car->value - '0';
742       p = p->cdr;
743     }
744     if (p == &scm_nil) return make_number (n * sign);
745   }
746   
747   scm *x = internal_lookup_symbol (s);
748   if (x) return x;
749
750   if (s->cdr == &scm_nil) {
751     if (s->car->value == '\'') return &symbol_quote;
752     if (s->car->value == '`') return &symbol_quasiquote;
753     if (s->car->value == ',') return &symbol_unquote;
754   }
755   else if (s->cdr->cdr == &scm_nil) {
756     if (s->car->value == ',' && s->cdr->car->value == '@') return &symbol_unquote_splicing;
757     if (s->car->value == '#' && s->cdr->car->value == '\'') return &symbol_syntax;
758     if (s->car->value == '#' && s->cdr->car->value == '`') return &symbol_quasisyntax;
759     if (s->car->value == '#' && s->cdr->car->value == ',') return &symbol_unsyntax;
760   }
761   else if (s->cdr->cdr->cdr == &scm_nil) {
762     if (s->car->value == '#' && s->cdr->car->value == ',' && s->cdr->cdr->car->value == '@') return &symbol_unsyntax_splicing;
763     if (s->car->value == 'E' && s->cdr->car->value == 'O' && s->cdr->cdr->car->value == 'F') {
764       fprintf (stderr, "mes: got EOF\n");
765       return &scm_nil; // `EOF': eval program, which may read stdin
766     }
767   }
768
769   return internal_make_symbol (s);
770 }
771
772 scm *
773 lookup_char (int c, scm *a)
774 {
775   return lookup (cons (make_char (c), &scm_nil), a);
776 }
777
778 scm *
779 list_to_vector (scm *x)
780 {
781   scm n = {NUMBER, .value=length (x)->value};
782   scm *v = make_vector (&n);
783   scm *p = v->vector;
784   while (x != &scm_nil)
785     {
786       *p++ = *vector_entry (car (x));
787       x = cdr (x);
788     }
789   return v;
790 }
791
792 scm *
793 newline (scm *p) ///((args . n))
794 {
795   int fd = 1;
796   if (p->type == PAIR && p->car->type == NUMBER) fd = p->car->value;
797   FILE *f = fd == 1 ? stdout : stderr;
798   fputs ("\n", f);
799   return &scm_unspecified;
800 }
801
802 scm *
803 force_output (scm *p) ///((args . n))
804 {
805   int fd = 1;
806   if (p->type == PAIR && p->car->type == NUMBER) fd = p->car->value;
807   FILE *f = fd == 1 ? stdout : stderr;
808   fflush (f);
809 }
810
811 scm *
812 display_helper (FILE* f, scm *x, bool cont, char const *sep, bool quote)
813 {
814   scm *r;
815   fprintf (f, "%s", sep);
816   if (x->type == CHAR && x->value == char_nul.value) fprintf (f, "#\\%s", char_nul.name);
817   else if (x->type == CHAR && x->value == char_backspace.value) fprintf (f, "#\\%s", char_backspace.name);
818   else if (x->type == CHAR && x->value == char_tab.value) fprintf (f, "#\\%s", char_tab.name);
819   else if (x->type == CHAR && x->value == char_newline.value) fprintf (f, "#\\%s", char_newline.name);
820   else if (x->type == CHAR && x->value == char_vt.value) fprintf (f, "#\\%s", char_vt.name);
821   else if (x->type == CHAR && x->value == char_page.value) fprintf (f, "#\\%s", char_page.name);
822   else if (x->type == CHAR && x->value == char_return.value) fprintf (f, "#\\%s", char_return.name);
823   else if (x->type == CHAR && x->value == char_space.value) fprintf (f, "#\\%s", char_space.name);
824   else if (x->type == CHAR) fprintf (f, "#\\%c", x->value);
825   else if (x->type == MACRO) {
826     fprintf (f, "(*macro* ");
827     display_helper (f, x->macro, cont, sep, quote);
828     fprintf (f, ")");
829   }
830   else if (x->type == NUMBER) fprintf (f, "%d", x->value);
831   else if (x->type == PAIR) {
832     if (car (x) == &scm_circular) {
833       fprintf (f, "(*circ* . #-1#)");
834       return &scm_unspecified;
835     }
836     if (car (x) == &scm_closure) {
837       fprintf (f, "(*closure* . #-1#)");
838       return &scm_unspecified;
839     }
840     if (car (x) == &scm_quote) {
841       fprintf (f, "'");
842       return display_helper (f, car (cdr (x)), cont, "", true);
843     }
844     if (!cont) fprintf (f, "(");
845     display_ (f, car (x));
846     if (cdr (x)->type == PAIR)
847       display_helper (f, cdr (x), true, " ", false);
848     else if (cdr (x) != &scm_nil) {
849       fprintf (f, " . ");
850       display_ (f, cdr (x));
851     }
852     if (!cont) fprintf (f, ")");
853   }
854   else if (x->type == VECTOR) {
855     fprintf (f, "#(", x->length);
856     for (int i = 0; i < x->length; i++) {
857       if (x->vector[i].type == VECTOR
858           || (x->vector[i].type == REF
859               && x->vector[i].ref->type == VECTOR))
860         fprintf (f, "%s#(...)", i ? " " : "");
861       else
862         display_helper (f, &x->vector[i], false, i ? " " : "", false);
863     }
864     fprintf (f, ")");
865   }
866   else if (x->type == REF) display_helper (f, x->ref, cont, "", true);
867   else if (builtin_p (x) == &scm_t) fprintf (f, "#<procedure %s>", x->name);
868   else if (x->type != PAIR && x->string) {
869     scm *p = x->string;
870     assert (p);
871     while (p != &scm_nil) {
872       assert (p->car->type == CHAR);
873       fputc (p->car->value, f);
874       p = p->cdr;
875     }
876   }
877   else if (x->type != PAIR && x->name) fprintf (f, "%s", x->name);
878
879   return &scm_unspecified;
880 }
881
882 // READ
883
884 int
885 ungetchar (int c)
886 {
887   return ungetc (c, stdin);
888 }
889
890 int
891 peekchar ()
892 {
893   int c = getchar ();
894   ungetchar (c);
895   return c;
896 }
897
898 scm *
899 peek_char ()
900 {
901   return make_char (peekchar ());
902 }
903
904 scm *
905 read_char ()
906 {
907   return make_char (getchar ());
908 }
909
910 scm *
911 write_char (scm *x) ///((args . n))
912 {
913   scm *c = car (x);
914   scm *p = cdr (x);
915   int fd = 1;
916   if (p->type == PAIR && p->car->type == NUMBER) fd = p->car->value;
917   FILE *f = fd == 1 ? stdout : stderr;
918   assert (c->type == NUMBER || c->type == CHAR);
919   fputc (c->value, f);
920   return c;
921 }
922
923 scm *
924 unget_char (scm *c)
925 {
926   assert (c->type == NUMBER || c->type == CHAR);
927   ungetchar (c->value);
928   return c;
929 }
930
931 int
932 readcomment (int c)
933 {
934   if (c == '\n') return c;
935   return readcomment (getchar ());
936 }
937
938 int
939 readblock (int c)
940 {
941   if (c == '!' && peekchar () == '#') return getchar ();
942   return readblock (getchar ());
943 }
944
945 scm *
946 readword (int c, scm *w, scm *a)
947 {
948   if (c == EOF && w == &scm_nil) return &scm_nil;
949   if (c == '\n' && w == &scm_nil) return readword (getchar (), w, a);
950   if (c == '\n' && w->car->value == '.' && w->cdr == &scm_nil) return &scm_dot;
951   if (c == EOF || c == '\n') return lookup (w, a);
952   if (c == ' ') return readword ('\n', w, a);
953   if (c == '"' && w == &scm_nil) return readstring ();
954   if (c == '"') {ungetchar (c); return lookup (w, a);}
955   if (c == '(' && w == &scm_nil) return readlist (a);
956   if (c == '(') {ungetchar (c); return lookup (w, a);}
957   if (c == ')' && w == &scm_nil) {ungetchar (c); return &scm_nil;}
958   if (c == ')') {ungetchar (c); return lookup (w, a);}
959   if (c == ',' && peekchar () == '@') {getchar (); return cons (lookup (symbol_unquote_splicing.string, a),
960                                                                    cons (readword (getchar (), w, a),
961                                                                          &scm_nil));}
962   if ((c == '\''
963        || c == '`'
964        || c == ',')
965       && w == &scm_nil) {return cons (lookup_char (c, a),
966                                      cons (readword (getchar (), w, a),
967                                            &scm_nil));}
968   if (c == '#' && peekchar () == ',' && w == &scm_nil) {
969     getchar ();
970     if (peekchar () == '@'){getchar (); return cons (lookup (symbol_unsyntax_splicing.string, a),
971                                                      cons (readword (getchar (), w, a),
972                                                            &scm_nil));}
973     return cons (lookup (symbol_unsyntax.string, a), cons (readword (getchar (), w, a), &scm_nil));
974   }
975   if (c == '#'
976      && (peekchar () == '\''
977          || peekchar () == '`')
978       && w == &scm_nil) {return cons (lookup (cons (make_char ('#'), cons (make_char (getchar ()), &scm_nil)), a),
979                           cons (readword (getchar (), w, a),
980                                 &scm_nil));}
981   if (c == ';') {readcomment (c); return readword ('\n', w, a);}
982   if (c == '#' && peekchar () == 'x') {getchar (); return read_hex ();}
983   if (c == '#' && peekchar () == '\\') {getchar (); return read_character ();}
984   if (c == '#' && w == &scm_nil && peekchar () == '(') {getchar (); return list_to_vector (readlist (a));}
985   if (c == '#' && peekchar () == '(') {ungetchar (c); return lookup (w, a);}
986   if (c == '#' && peekchar () == '!') {getchar (); readblock (getchar ()); return readword (getchar (), w, a);}
987   return readword (getchar (), append2 (w, cons (make_char (c), &scm_nil)), a);
988 }
989
990 scm *
991 read_hex ()
992 {
993   int n = 0;
994   int c = peekchar ();
995   while ((c >= '0' && c <= '9')
996          || (c >= 'A' && c <= 'F')
997          || (c >= 'a' && c <= 'f')) {
998     n <<= 4;
999     if (c >= 'a') n += c - 'a' + 10;
1000     else if (c >= 'A') n += c - 'A' + 10;
1001     else n+= c - '0';
1002     getchar ();
1003     c = peekchar ();
1004   }
1005   return make_number (n);
1006 }
1007
1008 scm *
1009 read_character ()
1010 {
1011   int c = getchar ();
1012   if (c >= '0' && c <= '7'
1013       && peekchar () >= '0' && peekchar () <= '7') {
1014     c = c - '0';
1015     while (peekchar () >= '0' && peekchar () <= '7') {
1016       c <<= 3;
1017       c += getchar () - '0';
1018     }
1019   }
1020   else if (c >= 'a' && c <= 'z'
1021       && peekchar () >= 'a' && peekchar () <= 'z') {
1022     char buf[10];
1023     char *p = buf;
1024     *p++ = c;
1025     while (peekchar () >= 'a' && peekchar () <= 'z') {
1026       *p++ = getchar ();
1027     }
1028     *p = 0;
1029     if (!strcmp (buf, char_nul.name)) c = char_nul.value;
1030     else if (!strcmp (buf, char_backspace.name)) c = char_backspace.value;
1031     else if (!strcmp (buf, char_tab.name)) c = char_tab.value;
1032     else if (!strcmp (buf, char_newline.name)) c = char_newline.value;
1033     else if (!strcmp (buf, char_vt.name)) c = char_vt.value;
1034     else if (!strcmp (buf, char_page.name)) c = char_page.value;
1035     else if (!strcmp (buf, char_return.name)) c = char_return.value;
1036     else if (!strcmp (buf, char_space.name)) c = char_space.value;
1037     else {
1038       fprintf (stderr, "char not supported: %s\n", buf);
1039       assert (!"char not supported");
1040     }
1041   }
1042   return make_char (c);
1043 }
1044
1045 scm *
1046 append_char (scm *x, int i)
1047 {
1048   return append2 (x, cons (make_char (i), &scm_nil));
1049 }
1050
1051 scm *
1052 readstring ()
1053 {
1054   scm *p = &scm_nil;
1055   int c = getchar ();
1056   while (true) {
1057     if (c == '"') break;
1058     if (c == '\\' && peekchar () == '"') p = append_char (p, getchar ());
1059     else if (c == '\\' && peekchar () == 'n') {getchar (); p = append_char (p, '\n');}
1060     else if (c == EOF) assert (!"EOF in string");
1061     else p = append_char (p, c);
1062     c = getchar ();
1063   }
1064   return make_string (p);
1065 }
1066
1067 int
1068 eat_whitespace (int c)
1069 {
1070   while (c == ' ' || c == '\t' || c == '\n') c = getchar ();
1071   if (c == ';') return eat_whitespace (readcomment (c));
1072   if (c == '#' && peekchar () == '!') {getchar (); readblock (getchar ()); return eat_whitespace (getchar ());}
1073   return c;
1074 }
1075
1076 scm *
1077 readlist (scm *a)
1078 {
1079   int c = getchar ();
1080   c = eat_whitespace (c);
1081   if (c == ')') return &scm_nil;
1082   scm *w = readword (c, &scm_nil, a);
1083   if (w == &scm_dot)
1084     return car (readlist (a));
1085   return cons (w, readlist (a));
1086 }
1087
1088 scm *
1089 read_env (scm *a)
1090 {
1091   return readword (getchar (), &scm_nil, a);
1092 }
1093
1094 scm *
1095 add_environment (scm *a, char const *name, scm *x)
1096 {
1097   return cons (cons (make_symbol (cstring_to_list (name)), x), a);
1098 }
1099
1100 scm *
1101 mes_environment () ///((internal))
1102 {
1103   scm *a = &scm_nil;
1104
1105   #include "mes.symbols.i"
1106
1107 #if BOOT
1108   symbols = cons (&scm_label, symbols);
1109   a = cons (cons (&scm_label, &scm_t), a);
1110 #endif
1111
1112 #include "string.environment.i"
1113 #include "math.environment.i"
1114 #include "lib.environment.i"
1115 #include "mes.environment.i"
1116 #include "define.environment.i"
1117 #include "type.environment.i"
1118
1119   a = add_environment (a, "sc-expand", &scm_f);
1120
1121   a = cons (cons (&scm_closure, a), a);
1122   return a;
1123 }
1124
1125 scm *
1126 make_lambda (scm *args, scm *body)
1127 {
1128   return cons (&scm_lambda, cons (args, body));
1129 }
1130
1131 scm *
1132 make_closure (scm *args, scm *body, scm *a)
1133 {
1134   return cons (&scm_closure, cons (cons (&scm_circular, a), cons (args, body)));
1135 }
1136
1137 scm *
1138 lookup_macro (scm *x, scm *a)
1139 {
1140   if (x->type != SYMBOL) return &scm_f;
1141   scm *m = assq_ref_cache (x, a);
1142   if (macro_p (m) == &scm_t) return m->macro;
1143   return &scm_f;
1144 }
1145
1146 scm *
1147 read_file_env (scm *e, scm *a)
1148 {
1149   if (e == &scm_nil) return e;
1150   return cons (e, read_file_env (read_env (a), a));
1151 }
1152
1153 scm *
1154 load_file_env (scm *a)
1155 {
1156   return begin (read_file_env (read_env (a), a), a);
1157 }
1158
1159 #include "type.c"
1160 #include "define.c"
1161 #include "lib.c"
1162 #include "math.c"
1163 #include "quasiquote.c"
1164 #include "string.c"
1165
1166 int
1167 main (int argc, char *argv[])
1168 {
1169   if (argc > 1 && !strcmp (argv[1], "--help")) return puts ("Usage: mes < FILE\n");
1170   if (argc > 1 && !strcmp (argv[1], "--version")) return puts ("Mes 0.1\n");
1171   scm *a = mes_environment ();
1172   display_ (stderr, load_file_env (a));
1173   fputs ("", stderr);
1174   return 0;
1175 }