Define garbage collector/jam collector primitives.
[mes.git] / mes.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #define _GNU_SOURCE
22 #include <assert.h>
23 #include <ctype.h>
24 #include <limits.h>
25 #include <stdio.h>
26 #include <string.h>
27 #include <stdlib.h>
28 #include <stdbool.h>
29
30 #define DEBUG 0
31 #define QUASIQUOTE 1
32
33 enum type {CHAR, MACRO, NUMBER, PAIR, SCM, STRING, SYMBOL, REF, VALUES, VECTOR,
34            FUNCTION0, FUNCTION1, FUNCTION2, FUNCTION3, FUNCTIONn};
35 struct scm_t;
36 typedef struct scm_t* (*function0_t) (void);
37 typedef struct scm_t* (*function1_t) (struct scm_t*);
38 typedef struct scm_t* (*function2_t) (struct scm_t*, struct scm_t*);
39 typedef struct scm_t* (*function3_t) (struct scm_t*, struct scm_t*, struct scm_t*);
40 typedef struct scm_t* (*functionn_t) (struct scm_t*);
41
42 typedef struct scm_t {
43   enum type type;
44   union {
45     char const *name;
46     struct scm_t* string;
47     struct scm_t* car;
48     struct scm_t* ref;
49     int length;
50   };
51   union {
52     int value;
53     function0_t function0;
54     function1_t function1;
55     function2_t function2;
56     function3_t function3;
57     functionn_t functionn;
58     struct scm_t* cdr;
59     struct scm_t* macro;
60     struct scm_t* vector;
61     int hits;
62   };
63 } scm;
64
65 #include "define.environment.h"
66 #include "lib.environment.h"
67 #include "math.environment.h"
68 #include "mes.environment.h"
69 #include "quasiquote.environment.h"
70 #include "string.environment.h"
71 #include "type.environment.h"
72
73 scm *display_ (FILE* f, scm *x);
74 scm *display_helper (FILE*, scm*, bool, char const*, bool);
75
76 scm scm_nil = {SCM, "()"};
77 scm scm_dot = {SCM, "."};
78 scm scm_f = {SCM, "#f"};
79 scm scm_t = {SCM, "#t"};
80 scm scm_undefined = {SCM, "*undefined*"};
81 scm scm_unspecified = {SCM, "*unspecified*"};
82 scm scm_closure = {SCM, "*closure*"};
83 scm scm_circular = {SCM, "*circular*"};
84 #if BOOT
85 scm scm_label = {
86   SCM, "label"};
87 #endif
88 scm scm_lambda = {SCM, "lambda"};
89
90 scm symbol_begin = {SCM, "begin"};
91 scm symbol_if = {SCM, "if"};
92 scm symbol_define = {SCM, "define"};
93 scm symbol_define_macro = {SCM, "define-macro"};
94 scm symbol_set_x = {SCM, "set!"};
95
96 scm symbol_quote = {SYMBOL, "quote"};
97 scm symbol_quasiquote = {SYMBOL, "quasiquote"};
98 scm symbol_unquote = {SYMBOL, "unquote"};
99 scm symbol_unquote_splicing = {SYMBOL, "unquote-splicing"};
100
101 scm symbol_sc_expand = {SYMBOL, "sc-expand"};
102 scm symbol_syntax = {SYMBOL, "syntax"};
103 scm symbol_quasisyntax = {SYMBOL, "quasisyntax"};
104 scm symbol_unsyntax = {SYMBOL, "unsyntax"};
105 scm symbol_unsyntax_splicing = {SYMBOL, "unsyntax-splicing"};
106
107 scm symbol_call_with_values = {SYMBOL, "call-with-values"};
108 scm symbol_current_module = {SYMBOL, "current-module"};
109
110
111 scm char_nul = {CHAR, .name="nul", .value=0};
112 scm char_backspace = {CHAR, .name="backspace", .value=8};
113 scm char_tab = {CHAR, .name="tab", .value=9};
114 scm char_newline = {CHAR, .name="newline", .value=10};
115 scm char_vt = {CHAR, .name="vt", .value=11};
116 scm char_page = {CHAR, .name="page", .value=12};
117 scm char_return = {CHAR, .name="return", .value=13};
118 scm char_space = {CHAR, .name="space", .value=32};
119
120 // PRIMITIVES
121
122 scm *
123 car (scm *x)
124 {
125   assert (x->type == PAIR);
126   return x->car;
127 }
128
129 scm *
130 cdr (scm *x)
131 {
132   assert (x->type == PAIR);
133   return x->cdr;
134 }
135
136 scm *
137 alloc (int n)
138 {
139   return (scm*)malloc (n * sizeof (scm));
140 }
141
142 scm *
143 make_cell (scm *type, scm *car, scm *cdr)
144 {
145   scm *x = alloc (1);
146   assert (type->type == NUMBER);
147   x->type = type->value;
148   if (type->value == CHAR || type->value == NUMBER) {
149     if (car) x->car = car->car;
150     if (cdr) x->cdr = cdr->cdr;
151   } else {
152     x->car = car;
153     x->cdr = cdr;
154   }
155   return x;
156 }
157
158 scm *
159 cons (scm *x, scm *y)
160 {
161   scm t = {NUMBER, .value=PAIR};
162   return make_cell (&t, x, y);
163 }
164
165 scm *
166 eq_p (scm *x, scm *y)
167 {
168   return (x == y
169           || (x->type == CHAR && y->type == CHAR
170               && x->value == y->value)
171           || (x->type == NUMBER && y->type == NUMBER
172               && x->value == y->value))
173     ? &scm_t : &scm_f;
174 }
175
176 scm *
177 set_car_x (scm *x, scm *e)
178 {
179   assert (x->type == PAIR);
180   x->car = e;
181   return &scm_unspecified;
182 }
183
184 scm *
185 set_cdr_x (scm *x, scm *e)
186 {
187   assert (x->type == PAIR);
188   cache_invalidate (x->cdr);
189   x->cdr = e;
190   return &scm_unspecified;
191 }
192
193 scm *
194 set_env_x (scm *x, scm *e, scm *a)
195 {
196   cache_invalidate (x);
197   return set_cdr_x (assq (x, a), e);
198 }
199
200 scm *
201 quote (scm *x)
202 {
203   return cons (&symbol_quote, x);
204 }
205
206 scm *
207 quasiquote (scm *x)
208 {
209   return cons (&symbol_quasiquote, x);
210 }
211
212 scm *
213 quasisyntax (scm *x)
214 {
215   return cons (&symbol_quasisyntax, x);
216 }
217
218 scm *
219 pairlis (scm *x, scm *y, scm *a)
220 {
221   if (x == &scm_nil)
222     return a;
223   if (pair_p (x) == &scm_f)
224     return cons (cons (x, y), a);
225   return cons (cons (car (x), car (y)),
226                pairlis (cdr (x), cdr (y), a));
227 }
228
229 scm *
230 assq (scm *x, scm *a)
231 {
232   while (a != &scm_nil && eq_p (x, a->car->car) == &scm_f) a = a->cdr;
233   return a != &scm_nil ? a->car : &scm_f;
234 }
235
236 #define ENV_CACHE 1
237 #define CACHE_SIZE 30
238 #define ENV_HEAD 15
239
240 #if !ENV_CACHE
241 scm *
242 assq_ref_cache (scm *x, scm *a)
243 {
244   x = assq (x, a);
245   if (x == &scm_f) return &scm_f;
246   return x->cdr;
247 }
248 scm*cache_invalidate (scm*x){}
249 scm*cache_invalidate_range (scm*p,scm*a){}
250 scm*cache_save (scm*p){}
251 scm*cache_lookup (scm*x){}
252
253 #else // ENV_CACHE
254
255 scm *env_cache_cars[CACHE_SIZE];
256 scm *env_cache_cdrs[CACHE_SIZE];
257 int cache_threshold = 0;
258 scm *
259 cache_save (scm *p)
260 {
261   int n = p->car->hits;
262   if (n < cache_threshold) return &scm_unspecified;
263   int j = -1;
264   for (int i=0; i < CACHE_SIZE; i++) {
265     if (!env_cache_cars[i]) {
266       j = i;
267       break;
268     }
269     if (env_cache_cars[i] == p->car) return &scm_unspecified;
270     if (n > env_cache_cars[i]->hits) {
271       n = env_cache_cars[i]->hits;
272       j = i;
273     }
274   }
275   if (j >= 0) {
276     cache_threshold = p->car->hits;
277     env_cache_cars[j] = p->car;
278     env_cache_cdrs[j] = p->cdr;
279   }
280   return &scm_unspecified;
281 }
282
283 scm *
284 cache_lookup (scm *x)
285 {
286   for (int i=0; i < CACHE_SIZE; i++) {
287     if (!env_cache_cars[i]) break;
288     if (env_cache_cars[i] == x) return env_cache_cdrs[i];
289   }
290   return &scm_undefined;
291 }
292
293 scm *
294 cache_invalidate (scm *x)
295 {
296   for (int i=0; i < CACHE_SIZE; i++) {
297     if (env_cache_cars[i] == x) {
298       env_cache_cars[i] = 0;
299       break;
300     }
301   }
302   return &scm_unspecified;
303 }
304
305 scm *
306 cache_invalidate_range (scm *p, scm *a)
307 {
308   do {
309     cache_invalidate (p->car->car);
310     p = p->cdr;
311   } while (p != a);
312   return &scm_unspecified;
313 }
314
315 scm *
316 assq_ref_cache (scm *x, scm *a)
317 {
318   x->hits++;
319   scm *c = cache_lookup (x);
320   if (c != &scm_undefined) return c;
321   int i = 0;
322   while (a != &scm_nil && x != a->car->car) {i++;a = a->cdr;}
323   if (a == &scm_nil) return &scm_undefined;
324   if (i>ENV_HEAD) cache_save (a->car);
325   return a->car->cdr;
326 }
327 #endif // ENV_CACHE
328
329 scm *
330 evlis_env (scm *m, scm *a)
331 {
332   if (m == &scm_nil) return &scm_nil;
333   if (m->type != PAIR) return builtin_eval (m, a);
334   scm *e = builtin_eval (car (m), a);
335   return cons (e, evlis_env (cdr (m), a));
336 }
337
338 scm *
339 apply_env (scm *fn, scm *x, scm *a)
340 {
341   if (fn->type != PAIR)
342     {
343       if (fn == &scm_car) return x->car->car;
344       if (fn == &scm_cdr) return x->car->cdr;
345       if (builtin_p (fn) == &scm_t)
346         return call (fn, x);
347       if (eq_p (fn, &symbol_call_with_values) == &scm_t)
348         return call (&scm_call_with_values_env, append2 (x, cons (a, &scm_nil)));
349       if (fn == &symbol_current_module) return a;
350     }
351   else if (fn->car == &scm_lambda) {
352     scm *p = pairlis (cadr (fn), x, a);
353     cache_invalidate_range (p, a->cdr);
354     scm *r = begin (cddr (fn), cons (cons (&scm_closure, p), p));
355     cache_invalidate_range (p, a->cdr);
356     return r;
357   }
358   else if (fn->car == &scm_closure) {
359     scm *args = caddr (fn);
360     scm *body = cdddr (fn);
361     a = cdadr (fn);
362     a = cdr (a);
363     scm *p = pairlis (args, x, a);
364     cache_invalidate_range (p, a->cdr);
365     scm *r = begin (body, cons (cons (&scm_closure, p), p));
366     cache_invalidate_range (p, a->cdr);
367     return r;
368   }
369 #if BOOT
370   else if (fn->car == &scm_label)
371     return apply_env (caddr (fn), x, cons (cons (cadr (fn), caddr (fn)), a));
372 #endif
373   scm *efn = builtin_eval (fn, a);
374   if (efn == &scm_f || efn == &scm_t) assert (!"apply bool");
375   if (efn->type == NUMBER) assert (!"apply number");
376   if (efn->type == STRING) assert (!"apply string");
377   return apply_env (efn, x, a);
378 }
379
380 scm *
381 builtin_eval (scm *e, scm *a)
382 {
383   if (builtin_p (e) == &scm_t) return e;
384   if (e->type == SCM) return e;
385
386   e = expand_macro_env (e, a);
387
388   if (e->type == SYMBOL) {
389     scm *y = assq_ref_cache (e, a);
390     if (y == &scm_undefined) {
391       fprintf (stderr, "eval: unbound variable:");
392       display_ (stderr, e);
393       fprintf (stderr, "\n");
394       assert (!"unbound variable");
395     }
396     return y;
397   }
398   else if (e->type != PAIR)
399     return e;
400   else if (e->car->type != PAIR)
401     {
402       if (e->car == &symbol_quote)
403         return cadr (e);
404       if (e->car == &symbol_syntax)
405         return e;
406       if (e->car == &symbol_begin)
407         return begin (e, a);
408       if (e->car == &scm_lambda)
409         return make_closure (cadr (e), cddr (e), assq (&scm_closure, a));
410       if (e->car == &scm_closure)
411         return e;
412       if (e->car == &symbol_if)
413         return builtin_if (cdr (e), a);
414 #if !BOOT
415       if (e->car == &symbol_define)
416         return define (e, a);
417       if (e->car == &symbol_define_macro)
418         return define (e, a);
419 #else
420       if (e->car == &symbol_define) {
421         fprintf (stderr, "C DEFINE: ");
422         display_ (stderr,
423                   e->cdr->car->type == SYMBOL
424                   ? e->cdr->car->string
425                   : e->cdr->car->car->string);
426         fprintf (stderr, "\n");
427       }
428       assert (e->car != &symbol_define);
429       assert (e->car != &symbol_define_macro);
430 #endif
431       if (e->car == &symbol_set_x)
432         return set_env_x (cadr (e), builtin_eval (caddr (e), a), a);
433 #if QUASIQUOTE
434       if (e->car == &symbol_unquote)
435         return builtin_eval (cadr (e), a);
436       if (e->car == &symbol_quasiquote)
437         return eval_quasiquote (cadr (e), add_unquoters (a));
438       if (e->car == &symbol_unsyntax)
439         return builtin_eval (cadr (e), a);
440       if (e->car == &symbol_quasisyntax)
441         return eval_quasisyntax (cadr (e), add_unsyntaxers (a));
442 #endif //QUASIQUOTE
443     }
444   return apply_env (e->car, evlis_env (e->cdr, a), a);
445 }
446
447 scm *
448 expand_macro_env (scm *e, scm *a)
449 {
450   scm *macro;
451   if (e->type == PAIR
452       && (macro = lookup_macro (e->car, a)) != &scm_f)
453     return expand_macro_env (apply_env (macro, e->cdr, a), a);
454   return e;
455 }
456
457 scm *
458 begin (scm *e, scm *a)
459 {
460   scm *r = &scm_unspecified;
461   while (e != &scm_nil) {
462     r = builtin_eval (e->car, a);
463     e = e->cdr;
464   }
465   return r;
466 }
467
468 scm *
469 builtin_if (scm *e, scm *a)
470 {
471   if (builtin_eval (car (e), a) != &scm_f)
472     return builtin_eval (cadr (e), a);
473   if (cddr (e) != &scm_nil)
474     return builtin_eval (caddr (e), a);
475   return &scm_unspecified;
476 }
477
478 //Helpers
479
480 scm *
481 display (scm *x) ///((args . n))
482 {
483   scm *e = car (x);
484   scm *p = cdr (x);
485   int fd = 1;
486   if (p->type == PAIR && p->car->type == NUMBER) fd = p->car->hits;
487   FILE *f = fd == 1 ? stdout : stderr;
488   return display_helper (f, e, false, "", false);
489 }
490
491 scm *
492 display_ (FILE* f, scm *x)
493 {
494   return display_helper (f, x, false, "", false);
495 }
496
497 scm *
498 call (scm *fn, scm *x)
499 {
500   if (fn->type == FUNCTION0)
501     return fn->function0 ();
502   if (x->car->type == VALUES)
503     x = cons (x->car->cdr->car, &scm_nil);
504   if (fn->type == FUNCTION1)
505     return fn->function1 (car (x));
506   if (fn->type == FUNCTION2)
507     return fn->function2 (car (x), cadr (x));
508   if (fn->type == FUNCTION3)
509     return fn->function3 (car (x), cadr (x), caddr (x));
510   if (fn->type == FUNCTIONn)
511     return fn->functionn (x);
512   return &scm_unspecified;
513 }
514
515 scm *
516 append2 (scm *x, scm *y)
517 {
518   if (x == &scm_nil) return y;
519   assert (x->type == PAIR);
520   return cons (car (x), append2 (cdr (x), y));
521 }
522
523 scm *
524 append (scm *x) ///((args . n))
525  {
526   if (x == &scm_nil) return &scm_nil;
527   return append2 (car (x), append (cdr (x)));
528  }
529
530 scm *
531 make_char (int x)
532 {
533   scm t = {NUMBER, .value=CHAR};
534   scm n = {NUMBER, .value=x};  
535   return make_cell (&t, &n, &n);
536 }
537
538 scm *
539 make_macro (scm *name, scm *x)
540 {
541   scm t = {NUMBER, .value=MACRO};
542   return make_cell (&t, name->string, x);
543 }
544
545 scm *
546 make_number (int x)
547 {
548   scm t = {NUMBER, .value=NUMBER};
549   scm n = {NUMBER, .value=x};  
550   return make_cell (&t, &n, &n);
551 }
552
553 scm *
554 make_ref (scm *x)
555 {
556   scm t = {NUMBER, .value=REF};
557   return make_cell (&t, x, x);
558 }
559
560 scm *
561 make_string (scm *x)
562 {
563   scm t = {NUMBER, .value=STRING};
564   return make_cell (&t, x, 0);
565 }
566
567 scm *
568 cstring_to_list (char const* s)
569 {
570   scm *p = &scm_nil;
571   while (s && *s)
572     p = append2 (p, cons (make_char (*s++), &scm_nil));
573   return p;
574 }
575
576 scm *symbols = 0;
577
578 scm *
579 list_of_char_equal_p (scm *a, scm *b)
580 {
581   while (a != &scm_nil && b != &scm_nil && a->car->value == b->car->value) {
582     assert (a->car->type == CHAR);
583     assert (b->car->type == CHAR);
584     a = a->cdr;
585     b = b->cdr;
586   }
587   return (a == &scm_nil && b == &scm_nil) ? &scm_t : &scm_f;
588 }
589
590 scm *
591 internal_lookup_symbol (scm *s)
592 {
593   scm *x = symbols;
594   while (x) {
595     // .string and .name is the same field; .name is used as a handy
596     // static field initializer.  A string can only be mistaken for a
597     // cell with type == PAIR for the one character long, zero-padded
598     // #\etx.
599     if (x->car->string->type != PAIR)
600       x->car->string = cstring_to_list (x->car->name);
601     if (list_of_char_equal_p (x->car->string, s) == &scm_t) break;
602     x = x->cdr;
603   }
604   if (x) x = x->car;
605   return x;
606 }
607
608 scm *
609 internal_make_symbol (scm *s)
610 {
611   scm t = {NUMBER, .value=SYMBOL};
612   scm *x = make_cell (&t, s, 0);
613   symbols = cons (x, symbols);
614   return x;
615 }
616
617 scm *
618 make_symbol (scm *s)
619 {
620   scm *x = internal_lookup_symbol (s);
621   return x ? x : internal_make_symbol (s);
622 }
623
624 scm *
625 make_vector (scm *n)
626 {
627   scm t = {NUMBER, .value=VECTOR};
628   scm *v = alloc (n->value);
629   scm *x = make_cell (&t, (scm*)(long)n->value, v);
630   for (int i=0; i<n->value; i++) x->vector[i] = *vector_entry (&scm_unspecified);
631   return x;
632 }
633
634 scm *
635 values (scm *x) ///((args . n))
636 {
637   scm *v = cons (0, x);
638   v->type = VALUES;
639   return v;
640 }
641
642 scm *
643 call_with_values_env (scm *producer, scm *consumer, scm *a)
644 {
645   scm *v = apply_env (producer, &scm_nil, a);
646   if (v->type == VALUES)
647     v = v->cdr;
648   return apply_env (consumer, v, a);
649 }
650
651 scm *
652 vector_length (scm *x)
653 {
654   assert (x->type == VECTOR);
655   return make_number (x->length);
656 }
657
658 scm *
659 vector_ref (scm *x, scm *i)
660 {
661   assert (x->type == VECTOR);
662   assert (i->value < x->length);
663   scm *e = &x->vector[i->value];
664   if (e->type == REF) e = e->ref;
665   if (e->type == CHAR) e = make_char (e->value);
666   if (e->type == NUMBER) e = make_number (e->value);
667   return e;
668 }
669
670 scm *
671 vector_entry (scm *x) {
672   if (x->type == PAIR || x->type == SCM || x->type == STRING || x->type == SYMBOL || x->type == VECTOR) x = make_ref (x);
673   return x;
674 }
675
676 scm *
677 vector_set_x (scm *x, scm *i, scm *e)
678 {
679   assert (x->type == VECTOR);
680   assert (i->value < x->length);
681   x->vector[i->value] = *vector_entry (e);
682   return &scm_unspecified;
683 }
684
685 scm *
686 lookup (scm *s, scm *a)
687 {
688   if (isdigit (s->car->value) || (s->car->value == '-' && s->cdr != &scm_nil)) {
689     scm *p = s;
690     int sign = 1;
691     if (s->car->value == '-') {
692       sign = -1;
693       p = s->cdr;
694     }
695     int n = 0;
696     while (p != &scm_nil && isdigit (p->car->value)) {
697       n *= 10;
698       n += p->car->value - '0';
699       p = p->cdr;
700     }
701     if (p == &scm_nil) return make_number (n * sign);
702   }
703   
704   scm *x = internal_lookup_symbol (s);
705   if (x) return x;
706
707   if (s->cdr == &scm_nil) {
708     if (s->car->value == '\'') return &symbol_quote;
709     if (s->car->value == '`') return &symbol_quasiquote;
710     if (s->car->value == ',') return &symbol_unquote;
711   }
712   else if (s->cdr->cdr == &scm_nil) {
713     if (s->car->value == ',' && s->cdr->car->value == '@') return &symbol_unquote_splicing;
714     if (s->car->value == '#' && s->cdr->car->value == '\'') return &symbol_syntax;
715     if (s->car->value == '#' && s->cdr->car->value == '`') return &symbol_quasisyntax;
716     if (s->car->value == '#' && s->cdr->car->value == ',') return &symbol_unsyntax;
717   }
718   else if (s->cdr->cdr->cdr == &scm_nil) {
719     if (s->car->value == '#' && s->cdr->car->value == ',' && s->cdr->cdr->car->value == '@') return &symbol_unsyntax_splicing;
720     if (s->car->value == 'E' && s->cdr->car->value == 'O' && s->cdr->cdr->car->value == 'F') {
721       fprintf (stderr, "mes: got EOF\n");
722       return &scm_nil; // `EOF': eval program, which may read stdin
723     }
724   }
725
726   return internal_make_symbol (s);
727 }
728
729 scm *
730 lookup_char (int c, scm *a)
731 {
732   return lookup (cons (make_char (c), &scm_nil), a);
733 }
734
735 scm *
736 list_to_vector (scm *x)
737 {
738   scm n = {NUMBER, .value=length (x)->value};
739   scm *v = make_vector (&n);
740   scm *p = v->vector;
741   while (x != &scm_nil)
742     {
743       *p++ = *vector_entry (car (x));
744       x = cdr (x);
745     }
746   return v;
747 }
748
749 scm *
750 newline (scm *p) ///((args . n))
751 {
752   int fd = 1;
753   if (p->type == PAIR && p->car->type == NUMBER) fd = p->car->value;
754   FILE *f = fd == 1 ? stdout : stderr;
755   fputs ("\n", f);
756   return &scm_unspecified;
757 }
758
759 scm *
760 force_output (scm *p) ///((args . n))
761 {
762   int fd = 1;
763   if (p->type == PAIR && p->car->type == NUMBER) fd = p->car->value;
764   FILE *f = fd == 1 ? stdout : stderr;
765   fflush (f);
766 }
767
768 scm *
769 display_helper (FILE* f, scm *x, bool cont, char const *sep, bool quote)
770 {
771   scm *r;
772   fprintf (f, "%s", sep);
773   if (x->type == CHAR && x->value == char_nul.value) fprintf (f, "#\\%s", char_nul.name);
774   else if (x->type == CHAR && x->value == char_backspace.value) fprintf (f, "#\\%s", char_backspace.name);
775   else if (x->type == CHAR && x->value == char_tab.value) fprintf (f, "#\\%s", char_tab.name);
776   else if (x->type == CHAR && x->value == char_newline.value) fprintf (f, "#\\%s", char_newline.name);
777   else if (x->type == CHAR && x->value == char_vt.value) fprintf (f, "#\\%s", char_vt.name);
778   else if (x->type == CHAR && x->value == char_page.value) fprintf (f, "#\\%s", char_page.name);
779   else if (x->type == CHAR && x->value == char_return.value) fprintf (f, "#\\%s", char_return.name);
780   else if (x->type == CHAR && x->value == char_space.value) fprintf (f, "#\\%s", char_space.name);
781   else if (x->type == CHAR) fprintf (f, "#\\%c", x->value);
782   else if (x->type == MACRO) {
783     fprintf (f, "(*macro* ");
784     display_helper (f, x->macro, cont, sep, quote);
785     fprintf (f, ")");
786   }
787   else if (x->type == NUMBER) fprintf (f, "%d", x->value);
788   else if (x->type == PAIR) {
789     if (car (x) == &scm_circular) {
790       fprintf (f, "(*circ* . #-1#)");
791       return &scm_unspecified;
792     }
793     if (car (x) == &scm_closure) {
794       fprintf (f, "(*closure* . #-1#)");
795       return &scm_unspecified;
796     }
797     if (car (x) == &scm_quote) {
798       fprintf (f, "'");
799       return display_helper (f, car (cdr (x)), cont, "", true);
800     }
801     if (!cont) fprintf (f, "(");
802     display_ (f, car (x));
803     if (cdr (x)->type == PAIR)
804       display_helper (f, cdr (x), true, " ", false);
805     else if (cdr (x) != &scm_nil) {
806       fprintf (f, " . ");
807       display_ (f, cdr (x));
808     }
809     if (!cont) fprintf (f, ")");
810   }
811   else if (x->type == VECTOR) {
812     fprintf (f, "#(", x->length);
813     for (int i = 0; i < x->length; i++) {
814       if (x->vector[i].type == VECTOR
815           || (x->vector[i].type == REF
816               && x->vector[i].ref->type == VECTOR))
817         fprintf (f, "%s#(...)", i ? " " : "");
818       else
819         display_helper (f, &x->vector[i], false, i ? " " : "", false);
820     }
821     fprintf (f, ")");
822   }
823   else if (x->type == REF) display_helper (f, x->ref, cont, "", true);
824   else if (builtin_p (x) == &scm_t) fprintf (f, "#<procedure %s>", x->name);
825   else if (x->type != PAIR && x->string) {
826     scm *p = x->string;
827     assert (p);
828     while (p != &scm_nil) {
829       assert (p->car->type == CHAR);
830       fputc (p->car->value, f);
831       p = p->cdr;
832     }
833   }
834   else if (x->type != PAIR && x->name) fprintf (f, "%s", x->name);
835
836   return &scm_unspecified;
837 }
838
839 // READ
840
841 int
842 ungetchar (int c)
843 {
844   return ungetc (c, stdin);
845 }
846
847 int
848 peekchar ()
849 {
850   int c = getchar ();
851   ungetchar (c);
852   return c;
853 }
854
855 scm *
856 peek_char ()
857 {
858   return make_char (peekchar ());
859 }
860
861 scm *
862 read_char ()
863 {
864   return make_char (getchar ());
865 }
866
867 scm *
868 write_char (scm *x) ///((args . n))
869 {
870   scm *c = car (x);
871   scm *p = cdr (x);
872   int fd = 1;
873   if (p->type == PAIR && p->car->type == NUMBER) fd = p->car->value;
874   FILE *f = fd == 1 ? stdout : stderr;
875   assert (c->type == NUMBER || c->type == CHAR);
876   fputc (c->value, f);
877   return c;
878 }
879
880 scm *
881 unget_char (scm *c)
882 {
883   assert (c->type == NUMBER || c->type == CHAR);
884   ungetchar (c->value);
885   return c;
886 }
887
888 int
889 readcomment (int c)
890 {
891   if (c == '\n') return c;
892   return readcomment (getchar ());
893 }
894
895 int
896 readblock (int c)
897 {
898   if (c == '!' && peekchar () == '#') return getchar ();
899   return readblock (getchar ());
900 }
901
902 scm *
903 readword (int c, scm *w, scm *a)
904 {
905   if (c == EOF && w == &scm_nil) return &scm_nil;
906   if (c == '\n' && w == &scm_nil) return readword (getchar (), w, a);
907   if (c == '\n' && w->car->value == '.' && w->cdr == &scm_nil) return &scm_dot;
908   if (c == EOF || c == '\n') return lookup (w, a);
909   if (c == ' ') return readword ('\n', w, a);
910   if (c == '"' && w == &scm_nil) return readstring ();
911   if (c == '"') {ungetchar (c); return lookup (w, a);}
912   if (c == '(' && w == &scm_nil) return readlist (a);
913   if (c == '(') {ungetchar (c); return lookup (w, a);}
914   if (c == ')' && w == &scm_nil) {ungetchar (c); return &scm_nil;}
915   if (c == ')') {ungetchar (c); return lookup (w, a);}
916   if (c == ',' && peekchar () == '@') {getchar (); return cons (lookup (symbol_unquote_splicing.string, a),
917                                                                    cons (readword (getchar (), w, a),
918                                                                          &scm_nil));}
919   if ((c == '\''
920        || c == '`'
921        || c == ',')
922       && w == &scm_nil) {return cons (lookup_char (c, a),
923                                      cons (readword (getchar (), w, a),
924                                            &scm_nil));}
925   if (c == '#' && peekchar () == ',' && w == &scm_nil) {
926     getchar ();
927     if (peekchar () == '@'){getchar (); return cons (lookup (symbol_unsyntax_splicing.string, a),
928                                                      cons (readword (getchar (), w, a),
929                                                            &scm_nil));}
930     return cons (lookup (symbol_unsyntax.string, a), cons (readword (getchar (), w, a), &scm_nil));
931   }
932   if (c == '#'
933      && (peekchar () == '\''
934          || peekchar () == '`')
935       && w == &scm_nil) {return cons (lookup (cons (make_char ('#'), cons (make_char (getchar ()), &scm_nil)), a),
936                           cons (readword (getchar (), w, a),
937                                 &scm_nil));}
938   if (c == ';') {readcomment (c); return readword ('\n', w, a);}
939   if (c == '#' && peekchar () == 'x') {getchar (); return read_hex ();}
940   if (c == '#' && peekchar () == '\\') {getchar (); return read_character ();}
941   if (c == '#' && w == &scm_nil && peekchar () == '(') {getchar (); return list_to_vector (readlist (a));}
942   if (c == '#' && peekchar () == '(') {ungetchar (c); return lookup (w, a);}
943   if (c == '#' && peekchar () == '!') {getchar (); readblock (getchar ()); return readword (getchar (), w, a);}
944   return readword (getchar (), append2 (w, cons (make_char (c), &scm_nil)), a);
945 }
946
947 scm *
948 read_hex ()
949 {
950   int n = 0;
951   int c = peekchar ();
952   while ((c >= '0' && c <= '9')
953          || (c >= 'A' && c <= 'F')
954          || (c >= 'a' && c <= 'f')) {
955     n <<= 4;
956     if (c >= 'a') n += c - 'a' + 10;
957     else if (c >= 'A') n += c - 'A' + 10;
958     else n+= c - '0';
959     getchar ();
960     c = peekchar ();
961   }
962   return make_number (n);
963 }
964
965 scm *
966 read_character ()
967 {
968   int c = getchar ();
969   if (c >= '0' && c <= '7'
970       && peekchar () >= '0' && peekchar () <= '7') {
971     c = c - '0';
972     while (peekchar () >= '0' && peekchar () <= '7') {
973       c <<= 3;
974       c += getchar () - '0';
975     }
976   }
977   else if (c >= 'a' && c <= 'z'
978       && peekchar () >= 'a' && peekchar () <= 'z') {
979     char buf[10];
980     char *p = buf;
981     *p++ = c;
982     while (peekchar () >= 'a' && peekchar () <= 'z') {
983       *p++ = getchar ();
984     }
985     *p = 0;
986     if (!strcmp (buf, char_nul.name)) c = char_nul.value;
987     else if (!strcmp (buf, char_backspace.name)) c = char_backspace.value;
988     else if (!strcmp (buf, char_tab.name)) c = char_tab.value;
989     else if (!strcmp (buf, char_newline.name)) c = char_newline.value;
990     else if (!strcmp (buf, char_vt.name)) c = char_vt.value;
991     else if (!strcmp (buf, char_page.name)) c = char_page.value;
992     else if (!strcmp (buf, char_return.name)) c = char_return.value;
993     else if (!strcmp (buf, char_space.name)) c = char_space.value;
994     else {
995       fprintf (stderr, "char not supported: %s\n", buf);
996       assert (!"char not supported");
997     }
998   }
999   return make_char (c);
1000 }
1001
1002 scm *
1003 append_char (scm *x, int i)
1004 {
1005   return append2 (x, cons (make_char (i), &scm_nil));
1006 }
1007
1008 scm *
1009 readstring ()
1010 {
1011   scm *p = &scm_nil;
1012   int c = getchar ();
1013   while (true) {
1014     if (c == '"') break;
1015     if (c == '\\' && peekchar () == '"') p = append_char (p, getchar ());
1016     else if (c == '\\' && peekchar () == 'n') {getchar (); p = append_char (p, '\n');}
1017     else if (c == EOF) assert (!"EOF in string");
1018     else p = append_char (p, c);
1019     c = getchar ();
1020   }
1021   return make_string (p);
1022 }
1023
1024 int
1025 eat_whitespace (int c)
1026 {
1027   while (c == ' ' || c == '\t' || c == '\n') c = getchar ();
1028   if (c == ';') return eat_whitespace (readcomment (c));
1029   if (c == '#' && peekchar () == '!') {getchar (); readblock (getchar ()); return eat_whitespace (getchar ());}
1030   return c;
1031 }
1032
1033 scm *
1034 readlist (scm *a)
1035 {
1036   int c = getchar ();
1037   c = eat_whitespace (c);
1038   if (c == ')') return &scm_nil;
1039   scm *w = readword (c, &scm_nil, a);
1040   if (w == &scm_dot)
1041     return car (readlist (a));
1042   return cons (w, readlist (a));
1043 }
1044
1045 scm *
1046 read_env (scm *a)
1047 {
1048   return readword (getchar (), &scm_nil, a);
1049 }
1050
1051 scm *
1052 add_environment (scm *a, char const *name, scm *x)
1053 {
1054   return cons (cons (make_symbol (cstring_to_list (name)), x), a);
1055 }
1056
1057 scm *
1058 mes_environment () ///((internal))
1059 {
1060   scm *a = &scm_nil;
1061
1062   #include "mes.symbols.i"
1063
1064 #if BOOT
1065   symbols = cons (&scm_label, symbols);
1066   a = cons (cons (&scm_label, &scm_t), a);
1067 #endif
1068
1069 #include "string.environment.i"
1070 #include "math.environment.i"
1071 #include "lib.environment.i"
1072 #include "mes.environment.i"
1073 #include "define.environment.i"
1074 #include "type.environment.i"
1075
1076   a = cons (cons (&scm_closure, a), a);
1077   return a;
1078 }
1079
1080 scm *
1081 make_lambda (scm *args, scm *body)
1082 {
1083   return cons (&scm_lambda, cons (args, body));
1084 }
1085
1086 scm *
1087 make_closure (scm *args, scm *body, scm *a)
1088 {
1089   return cons (&scm_closure, cons (cons (&scm_circular, a), cons (args, body)));
1090 }
1091
1092 scm *
1093 lookup_macro (scm *x, scm *a)
1094 {
1095   if (x->type != SYMBOL) return &scm_f;
1096   scm *m = assq_ref_cache (x, a);
1097   if (macro_p (m) == &scm_t) return m->macro;
1098   return &scm_f;
1099 }
1100
1101 scm *
1102 read_file (scm *e, scm *a)
1103 {
1104   if (e == &scm_nil) return e;
1105 #if DEBUG
1106   scm *x = cons (e, read_file (read_env (a), a));
1107   display_ (stderr, x);
1108 #else
1109   return cons (e, read_file (read_env (a), a));
1110 #endif
1111 }
1112
1113 #include "type.c"
1114 #include "define.c"
1115 #include "lib.c"
1116 #include "math.c"
1117 #include "quasiquote.c"
1118 #include "string.c"
1119
1120 int
1121 main (int argc, char *argv[])
1122 {
1123   if (argc > 1 && !strcmp (argv[1], "--help")) return puts ("Usage: mes < FILE\n");
1124   if (argc > 1 && !strcmp (argv[1], "--version")) return puts ("Mes 0.1\n");
1125   scm *a = mes_environment ();
1126   display_ (stderr, begin (read_file (read_env (a), a), a));
1127   fputs ("", stderr);
1128   return 0;
1129 }