core: Support switching of input stream.
[mes.git] / mes.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #define _GNU_SOURCE
22 #include <assert.h>
23 #include <ctype.h>
24 #include <limits.h>
25 #include <stdio.h>
26 #include <string.h>
27 #include <stdlib.h>
28 #include <stdbool.h>
29
30 #define DEBUG 0
31 #define QUASIQUOTE 1
32 //#define QUASISYNTAX 0
33
34 enum type {CHAR, MACRO, NUMBER, PAIR, SCM, STRING, SYMBOL, REF, VALUES, VECTOR,
35            FUNCTION0, FUNCTION1, FUNCTION2, FUNCTION3, FUNCTIONn};
36 struct scm_t;
37 typedef struct scm_t* (*function0_t) (void);
38 typedef struct scm_t* (*function1_t) (struct scm_t*);
39 typedef struct scm_t* (*function2_t) (struct scm_t*, struct scm_t*);
40 typedef struct scm_t* (*function3_t) (struct scm_t*, struct scm_t*, struct scm_t*);
41 typedef struct scm_t* (*functionn_t) (struct scm_t*);
42
43 typedef struct scm_t {
44   enum type type;
45   union {
46     char const *name;
47     struct scm_t* string;
48     struct scm_t* car;
49     struct scm_t* ref;
50     int length;
51   };
52   union {
53     int value;
54     function0_t function0;
55     function1_t function1;
56     function2_t function2;
57     function3_t function3;
58     functionn_t functionn;
59     struct scm_t* cdr;
60     struct scm_t* macro;
61     struct scm_t* vector;
62     int hits;
63   };
64 } scm;
65
66 #include "define.environment.h"
67 #include "lib.environment.h"
68 #include "math.environment.h"
69 #include "mes.environment.h"
70 #include "quasiquote.environment.h"
71 #include "string.environment.h"
72 #include "type.environment.h"
73
74 scm *display_ (FILE* f, scm *x);
75 scm *display_helper (FILE*, scm*, bool, char const*, bool);
76
77 scm scm_nil = {SCM, "()"};
78 scm scm_dot = {SCM, "."};
79 scm scm_f = {SCM, "#f"};
80 scm scm_t = {SCM, "#t"};
81 scm scm_undefined = {SCM, "*undefined*"};
82 scm scm_unspecified = {SCM, "*unspecified*"};
83 scm scm_closure = {SCM, "*closure*"};
84 scm scm_circular = {SCM, "*circular*"};
85 #if BOOT
86 scm scm_label = {
87   SCM, "label"};
88 #endif
89 scm scm_begin = {SCM, "begin"};
90
91 scm symbol_lambda = {SYMBOL, "lambda"};
92 scm symbol_begin = {SYMBOL, "begin"};
93 scm symbol_if = {SYMBOL, "if"};
94 scm symbol_define = {SYMBOL, "define"};
95 scm symbol_define_macro = {SCM, "define-macro"};
96 scm symbol_set_x = {SYMBOL, "set!"};
97
98 scm symbol_quote = {SYMBOL, "quote"};
99 scm symbol_quasiquote = {SYMBOL, "quasiquote"};
100 scm symbol_unquote = {SYMBOL, "unquote"};
101 scm symbol_unquote_splicing = {SYMBOL, "unquote-splicing"};
102
103 scm symbol_sc_expand = {SYMBOL, "sc-expand"};
104 scm symbol_expand_macro = {SYMBOL, "expand-macro"};
105 scm symbol_sc_expander_alist = {SYMBOL, "*sc-expander-alist*"};
106 scm symbol_noexpand = {SYMBOL, "noexpand"};
107 scm symbol_syntax = {SYMBOL, "syntax"};
108 scm symbol_quasisyntax = {SYMBOL, "quasisyntax"};
109 scm symbol_unsyntax = {SYMBOL, "unsyntax"};
110 scm symbol_unsyntax_splicing = {SYMBOL, "unsyntax-splicing"};
111
112 scm symbol_call_with_values = {SYMBOL, "call-with-values"};
113 scm symbol_current_module = {SYMBOL, "current-module"};
114
115
116 scm char_nul = {CHAR, .name="nul", .value=0};
117 scm char_backspace = {CHAR, .name="backspace", .value=8};
118 scm char_tab = {CHAR, .name="tab", .value=9};
119 scm char_newline = {CHAR, .name="newline", .value=10};
120 scm char_vt = {CHAR, .name="vt", .value=11};
121 scm char_page = {CHAR, .name="page", .value=12};
122 scm char_return = {CHAR, .name="return", .value=13};
123 scm char_space = {CHAR, .name="space", .value=32};
124
125 // PRIMITIVES
126
127 scm *
128 car (scm *x)
129 {
130   assert (x->type == PAIR);
131   return x->car;
132 }
133
134 scm *
135 cdr (scm *x)
136 {
137   assert (x->type == PAIR);
138   return x->cdr;
139 }
140
141 scm *
142 alloc (int n)
143 {
144   return (scm*)malloc (n * sizeof (scm));
145 }
146
147 scm *
148 make_cell (scm *type, scm *car, scm *cdr)
149 {
150   scm *x = alloc (1);
151   assert (type->type == NUMBER);
152   x->type = type->value;
153   if (type->value == CHAR || type->value == NUMBER) {
154     if (car) x->car = car->car;
155     if (cdr) x->cdr = cdr->cdr;
156   } else {
157     x->car = car;
158     x->cdr = cdr;
159   }
160   return x;
161 }
162
163 scm *
164 cons (scm *x, scm *y)
165 {
166   scm t = {NUMBER, .value=PAIR};
167   return make_cell (&t, x, y);
168 }
169
170 scm *
171 eq_p (scm *x, scm *y)
172 {
173   return (x == y
174           || (x->type == CHAR && y->type == CHAR
175               && x->value == y->value)
176           || (x->type == NUMBER && y->type == NUMBER
177               && x->value == y->value))
178     ? &scm_t : &scm_f;
179 }
180
181 scm *
182 set_car_x (scm *x, scm *e)
183 {
184   assert (x->type == PAIR);
185   x->car = e;
186   return &scm_unspecified;
187 }
188
189 scm *
190 set_cdr_x (scm *x, scm *e)
191 {
192   assert (x->type == PAIR);
193   cache_invalidate (x->cdr);
194   x->cdr = e;
195   return &scm_unspecified;
196 }
197
198 scm *
199 set_env_x (scm *x, scm *e, scm *a)
200 {
201   cache_invalidate (x);
202   scm *p = assq (x, a);
203   if (p->type != PAIR)
204     {
205       fprintf (stderr, "set!: unbound variable:");
206       display_ (stderr, x);
207       fprintf (stderr, "\n");
208       assert (!"unbound variable");
209     }
210   return set_cdr_x (p, e);
211 }
212
213 scm *
214 quote (scm *x)
215 {
216   return cons (&symbol_quote, x);
217 }
218
219 scm *
220 quasiquote (scm *x)
221 {
222   return cons (&symbol_quasiquote, x);
223 }
224
225 scm *
226 quasisyntax (scm *x)
227 {
228   return cons (&symbol_quasisyntax, x);
229 }
230
231 scm *
232 pairlis (scm *x, scm *y, scm *a)
233 {
234   if (x == &scm_nil)
235     return a;
236   if (pair_p (x) == &scm_f)
237     return cons (cons (x, y), a);
238   return cons (cons (car (x), car (y)),
239                pairlis (cdr (x), cdr (y), a));
240 }
241
242 scm *
243 assq (scm *x, scm *a)
244 {
245   while (a != &scm_nil && eq_p (x, a->car->car) == &scm_f) a = a->cdr;
246   return a != &scm_nil ? a->car : &scm_f;
247 }
248
249 #define ENV_CACHE 1
250 #define CACHE_SIZE 30
251 #define ENV_HEAD 15
252
253 #if !ENV_CACHE
254 scm *
255 assq_ref_cache (scm *x, scm *a)
256 {
257   x = assq (x, a);
258   if (x == &scm_f) return &scm_undefined;
259   return x->cdr;
260 }
261 scm*cache_invalidate (scm*x){}
262 scm*cache_invalidate_range (scm*p,scm*a){}
263 scm*cache_save (scm*p){}
264 scm*cache_lookup (scm*x){}
265
266 #else // ENV_CACHE
267
268 scm *env_cache_cars[CACHE_SIZE];
269 scm *env_cache_cdrs[CACHE_SIZE];
270 int cache_threshold = 0;
271 scm *
272 cache_save (scm *p)
273 {
274   int n = p->car->hits;
275   if (n < cache_threshold) return &scm_unspecified;
276   int j = -1;
277   for (int i=0; i < CACHE_SIZE; i++) {
278     if (!env_cache_cars[i]) {
279       j = i;
280       break;
281     }
282     if (env_cache_cars[i] == p->car) return &scm_unspecified;
283     if (n > env_cache_cars[i]->hits) {
284       n = env_cache_cars[i]->hits;
285       j = i;
286     }
287   }
288   if (j >= 0) {
289     cache_threshold = p->car->hits;
290     env_cache_cars[j] = p->car;
291     env_cache_cdrs[j] = p->cdr;
292   }
293   return &scm_unspecified;
294 }
295
296 scm *
297 cache_lookup (scm *x)
298 {
299   for (int i=0; i < CACHE_SIZE; i++) {
300     if (!env_cache_cars[i]) break;
301     if (env_cache_cars[i] == x) return env_cache_cdrs[i];
302   }
303   return &scm_undefined;
304 }
305
306 scm *
307 cache_invalidate (scm *x)
308 {
309   for (int i=0; i < CACHE_SIZE; i++) {
310     if (env_cache_cars[i] == x) {
311       env_cache_cars[i] = 0;
312       break;
313     }
314   }
315   return &scm_unspecified;
316 }
317
318 scm *
319 cache_invalidate_range (scm *p, scm *a)
320 {
321   do {
322     cache_invalidate (p->car->car);
323     p = p->cdr;
324   } while (p != a);
325   return &scm_unspecified;
326 }
327
328 scm *
329 assq_ref_cache (scm *x, scm *a)
330 {
331   x->hits++;
332   scm *c = cache_lookup (x);
333   if (c != &scm_undefined) return c;
334   int i = 0;
335   while (a != &scm_nil && x != a->car->car) {i++;a = a->cdr;}
336   if (a == &scm_nil) return &scm_undefined;
337   if (i>ENV_HEAD) cache_save (a->car);
338   return a->car->cdr;
339 }
340 #endif // ENV_CACHE
341
342 scm *
343 evlis_env (scm *m, scm *a)
344 {
345   if (m == &scm_nil) return &scm_nil;
346   if (m->type != PAIR) return builtin_eval (m, a);
347   scm *e = builtin_eval (car (m), a);
348   return cons (e, evlis_env (cdr (m), a));
349 }
350
351 scm *
352 apply_env (scm *fn, scm *x, scm *a)
353 {
354   if (fn->type != PAIR)
355     {
356       if (fn == &scm_car) return x->car->car;
357       if (fn == &scm_cdr) return x->car->cdr;
358       if (builtin_p (fn) == &scm_t)
359         return call (fn, x);
360       if (eq_p (fn, &symbol_call_with_values) == &scm_t)
361         return call (&scm_call_with_values_env, append2 (x, cons (a, &scm_nil)));
362       if (fn == &symbol_current_module) return a;
363     }
364   else if (fn->car == &symbol_lambda) {
365     scm *p = pairlis (cadr (fn), x, a);
366     cache_invalidate_range (p, a->cdr);
367     scm *r = begin_env (cddr (fn), cons (cons (&scm_closure, p), p));
368     cache_invalidate_range (p, a->cdr);
369     return r;
370   }
371   else if (fn->car == &scm_closure) {
372     scm *args = caddr (fn);
373     scm *body = cdddr (fn);
374     a = cdadr (fn);
375     a = cdr (a);
376     scm *p = pairlis (args, x, a);
377     cache_invalidate_range (p, a->cdr);
378     scm *r = begin_env (body, cons (cons (&scm_closure, p), p));
379     cache_invalidate_range (p, a->cdr);
380     return r;
381   }
382 #if BOOT
383   else if (fn->car == &scm_label)
384     return apply_env (caddr (fn), x, cons (cons (cadr (fn), caddr (fn)), a));
385 #endif
386   scm *efn = builtin_eval (fn, a);
387   if (efn == &scm_f || efn == &scm_t) assert (!"apply bool");
388   if (efn->type == NUMBER) assert (!"apply number");
389   if (efn->type == STRING) assert (!"apply string");
390   if (efn == &scm_unspecified) assert (!"apply *unspecified*");
391   return apply_env (efn, x, a);
392 }
393
394 scm *
395 builtin_eval (scm *e, scm *a)
396 {
397   if (builtin_p (e) == &scm_t) return e;
398   if (e->type == SCM) return e;
399
400   e = expand_macro_env (e, a);
401
402   if (e->type == SYMBOL) {
403     scm *y = assq_ref_cache (e, a);
404     if (y == &scm_undefined) {
405       fprintf (stderr, "eval: unbound variable:");
406       display_ (stderr, e);
407       fprintf (stderr, "\n");
408       assert (!"unbound variable");
409     }
410     return y;
411   }
412   else if (e->type != PAIR)
413     return e;
414   else if (e->car->type != PAIR)
415     {
416       if (e->car->type == STRING && string_to_symbol (e->car) == &symbol_noexpand)
417         e = cadr (e);
418       else
419         e = sc_expand_env (e, a);
420       if (e->car == &symbol_quote)
421         return cadr (e);
422 #if QUASISYNTAX
423       if (e->car == &symbol_syntax)
424         return e;
425 #endif
426       if (e->car == &symbol_begin)
427         return begin_env (e, a);
428       if (e->car == &symbol_lambda)
429         return make_closure (cadr (e), cddr (e), assq (&scm_closure, a));
430       if (e->car == &scm_closure)
431         return e;
432       if (e->car == &symbol_if)
433         return builtin_if (cdr (e), a);
434 #if !BOOT
435       if (e->car == &symbol_define)
436         return define_env (e, a);
437       if (e->car == &symbol_define_macro)
438         return define_env (e, a);
439 #else
440       if (e->car == &symbol_define) {
441         fprintf (stderr, "C DEFINE: ");
442         display_ (stderr,
443                   e->cdr->car->type == SYMBOL
444                   ? e->cdr->car->string
445                   : e->cdr->car->car->string);
446         fprintf (stderr, "\n");
447       }
448       assert (e->car != &symbol_define);
449       assert (e->car != &symbol_define_macro);
450 #endif
451       if (e->car == &symbol_set_x)
452         return set_env_x (cadr (e), builtin_eval (caddr (e), a), a);
453 #if QUASIQUOTE
454       if (e->car == &symbol_unquote)
455         return builtin_eval (cadr (e), a);
456       if (e->car == &symbol_quasiquote)
457         return eval_quasiquote (cadr (e), add_unquoters (a));
458 #endif //QUASIQUOTE
459 #if QUASISYNTAX
460       if (e->car == &symbol_unsyntax)
461         return builtin_eval (cadr (e), a);
462       if (e->car == &symbol_quasisyntax)
463         return eval_quasisyntax (cadr (e), add_unsyntaxers (a));
464 #endif //QUASISYNTAX
465     }
466   return apply_env (e->car, evlis_env (e->cdr, a), a);
467 }
468
469 scm *
470 expand_macro_env (scm *e, scm *a)
471 {
472   scm *macro;
473   if (e->type == PAIR
474       && (macro = lookup_macro (e->car, a)) != &scm_f)
475     return expand_macro_env (apply_env (macro, e->cdr, a), a);
476   return e;
477 }
478
479 scm *
480 sc_expand_env (scm *e, scm *a)
481 {
482   scm *expanders;
483   scm *macro;
484   if (e->type == PAIR
485     && car (e)->type == SYMBOL
486
487     && car (e) != &symbol_lambda
488     && car (e) != &symbol_set_x
489     && car (e) != &symbol_if
490     && car (e) != &symbol_begin
491     && car (e) != &symbol_define
492
493     && car (e) != &symbol_quasiquote
494     && car (e) != &symbol_quote
495     && car (e) != &symbol_unquote
496     && car (e) != &symbol_unquote_splicing
497     && ((expanders = assq_ref_cache (&symbol_sc_expander_alist, a)) != &scm_undefined)
498     && ((macro = assq (car (e), expanders)) != &scm_f))
499     {
500       scm *sc_expand = assq_ref_cache (&symbol_expand_macro, a);
501       if (sc_expand != &scm_undefined && sc_expand != &scm_f)
502         {
503           e = apply_env (sc_expand, cons (e, &scm_nil), a);
504           return expand_macro_env (e, a);
505         }
506     }
507   return e;
508 }
509
510 scm *
511 begin_env (scm *e, scm *a)
512 {
513   scm *r = &scm_unspecified;
514   while (e != &scm_nil) {
515     r = builtin_eval (e->car, a);
516     e = e->cdr;
517   }
518   return r;
519 }
520
521 scm *
522 builtin_if (scm *e, scm *a)
523 {
524   if (builtin_eval (car (e), a) != &scm_f)
525     return builtin_eval (cadr (e), a);
526   if (cddr (e) != &scm_nil)
527     return builtin_eval (caddr (e), a);
528   return &scm_unspecified;
529 }
530
531 //Helpers
532
533 scm *
534 display (scm *x) ///((args . n))
535 {
536   scm *e = car (x);
537   scm *p = cdr (x);
538   int fd = 1;
539   if (p->type == PAIR && p->car->type == NUMBER) fd = p->car->hits;
540   FILE *f = fd == 1 ? stdout : stderr;
541   return display_helper (f, e, false, "", false);
542 }
543
544 scm *
545 display_ (FILE* f, scm *x)
546 {
547   return display_helper (f, x, false, "", false);
548 }
549
550 scm *
551 call (scm *fn, scm *x)
552 {
553   if (fn->type == FUNCTION0)
554     return fn->function0 ();
555   if (x != &scm_nil && x->car->type == VALUES)
556     x = cons (x->car->cdr->car, x->cdr);
557   if (fn->type == FUNCTION1)
558     return fn->function1 (car (x));
559   if (x != &scm_nil && x->cdr->car->type == VALUES)
560     x = cons (x->car, cons (x->cdr->car->cdr->car, x->cdr));
561   if (fn->type == FUNCTION2)
562     return fn->function2 (car (x), cadr (x));
563   if (fn->type == FUNCTION3)
564     return fn->function3 (car (x), cadr (x), caddr (x));
565   if (fn->type == FUNCTIONn)
566     return fn->functionn (x);
567   return &scm_unspecified;
568 }
569
570 scm *
571 append2 (scm *x, scm *y)
572 {
573   if (x == &scm_nil) return y;
574   assert (x->type == PAIR);
575   return cons (car (x), append2 (cdr (x), y));
576 }
577
578 scm *
579 append (scm *x) ///((args . n))
580  {
581   if (x == &scm_nil) return &scm_nil;
582   return append2 (car (x), append (cdr (x)));
583  }
584
585 scm *
586 make_char (int x)
587 {
588   scm t = {NUMBER, .value=CHAR};
589   scm n = {NUMBER, .value=x};  
590   return make_cell (&t, &n, &n);
591 }
592
593 scm *
594 make_macro (scm *name, scm *x)
595 {
596   scm t = {NUMBER, .value=MACRO};
597   return make_cell (&t, name->string, x);
598 }
599
600 scm *
601 make_number (int x)
602 {
603   scm t = {NUMBER, .value=NUMBER};
604   scm n = {NUMBER, .value=x};  
605   return make_cell (&t, &n, &n);
606 }
607
608 scm *
609 make_ref (scm *x)
610 {
611   scm t = {NUMBER, .value=REF};
612   return make_cell (&t, x, x);
613 }
614
615 scm *
616 make_string (scm *x)
617 {
618   scm t = {NUMBER, .value=STRING};
619   return make_cell (&t, x, 0);
620 }
621
622 scm *
623 cstring_to_list (char const* s)
624 {
625   scm *p = &scm_nil;
626   while (s && *s)
627     p = append2 (p, cons (make_char (*s++), &scm_nil));
628   return p;
629 }
630
631 scm *symbols = 0;
632
633 scm *
634 list_of_char_equal_p (scm *a, scm *b)
635 {
636   while (a != &scm_nil && b != &scm_nil && a->car->value == b->car->value) {
637     assert (a->car->type == CHAR);
638     assert (b->car->type == CHAR);
639     a = a->cdr;
640     b = b->cdr;
641   }
642   return (a == &scm_nil && b == &scm_nil) ? &scm_t : &scm_f;
643 }
644
645 scm *
646 internal_lookup_symbol (scm *s)
647 {
648   scm *x = symbols;
649   while (x) {
650     // .string and .name is the same field; .name is used as a handy
651     // static field initializer.  A string can only be mistaken for a
652     // cell with type == PAIR for the one character long, zero-padded
653     // #\etx.
654     if (x->car->string->type != PAIR)
655       x->car->string = cstring_to_list (x->car->name);
656     if (list_of_char_equal_p (x->car->string, s) == &scm_t) break;
657     x = x->cdr;
658   }
659   if (x) x = x->car;
660   return x;
661 }
662
663 scm *
664 internal_make_symbol (scm *s)
665 {
666   scm t = {NUMBER, .value=SYMBOL};
667   scm *x = make_cell (&t, s, 0);
668   symbols = cons (x, symbols);
669   return x;
670 }
671
672 scm *
673 make_symbol (scm *s)
674 {
675   scm *x = internal_lookup_symbol (s);
676   return x ? x : internal_make_symbol (s);
677 }
678
679 scm *
680 make_vector (scm *n)
681 {
682   scm t = {NUMBER, .value=VECTOR};
683   scm *v = alloc (n->value);
684   scm *x = make_cell (&t, (scm*)(long)n->value, v);
685   for (int i=0; i<n->value; i++) x->vector[i] = *vector_entry (&scm_unspecified);
686   return x;
687 }
688
689 scm *
690 values (scm *x) ///((args . n))
691 {
692   scm *v = cons (0, x);
693   v->type = VALUES;
694   return v;
695 }
696
697 scm *
698 call_with_values_env (scm *producer, scm *consumer, scm *a)
699 {
700   scm *v = apply_env (producer, &scm_nil, a);
701   if (v->type == VALUES)
702     v = v->cdr;
703   return apply_env (consumer, v, a);
704 }
705
706 scm *
707 vector_length (scm *x)
708 {
709   assert (x->type == VECTOR);
710   return make_number (x->length);
711 }
712
713 scm *
714 vector_ref (scm *x, scm *i)
715 {
716   assert (x->type == VECTOR);
717   assert (i->value < x->length);
718   scm *e = &x->vector[i->value];
719   if (e->type == REF) e = e->ref;
720   if (e->type == CHAR) e = make_char (e->value);
721   if (e->type == NUMBER) e = make_number (e->value);
722   return e;
723 }
724
725 scm *
726 vector_entry (scm *x) {
727   if (x->type == PAIR || x->type == SCM || x->type == STRING || x->type == SYMBOL || x->type == VECTOR) x = make_ref (x);
728   return x;
729 }
730
731 scm *
732 vector_set_x (scm *x, scm *i, scm *e)
733 {
734   assert (x->type == VECTOR);
735   assert (i->value < x->length);
736   x->vector[i->value] = *vector_entry (e);
737   return &scm_unspecified;
738 }
739
740 scm *
741 lookup (scm *s, scm *a)
742 {
743   if (isdigit (s->car->value) || (s->car->value == '-' && s->cdr != &scm_nil)) {
744     scm *p = s;
745     int sign = 1;
746     if (s->car->value == '-') {
747       sign = -1;
748       p = s->cdr;
749     }
750     int n = 0;
751     while (p != &scm_nil && isdigit (p->car->value)) {
752       n *= 10;
753       n += p->car->value - '0';
754       p = p->cdr;
755     }
756     if (p == &scm_nil) return make_number (n * sign);
757   }
758   
759   scm *x = internal_lookup_symbol (s);
760   if (x) return x;
761
762   if (s->cdr == &scm_nil) {
763     if (s->car->value == '\'') return &symbol_quote;
764     if (s->car->value == '`') return &symbol_quasiquote;
765     if (s->car->value == ',') return &symbol_unquote;
766   }
767   else if (s->cdr->cdr == &scm_nil) {
768     if (s->car->value == ',' && s->cdr->car->value == '@') return &symbol_unquote_splicing;
769     if (s->car->value == '#' && s->cdr->car->value == '\'') return &symbol_syntax;
770     if (s->car->value == '#' && s->cdr->car->value == '`') return &symbol_quasisyntax;
771     if (s->car->value == '#' && s->cdr->car->value == ',') return &symbol_unsyntax;
772   }
773   else if (s->cdr->cdr->cdr == &scm_nil) {
774     if (s->car->value == '#' && s->cdr->car->value == ',' && s->cdr->cdr->car->value == '@') return &symbol_unsyntax_splicing;
775     if (s->car->value == 'E' && s->cdr->car->value == 'O' && s->cdr->cdr->car->value == 'F') {
776       fprintf (stderr, "mes: got EOF\n");
777       return &scm_nil; // `EOF': eval program, which may read stdin
778     }
779   }
780
781   return internal_make_symbol (s);
782 }
783
784 scm *
785 lookup_char (int c, scm *a)
786 {
787   return lookup (cons (make_char (c), &scm_nil), a);
788 }
789
790 scm *
791 list_to_vector (scm *x)
792 {
793   scm n = {NUMBER, .value=length (x)->value};
794   scm *v = make_vector (&n);
795   scm *p = v->vector;
796   while (x != &scm_nil)
797     {
798       *p++ = *vector_entry (car (x));
799       x = cdr (x);
800     }
801   return v;
802 }
803
804 scm *
805 newline (scm *p) ///((args . n))
806 {
807   int fd = 1;
808   if (p->type == PAIR && p->car->type == NUMBER) fd = p->car->value;
809   FILE *f = fd == 1 ? stdout : stderr;
810   fputs ("\n", f);
811   return &scm_unspecified;
812 }
813
814 scm *
815 force_output (scm *p) ///((args . n))
816 {
817   int fd = 1;
818   if (p->type == PAIR && p->car->type == NUMBER) fd = p->car->value;
819   FILE *f = fd == 1 ? stdout : stderr;
820   fflush (f);
821 }
822
823 scm *
824 display_helper (FILE* f, scm *x, bool cont, char const *sep, bool quote)
825 {
826   scm *r;
827   fprintf (f, "%s", sep);
828   if (x->type == CHAR && x->value == char_nul.value) fprintf (f, "#\\%s", char_nul.name);
829   else if (x->type == CHAR && x->value == char_backspace.value) fprintf (f, "#\\%s", char_backspace.name);
830   else if (x->type == CHAR && x->value == char_tab.value) fprintf (f, "#\\%s", char_tab.name);
831   else if (x->type == CHAR && x->value == char_newline.value) fprintf (f, "#\\%s", char_newline.name);
832   else if (x->type == CHAR && x->value == char_vt.value) fprintf (f, "#\\%s", char_vt.name);
833   else if (x->type == CHAR && x->value == char_page.value) fprintf (f, "#\\%s", char_page.name);
834   else if (x->type == CHAR && x->value == char_return.value) fprintf (f, "#\\%s", char_return.name);
835   else if (x->type == CHAR && x->value == char_space.value) fprintf (f, "#\\%s", char_space.name);
836   else if (x->type == CHAR) fprintf (f, "#\\%c", x->value);
837   else if (x->type == MACRO) {
838     fprintf (f, "(*macro* ");
839     display_helper (f, x->macro, cont, sep, quote);
840     fprintf (f, ")");
841   }
842   else if (x->type == NUMBER) fprintf (f, "%d", x->value);
843   else if (x->type == PAIR) {
844     if (car (x) == &scm_circular) {
845       fprintf (f, "(*circ* . #-1#)");
846       return &scm_unspecified;
847     }
848     if (car (x) == &scm_closure) {
849       fprintf (f, "(*closure* . #-1#)");
850       return &scm_unspecified;
851     }
852     if (car (x) == &scm_quote) {
853       fprintf (f, "'");
854       return display_helper (f, car (cdr (x)), cont, "", true);
855     }
856     if (!cont) fprintf (f, "(");
857     display_ (f, car (x));
858     if (cdr (x)->type == PAIR)
859       display_helper (f, cdr (x), true, " ", false);
860     else if (cdr (x) != &scm_nil) {
861       fprintf (f, " . ");
862       display_ (f, cdr (x));
863     }
864     if (!cont) fprintf (f, ")");
865   }
866   else if (x->type == VECTOR) {
867     fprintf (f, "#(", x->length);
868     for (int i = 0; i < x->length; i++) {
869       if (x->vector[i].type == VECTOR
870           || (x->vector[i].type == REF
871               && x->vector[i].ref->type == VECTOR))
872         fprintf (f, "%s#(...)", i ? " " : "");
873       else
874         display_helper (f, &x->vector[i], false, i ? " " : "", false);
875     }
876     fprintf (f, ")");
877   }
878   else if (x->type == REF) display_helper (f, x->ref, cont, "", true);
879   else if (builtin_p (x) == &scm_t) fprintf (f, "#<procedure %s>", x->name);
880   else if (x->type != PAIR && x->string) {
881     scm *p = x->string;
882     assert (p);
883     while (p != &scm_nil) {
884       assert (p->car->type == CHAR);
885       fputc (p->car->value, f);
886       p = p->cdr;
887     }
888   }
889   else if (x->type != PAIR && x->name) fprintf (f, "%s", x->name);
890
891   return &scm_unspecified;
892 }
893
894 // READ
895
896 FILE *g_stdin;
897 int
898 getchar ()
899 {
900   return getc (g_stdin);
901 }
902
903 int
904 ungetchar (int c)
905 {
906   return ungetc (c, g_stdin);
907 }
908
909 int
910 peekchar ()
911 {
912   int c = getchar ();
913   ungetchar (c);
914   return c;
915 }
916
917 scm *
918 peek_char ()
919 {
920   return make_char (peekchar ());
921 }
922
923 scm *
924 read_char ()
925 {
926   return make_char (getchar ());
927 }
928
929 scm *
930 write_char (scm *x) ///((args . n))
931 {
932   scm *c = car (x);
933   scm *p = cdr (x);
934   int fd = 1;
935   if (p->type == PAIR && p->car->type == NUMBER) fd = p->car->value;
936   FILE *f = fd == 1 ? stdout : stderr;
937   assert (c->type == NUMBER || c->type == CHAR);
938   fputc (c->value, f);
939   return c;
940 }
941
942 scm *
943 unget_char (scm *c)
944 {
945   assert (c->type == NUMBER || c->type == CHAR);
946   ungetchar (c->value);
947   return c;
948 }
949
950 int
951 readcomment (int c)
952 {
953   if (c == '\n') return c;
954   return readcomment (getchar ());
955 }
956
957 int
958 readblock (int c)
959 {
960   if (c == '!' && peekchar () == '#') return getchar ();
961   return readblock (getchar ());
962 }
963
964 scm *
965 readword (int c, scm *w, scm *a)
966 {
967   if (c == EOF && w == &scm_nil) return &scm_nil;
968   if (c == '\n' && w == &scm_nil) return readword (getchar (), w, a);
969   if (c == '\n' && w->car->value == '.' && w->cdr == &scm_nil) return &scm_dot;
970   if (c == EOF || c == '\n') return lookup (w, a);
971   if (c == ' ') return readword ('\n', w, a);
972   if (c == '"' && w == &scm_nil) return readstring ();
973   if (c == '"') {ungetchar (c); return lookup (w, a);}
974   if (c == '(' && w == &scm_nil) return readlist (a);
975   if (c == '(') {ungetchar (c); return lookup (w, a);}
976   if (c == ')' && w == &scm_nil) {ungetchar (c); return &scm_nil;}
977   if (c == ')') {ungetchar (c); return lookup (w, a);}
978   if (c == ',' && peekchar () == '@') {getchar (); return cons (lookup (symbol_unquote_splicing.string, a),
979                                                                    cons (readword (getchar (), w, a),
980                                                                          &scm_nil));}
981   if ((c == '\''
982        || c == '`'
983        || c == ',')
984       && w == &scm_nil) {return cons (lookup_char (c, a),
985                                      cons (readword (getchar (), w, a),
986                                            &scm_nil));}
987   if (c == '#' && peekchar () == ',' && w == &scm_nil) {
988     getchar ();
989     if (peekchar () == '@'){getchar (); return cons (lookup (symbol_unsyntax_splicing.string, a),
990                                                      cons (readword (getchar (), w, a),
991                                                            &scm_nil));}
992     return cons (lookup (symbol_unsyntax.string, a), cons (readword (getchar (), w, a), &scm_nil));
993   }
994   if (c == '#' && (peekchar () == '\'' || peekchar () == '`') && w == &scm_nil) {
995     c = getchar ();
996     return cons (lookup (cons (make_char ('#'), cons (make_char (c), &scm_nil)), a),
997                  cons (readword (getchar (), w, a), &scm_nil));}
998   if (c == ';') {readcomment (c); return readword ('\n', w, a);}
999   if (c == '#' && peekchar () == 'x') {getchar (); return read_hex ();}
1000   if (c == '#' && peekchar () == '\\') {getchar (); return read_character ();}
1001   if (c == '#' && w == &scm_nil && peekchar () == '(') {getchar (); return list_to_vector (readlist (a));}
1002   if (c == '#' && peekchar () == '(') {ungetchar (c); return lookup (w, a);}
1003   if (c == '#' && peekchar () == '!') {getchar (); readblock (getchar ()); return readword (getchar (), w, a);}
1004   return readword (getchar (), append2 (w, cons (make_char (c), &scm_nil)), a);
1005 }
1006
1007 scm *
1008 read_hex ()
1009 {
1010   int n = 0;
1011   int c = peekchar ();
1012   while ((c >= '0' && c <= '9')
1013          || (c >= 'A' && c <= 'F')
1014          || (c >= 'a' && c <= 'f')) {
1015     n <<= 4;
1016     if (c >= 'a') n += c - 'a' + 10;
1017     else if (c >= 'A') n += c - 'A' + 10;
1018     else n+= c - '0';
1019     getchar ();
1020     c = peekchar ();
1021   }
1022   return make_number (n);
1023 }
1024
1025 scm *
1026 read_character ()
1027 {
1028   int c = getchar ();
1029   if (c >= '0' && c <= '7'
1030       && peekchar () >= '0' && peekchar () <= '7') {
1031     c = c - '0';
1032     while (peekchar () >= '0' && peekchar () <= '7') {
1033       c <<= 3;
1034       c += getchar () - '0';
1035     }
1036   }
1037   else if (c >= 'a' && c <= 'z'
1038       && peekchar () >= 'a' && peekchar () <= 'z') {
1039     char buf[10];
1040     char *p = buf;
1041     *p++ = c;
1042     while (peekchar () >= 'a' && peekchar () <= 'z') {
1043       *p++ = getchar ();
1044     }
1045     *p = 0;
1046     if (!strcmp (buf, char_nul.name)) c = char_nul.value;
1047     else if (!strcmp (buf, char_backspace.name)) c = char_backspace.value;
1048     else if (!strcmp (buf, char_tab.name)) c = char_tab.value;
1049     else if (!strcmp (buf, char_newline.name)) c = char_newline.value;
1050     else if (!strcmp (buf, char_vt.name)) c = char_vt.value;
1051     else if (!strcmp (buf, char_page.name)) c = char_page.value;
1052     else if (!strcmp (buf, char_return.name)) c = char_return.value;
1053     else if (!strcmp (buf, char_space.name)) c = char_space.value;
1054     else {
1055       fprintf (stderr, "char not supported: %s\n", buf);
1056       assert (!"char not supported");
1057     }
1058   }
1059   return make_char (c);
1060 }
1061
1062 scm *
1063 append_char (scm *x, int i)
1064 {
1065   return append2 (x, cons (make_char (i), &scm_nil));
1066 }
1067
1068 scm *
1069 readstring ()
1070 {
1071   scm *p = &scm_nil;
1072   int c = getchar ();
1073   while (true) {
1074     if (c == '"') break;
1075     if (c == '\\' && peekchar () == '"') p = append_char (p, getchar ());
1076     else if (c == '\\' && peekchar () == 'n') {getchar (); p = append_char (p, '\n');}
1077     else if (c == EOF) assert (!"EOF in string");
1078     else p = append_char (p, c);
1079     c = getchar ();
1080   }
1081   return make_string (p);
1082 }
1083
1084 int
1085 eat_whitespace (int c)
1086 {
1087   while (c == ' ' || c == '\t' || c == '\n') c = getchar ();
1088   if (c == ';') return eat_whitespace (readcomment (c));
1089   if (c == '#' && peekchar () == '!') {getchar (); readblock (getchar ()); return eat_whitespace (getchar ());}
1090   return c;
1091 }
1092
1093 scm *
1094 readlist (scm *a)
1095 {
1096   int c = getchar ();
1097   c = eat_whitespace (c);
1098   if (c == ')') return &scm_nil;
1099   scm *w = readword (c, &scm_nil, a);
1100   if (w == &scm_dot)
1101     return car (readlist (a));
1102   return cons (w, readlist (a));
1103 }
1104
1105 scm *
1106 read_env (scm *a)
1107 {
1108   return readword (getchar (), &scm_nil, a);
1109 }
1110
1111 scm *
1112 add_environment (scm *a, char const *name, scm *x)
1113 {
1114   return cons (cons (make_symbol (cstring_to_list (name)), x), a);
1115 }
1116
1117 scm *
1118 mes_environment () ///((internal))
1119 {
1120   scm *a = &scm_nil;
1121
1122   #include "mes.symbols.i"
1123
1124 #if BOOT
1125   symbols = cons (&scm_label, symbols);
1126   a = cons (cons (&scm_label, &scm_t), a);
1127 #endif
1128   a = cons (cons (&symbol_begin, &scm_begin), a);
1129
1130 #include "string.environment.i"
1131 #include "math.environment.i"
1132 #include "lib.environment.i"
1133 #include "mes.environment.i"
1134 #include "define.environment.i"
1135 #include "type.environment.i"
1136
1137   a = add_environment (a, "sc-expand", &scm_f);
1138
1139   a = cons (cons (&scm_closure, a), a);
1140   return a;
1141 }
1142
1143 scm *
1144 make_lambda (scm *args, scm *body)
1145 {
1146   return cons (&symbol_lambda, cons (args, body));
1147 }
1148
1149 scm *
1150 make_closure (scm *args, scm *body, scm *a)
1151 {
1152   return cons (&scm_closure, cons (cons (&scm_circular, a), cons (args, body)));
1153 }
1154
1155 scm *
1156 lookup_macro (scm *x, scm *a)
1157 {
1158   if (x->type != SYMBOL) return &scm_f;
1159   scm *m = assq_ref_cache (x, a);
1160   if (macro_p (m) == &scm_t) return m->macro;
1161   return &scm_f;
1162 }
1163
1164 scm *
1165 read_file_env (scm *e, scm *a)
1166 {
1167   if (e == &scm_nil) return e;
1168   return cons (e, read_file_env (read_env (a), a));
1169 }
1170
1171 scm *
1172 load_file_env (scm *a)
1173 {
1174   return begin_env (read_file_env (read_env (a), a), a);
1175 }
1176
1177 #include "type.c"
1178 #include "define.c"
1179 #include "lib.c"
1180 #include "math.c"
1181 #include "quasiquote.c"
1182 #include "string.c"
1183
1184 int
1185 main (int argc, char *argv[])
1186 {
1187   if (argc > 1 && !strcmp (argv[1], "--help")) return puts ("Usage: mes < FILE\n");
1188   if (argc > 1 && !strcmp (argv[1], "--version")) return puts ("Mes 0.1\n");
1189   g_stdin = stdin;
1190   scm *a = mes_environment ();
1191   display_ (stderr, load_file_env (a));
1192   fputs ("", stderr);
1193   return 0;
1194 }