core: Simplify lookup.
[mes.git] / mes.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #define _GNU_SOURCE
22 #include <assert.h>
23 #include <ctype.h>
24 #include <errno.h>
25 #include <limits.h>
26 #include <stdio.h>
27 #include <string.h>
28 #include <stdlib.h>
29 #include <stdbool.h>
30
31 #define DEBUG 0
32 #define FIXED_PRIMITIVES 1
33
34 int ARENA_SIZE = 100000;
35 int MAX_ARENA_SIZE = 20000000;
36 int GC_SAFETY = 100;
37
38 typedef int SCM;
39 enum type_t {CHAR, FUNCTION, KEYWORD, MACRO, NUMBER, PAIR, SPECIAL, STRING, SYMBOL, REF, VALUES, VECTOR, BROKEN_HEART};
40 typedef SCM (*function0_t) (void);
41 typedef SCM (*function1_t) (SCM);
42 typedef SCM (*function2_t) (SCM, SCM);
43 typedef SCM (*function3_t) (SCM, SCM, SCM);
44 typedef SCM (*functionn_t) (SCM);
45 typedef struct function_t {
46   union {
47     function0_t function0;
48     function1_t function1;
49     function2_t function2;
50     function3_t function3;
51     functionn_t functionn;
52   };
53   int arity;
54 } function;
55 struct scm_t;
56 typedef struct scm_t {
57   enum type_t type;
58   union {
59     char const *name;
60     SCM string;
61     SCM car;
62     SCM ref;
63     int length;
64   };
65   union {
66     int value;
67     int function;
68     SCM cdr;
69     SCM macro;
70     SCM vector;
71     int hits;
72   };
73 } scm;
74
75 scm scm_nil = {SPECIAL, "()"};
76 scm scm_f = {SPECIAL, "#f"};
77 scm scm_t = {SPECIAL, "#t"};
78 scm scm_dot = {SPECIAL, "."};
79 scm scm_arrow = {SPECIAL, "=>"};
80 scm scm_undefined = {SPECIAL, "*undefined*"};
81 scm scm_unspecified = {SPECIAL, "*unspecified*"};
82 scm scm_closure = {SPECIAL, "*closure*"};
83 scm scm_circular = {SPECIAL, "*circular*"};
84 scm scm_label = {SPECIAL, "label"};
85 scm scm_begin = {SPECIAL, "*begin*"};
86
87 scm scm_symbol_lambda = {SYMBOL, "lambda"};
88 scm scm_symbol_begin = {SYMBOL, "begin"};
89 scm scm_symbol_if = {SYMBOL, "if"};
90 scm scm_symbol_define = {SYMBOL, "define"};
91 scm scm_symbol_define_macro = {SYMBOL, "define-macro"};
92 scm scm_symbol_set_x = {SYMBOL, "set!"};
93
94 scm scm_symbol_quote = {SYMBOL, "quote"};
95 scm scm_symbol_quasiquote = {SYMBOL, "quasiquote"};
96 scm scm_symbol_unquote = {SYMBOL, "unquote"};
97 scm scm_symbol_unquote_splicing = {SYMBOL, "unquote-splicing"};
98
99 scm scm_symbol_sc_expand = {SYMBOL, "sc-expand"};
100 scm scm_symbol_macro_expand = {SYMBOL, "macro-expand"};
101 scm scm_symbol_sc_expander_alist = {SYMBOL, "*sc-expander-alist*"};
102 scm scm_symbol_noexpand = {SYMBOL, "noexpand"};
103 scm scm_symbol_syntax = {SYMBOL, "syntax"};
104 scm scm_symbol_quasisyntax = {SYMBOL, "quasisyntax"};
105 scm scm_symbol_unsyntax = {SYMBOL, "unsyntax"};
106 scm scm_symbol_unsyntax_splicing = {SYMBOL, "unsyntax-splicing"};
107
108 scm scm_symbol_call_with_values = {SYMBOL, "call-with-values"};
109 scm scm_symbol_current_module = {SYMBOL, "current-module"};
110 scm scm_symbol_primitive_load = {SYMBOL, "primitive-load"};
111 scm scm_symbol_read_input_file = {SYMBOL, "read-input-file"};
112
113 scm scm_symbol_car = {SYMBOL, "car"};
114 scm scm_symbol_cdr = {SYMBOL, "cdr"};
115 scm scm_symbol_null_p = {SYMBOL, "null?"};
116 scm scm_symbol_eq_p = {SYMBOL, "eq?"};
117 scm scm_symbol_cons = {SYMBOL, "cons"};
118
119 scm char_eof = {CHAR, .name="*eof*", .value=-1};
120 scm char_nul = {CHAR, .name="nul", .value=0};
121 scm char_alarm = {CHAR, .name="alarm", .value=8};
122 scm char_backspace = {CHAR, .name="backspace", .value=8};
123 scm char_tab = {CHAR, .name="tab", .value=9};
124 scm char_newline = {CHAR, .name="newline", .value=10};
125 scm char_vtab = {CHAR, .name="vtab", .value=11};
126 scm char_page = {CHAR, .name="page", .value=12};
127 scm char_return = {CHAR, .name="return", .value=13};
128 scm char_space = {CHAR, .name="space", .value=32};
129
130 scm g_free = {NUMBER, .value=0};
131 scm *g_cells;
132 scm *g_news = 0;
133
134 #include "mes.symbols.h"
135
136 SCM tmp;
137 SCM tmp_num;
138 SCM tmp_num2;
139 SCM tmp_num3;
140 SCM tmp_num4;
141
142 function functions[200];
143 int g_function = 0;
144
145 SCM g_symbols = 0;
146 SCM stack = 0;
147 SCM r0 = 0; // a/env
148 SCM r1 = 0; // param 1
149 SCM r2 = 0; // param 2
150 SCM r3 = 0; // param 3
151
152 #include "display.h"
153 #include "lib.h"
154 #include "math.h"
155 #include "mes.h"
156 #include "posix.h"
157 #include "reader.h"
158 #include "string.h"
159 #include "type.h"
160
161 #define CAR(x) g_cells[x].car
162 #define CDR(x) g_cells[x].cdr
163 #define HITS(x) g_cells[x].hits
164 #define LENGTH(x) g_cells[x].length
165 #define NAME(x) g_cells[x].name
166 #define STRING(x) g_cells[x].string
167 #define TYPE(x) g_cells[x].type
168 #define MACRO(x) g_cells[x].macro
169 #define REF(x) g_cells[x].ref
170 #define VALUE(x) g_cells[x].value
171 #define VECTOR(x) g_cells[x].vector
172 #define FUNCTION(x) functions[g_cells[x].function]
173 #define NCAR(x) g_news[x].car
174 #define NTYPE(x) g_news[x].type
175
176 #define CAAR(x) CAR (CAR (x))
177 #define CDAR(x) CDR (CAR (x))
178 #define CAAR(x) CAR (CAR (x))
179 #define CADAR(x) CAR (CDR (CAR (x)))
180 #define CADDR(x) CAR (CDR (CDR (x)))
181 #define CDADAR(x) CAR (CDR (CAR (CDR (x))))
182 #define CADR(x) CAR (CDR (x))
183
184 SCM display_ (FILE* f, SCM x);
185 SCM vm_call (function0_t f, SCM p1, SCM p2, SCM a);
186
187 SCM
188 alloc (int n)
189 {
190   assert (g_free.value + n < ARENA_SIZE);
191   SCM x = g_free.value;
192   g_free.value += n;
193   return x;
194 }
195
196 SCM
197 make_cell (SCM type, SCM car, SCM cdr)
198 {
199   SCM x = alloc (1);
200   assert (TYPE (type) == NUMBER);
201   TYPE (x) = VALUE (type);
202   if (VALUE (type) == CHAR || VALUE (type) == NUMBER) {
203     if (car) CAR (x) = CAR (car);
204     if (cdr) CDR (x) = CDR (cdr);
205   } else if (VALUE (type) == FUNCTION) {
206     if (car) CAR (x) = car;
207     if (cdr) CDR (x) = CDR (cdr);
208   } else {
209     CAR (x) = car;
210     CDR (x) = cdr;
211   }
212   return x;
213 }
214
215 SCM
216 cons (SCM x, SCM y)
217 {
218   g_cells[tmp_num].value = PAIR;
219   return make_cell (tmp_num, x, y);
220 }
221
222 SCM
223 car (SCM x)
224 {
225   assert (TYPE (x) == PAIR);
226   return CAR (x);
227 }
228
229 SCM
230 cdr (SCM x)
231 {
232   assert (TYPE (x) == PAIR);
233   return CDR (x);
234 }
235
236 SCM
237 eq_p (SCM x, SCM y)
238 {
239   return (x == y
240           || ((TYPE (x) == KEYWORD && TYPE (y) == KEYWORD
241                && STRING (x) == STRING (y)))
242           || (TYPE (x) == CHAR && TYPE (y) == CHAR
243               && VALUE (x) == VALUE (y))
244           || (TYPE (x) == NUMBER && TYPE (y) == NUMBER
245               && VALUE (x) == VALUE (y)))
246     ? cell_t : cell_f;
247 }
248
249 SCM
250 set_car_x (SCM x, SCM e)
251 {
252   assert (TYPE (x) == PAIR);
253   CAR (x) = e;
254   return cell_unspecified;
255 }
256
257 SCM
258 set_cdr_x (SCM x, SCM e)
259 {
260   assert (TYPE (x) == PAIR);
261   CDR (x) = e;
262   return cell_unspecified;
263 }
264
265 SCM
266 set_env_x (SCM x, SCM e, SCM a)
267 {
268   SCM p = assert_defined (x, assq (x, a));
269   return set_cdr_x (p, e);
270 }
271
272 SCM
273 quote (SCM x)
274 {
275   return cons (cell_symbol_quote, x);
276 }
277
278 SCM
279 quasiquote (SCM x)
280 {
281   return cons (cell_symbol_quasiquote, x);
282 }
283
284 SCM
285 quasisyntax (SCM x)
286 {
287   return cons (cell_symbol_quasisyntax, x);
288 }
289
290 SCM
291 pairlis (SCM x, SCM y, SCM a)
292 {
293   if (x == cell_nil)
294     return a;
295   if (pair_p (x) == cell_f)
296     return cons (cons (x, y), a);
297   return cons (cons (car (x), car (y)),
298                pairlis (cdr (x), cdr (y), a));
299 }
300
301 SCM
302 assq (SCM x, SCM a)
303 {
304   while (a != cell_nil && eq_p (x, CAAR (a)) == cell_f)
305     {
306       if (TYPE (a) == BROKEN_HEART || TYPE (CAR (a)) == BROKEN_HEART)
307         fprintf (stderr, "oops, broken heart\n");
308       a = CDR (a);
309     }
310   return a != cell_nil ? car (a) : cell_f;
311 }
312
313 SCM
314 assq_ref_cache (SCM x, SCM a)
315 {
316   x = assq (x, a);
317   if (x == cell_f) return cell_undefined;
318   return cdr (x);
319 }
320
321 SCM
322 assert_defined (SCM x, SCM e)
323 {
324   if (e == cell_undefined)
325     {
326       fprintf (stderr, "eval: unbound variable:");
327       display_ (stderr, x);
328       fprintf (stderr, "\n");
329       assert (!"unbound variable");
330     }
331   return e;
332 }
333
334 enum eval_apply_t {EVLIS, APPLY, EVAL, MACRO_EXPAND, BEGIN, IF, CALL_WITH_VALUES};
335 enum eval_apply_t g_target;
336
337 SCM
338 call_lambda (SCM e, SCM x, SCM aa, SCM a) ///((internal))
339 {
340   SCM cl = cons (cons (cell_closure, x), x);
341   r1 = e;
342   r0 = cl;
343   r2 = a;
344   r3 = aa;
345   return cell_unspecified;
346 }
347
348 SCM
349 eval_apply ()
350 {
351   switch (g_target)
352     {
353     case EVLIS: goto evlis;
354     case APPLY: goto apply;
355     case EVAL: goto eval;
356     case MACRO_EXPAND: goto macro_expand;
357     case BEGIN: goto begin;
358     case IF: goto label_if;
359     case CALL_WITH_VALUES: goto call_with_values;
360     }
361
362  evlis:
363   if (r1 == cell_nil) return cell_nil;
364   if (TYPE (r1) != PAIR) goto eval;
365   r2 = eval_env (car (r1), r0);
366   r1 = evlis_env (cdr (r1), r0);
367   return cons (r2, r1);
368
369  apply:
370   if (TYPE (r1) != PAIR)
371     {
372       if (TYPE (r1) == FUNCTION) return call (r1, r2);
373       if (r1 == cell_symbol_call_with_values)
374         {
375           r1 = car (r2);
376           r2 = cadr (r2);
377           goto call_with_values;
378         }
379       if (r1 == cell_symbol_current_module) return r0;
380     }
381   else
382     switch (car (r1))
383       {
384       case cell_symbol_lambda:
385         {
386           SCM args = cadr (r1);
387           SCM body = cddr (r1);
388           SCM p = pairlis (args, r2, r0);
389           call_lambda (body, p, p, r0);
390           goto begin;
391         }
392       case cell_closure:
393         {
394           SCM args = caddr (r1);
395           SCM body = cdddr (r1);
396           SCM aa = cdadr (r1);
397           aa = cdr (aa);
398           SCM p = pairlis (args, r2, aa);
399           call_lambda (body, p, aa, r0);
400           goto begin;
401         }
402 #if BOOT
403       case cell_symbol_label:
404         {
405           r0 = cons (cons (cadr (r1), caddr (r1)), r0);
406           r1 = caddr (r1);
407           goto apply;
408         }
409 #endif
410       }
411   SCM e = eval_env (r1, r0);
412   char const* type = 0;
413   if (e == cell_f || e == cell_t) type = "bool";
414   if (TYPE (e) == CHAR) type = "char";
415   if (TYPE (e) == NUMBER) type = "number";
416   if (TYPE (e) == STRING) type = "string";
417   if (e == cell_unspecified) type = "*unspecified*";
418   if (e == cell_undefined) type =  "*undefined*";
419   if (type)
420     {
421       fprintf (stderr, "cannot apply: %s: ", type);
422       display_ (stderr, e);
423       fprintf (stderr, " [");
424       display_ (stderr, r1);
425       fprintf (stderr, "]\n");
426       assert (!"cannot apply");
427     }
428   r1 = e;
429   goto apply;
430
431  eval:
432   switch (TYPE (r1))
433     {
434     case PAIR:
435       {
436         switch (car (r1))
437           {
438 #if FIXED_PRIMITIVES
439           case cell_symbol_car: return car (eval_env (CADR (r1), r0));
440           case cell_symbol_cdr: return cdr (eval_env (CADR (r1), r0));
441           case cell_symbol_cons: {SCM m = evlis_env (CDR (r1), r0);
442               return cons (CAR (m), CADR (m));}
443           case cell_symbol_null_p: return null_p (eval_env (CADR (r1), r0));
444 #endif // FIXED_PRIMITIVES
445           case cell_symbol_quote: return cadr (r1);
446           case cell_symbol_begin: goto begin;
447           case cell_symbol_lambda:
448             return make_closure (cadr (r1), cddr (r1), assq (cell_closure, r0));
449           case cell_closure: return r1;
450           case cell_symbol_if: {r1=cdr (r1); goto label_if;}
451           case cell_symbol_set_x: {
452             SCM x = eval_env (caddr (r1), r0); return set_env_x (cadr (r1), x, r0);
453           }
454           default: {
455             SCM x = macro_expand_env (r1, r0);
456             if (x != r1)
457               {
458                 if (TYPE (x) == PAIR)
459                   {
460                     set_cdr_x (r1, cdr (x));
461                     set_car_x (r1, car (x));
462                   }
463                 r1 = x;
464                 goto eval;
465               }
466             SCM m = evlis_env (CDR (r1), r0);
467             r1 = car (r1);
468             r2 = m;
469             goto apply;
470           }
471           }
472       }
473     case SYMBOL: return assert_defined (r1, assq_ref_cache (r1, r0));
474     default: return r1;
475     }
476
477  macro_expand:
478   if (TYPE (CAR (r1)) == STRING && string_to_symbol (CAR (r1)) == cell_symbol_noexpand)
479     return cadr (r1);
480
481   SCM macro;
482   SCM expanders;
483   if (TYPE (r1) == PAIR
484       && (macro = lookup_macro (car (r1), r0)) != cell_f)
485     {
486       r2 = CDR (r1);
487       r1 = macro;
488       goto apply;
489     }
490   else if (TYPE (r1) == PAIR
491            && TYPE (CAR (r1)) == SYMBOL
492            && ((expanders = assq_ref_cache (cell_symbol_sc_expander_alist, r0)) != cell_undefined)
493            && ((macro = assq (CAR (r1), expanders)) != cell_f))
494     {
495       SCM sc_expand = assq_ref_cache (cell_symbol_macro_expand, r0);
496       if (sc_expand != cell_undefined && sc_expand != cell_f)
497         {
498           r2 = cons (r1, cell_nil);
499           r1 = sc_expand;
500           goto apply;
501         }
502     }
503   return r1;
504
505   SCM r;
506  begin:
507   r = cell_unspecified;
508   while (r1 != cell_nil) {
509     if (TYPE (r1) == PAIR && TYPE (CAR (r1)) == PAIR)
510       {
511         if (caar (r1) == cell_symbol_begin)
512           r1 = append2 (cdar (r1), cdr (r1));
513         else if (caar (r1) == cell_symbol_primitive_load)
514           {
515             SCM f = read_input_file_env (r0);
516             r1 = append2 (f, cdr (r1));
517           }
518       }
519     if (CDR (r1) == cell_nil)
520       {
521         r1 = car (r1);
522         goto eval;
523       }
524     r = eval_env (car (r1), r0);
525     r1 = CDR (r1);
526   }
527   return r;
528
529   SCM x;
530  label_if:
531   x = eval_env (car (r1), r0);
532   if (x != cell_f)
533     {
534       r1 = cadr (r1);
535       goto eval;
536     }
537   if (cddr (r1) != cell_nil)
538     {
539       r1 = caddr (r1);
540       goto eval;
541     }
542   return cell_unspecified;
543
544   SCM v;
545  call_with_values:
546   v = apply_env (r1, cell_nil, r0);
547   if (TYPE (v) == VALUES)
548     v = CDR (v);
549   r1 = r2;
550   r2 = v;
551   goto apply;
552 }
553
554 SCM
555 call (SCM fn, SCM x)
556 {
557   if ((FUNCTION (fn).arity > 0 || FUNCTION (fn).arity == -1)
558       && x != cell_nil && TYPE (CAR (x)) == VALUES)
559     x = cons (CADAR (x), CDR (x));
560   if ((FUNCTION (fn).arity > 1 || FUNCTION (fn).arity == -1)
561       && x != cell_nil && TYPE (CDR (x)) == PAIR && TYPE (CADR (x)) == VALUES)
562     x = cons (CAR (x), cons (CDADAR (x), CDR (x)));
563   switch (FUNCTION (fn).arity)
564     {
565     case 0: return FUNCTION (fn).function0 ();
566     case 1: return FUNCTION (fn).function1 (car (x));
567     case 2: return FUNCTION (fn).function2 (car (x), cadr (x));
568     case 3: return FUNCTION (fn).function3 (car (x), cadr (x), caddr (x));
569     case -1: return FUNCTION (fn).functionn (x);
570     }
571   return cell_unspecified;
572 }
573
574 SCM
575 gc_frame (SCM stack)
576 {
577   SCM frame = car (stack);
578   r1 = car (frame);
579   r2 = cadr (frame);
580   r3 = caddr (frame);
581   r0 = cadddr (frame);
582   return frame;
583 }
584
585 SCM
586 gc_stack (SCM a)
587 {
588   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
589   stack = cons (frame, stack);
590   stack = gc (stack);
591   gc_frame (stack);
592   stack = cdr (stack);
593   return stack;
594 }
595
596 SCM
597 vm_call (function0_t f, SCM p1, SCM p2, SCM a)
598 {
599   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
600   stack = cons (frame, stack);
601   r1 = p1;
602   r2 = p2;
603   r0 = a;
604   if (g_free.value + GC_SAFETY > ARENA_SIZE)
605     gc_stack (stack);
606
607   SCM r = f ();
608   frame = gc_frame (stack);
609   stack = cdr (stack);
610   return r;
611 }
612
613 SCM
614 evlis_env (SCM m, SCM a)
615 {
616   g_target = EVLIS;
617   return vm_call (eval_apply, m, cell_undefined, a);
618 }
619
620 SCM
621 apply_env (SCM fn, SCM x, SCM a)
622 {
623   g_target = APPLY;
624   return vm_call (eval_apply, fn, x, a);
625 }
626
627 SCM
628 eval_env (SCM e, SCM a)
629 {
630   g_target = EVAL;
631   return vm_call (eval_apply, e, cell_undefined, a);
632 }
633
634 SCM
635 macro_expand_env (SCM e, SCM a)
636 {
637   g_target = MACRO_EXPAND;
638   return vm_call (eval_apply, e, cell_undefined, a);
639 }
640
641 SCM
642 begin_env (SCM e, SCM a)
643 {
644   g_target = BEGIN;
645   return vm_call (eval_apply, e, cell_undefined, a);
646 }
647
648 SCM
649 if_env (SCM e, SCM a)
650 {
651   g_target = IF;
652   return vm_call (eval_apply, e, cell_undefined, a);
653 }
654
655 SCM
656 call_with_values_env (SCM producer, SCM consumer, SCM a)
657 {
658   g_target = CALL_WITH_VALUES;
659   return vm_call (eval_apply, producer, consumer, a);
660 }
661
662 SCM
663 append2 (SCM x, SCM y)
664 {
665   if (x == cell_nil) return y;
666   assert (TYPE (x) == PAIR);
667   return cons (car (x), append2 (cdr (x), y));
668 }
669
670 SCM
671 append (SCM x) ///((arity . n))
672  {
673   if (x == cell_nil) return cell_nil;
674   if (cdr (x) == cell_nil) return car (x);
675   return append2 (car (x), append (cdr (x)));
676  }
677
678 SCM
679 make_char (int x)
680 {
681   g_cells[tmp_num].value = CHAR;
682   g_cells[tmp_num2].value = x;
683   return make_cell (tmp_num, tmp_num2, tmp_num2);
684 }
685
686 SCM
687 make_function (SCM name, SCM id, SCM arity)
688 {
689   g_cells[tmp_num3].value = FUNCTION;
690   function *f = (function*)malloc (sizeof (function));
691   f->arity = VALUE (arity);
692   g_cells[tmp_num4].value = (long)f;
693   return make_cell (tmp_num3, name, tmp_num4);
694 }
695
696 SCM
697 make_keyword (SCM s)
698 {
699   SCM x = lookup_symbol_ (s);
700   x = x ? x : make_symbol_ (s);
701   g_cells[tmp_num].value = KEYWORD;
702   return make_cell (tmp_num, STRING (x), 0);
703 }
704
705 SCM
706 make_macro (SCM name, SCM x)
707 {
708   g_cells[tmp_num].value = MACRO;
709   return make_cell (tmp_num, STRING (name), x);
710 }
711
712 SCM
713 make_number (int x)
714 {
715   g_cells[tmp_num].value = NUMBER;
716   g_cells[tmp_num2].value = x;
717   return make_cell (tmp_num, tmp_num2, tmp_num2);
718 }
719
720 SCM
721 make_ref (SCM x)
722 {
723   g_cells[tmp_num].value = REF;
724   return make_cell (tmp_num, x, x);
725 }
726
727 SCM
728 make_string (SCM x)
729 {
730   g_cells[tmp_num].value = STRING;
731   return make_cell (tmp_num, x, 0);
732 }
733
734 SCM
735 cstring_to_list (char const* s)
736 {
737   SCM p = cell_nil;
738   int i = strlen (s);
739   while (i--)
740     p = cons (make_char (s[i]), p);
741   return p;
742 }
743
744 SCM
745 null_p (SCM x)
746 {
747   return x == cell_nil ? cell_t : cell_f;
748 }
749
750 SCM
751 make_symbol_ (SCM s)
752 {
753   g_cells[tmp_num].value = SYMBOL;
754   SCM x = make_cell (tmp_num, s, 0);
755   g_symbols = cons (x, g_symbols);
756   return x;
757 }
758
759 SCM
760 make_symbol (SCM s)
761 {
762   SCM x = lookup_symbol_ (s);
763   return x ? x : make_symbol_ (s);
764 }
765
766 SCM
767 make_vector (SCM n)
768 {
769   int k = VALUE (n);
770   g_cells[tmp_num].value = VECTOR;
771   SCM v = alloc (k);
772   SCM x = make_cell (tmp_num, k, v);
773   for (int i=0; i<k; i++) g_cells[v+i] = g_cells[vector_entry (cell_unspecified)];
774   return x;
775 }
776
777 SCM
778 values (SCM x) ///((arity . n))
779 {
780   SCM v = cons (0, x);
781   TYPE (v) = VALUES;
782   return v;
783 }
784
785 SCM
786 vector_length (SCM x)
787 {
788   assert (TYPE (x) == VECTOR);
789   return make_number (LENGTH (x));
790 }
791
792 SCM
793 vector_ref (SCM x, SCM i)
794 {
795   assert (TYPE (x) == VECTOR);
796   assert (VALUE (i) < LENGTH (x));
797   SCM e = VECTOR (x) + VALUE (i);
798   if (TYPE (e) == REF) e = g_cells[e].ref;
799   if (TYPE (e) == CHAR) e = make_char (VALUE (e));
800   if (TYPE (e) == NUMBER) e = make_number (VALUE (e));
801   return e;
802 }
803
804 SCM
805 vector_entry (SCM x) {
806   if (TYPE (x) == PAIR || TYPE (x) == SPECIAL || TYPE (x) == STRING || TYPE (x) == SYMBOL || TYPE (x) == VECTOR) x = make_ref (x);
807   return x;
808 }
809
810 SCM
811 vector_set_x (SCM x, SCM i, SCM e)
812 {
813   assert (TYPE (x) == VECTOR);
814   assert (VALUE (i) < LENGTH (x));
815   g_cells[VECTOR (x)+g_cells[i].value] = g_cells[vector_entry (e)];
816   return cell_unspecified;
817 }
818
819 SCM
820 list_to_vector (SCM x)
821 {
822   VALUE (tmp_num) = VALUE (length (x));
823   SCM v = make_vector (tmp_num);
824   SCM p = VECTOR (v);
825   while (x != cell_nil)
826     {
827       g_cells[p++] = g_cells[vector_entry (car (x))];
828       x = cdr (x);
829     }
830   return v;
831 }
832
833 FILE *g_stdin;
834 int
835 getchar ()
836 {
837   return getc (g_stdin);
838 }
839
840 int
841 ungetchar (int c)
842 {
843   return ungetc (c, g_stdin);
844 }
845
846 int
847 peekchar ()
848 {
849   int c = getchar ();
850   ungetchar (c);
851   return c;
852 }
853
854 SCM
855 peek_byte ()
856 {
857   return make_number (peekchar ());
858 }
859
860 SCM
861 read_byte ()
862 {
863   return make_number (getchar ());
864 }
865
866 SCM
867 unread_byte (SCM i)
868 {
869   ungetchar (VALUE (i));
870   return i;
871 }
872
873 SCM
874 write_char (SCM x) ///((arity . n))
875 {
876   SCM c = car (x);
877   SCM p = cdr (x);
878   int fd = 1;
879   if (TYPE (p) == PAIR && TYPE (car (p)) == NUMBER) fd = VALUE (car (p));
880   FILE *f = fd == 1 ? stdout : stderr;
881   assert (TYPE (c) == NUMBER || TYPE (c) == CHAR);
882   fputc (VALUE (c), f);
883   return c;
884 }
885
886 SCM
887 symbol_to_list (SCM x)
888 {
889   assert (TYPE (x) == SYMBOL);
890   return STRING (x);
891 }
892
893 SCM
894 char_to_integer (SCM x)
895 {
896   assert (TYPE (x) == CHAR);
897   return make_number (VALUE (x));
898 }
899
900 SCM
901 integer_to_char (SCM x)
902 {
903   assert (TYPE (x) == NUMBER);
904   return make_char (VALUE (x));
905 }
906
907 void
908 make_tmps (scm* cells)
909 {
910   tmp = g_free.value++;
911   cells[tmp].type = CHAR;
912   tmp_num = g_free.value++;
913   cells[tmp_num].type = NUMBER;
914   tmp_num2 = g_free.value++;
915   cells[tmp_num2].type = NUMBER;
916   tmp_num3 = g_free.value++;
917   cells[tmp_num3].type = NUMBER;
918   tmp_num4 = g_free.value++;
919   cells[tmp_num4].type = NUMBER;
920 }
921
922 //\f Jam Collector
923 SCM g_symbol_max;
924 bool g_debug = false;
925
926 SCM
927 gc_up_arena ()
928 {
929   ARENA_SIZE *= 2;
930   void *p = realloc (g_cells-1, 2*ARENA_SIZE*sizeof(scm));
931   if (!p)
932     {
933       if (g_debug) fprintf (stderr, "cannot up arena: %s: arena=%d\n", strerror (errno), 2*ARENA_SIZE);
934       return cell_unspecified;
935     }
936   g_cells = (scm*)p;
937   g_cells++;
938   gc_init_news ();
939 }
940
941 SCM
942 gc ()
943 {
944   if (g_debug) fprintf (stderr, "***gc[%d]...", g_free.value);
945   g_free.value = 1;
946   if (g_cells < g_news && ARENA_SIZE < MAX_ARENA_SIZE) gc_up_arena ();
947   for (int i=g_free.value; i<g_symbol_max; i++)
948     gc_copy (i);
949   make_tmps (g_news);
950   g_symbols = gc_copy (g_symbols);
951   SCM new = gc_copy (stack);
952   if (g_debug) fprintf (stderr, "new=%d\n", new, stack);
953   stack = new;
954   return gc_loop (1);
955 }
956
957 SCM
958 gc_loop (SCM scan)
959 {
960   while (scan < g_free.value)
961     {
962       if (NTYPE (scan) == KEYWORD
963           || NTYPE (scan) == MACRO
964           || NTYPE (scan) == PAIR
965           || NTYPE (scan) == REF
966           || scan == 1 // null
967           || NTYPE (scan) == SPECIAL
968           || NTYPE (scan) == STRING
969           || NTYPE (scan) == SYMBOL)
970         {
971           SCM car = gc_copy (g_news[scan].car);
972           gc_relocate_car (scan, car);
973         }
974       if ((NTYPE (scan) == MACRO
975            || NTYPE (scan) == PAIR
976            || NTYPE (scan) == VALUES)
977           && g_news[scan].cdr) // allow for 0 terminated list of symbols
978         {
979           SCM cdr = gc_copy (g_news[scan].cdr);
980           gc_relocate_cdr (scan, cdr);
981         }
982       scan++;
983     }
984   return gc_flip ();
985 }
986
987 SCM
988 gc_copy (SCM old)
989 {
990   if (TYPE (old) == BROKEN_HEART) return g_cells[old].car;
991   SCM new = g_free.value++;
992   g_news[new] = g_cells[old];
993   if (NTYPE (new) == VECTOR)
994     {
995       g_news[new].vector = g_free.value;
996       for (int i=0; i<LENGTH (old); i++)
997         g_news[g_free.value++] = g_cells[VECTOR (old)+i];
998     }
999   g_cells[old].type = BROKEN_HEART;
1000   g_cells[old].car = new;
1001   return new;
1002 }
1003
1004 SCM
1005 gc_relocate_car (SCM new, SCM car)
1006 {
1007   g_news[new].car = car;
1008   return cell_unspecified;
1009 }
1010
1011 SCM
1012 gc_relocate_cdr (SCM new, SCM cdr)
1013 {
1014   g_news[new].cdr = cdr;
1015   return cell_unspecified;
1016 }
1017
1018 SCM
1019 gc_flip ()
1020 {
1021   scm *cells = g_cells;
1022   g_cells = g_news;
1023   g_news = cells;
1024   if (g_debug) fprintf (stderr, " => jam[%d]\n", g_free.value);
1025   return stack;
1026 }
1027
1028 SCM
1029 gc_show ()
1030 {
1031   fprintf (stderr, "cells: ");
1032   scm *t = g_cells;
1033   display_ (stderr, -1);
1034   fprintf (stderr, "\n");
1035   if (g_news)
1036     {
1037       fprintf (stderr, "news: ");
1038       g_cells = g_news;
1039       display_ (stderr, -1);
1040       fprintf (stderr, "\n");
1041     }
1042   g_cells = t;
1043   return cell_unspecified;
1044 }
1045
1046 //\f Environment setup
1047 SCM
1048 acons (SCM key, SCM value, SCM alist)
1049 {
1050   return cons (cons (key, value), alist);
1051 }
1052
1053 SCM
1054 add_environment (SCM a, char const *name, SCM x)
1055 {
1056   return acons (make_symbol (cstring_to_list (name)), x, a);
1057 }
1058
1059 SCM
1060 gc_init_cells ()
1061 {
1062   g_cells = (scm *)malloc (2*ARENA_SIZE*sizeof(scm));
1063   g_cells[0].type = VECTOR;
1064   g_cells[0].length = 1000;
1065   g_cells[0].vector = 0;
1066   g_cells++;
1067   g_cells[0].type = CHAR;
1068   g_cells[0].value = 'c';
1069 }
1070
1071 SCM
1072 gc_init_news ()
1073 {
1074   g_news = g_cells-1 + ARENA_SIZE;
1075   g_news[0].type = VECTOR;
1076   g_news[0].length = 1000;
1077   g_news[0].vector = 0;
1078   g_news++;
1079   g_news[0].type = CHAR;
1080   g_news[0].value = 'n';
1081 }
1082
1083 SCM
1084 mes_symbols () ///((internal))
1085 {
1086   gc_init_cells ();
1087   gc_init_news ();
1088
1089 #include "mes.symbols.i"
1090
1091   g_symbol_max = g_free.value;
1092   make_tmps (g_cells);
1093
1094   g_symbols = 0;
1095   for (int i=1; i<g_symbol_max; i++)
1096     g_symbols = cons (i, g_symbols);
1097
1098   SCM a = cell_nil;
1099
1100 #include "mes.symbol-names.i"
1101
1102 #if BOOT
1103   a = acons (cell_symbol_label, cell_t, a);
1104 #endif
1105   a = acons (cell_symbol_begin, cell_begin, a);
1106   a = add_environment (a, "sc-expand", cell_f);
1107   a = acons (cell_closure, a, a);
1108
1109   return a;
1110 }
1111
1112 SCM
1113 mes_builtins (SCM a)
1114 {
1115 #include "mes.i"
1116
1117 #include "display.i"
1118 #include "lib.i"
1119 #include "math.i"
1120 #include "posix.i"
1121 #include "reader.i"
1122 #include "string.i"
1123 #include "type.i"
1124
1125 #include "display.environment.i"
1126 #include "lib.environment.i"
1127 #include "math.environment.i"
1128 #include "mes.environment.i"
1129 #include "posix.environment.i"
1130 #include "reader.environment.i"
1131 #include "string.environment.i"
1132 #include "type.environment.i"
1133
1134   a = add_environment (a, "*dot*", cell_dot);
1135   a = add_environment (a, "*foo-bar-baz*", cell_nil); // FIXME: some off-by one?
1136
1137   return a;
1138 }
1139
1140 SCM
1141 mes_stack (SCM a) ///((internal))
1142 {
1143   r0 = a;
1144   r1 = make_char (0);
1145   r2 = make_char (0);
1146   r3 = make_char (0);
1147   stack = cons (cell_nil, cell_nil);
1148   return r0;
1149 }
1150
1151 SCM
1152 mes_environment () ///((internal))
1153 {
1154   SCM a = mes_symbols ();
1155   return mes_stack (a);
1156 }
1157
1158 SCM
1159 make_lambda (SCM args, SCM body)
1160 {
1161   return cons (cell_symbol_lambda, cons (args, body));
1162 }
1163
1164 SCM
1165 make_closure (SCM args, SCM body, SCM a)
1166 {
1167   return cons (cell_closure, cons (cons (cell_circular, a), cons (args, body)));
1168 }
1169
1170 SCM
1171 lookup_macro (SCM x, SCM a)
1172 {
1173   if (TYPE (x) != SYMBOL) return cell_f;
1174   SCM m = assq_ref_cache (x, a);
1175   if (macro_p (m) == cell_t) return MACRO (m);
1176   return cell_f;
1177 }
1178
1179 SCM
1180 read_input_file_env_ (SCM e, SCM a)
1181 {
1182   if (e == cell_nil) return e;
1183   return cons (e, read_input_file_env_ (read_env (a), a));
1184 }
1185
1186 SCM
1187 read_input_file_env (SCM a)
1188 {
1189   r0 = a;
1190   if (assq_ref_cache (cell_symbol_read_input_file, r0) != cell_undefined)
1191     return apply_env (cell_symbol_read_input_file, cell_nil, r0);
1192   return read_input_file_env_ (read_env (r0), r0);
1193 }
1194
1195 SCM
1196 load_env (SCM a) ///((internal))
1197 {
1198   r0 =a;
1199   g_stdin = fopen ("module/mes/read-0.mes", "r");
1200   g_stdin = g_stdin ? g_stdin : fopen (PREFIX "module/mes/read-0.mes", "r");
1201   if (!g_function) r0 = mes_builtins (r0);
1202   r3 = read_input_file_env (r0);
1203   g_stdin = stdin;
1204   return r3;
1205 }
1206
1207 SCM
1208 bload_env (SCM a) ///((internal))
1209 {
1210   g_stdin = fopen ("module/mes/read-0.mo", "r");
1211   g_stdin = g_stdin ? g_stdin : fopen (PREFIX "module/mes/read-0.mo", "r");
1212   char *p = (char*)g_cells;
1213   assert (getchar () == 'M');
1214   assert (getchar () == 'E');
1215   assert (getchar () == 'S');
1216   stack = getchar () << 8;
1217   stack += getchar ();
1218   int c = getchar ();
1219   while (c != EOF)
1220     {
1221       *p++ = c;
1222       c = getchar ();
1223     }
1224   g_free.value = (p-(char*)g_cells) / sizeof (scm);
1225   gc_frame (stack);
1226   g_symbols = r1;
1227   g_stdin = stdin;
1228
1229   r0 = mes_builtins (r0);
1230   return r3;
1231 }
1232
1233 int
1234 dump ()
1235 {
1236   r1 = g_symbols;
1237   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
1238   stack = cons (frame, stack);
1239   stack = gc (stack);
1240   gc_frame (stack);
1241   char *p = (char*)g_cells;
1242   fputc ('M', stdout);
1243   fputc ('E', stdout);
1244   fputc ('S', stdout);
1245   fputc (stack >> 8, stdout);
1246   fputc (stack % 256, stdout);
1247   for (int i=0; i<g_free.value * sizeof(scm); i++)
1248     fputc (*p++, stdout);
1249   return 0;
1250 }
1251
1252 #include "type.c"
1253 #include "display.c"
1254 #include "lib.c"
1255 #include "math.c"
1256 #include "posix.c"
1257 #include "reader.c"
1258 #include "string.c"
1259
1260 int
1261 main (int argc, char *argv[])
1262 {
1263   g_debug = getenv ("MES_DEBUG");
1264   if (getenv ("MES_ARENA")) ARENA_SIZE = atoi (getenv ("MES_ARENA"));
1265   if (argc > 1 && !strcmp (argv[1], "--help")) return puts ("Usage: mes < FILE\n");
1266   if (argc > 1 && !strcmp (argv[1], "--version")) return puts ("Mes 0.3\n");
1267   g_stdin = stdin;
1268   r0 = mes_environment ();
1269   SCM program = (argc > 1 && !strcmp (argv[1], "--load"))
1270     ? bload_env (r0) : load_env (r0);
1271   if (argc > 1 && !strcmp (argv[1], "--dump")) return dump ();
1272   display_ (stderr, begin_env (program, r0));
1273   fputs ("", stderr);
1274   gc (stack);
1275   if (g_debug) fprintf (stderr, "\nstats: [%d]\n", g_free.value);
1276   return 0;
1277 }