core: One big eval_apply.
[mes.git] / mes.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #define _GNU_SOURCE
22 #include <assert.h>
23 #include <ctype.h>
24 #include <errno.h>
25 #include <limits.h>
26 #include <stdio.h>
27 #include <string.h>
28 #include <stdlib.h>
29 #include <stdbool.h>
30
31 #define DEBUG 0
32 #define FIXED_PRIMITIVES 1
33 #define READER 1
34
35 #if READER
36 int ARENA_SIZE = 1000000;
37 #else
38 int ARENA_SIZE = 100000;
39 #endif
40 int MAX_ARENA_SIZE = 20000000;
41 int GC_SAFETY = 100;
42
43 typedef int SCM;
44 enum type_t {CHAR, FUNCTION, KEYWORD, MACRO, NUMBER, PAIR, SPECIAL, STRING, SYMBOL, REF, VALUES, VECTOR, BROKEN_HEART};
45 typedef SCM (*function0_t) (void);
46 typedef SCM (*function1_t) (SCM);
47 typedef SCM (*function2_t) (SCM, SCM);
48 typedef SCM (*function3_t) (SCM, SCM, SCM);
49 typedef SCM (*functionn_t) (SCM);
50 typedef struct function_t {
51   union {
52     function0_t function0;
53     function1_t function1;
54     function2_t function2;
55     function3_t function3;
56     functionn_t functionn;
57   };
58   int arity;
59 } function;
60 struct scm_t;
61 typedef struct scm_t {
62   enum type_t type;
63   union {
64     char const *name;
65     SCM string;
66     SCM car;
67     SCM ref;
68     int length;
69   };
70   union {
71     int value;
72     int function;
73     SCM cdr;
74     SCM macro;
75     SCM vector;
76     int hits;
77   };
78 } scm;
79
80 scm scm_nil = {SPECIAL, "()"};
81 scm scm_f = {SPECIAL, "#f"};
82 scm scm_t = {SPECIAL, "#t"};
83 scm scm_dot = {SPECIAL, "."};
84 scm scm_arrow = {SPECIAL, "=>"};
85 scm scm_undefined = {SPECIAL, "*undefined*"};
86 scm scm_unspecified = {SPECIAL, "*unspecified*"};
87 scm scm_closure = {SPECIAL, "*closure*"};
88 scm scm_circular = {SPECIAL, "*circular*"};
89 #if BOOT
90 scm scm_label = {
91   SPECIAL, "label"};
92 #endif
93 scm scm_begin = {SPECIAL, "*begin*"};
94
95 scm scm_symbol_lambda = {SYMBOL, "lambda"};
96 scm scm_symbol_begin = {SYMBOL, "begin"};
97 scm scm_symbol_if = {SYMBOL, "if"};
98 scm scm_symbol_define = {SYMBOL, "define"};
99 scm scm_symbol_define_macro = {SYMBOL, "define-macro"};
100 scm scm_symbol_set_x = {SYMBOL, "set!"};
101
102 scm scm_symbol_quote = {SYMBOL, "quote"};
103 scm scm_symbol_quasiquote = {SYMBOL, "quasiquote"};
104 scm scm_symbol_unquote = {SYMBOL, "unquote"};
105 scm scm_symbol_unquote_splicing = {SYMBOL, "unquote-splicing"};
106
107 scm scm_symbol_sc_expand = {SYMBOL, "sc-expand"};
108 scm scm_symbol_macro_expand = {SYMBOL, "macro-expand"};
109 scm scm_symbol_sc_expander_alist = {SYMBOL, "*sc-expander-alist*"};
110 scm scm_symbol_noexpand = {SYMBOL, "noexpand"};
111 scm scm_symbol_syntax = {SYMBOL, "syntax"};
112 scm scm_symbol_quasisyntax = {SYMBOL, "quasisyntax"};
113 scm scm_symbol_unsyntax = {SYMBOL, "unsyntax"};
114 scm scm_symbol_unsyntax_splicing = {SYMBOL, "unsyntax-splicing"};
115
116 scm scm_symbol_call_with_values = {SYMBOL, "call-with-values"};
117 scm scm_symbol_current_module = {SYMBOL, "current-module"};
118 scm scm_symbol_primitive_load = {SYMBOL, "primitive-load"};
119 scm scm_symbol_read_input_file = {SYMBOL, "read-input-file"};
120
121 scm scm_symbol_car = {SYMBOL, "car"};
122 scm scm_symbol_cdr = {SYMBOL, "cdr"};
123 scm scm_symbol_null_p = {SYMBOL, "null?"};
124 scm scm_symbol_eq_p = {SYMBOL, "eq?"};
125 scm scm_symbol_cons = {SYMBOL, "cons"};
126
127 scm char_eof = {CHAR, .name="*eof*", .value=-1};
128 scm char_nul = {CHAR, .name="nul", .value=0};
129 scm char_alarm = {CHAR, .name="alarm", .value=8};
130 scm char_backspace = {CHAR, .name="backspace", .value=8};
131 scm char_tab = {CHAR, .name="tab", .value=9};
132 scm char_newline = {CHAR, .name="newline", .value=10};
133 scm char_vtab = {CHAR, .name="vtab", .value=11};
134 scm char_page = {CHAR, .name="page", .value=12};
135 scm char_return = {CHAR, .name="return", .value=13};
136 scm char_space = {CHAR, .name="space", .value=32};
137
138 scm g_free = {NUMBER, .value=0};
139 scm *g_cells;
140 scm *g_news = 0;
141
142 #include "mes.symbols.h"
143
144 SCM tmp;
145 SCM tmp_num;
146 SCM tmp_num2;
147 SCM tmp_num3;
148 SCM tmp_num4;
149
150 function functions[200];
151 int g_function = 0;
152
153 SCM g_symbols = 0;
154 SCM stack = 0;
155 SCM r0 = 0; // a/env
156 SCM r1 = 0; // param 1
157 SCM r2 = 0; // param 2
158 SCM r3 = 0; // param 3
159
160 #include "display.h"
161 #include "lib.h"
162 #include "math.h"
163 #include "mes.h"
164 #include "posix.h"
165 #include "reader.h"
166 #include "string.h"
167 #include "type.h"
168
169 #define CAR(x) g_cells[x].car
170 #define CDR(x) g_cells[x].cdr
171 #define HITS(x) g_cells[x].hits
172 #define LENGTH(x) g_cells[x].length
173 #define NAME(x) g_cells[x].name
174 #define STRING(x) g_cells[x].string
175 #define TYPE(x) g_cells[x].type
176 #define MACRO(x) g_cells[x].macro
177 #define REF(x) g_cells[x].ref
178 #define VALUE(x) g_cells[x].value
179 #define VECTOR(x) g_cells[x].vector
180 #define FUNCTION(x) functions[g_cells[x].function]
181 #define NCAR(x) g_news[x].car
182 #define NTYPE(x) g_news[x].type
183
184 #define CAAR(x) CAR (CAR (x))
185 #define CDAR(x) CDR (CAR (x))
186 #define CAAR(x) CAR (CAR (x))
187 #define CADAR(x) CAR (CDR (CAR (x)))
188 #define CADDR(x) CAR (CDR (CDR (x)))
189 #define CDADAR(x) CAR (CDR (CAR (CDR (x))))
190 #define CADR(x) CAR (CDR (x))
191
192 SCM display_ (FILE* f, SCM x);
193 SCM vm_call (function0_t f, SCM p1, SCM p2, SCM a);
194
195 SCM
196 alloc (int n)
197 {
198   assert (g_free.value + n < ARENA_SIZE);
199   SCM x = g_free.value;
200   g_free.value += n;
201   return x;
202 }
203
204 SCM
205 make_cell (SCM type, SCM car, SCM cdr)
206 {
207   SCM x = alloc (1);
208   assert (TYPE (type) == NUMBER);
209   TYPE (x) = VALUE (type);
210   if (VALUE (type) == CHAR || VALUE (type) == NUMBER) {
211     if (car) CAR (x) = CAR (car);
212     if (cdr) CDR (x) = CDR (cdr);
213   } else if (VALUE (type) == FUNCTION) {
214     if (car) CAR (x) = car;
215     if (cdr) CDR (x) = CDR (cdr);
216   } else {
217     CAR (x) = car;
218     CDR (x) = cdr;
219   }
220   return x;
221 }
222
223 SCM
224 cons (SCM x, SCM y)
225 {
226   g_cells[tmp_num].value = PAIR;
227   return make_cell (tmp_num, x, y);
228 }
229
230 SCM
231 car (SCM x)
232 {
233   assert (TYPE (x) == PAIR);
234   return CAR (x);
235 }
236
237 SCM
238 cdr (SCM x)
239 {
240   assert (TYPE (x) == PAIR);
241   return CDR (x);
242 }
243
244 SCM
245 eq_p (SCM x, SCM y)
246 {
247   return (x == y
248           || ((TYPE (x) == KEYWORD && TYPE (y) == KEYWORD
249                && STRING (x) == STRING (y)))
250           || (TYPE (x) == CHAR && TYPE (y) == CHAR
251               && VALUE (x) == VALUE (y))
252           || (TYPE (x) == NUMBER && TYPE (y) == NUMBER
253               && VALUE (x) == VALUE (y)))
254     ? cell_t : cell_f;
255 }
256
257 SCM
258 set_car_x (SCM x, SCM e)
259 {
260   assert (TYPE (x) == PAIR);
261   CAR (x) = e;
262   return cell_unspecified;
263 }
264
265 SCM
266 set_cdr_x (SCM x, SCM e)
267 {
268   assert (TYPE (x) == PAIR);
269   CDR (x) = e;
270   return cell_unspecified;
271 }
272
273 SCM
274 set_env_x (SCM x, SCM e, SCM a)
275 {
276   SCM p = assert_defined (x, assq (x, a));
277   return set_cdr_x (p, e);
278 }
279
280 SCM
281 quote (SCM x)
282 {
283   return cons (cell_symbol_quote, x);
284 }
285
286 SCM
287 quasiquote (SCM x)
288 {
289   return cons (cell_symbol_quasiquote, x);
290 }
291
292 SCM
293 quasisyntax (SCM x)
294 {
295   return cons (cell_symbol_quasisyntax, x);
296 }
297
298 SCM
299 pairlis (SCM x, SCM y, SCM a)
300 {
301   if (x == cell_nil)
302     return a;
303   if (pair_p (x) == cell_f)
304     return cons (cons (x, y), a);
305   return cons (cons (car (x), car (y)),
306                pairlis (cdr (x), cdr (y), a));
307 }
308
309 SCM
310 assq (SCM x, SCM a)
311 {
312   while (a != cell_nil && eq_p (x, CAAR (a)) == cell_f)
313     {
314       if (TYPE (a) == BROKEN_HEART || TYPE (CAR (a)) == BROKEN_HEART)
315         fprintf (stderr, "oops, broken heart\n");
316       a = CDR (a);
317     }
318   return a != cell_nil ? car (a) : cell_f;
319 }
320
321 SCM
322 assq_ref_cache (SCM x, SCM a)
323 {
324   x = assq (x, a);
325   if (x == cell_f) return cell_undefined;
326   return cdr (x);
327 }
328
329 SCM
330 assert_defined (SCM x, SCM e)
331 {
332   if (e == cell_undefined)
333     {
334       fprintf (stderr, "eval: unbound variable:");
335       display_ (stderr, x);
336       fprintf (stderr, "\n");
337       assert (!"unbound variable");
338     }
339   return e;
340 }
341
342 enum eval_apply_t {EVLIS, APPLY, EVAL, MACRO_EXPAND, BEGIN, IF, CALL_WITH_VALUES};
343 enum eval_apply_t g_target;
344
345 SCM
346 call_lambda (SCM e, SCM x, SCM aa, SCM a) ///((internal))
347 {
348   SCM cl = cons (cons (cell_closure, x), x);
349   r1 = e;
350   r0 = cl;
351   r2 = a;
352   r3 = aa;
353   g_target = BEGIN;
354   return eval_apply ();
355 }
356
357 SCM
358 eval_apply ()
359 {
360   switch (g_target)
361     {
362     case EVLIS: goto evlis;
363     case APPLY: goto apply;
364     case EVAL: goto eval;
365     case MACRO_EXPAND: goto macro_expand;
366     case BEGIN: goto begin;
367     case IF: goto label_if;
368     case CALL_WITH_VALUES: goto call_with_values;
369     }
370
371  evlis:
372   if (r1 == cell_nil) return cell_nil;
373   if (TYPE (r1) != PAIR) goto eval; // (r1, r0);
374   r2 = eval_env (car (r1), r0);
375   r1 = evlis_env (cdr (r1), r0);
376   return cons (r2, r1);
377
378  apply:
379   if (TYPE (r1) != PAIR)
380     {
381       if (TYPE (r1) == FUNCTION) return call (r1, r2);
382       if (r1 == cell_symbol_call_with_values)
383         return call_with_values_env (car (r2), cadr (r2), r0);
384       if (r1 == cell_symbol_current_module) return r0;
385     }
386   else
387     switch (car (r1))
388       {
389       case cell_symbol_lambda:
390         {
391           SCM args = cadr (r1);
392           SCM body = cddr (r1);
393           SCM p = pairlis (args, r2, r0);
394           return call_lambda (body, p, p, r0);
395         }
396       case cell_closure:
397         {
398           SCM args = caddr (r1);
399           SCM body = cdddr (r1);
400           SCM aa = cdadr (r1);
401           aa = cdr (aa);
402           SCM p = pairlis (args, r2, aa);
403           return call_lambda (body, p, aa, r0);
404         }
405 #if BOOT
406       case cell_symbol_label:
407         return apply_env (caddr (r1), r2, cons (cons (cadr (r1), caddr (r1)), r0));
408 #endif
409       }
410   SCM e = eval_env (r1, r0);
411   char const* type = 0;
412   if (e == cell_f || e == cell_t) type = "bool";
413   if (TYPE (e) == CHAR) type = "char";
414   if (TYPE (e) == NUMBER) type = "number";
415   if (TYPE (e) == STRING) type = "string";
416   if (e == cell_unspecified) type = "*unspecified*";
417   if (e == cell_undefined) type =  "*undefined*";
418   if (type)
419     {
420       fprintf (stderr, "cannot apply: %s: ", type);
421       display_ (stderr, e);
422       fprintf (stderr, " [");
423       display_ (stderr, r1);
424       fprintf (stderr, "]\n");
425       assert (!"cannot apply");
426     }
427   return apply_env (e, r2, r0);
428
429  eval:
430   switch (TYPE (r1))
431     {
432     case PAIR:
433       {
434         switch (car (r1))
435           {
436 #if FIXED_PRIMITIVES
437           case cell_symbol_car: return car (eval_env (CADR (r1), r0));
438           case cell_symbol_cdr: return cdr (eval_env (CADR (r1), r0));
439           case cell_symbol_cons: {SCM m = evlis_env (CDR (r1), r0);
440               return cons (CAR (m), CADR (m));}
441           case cell_symbol_null_p: return null_p (eval_env (CADR (r1), r0));
442 #endif // FIXED_PRIMITIVES
443           case cell_symbol_quote: return cadr (r1);
444 #if QUASISYNTAX
445           case cell_symbol_syntax: return cadr (r1);
446 #endif
447           case cell_symbol_begin: return begin_env (r1, r0);
448           case cell_symbol_lambda:
449             return make_closure (cadr (r1), cddr (r1), assq (cell_closure, r0));
450           case cell_closure: return r1;
451           case cell_symbol_if: return if_env (cdr (r1), r0);
452 #if 1 //!BOOT
453           case cell_symbol_set_x: {
454             SCM x = eval_env (caddr (r1), r0); return set_env_x (cadr (r1), x, r0);
455           }
456 #endif
457           default: {
458             SCM x = macro_expand_env (r1, r0);
459             if (x != r1)
460               {
461                 if (TYPE (x) == PAIR)
462                   {
463                     set_cdr_x (r1, cdr (x));
464                     set_car_x (r1, car (x));
465                   }
466                 else
467                   r1 = x;
468                 return eval_env (x, r0);
469               }
470             SCM m = evlis_env (CDR (r1), r0);
471             return apply_env (car (r1), m, r0);
472           }
473           }
474       }
475     case SYMBOL: return assert_defined (r1, assq_ref_cache (r1, r0));
476     default: return r1;
477     }
478
479  macro_expand:
480   if (TYPE (CAR (r1)) == STRING && string_to_symbol (CAR (r1)) == cell_symbol_noexpand)
481     return cadr (r1);
482
483   SCM macro;
484   SCM expanders;
485   if (TYPE (r1) == PAIR
486       && (macro = lookup_macro (car (r1), r0)) != cell_f)
487     return apply_env (macro, CDR (r1), r0);
488   else if (TYPE (r1) == PAIR
489            && TYPE (CAR (r1)) == SYMBOL
490            && ((expanders = assq_ref_cache (cell_symbol_sc_expander_alist, r0)) != cell_undefined)
491            && ((macro = assq (CAR (r1), expanders)) != cell_f))
492     {
493       SCM sc_expand = assq_ref_cache (cell_symbol_macro_expand, r0);
494       if (sc_expand != cell_undefined && sc_expand != cell_f)
495         r1 = apply_env (sc_expand, cons (r1, cell_nil), r0);
496     }
497   return r1;
498
499   SCM r;
500  begin:
501   r = cell_unspecified;
502   while (r1 != cell_nil) {
503     if (TYPE (r1) == PAIR && TYPE (CAR (r1)) == PAIR)
504       {
505         if (caar (r1) == cell_symbol_begin)
506           r1 = append2 (cdar (r1), cdr (r1));
507         else if (caar (r1) == cell_symbol_primitive_load)
508           {
509             SCM f = read_input_file_env (r0);
510             r1 = append2 (f, cdr (r1));
511           }
512       }
513     r = eval_env (car (r1), r0);
514     r1 = CDR (r1);
515   }
516   return r;
517
518   SCM x;
519  label_if:
520   x = eval_env (car (r1), r0);
521   if (x != cell_f)
522     return eval_env (cadr (r1), r0);
523   if (cddr (r1) != cell_nil)
524     return eval_env (caddr (r1), r0);
525   return cell_unspecified;
526
527   SCM v;
528  call_with_values:
529   v = apply_env (r1, cell_nil, r0);
530   if (TYPE (v) == VALUES)
531     v = CDR (v);
532   return apply_env (r2, v, r0);
533 }
534
535 SCM
536 call (SCM fn, SCM x)
537 {
538   if ((FUNCTION (fn).arity > 0 || FUNCTION (fn).arity == -1)
539       && x != cell_nil && TYPE (CAR (x)) == VALUES)
540     x = cons (CADAR (x), CDR (x));
541   if ((FUNCTION (fn).arity > 1 || FUNCTION (fn).arity == -1)
542       && x != cell_nil && TYPE (CDR (x)) == PAIR && TYPE (CADR (x)) == VALUES)
543     x = cons (CAR (x), cons (CDADAR (x), CDR (x)));
544   switch (FUNCTION (fn).arity)
545     {
546     case 0: return FUNCTION (fn).function0 ();
547     case 1: return FUNCTION (fn).function1 (car (x));
548     case 2: return FUNCTION (fn).function2 (car (x), cadr (x));
549     case 3: return FUNCTION (fn).function3 (car (x), cadr (x), caddr (x));
550     case -1: return FUNCTION (fn).functionn (x);
551     }
552   return cell_unspecified;
553 }
554
555 SCM
556 gc_frame (SCM stack)
557 {
558   SCM frame = car (stack);
559   r1 = car (frame);
560   r2 = cadr (frame);
561   r3 = caddr (frame);
562   r0 = cadddr (frame);
563   return frame;
564 }
565
566 SCM
567 gc_stack (SCM a)
568 {
569   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
570   stack = cons (frame, stack);
571   stack = gc (stack);
572   gc_frame (stack);
573   stack = cdr (stack);
574   return stack;
575 }
576
577 SCM
578 vm_call (function0_t f, SCM p1, SCM p2, SCM a)
579 {
580   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
581   stack = cons (frame, stack);
582   r1 = p1;
583   r2 = p2;
584   r0 = a;
585   if (g_free.value + GC_SAFETY > ARENA_SIZE)
586     gc_stack (stack);
587
588   SCM r = f ();
589   frame = gc_frame (stack);
590   stack = cdr (stack);
591   return r;
592 }
593
594 SCM
595 evlis_env (SCM m, SCM a)
596 {
597   g_target = EVLIS;
598   return vm_call (eval_apply, m, cell_undefined, a);
599 }
600
601 SCM
602 apply_env (SCM fn, SCM x, SCM a)
603 {
604   g_target = APPLY;
605   return vm_call (eval_apply, fn, x, a);
606 }
607
608 SCM
609 eval_env (SCM e, SCM a)
610 {
611   g_target = EVAL;
612   return vm_call (eval_apply, e, cell_undefined, a);
613 }
614
615 SCM
616 macro_expand_env (SCM e, SCM a)
617 {
618   g_target = MACRO_EXPAND;
619   return vm_call (eval_apply, e, cell_undefined, a);
620 }
621
622 SCM
623 begin_env (SCM e, SCM a)
624 {
625   g_target = BEGIN;
626   return vm_call (eval_apply, e, cell_undefined, a);
627 }
628
629 SCM
630 if_env (SCM e, SCM a)
631 {
632   g_target = IF;
633   return vm_call (eval_apply, e, cell_undefined, a);
634 }
635
636 SCM
637 call_with_values_env (SCM producer, SCM consumer, SCM a)
638 {
639   g_target = CALL_WITH_VALUES;
640   return vm_call (eval_apply, producer, consumer, a);
641 }
642
643 SCM
644 append2 (SCM x, SCM y)
645 {
646   if (x == cell_nil) return y;
647   assert (TYPE (x) == PAIR);
648   return cons (car (x), append2 (cdr (x), y));
649 }
650
651 SCM
652 append (SCM x) ///((arity . n))
653  {
654   if (x == cell_nil) return cell_nil;
655   if (cdr (x) == cell_nil) return car (x);
656   return append2 (car (x), append (cdr (x)));
657  }
658
659 SCM
660 make_char (int x)
661 {
662   g_cells[tmp_num].value = CHAR;
663   g_cells[tmp_num2].value = x;
664   return make_cell (tmp_num, tmp_num2, tmp_num2);
665 }
666
667 SCM
668 make_function (SCM name, SCM id, SCM arity)
669 {
670   g_cells[tmp_num3].value = FUNCTION;
671   function *f = (function*)malloc (sizeof (function));
672   f->arity = VALUE (arity);
673   g_cells[tmp_num4].value = (long)f;
674   return make_cell (tmp_num3, name, tmp_num4);
675 }
676
677 SCM
678 make_keyword (SCM s)
679 {
680   SCM x = internal_lookup_symbol (s);
681   x = x ? x : internal_make_symbol (s);
682   g_cells[tmp_num].value = KEYWORD;
683   return make_cell (tmp_num, STRING (x), 0);
684 }
685
686 SCM
687 make_macro (SCM name, SCM x)
688 {
689   g_cells[tmp_num].value = MACRO;
690   return make_cell (tmp_num, STRING (name), x);
691 }
692
693 SCM
694 make_number (int x)
695 {
696   g_cells[tmp_num].value = NUMBER;
697   g_cells[tmp_num2].value = x;
698   return make_cell (tmp_num, tmp_num2, tmp_num2);
699 }
700
701 SCM
702 make_ref (SCM x)
703 {
704   g_cells[tmp_num].value = REF;
705   return make_cell (tmp_num, x, x);
706 }
707
708 SCM
709 make_string (SCM x)
710 {
711   g_cells[tmp_num].value = STRING;
712   return make_cell (tmp_num, x, 0);
713 }
714
715 SCM
716 cstring_to_list (char const* s)
717 {
718   SCM p = cell_nil;
719   int i = strlen (s);
720   while (i--)
721     p = cons (make_char (s[i]), p);
722   return p;
723 }
724
725 SCM
726 null_p (SCM x)
727 {
728   return x == cell_nil ? cell_t : cell_f;
729 }
730
731 SCM
732 internal_make_symbol (SCM s)
733 {
734   g_cells[tmp_num].value = SYMBOL;
735   SCM x = make_cell (tmp_num, s, 0);
736   g_symbols = cons (x, g_symbols);
737   return x;
738 }
739
740 SCM
741 make_symbol (SCM s)
742 {
743   SCM x = internal_lookup_symbol (s);
744   return x ? x : internal_make_symbol (s);
745 }
746
747 SCM
748 make_vector (SCM n)
749 {
750   int k = VALUE (n);
751   g_cells[tmp_num].value = VECTOR;
752   SCM v = alloc (k);
753   SCM x = make_cell (tmp_num, k, v);
754   for (int i=0; i<k; i++) g_cells[v+i] = g_cells[vector_entry (cell_unspecified)];
755   return x;
756 }
757
758 SCM
759 values (SCM x) ///((arity . n))
760 {
761   SCM v = cons (0, x);
762   TYPE (v) = VALUES;
763   return v;
764 }
765
766 SCM
767 vector_length (SCM x)
768 {
769   assert (TYPE (x) == VECTOR);
770   return make_number (LENGTH (x));
771 }
772
773 SCM
774 vector_ref (SCM x, SCM i)
775 {
776   assert (TYPE (x) == VECTOR);
777   assert (VALUE (i) < LENGTH (x));
778   SCM e = VECTOR (x) + VALUE (i);
779   if (TYPE (e) == REF) e = g_cells[e].ref;
780   if (TYPE (e) == CHAR) e = make_char (VALUE (e));
781   if (TYPE (e) == NUMBER) e = make_number (VALUE (e));
782   return e;
783 }
784
785 SCM
786 vector_entry (SCM x) {
787   if (TYPE (x) == PAIR || TYPE (x) == SPECIAL || TYPE (x) == STRING || TYPE (x) == SYMBOL || TYPE (x) == VECTOR) x = make_ref (x);
788   return x;
789 }
790
791 SCM
792 vector_set_x (SCM x, SCM i, SCM e)
793 {
794   assert (TYPE (x) == VECTOR);
795   assert (VALUE (i) < LENGTH (x));
796   g_cells[VECTOR (x)+g_cells[i].value] = g_cells[vector_entry (e)];
797   return cell_unspecified;
798 }
799
800 SCM
801 list_to_vector (SCM x)
802 {
803   VALUE (tmp_num) = VALUE (length (x));
804   SCM v = make_vector (tmp_num);
805   SCM p = VECTOR (v);
806   while (x != cell_nil)
807     {
808       g_cells[p++] = g_cells[vector_entry (car (x))];
809       x = cdr (x);
810     }
811   return v;
812 }
813
814 FILE *g_stdin;
815 int
816 getchar ()
817 {
818   return getc (g_stdin);
819 }
820
821 int
822 ungetchar (int c)
823 {
824   return ungetc (c, g_stdin);
825 }
826
827 int
828 peekchar ()
829 {
830   int c = getchar ();
831   ungetchar (c);
832   return c;
833 }
834
835 SCM
836 peek_byte ()
837 {
838   return make_number (peekchar ());
839 }
840
841 SCM
842 read_byte ()
843 {
844   return make_number (getchar ());
845 }
846
847 SCM
848 unread_byte (SCM i)
849 {
850   ungetchar (VALUE (i));
851   return i;
852 }
853
854 SCM
855 write_char (SCM x) ///((arity . n))
856 {
857   SCM c = car (x);
858   SCM p = cdr (x);
859   int fd = 1;
860   if (TYPE (p) == PAIR && TYPE (car (p)) == NUMBER) fd = VALUE (car (p));
861   FILE *f = fd == 1 ? stdout : stderr;
862   assert (TYPE (c) == NUMBER || TYPE (c) == CHAR);
863   fputc (VALUE (c), f);
864   return c;
865 }
866
867 SCM
868 symbol_to_list (SCM x)
869 {
870   assert (TYPE (x) == SYMBOL);
871   return STRING (x);
872 }
873
874 SCM
875 char_to_integer (SCM x)
876 {
877   assert (TYPE (x) == CHAR);
878   return make_number (VALUE (x));
879 }
880
881 SCM
882 integer_to_char (SCM x)
883 {
884   assert (TYPE (x) == NUMBER);
885   return make_char (VALUE (x));
886 }
887
888 void
889 make_tmps (scm* cells)
890 {
891   tmp = g_free.value++;
892   cells[tmp].type = CHAR;
893   tmp_num = g_free.value++;
894   cells[tmp_num].type = NUMBER;
895   tmp_num2 = g_free.value++;
896   cells[tmp_num2].type = NUMBER;
897   tmp_num3 = g_free.value++;
898   cells[tmp_num3].type = NUMBER;
899   tmp_num4 = g_free.value++;
900   cells[tmp_num4].type = NUMBER;
901 }
902
903 //\f Jam Collector
904 SCM g_symbol_max;
905 bool g_debug = false;
906
907 SCM
908 gc_up_arena ()
909 {
910   ARENA_SIZE *= 2;
911   void *p = realloc (g_cells-1, 2*ARENA_SIZE*sizeof(scm));
912   if (!p)
913     {
914       if (g_debug) fprintf (stderr, "cannot up arena: %s: arena=%d\n", strerror (errno), 2*ARENA_SIZE);
915       return cell_unspecified;
916     }
917   g_cells = (scm*)p;
918   g_cells++;
919   gc_init_news ();
920 }
921
922 SCM
923 gc ()
924 {
925   if (g_debug) fprintf (stderr, "***gc[%d]...", g_free.value);
926   g_free.value = 1;
927   if (g_cells < g_news && ARENA_SIZE < MAX_ARENA_SIZE) gc_up_arena ();
928   for (int i=g_free.value; i<g_symbol_max; i++)
929     gc_copy (i);
930   make_tmps (g_news);
931   g_symbols = gc_copy (g_symbols);
932   SCM new = gc_copy (stack);
933   if (g_debug) fprintf (stderr, "new=%d\n", new, stack);
934   stack = new;
935   return gc_loop (1);
936 }
937
938 SCM
939 gc_loop (SCM scan)
940 {
941   while (scan < g_free.value)
942     {
943       if (NTYPE (scan) == KEYWORD
944           || NTYPE (scan) == MACRO
945           || NTYPE (scan) == PAIR
946           || NTYPE (scan) == REF
947           || scan == 1 // null
948           || NTYPE (scan) == SPECIAL
949           || NTYPE (scan) == STRING
950           || NTYPE (scan) == SYMBOL)
951         {
952           SCM car = gc_copy (g_news[scan].car);
953           gc_relocate_car (scan, car);
954         }
955       if ((NTYPE (scan) == MACRO
956            || NTYPE (scan) == PAIR
957            || NTYPE (scan) == VALUES)
958           && g_news[scan].cdr) // allow for 0 terminated list of symbols
959         {
960           SCM cdr = gc_copy (g_news[scan].cdr);
961           gc_relocate_cdr (scan, cdr);
962         }
963       scan++;
964     }
965   return gc_flip ();
966 }
967
968 SCM
969 gc_copy (SCM old)
970 {
971   if (TYPE (old) == BROKEN_HEART) return g_cells[old].car;
972   SCM new = g_free.value++;
973   g_news[new] = g_cells[old];
974   if (NTYPE (new) == VECTOR)
975     {
976       g_news[new].vector = g_free.value;
977       for (int i=0; i<LENGTH (old); i++)
978         g_news[g_free.value++] = g_cells[VECTOR (old)+i];
979     }
980   g_cells[old].type = BROKEN_HEART;
981   g_cells[old].car = new;
982   return new;
983 }
984
985 SCM
986 gc_relocate_car (SCM new, SCM car)
987 {
988   g_news[new].car = car;
989   return cell_unspecified;
990 }
991
992 SCM
993 gc_relocate_cdr (SCM new, SCM cdr)
994 {
995   g_news[new].cdr = cdr;
996   return cell_unspecified;
997 }
998
999 SCM
1000 gc_flip ()
1001 {
1002   scm *cells = g_cells;
1003   g_cells = g_news;
1004   g_news = cells;
1005   if (g_debug) fprintf (stderr, " => jam[%d]\n", g_free.value);
1006   return stack;
1007 }
1008
1009 SCM
1010 gc_show ()
1011 {
1012   fprintf (stderr, "cells: ");
1013   scm *t = g_cells;
1014   display_ (stderr, -1);
1015   fprintf (stderr, "\n");
1016   if (g_news)
1017     {
1018       fprintf (stderr, "news: ");
1019       g_cells = g_news;
1020       display_ (stderr, -1);
1021       fprintf (stderr, "\n");
1022     }
1023   g_cells = t;
1024   return cell_unspecified;
1025 }
1026
1027 //\f Environment setup
1028 SCM
1029 acons (SCM key, SCM value, SCM alist)
1030 {
1031   return cons (cons (key, value), alist);
1032 }
1033
1034 SCM
1035 add_environment (SCM a, char const *name, SCM x)
1036 {
1037   return acons (make_symbol (cstring_to_list (name)), x, a);
1038 }
1039
1040 SCM
1041 gc_init_cells ()
1042 {
1043   g_cells = (scm *)malloc (2*ARENA_SIZE*sizeof(scm));
1044   g_cells[0].type = VECTOR;
1045   g_cells[0].length = 1000;
1046   g_cells[0].vector = 0;
1047   g_cells++;
1048   g_cells[0].type = CHAR;
1049   g_cells[0].value = 'c';
1050 }
1051
1052 SCM
1053 gc_init_news ()
1054 {
1055   g_news = g_cells-1 + ARENA_SIZE;
1056   g_news[0].type = VECTOR;
1057   g_news[0].length = 1000;
1058   g_news[0].vector = 0;
1059   g_news++;
1060   g_news[0].type = CHAR;
1061   g_news[0].value = 'n';
1062 }
1063
1064 SCM
1065 mes_symbols () ///((internal))
1066 {
1067   gc_init_cells ();
1068   gc_init_news ();
1069
1070 #include "mes.symbols.i"
1071
1072   g_symbol_max = g_free.value;
1073   make_tmps (g_cells);
1074
1075   g_symbols = 0;
1076   for (int i=1; i<g_symbol_max; i++)
1077     g_symbols = cons (i, g_symbols);
1078
1079   SCM a = cell_nil;
1080
1081 #if BOOT
1082   a = acons (cell_symbol_label, cell_t, a);
1083 #endif
1084   a = acons (cell_symbol_begin, cell_begin, a);
1085   a = add_environment (a, "sc-expand", cell_f);
1086   a = acons (cell_closure, a, a);
1087
1088   internal_lookup_symbol (cell_nil);
1089
1090   return a;
1091 }
1092
1093 SCM
1094 mes_builtins (SCM a)
1095 {
1096 #include "mes.i"
1097
1098 #include "display.i"
1099 #include "lib.i"
1100 #include "math.i"
1101 #include "posix.i"
1102 #include "reader.i"
1103 #include "string.i"
1104 #include "type.i"
1105
1106 #include "display.environment.i"
1107 #include "lib.environment.i"
1108 #include "math.environment.i"
1109 #include "mes.environment.i"
1110 #include "posix.environment.i"
1111 #include "reader.environment.i"
1112 #include "string.environment.i"
1113 #include "type.environment.i"
1114
1115   a = add_environment (a, "*dot*", cell_dot);
1116   a = add_environment (a, "*foo-bar-baz*", cell_nil); // FIXME: some off-by one?
1117
1118   return a;
1119 }
1120
1121 SCM
1122 mes_stack (SCM a) ///((internal))
1123 {
1124   r0 = a;
1125   r1 = make_char (0);
1126   r2 = make_char (0);
1127   r3 = make_char (0);
1128   stack = cons (cell_nil, cell_nil);
1129   return r0;
1130 }
1131
1132 SCM
1133 mes_environment () ///((internal))
1134 {
1135   SCM a = mes_symbols ();
1136   return mes_stack (a);
1137 }
1138
1139 SCM
1140 make_lambda (SCM args, SCM body)
1141 {
1142   return cons (cell_symbol_lambda, cons (args, body));
1143 }
1144
1145 SCM
1146 make_closure (SCM args, SCM body, SCM a)
1147 {
1148   return cons (cell_closure, cons (cons (cell_circular, a), cons (args, body)));
1149 }
1150
1151 SCM
1152 lookup_macro (SCM x, SCM a)
1153 {
1154   if (TYPE (x) != SYMBOL) return cell_f;
1155   SCM m = assq_ref_cache (x, a);
1156   if (macro_p (m) == cell_t) return MACRO (m);
1157   return cell_f;
1158 }
1159
1160 SCM
1161 read_input_file_env_ (SCM e, SCM a)
1162 {
1163   if (e == cell_nil) return e;
1164   return cons (e, read_input_file_env_ (read_env (a), a));
1165 }
1166
1167 SCM
1168 read_input_file_env (SCM a)
1169 {
1170   r0 = a;
1171 #if READER
1172   return read_input_file_env_ (read_env (r0), r0);
1173 #endif
1174   return apply_env (cell_symbol_read_input_file, cell_nil, r0);
1175 }
1176
1177 SCM
1178 load_env (SCM a) ///((internal))
1179 {
1180   r0 =a;
1181 #if 1 //!READER
1182   g_stdin = fopen ("module/mes/read-0.mes", "r");
1183   g_stdin = g_stdin ? g_stdin : fopen (PREFIX "module/mes/read-0.mes", "r");
1184 #endif
1185   if (!g_function) r0 = mes_builtins (r0);
1186   r3 = read_input_file_env (r0);
1187   g_stdin = stdin;
1188   return r3;
1189 }
1190
1191 SCM
1192 bload_env (SCM a) ///((internal))
1193 {
1194   g_stdin = fopen ("module/mes/read-0.mo", "r");
1195   g_stdin = g_stdin ? g_stdin : fopen (PREFIX "module/mes/read-0.mo", "r");
1196   char *p = (char*)g_cells;
1197   assert (getchar () == 'M');
1198   assert (getchar () == 'E');
1199   assert (getchar () == 'S');
1200   stack = getchar () << 8;
1201   stack += getchar ();
1202   int c = getchar ();
1203   while (c != EOF)
1204     {
1205       *p++ = c;
1206       c = getchar ();
1207     }
1208   g_free.value = (p-(char*)g_cells) / sizeof (scm);
1209   gc_frame (stack);
1210   g_symbols = r1;
1211   g_stdin = stdin;
1212
1213   r0 = mes_builtins (r0);
1214   return r3;
1215 }
1216
1217 int
1218 dump ()
1219 {
1220   r1 = g_symbols;
1221   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
1222   stack = cons (frame, stack);
1223   stack = gc (stack);
1224   gc_frame (stack);
1225   char *p = (char*)g_cells;
1226   fputc ('M', stdout);
1227   fputc ('E', stdout);
1228   fputc ('S', stdout);
1229   fputc (stack >> 8, stdout);
1230   fputc (stack % 256, stdout);
1231   for (int i=0; i<g_free.value * sizeof(scm); i++)
1232     fputc (*p++, stdout);
1233   return 0;
1234 }
1235
1236 #include "type.c"
1237 #include "display.c"
1238 #include "lib.c"
1239 #include "math.c"
1240 #include "posix.c"
1241 #include "reader.c"
1242 #include "string.c"
1243
1244 int
1245 main (int argc, char *argv[])
1246 {
1247   g_debug = getenv ("MES_DEBUG");
1248   if (getenv ("MES_ARENA")) ARENA_SIZE = atoi (getenv ("MES_ARENA"));
1249   if (argc > 1 && !strcmp (argv[1], "--help")) return puts ("Usage: mes < FILE\n");
1250   if (argc > 1 && !strcmp (argv[1], "--version")) return puts ("Mes 0.3\n");
1251   g_stdin = stdin;
1252   r0 = mes_environment ();
1253   SCM program = (argc > 1 && !strcmp (argv[1], "--load"))
1254     ? bload_env (r0) : load_env (r0);
1255   if (argc > 1 && !strcmp (argv[1], "--dump")) return dump ();
1256   display_ (stderr, begin_env (program, r0));
1257   fputs ("", stderr);
1258   gc (stack);
1259   if (g_debug) fprintf (stderr, "\nstats: [%d]\n", g_free.value);
1260   return 0;
1261 }