core: gc bugfixes.
[mes.git] / mes.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #define _GNU_SOURCE
22 #include <assert.h>
23 #include <ctype.h>
24 #include <limits.h>
25 #include <stdio.h>
26 #include <string.h>
27 #include <stdlib.h>
28 #include <stdbool.h>
29
30 #define DEBUG 0
31 #define QUASIQUOTE 1
32 #define QUASISYNTAX 0
33 #define ENV_CACHE 1
34
35 //int ARENA_SIZE = 200000000;
36 //               30101417
37 int ARENA_SIZE = 30000000;
38 int GC_SAFETY = 10000;
39 int GC_FREE = 20000;
40
41 typedef long SCM;
42 enum type_t {CHAR, FUNCTION, MACRO, NUMBER, PAIR, SPECIAL, STRING, SYMBOL, REF, VALUES, VECTOR, BROKEN_HEART};
43 typedef SCM (*function0_t) (void);
44 typedef SCM (*function1_t) (SCM);
45 typedef SCM (*function2_t) (SCM, SCM);
46 typedef SCM (*function3_t) (SCM, SCM, SCM);
47 typedef SCM (*functionn_t) (SCM);
48 typedef struct function_t {
49   union {
50     function0_t function0;
51     function1_t function1;
52     function2_t function2;
53     function3_t function3;
54     functionn_t functionn;
55   };
56   int arity;
57 } function;
58 struct scm_t;
59 typedef struct scm_t {
60   enum type_t type;
61   union {
62     char const *name;
63     SCM string;
64     SCM car;
65     SCM ref;
66     int length;
67   };
68   union {
69     int value;
70     int function;
71     SCM cdr;
72     SCM macro;
73     SCM vector;
74     int hits;
75   };
76 } scm;
77
78 function functions[200];
79 int g_function = 0;
80
81 #include "mes.symbols.h"
82 #include "cache.h"
83 #include "define.h"
84 #include "display.h"
85 #include "lib.h"
86 #include "math.h"
87 #include "mes.h"
88 #include "posix.h"
89 #include "quasiquote.h"
90 #include "reader.h"
91 #include "string.h"
92 #include "type.h"
93
94 SCM g_symbols = 0;
95 SCM stack = 0;
96 SCM r0 = 0; // a/env
97 SCM r1 = 0; // param 1
98 SCM r2 = 0; // param 2
99 SCM r3 = 0; // param 3
100
101 SCM tmp;
102 SCM tmp_num;
103 SCM tmp_num2;
104 SCM tmp_num3;
105 SCM tmp_num4;
106
107 scm scm_nil = {SPECIAL, "()"};
108 scm scm_f = {SPECIAL, "#f"};
109 scm scm_t = {SPECIAL, "#t"};
110 scm scm_dot = {SPECIAL, "."};
111 scm scm_undefined = {SPECIAL, "*undefined*"};
112 scm scm_unspecified = {SPECIAL, "*unspecified*"};
113 scm scm_closure = {SPECIAL, "*closure*"};
114 scm scm_circular = {SPECIAL, "*circular*"};
115 #if BOOT
116 scm scm_label = {
117   SPECIAL, "label"};
118 #endif
119 scm scm_begin = {SPECIAL, "*begin*"};
120
121 scm scm_symbol_lambda = {SYMBOL, "lambda"};
122 scm scm_symbol_begin = {SYMBOL, "begin"};
123 scm scm_symbol_if = {SYMBOL, "if"};
124 scm scm_symbol_define = {SYMBOL, "define"};
125 scm scm_symbol_define_macro = {SYMBOL, "define-macro"};
126 scm scm_symbol_set_x = {SYMBOL, "set!"};
127
128 scm scm_symbol_quote = {SYMBOL, "quote"};
129 scm scm_symbol_quasiquote = {SYMBOL, "quasiquote"};
130 scm scm_symbol_unquote = {SYMBOL, "unquote"};
131 scm scm_symbol_unquote_splicing = {SYMBOL, "unquote-splicing"};
132
133 scm scm_symbol_sc_expand = {SYMBOL, "sc-expand"};
134 scm scm_symbol_expand_macro = {SYMBOL, "expand-macro"};
135 scm scm_symbol_sc_expander_alist = {SYMBOL, "*sc-expander-alist*"};
136 scm scm_symbol_noexpand = {SYMBOL, "noexpand"};
137 scm scm_symbol_syntax = {SYMBOL, "syntax"};
138 scm scm_symbol_quasisyntax = {SYMBOL, "quasisyntax"};
139 scm scm_symbol_unsyntax = {SYMBOL, "unsyntax"};
140 scm scm_symbol_unsyntax_splicing = {SYMBOL, "unsyntax-splicing"};
141
142 scm scm_symbol_call_with_values = {SYMBOL, "call-with-values"};
143 scm scm_symbol_current_module = {SYMBOL, "current-module"};
144 scm scm_symbol_primitive_load = {SYMBOL, "primitive-load"};
145
146 scm scm_symbol_the_unquoters = {SYMBOL, "*the-unquoters*"};
147
148 scm char_eof = {CHAR, .name="*eof*", .value=-1};
149 scm char_nul = {CHAR, .name="nul", .value=0};
150 scm char_backspace = {CHAR, .name="backspace", .value=8};
151 scm char_tab = {CHAR, .name="tab", .value=9};
152 scm char_newline = {CHAR, .name="newline", .value=10};
153 scm char_vt = {CHAR, .name="vt", .value=11};
154 scm char_page = {CHAR, .name="page", .value=12};
155 scm char_return = {CHAR, .name="return", .value=13};
156 scm char_space = {CHAR, .name="space", .value=32};
157
158 scm g_free = {NUMBER, .value=0};
159 scm *g_cells;
160 scm *g_news = 0;
161
162 #define CAR(x) g_cells[x].car
163 #define CDR(x) g_cells[x].cdr
164 #define HITS(x) g_cells[x].hits
165 #define LENGTH(x) g_cells[x].length
166 #define NAME(x) g_cells[x].name
167 #define STRING(x) g_cells[x].string
168 #define TYPE(x) g_cells[x].type
169 #define MACRO(x) g_cells[x].macro
170 #define REF(x) g_cells[x].ref
171 #define VALUE(x) g_cells[x].value
172 #define VECTOR(x) g_cells[x].vector
173 #define FUNCTION(x) functions[g_cells[x].function]
174 #define NCAR(x) g_news[x].car
175 #define NTYPE(x) g_news[x].type
176
177 #define CAAR(x) CAR (CAR (x))
178 #define CDAR(x) CDR (CAR (x))
179 #define CAAR(x) CAR (CAR (x))
180 #define CADAR(x) CAR (CDR (CAR (x)))
181 #define CDADAR(x) CAR (CDR (CAR (CDR (x))))
182 #define CADR(x) CAR (CDR (x))
183
184 SCM display_ (FILE* f, SCM x);
185 SCM vm_call (function0_t f, SCM p1, SCM p2, SCM a);
186
187 SCM
188 alloc (int n)
189 {
190   assert (g_free.value + n < ARENA_SIZE);
191   SCM x = g_free.value;
192   g_free.value += n;
193   return x;
194 }
195
196 SCM
197 make_cell (SCM type, SCM car, SCM cdr)
198 {
199   SCM x = alloc (1);
200   assert (TYPE (type) == NUMBER);
201   TYPE (x) = VALUE (type);
202   if (VALUE (type) == CHAR || VALUE (type) == NUMBER) {
203     if (car) CAR (x) = CAR (car);
204     if (cdr) CDR (x) = CDR (cdr);
205   } else if (VALUE (type) == FUNCTION) {
206     if (car) CAR (x) = car;
207     if (cdr) CDR (x) = CDR (cdr);
208   } else {
209     CAR (x) = car;
210     CDR (x) = cdr;
211   }
212   return x;
213 }
214
215 SCM
216 cons (SCM x, SCM y)
217 {
218   g_cells[tmp_num].value = PAIR;
219   return make_cell (tmp_num, x, y);
220 }
221
222 SCM
223 car (SCM x)
224 {
225   assert (TYPE (x) == PAIR);
226   return CAR (x);
227 }
228
229 SCM
230 cdr (SCM x)
231 {
232   assert (TYPE (x) == PAIR);
233   return CDR (x);
234 }
235
236 SCM
237 eq_p (SCM x, SCM y)
238 {
239   return (x == y
240           || (TYPE (x) == CHAR && TYPE (y) == CHAR
241               && VALUE (x) == VALUE (y))
242           || (TYPE (x) == NUMBER && TYPE (y) == NUMBER
243               && VALUE (x) == VALUE (y)))
244     ? cell_t : cell_f;
245 }
246
247 SCM
248 set_car_x (SCM x, SCM e)
249 {
250   assert (TYPE (x) == PAIR);
251   CAR (x) = e;
252   return cell_unspecified;
253 }
254
255 SCM
256 set_cdr_x (SCM x, SCM e)
257 {
258   assert (TYPE (x) == PAIR);
259   cache_invalidate (cdr (x));
260   CDR (x) = e;
261   return cell_unspecified;
262 }
263
264 SCM
265 set_env_x (SCM x, SCM e, SCM a)
266 {
267   cache_invalidate (x);
268   SCM p = assert_defined (x, assq (x, a));
269   return set_cdr_x (p, e);
270 }
271
272 SCM
273 quote (SCM x)
274 {
275   return cons (cell_symbol_quote, x);
276 }
277
278 SCM
279 quasiquote (SCM x)
280 {
281   return cons (cell_symbol_quasiquote, x);
282 }
283
284 SCM
285 quasisyntax (SCM x)
286 {
287   return cons (cell_symbol_quasisyntax, x);
288 }
289
290 SCM
291 pairlis (SCM x, SCM y, SCM a)
292 {
293   if (x == cell_nil)
294     return a;
295   if (pair_p (x) == cell_f)
296     return cons (cons (x, y), a);
297   return cons (cons (car (x), car (y)),
298                pairlis (cdr (x), cdr (y), a));
299 }
300
301 SCM
302 assq (SCM x, SCM a)
303 {
304   while (a != cell_nil && eq_p (x, CAAR (a)) == cell_f)
305     {
306       if (TYPE (a) == BROKEN_HEART || TYPE (CAR (a)) == BROKEN_HEART)
307         fprintf (stderr, "oops, broken heart\n");
308       a = CDR (a);
309     }
310   return a != cell_nil ? car (a) : cell_f;
311 }
312
313 #if! ENV_CACHE
314 SCM
315 assq_ref_cache (SCM x, SCM a)
316 {
317   x = assq (x, a);
318   if (x == cell_f) return cell_undefined;
319   return cdr (x);
320 }
321 #endif // !ENV_CACHE
322
323 SCM
324 assert_defined (SCM x, SCM e)
325 {
326   if (e == cell_undefined)
327     {
328       fprintf (stderr, "eval: unbound variable:");
329       display_ (stderr, x);
330       fprintf (stderr, "\n");
331       assert (!"unbound variable");
332     }
333   return e;
334 }
335
336 SCM
337 vm_evlis_env ()
338 {
339   if (r1 == cell_nil) return cell_nil;
340   if (TYPE (r1) != PAIR) return eval_env (r1, r0);
341   r2 = eval_env (car (r1), r0);
342   r1 = evlis_env (cdr (r1), r0);
343   return cons (r2, r1);
344 }
345
346 SCM
347 vm_call_lambda ()
348 {
349   return vm_call (vm_begin_env, r1, cell_undefined, r0);
350 }
351
352 SCM
353 call_lambda (SCM e, SCM x, SCM aa, SCM a) ///((internal))
354 {
355   SCM cl = cons (cons (cell_closure, x), x);
356   r1 = e;
357   r0 = cl;
358   r2 = a;
359   r3 = aa;
360   cache_invalidate_range (r0, CDR (r3));
361   SCM r = vm_call_lambda ();
362   cache_invalidate_range (r0, CDR (r3));
363   return r;
364 }
365
366 SCM
367 vm_apply_env ()
368 {
369   if (TYPE (r1) != PAIR)
370     {
371       if (TYPE (r1) == FUNCTION) return call (r1, r2);
372       if (r1 == cell_symbol_call_with_values)
373         return call_with_values_env (car (r2), cadr (r2), r0);
374       if (r1 == cell_symbol_current_module) return r0;
375     }
376   else if (car (r1) == cell_symbol_lambda) {
377     SCM args = cadr (r1);
378     SCM body = cddr (r1);
379     SCM p = pairlis (args, r2, r0);
380     return call_lambda (body, p, p, r0);
381   }
382   else if (car (r1) == cell_closure) {
383     SCM args = caddr (r1);
384     SCM body = cdddr (r1);
385     SCM aa = cdadr (r1);
386     aa = cdr (aa);
387     SCM p = pairlis (args, r2, aa);
388     return call_lambda (body, p, aa, r0);
389   }
390 #if BOOT
391   else if (car (r1) == cell_symbol_label)
392     return apply_env (caddr (r1), r2, cons (cons (cadr (r1), caddr (r1)), r0));
393 #endif
394   SCM e = eval_env (r1, r0);
395   char const* type = 0;
396   if (e == cell_f || e == cell_t) type = "bool";
397   if (TYPE (e) == CHAR) type = "char";
398   if (TYPE (e) == NUMBER) type = "number";
399   if (TYPE (e) == STRING) type = "string";
400   if (e == cell_unspecified) type = "*unspecified*";
401   if (e == cell_undefined) type =  "*undefined*";
402   if (type)
403     {
404       fprintf (stderr, "cannot apply: %s: ", type);
405       display_ (stderr, e);
406       fprintf (stderr, " [");
407       display_ (stderr, r1);
408       fprintf (stderr, "]\n");
409       assert (!"cannot apply");
410     }
411   return apply_env (e, r2, r0);
412 }
413
414 SCM
415 vm_eval_env ()
416 {
417   switch (TYPE (r1))
418     {
419     case PAIR:
420       {
421         if (car (r1) == cell_symbol_quote)
422           return cadr (r1);
423 #if QUASISYNTAX
424         if (car (r1) == cell_symbol_syntax)
425           return r1;
426 #endif
427         if (car (r1) == cell_symbol_begin)
428           return begin_env (r1, r0);
429         if (car (r1) == cell_symbol_lambda)
430           return make_closure (cadr (r1), cddr (r1), assq (cell_closure, r0));
431         if (car (r1) == cell_closure)
432           return r1;
433         if (car (r1) == cell_symbol_if)
434           return if_env (cdr (r1), r0);
435 #if !BOOT
436         if (car (r1) == cell_symbol_define)
437           return define_env (r1, r0);
438         if (car (r1) == cell_symbol_define_macro)
439           return define_env (r1, r0);
440         if (car (r1) == cell_symbol_primitive_load)
441           return begin_env (read_input_file_env (r0), r0);
442 #else
443         if (car (r1) == cell_symbol_define) {
444         fprintf (stderr, "C DEFINE: ");
445         display_ (stderr,
446                   TYPE (cadr (r1)) == SYMBOL
447                   ? STRING (cadr (r1))
448                   : STRING (caadr (r1)));
449         fprintf (stderr, "\n");
450       }
451       assert (car (r1) != cell_symbol_define);
452       assert (car (r1) != cell_symbol_define_macro);
453 #endif
454 #if 1 //!BOOT
455       if (car (r1) == cell_symbol_set_x)
456         {
457           SCM x = eval_env (caddr (r1), r0);
458           return set_env_x (cadr (r1), x, r0);
459         }
460 #else
461       assert (car (r1) != cell_symbol_set_x);
462 #endif
463 #if QUASIQUOTE
464       if (car (r1) == cell_symbol_unquote)
465         return eval_env (cadr (r1), r0);
466       if (car (r1) == cell_symbol_quasiquote)
467         return eval_quasiquote (cadr (r1), add_unquoters (r0));
468 #endif //QUASIQUOTE
469 #if QUASISYNTAX
470       if (car (r1) == cell_symbol_unsyntax)
471         return eval_env (cadr (r1), r0);
472       if (car (r1) == cell_symbol_quasisyntax)
473         return eval_quasisyntax (cadr (r1), add_unsyntaxers (r0));
474 #endif //QUASISYNTAX
475       SCM x = expand_macro_env (r1, r0);
476       if (x != r1)
477           return eval_env (x, r0);
478       SCM m = evlis_env (CDR (r1), r0);
479       return apply_env (car (r1), m, r0);
480       }
481     case SYMBOL: return assert_defined (r1, assq_ref_cache (r1, r0));
482     default: return r1;
483     }
484 }
485
486 SCM
487 vm_expand_macro_env ()
488 {
489   if (TYPE (CAR (r1)) == STRING && string_to_symbol (CAR (r1)) == cell_symbol_noexpand)
490     return cadr (r1);
491
492   SCM macro;
493   SCM expanders;
494   if (TYPE (r1) == PAIR
495       && (macro = lookup_macro (car (r1), r0)) != cell_f)
496     return apply_env (macro, CDR (r1), r0);
497   else if (TYPE (r1) == PAIR
498            && TYPE (CAR (r1)) == SYMBOL
499            && ((expanders = assq_ref_cache (cell_symbol_sc_expander_alist, r0)) != cell_undefined)
500            && ((macro = assq (CAR (r1), expanders)) != cell_f))
501     {
502       SCM sc_expand = assq_ref_cache (cell_symbol_expand_macro, r0);
503       if (sc_expand != cell_undefined && sc_expand != cell_f)
504         r1 = apply_env (sc_expand, cons (r1, cell_nil), r0);
505     }
506   return r1;
507 }
508
509 SCM
510 vm_begin_env ()
511 {
512   SCM r = cell_unspecified;
513   while (r1 != cell_nil) {
514     if (TYPE (r1) == PAIR && TYPE (CAR (r1)) == PAIR && caar (r1) == cell_symbol_begin)
515       r1 = append2 (cdar (r1), cdr (r1));
516     r = eval_env (car (r1), r0);
517     r1 = CDR (r1);
518   }
519   return r;
520 }
521
522 SCM
523 vm_if_env ()
524 {
525   SCM x = eval_env (car (r1), r0);
526   if (x != cell_f)
527     return eval_env (cadr (r1), r0);
528   if (cddr (r1) != cell_nil)
529     return eval_env (caddr (r1), r0);
530   return cell_unspecified;
531 }
532
533 SCM
534 vm_call_with_values_env ()
535 {
536   SCM v = apply_env (r1, cell_nil, r0);
537   if (TYPE (v) == VALUES)
538     v = CDR (v);
539   return apply_env (r2, v, r0);
540 }
541
542 SCM
543 call (SCM fn, SCM x)
544 {
545   if ((FUNCTION (fn).arity > 0 || FUNCTION (fn).arity == -1)
546       && x != cell_nil && TYPE (CAR (x)) == VALUES)
547     x = cons (CADAR (x), CDR (x));
548   if ((FUNCTION (fn).arity > 1 || FUNCTION (fn).arity == -1)
549       && x != cell_nil && TYPE (CDR (x)) == PAIR && TYPE (CADR (x)) == VALUES)
550     x = cons (CAR (x), cons (CDADAR (x), CDR (x)));
551   switch (FUNCTION (fn).arity)
552     {
553     case 0: return FUNCTION (fn).function0 ();
554     case 1: return FUNCTION (fn).function1 (car (x));
555     case 2: return FUNCTION (fn).function2 (car (x), cadr (x));
556     case 3: return FUNCTION (fn).function3 (car (x), cadr (x), caddr (x));
557     case -1: return FUNCTION (fn).functionn (x);
558     }
559   return cell_unspecified;
560 }
561
562 SCM
563 gc_frame (SCM stack)
564 {
565   SCM frame = car (stack);
566   r1 = car (frame);
567   r2 = cadr (frame);
568   r3 = caddr (frame);
569   r0 = cadddr (frame);
570   return frame;
571 }
572
573 SCM
574 gc_stack (SCM a)
575 {
576   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
577   stack = cons (frame, stack);
578   stack = gc (stack);
579   gc_frame (stack);
580   stack = cdr (stack);
581   return stack;
582 }
583
584 SCM
585 vm_call (function0_t f, SCM p1, SCM p2, SCM a)
586 {
587   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
588   stack = cons (frame, stack);
589   r1 = p1;
590   r2 = p2;
591   r0 = a;
592   if (g_free.value + GC_SAFETY > ARENA_SIZE)
593     {
594       cache_invalidate_range (r0, cell_nil);
595       gc_stack (stack);
596     }
597
598   SCM r = f ();
599   frame = gc_frame (stack);
600   stack = cdr (stack);
601   return r;
602 }
603
604 SCM
605 evlis_env (SCM m, SCM a)
606 {
607   return vm_call (vm_evlis_env, m, cell_undefined, a);
608 }
609
610 SCM
611 apply_env (SCM fn, SCM x, SCM a)
612 {
613   return vm_call (vm_apply_env, fn, x, a);
614 }
615
616 SCM
617 eval_env (SCM e, SCM a)
618 {
619   return vm_call (vm_eval_env, e, cell_undefined, a);
620 }
621
622 SCM
623 expand_macro_env (SCM e, SCM a)
624 {
625   return vm_call (vm_expand_macro_env, e, cell_undefined, a);
626 }
627
628 SCM
629 begin_env (SCM e, SCM a)
630 {
631   return vm_call (vm_begin_env, e, cell_undefined, a);
632 }
633
634 SCM
635 if_env (SCM e, SCM a)
636 {
637   return vm_call (vm_if_env, e, cell_undefined, a);
638 }
639
640 SCM
641 call_with_values_env (SCM producer, SCM consumer, SCM a)
642 {
643   return vm_call (vm_call_with_values_env, producer, consumer, a);
644 }
645
646 SCM
647 append2 (SCM x, SCM y)
648 {
649   if (x == cell_nil) return y;
650   assert (TYPE (x) == PAIR);
651   return cons (car (x), append2 (cdr (x), y));
652 }
653
654 SCM
655 append (SCM x) ///((arity . n))
656  {
657   if (x == cell_nil) return cell_nil;
658   return append2 (car (x), append (cdr (x)));
659  }
660
661 SCM
662 make_char (int x)
663 {
664   g_cells[tmp_num].value = CHAR;
665   g_cells[tmp_num2].value = x;
666   return make_cell (tmp_num, tmp_num2, tmp_num2);
667 }
668
669 SCM
670 make_function (SCM name, SCM id, SCM arity)
671 {
672   g_cells[tmp_num3].value = FUNCTION;
673   function *f = (function*)malloc (sizeof (function));
674   f->arity = VALUE (arity);
675   g_cells[tmp_num4].value = (long)f;
676   return make_cell (tmp_num3, name, tmp_num4);
677 }
678
679 SCM
680 make_macro (SCM name, SCM x)
681 {
682   g_cells[tmp_num].value = MACRO;
683   return make_cell (tmp_num, STRING (name), x);
684 }
685
686 SCM
687 make_number (int x)
688 {
689   g_cells[tmp_num].value = NUMBER;
690   g_cells[tmp_num2].value = x;
691   return make_cell (tmp_num, tmp_num2, tmp_num2);
692 }
693
694 SCM
695 make_ref (SCM x)
696 {
697   g_cells[tmp_num].value = REF;
698   return make_cell (tmp_num, x, x);
699 }
700
701 SCM
702 make_string (SCM x)
703 {
704   g_cells[tmp_num].value = STRING;
705   return make_cell (tmp_num, x, 0);
706 }
707
708 SCM
709 cstring_to_list (char const* s)
710 {
711   SCM p = cell_nil;
712   int i = strlen (s);
713   while (i--)
714     p = cons (make_char (s[i]), p);
715   return p;
716 }
717
718 SCM
719 null_p (SCM x)
720 {
721   return x == cell_nil ? cell_t : cell_f;
722 }
723
724 SCM
725 internal_make_symbol (SCM s)
726 {
727   g_cells[tmp_num].value = SYMBOL;
728   SCM x = make_cell (tmp_num, s, 0);
729   g_symbols = cons (x, g_symbols);
730   return x;
731 }
732
733 SCM
734 make_symbol (SCM s)
735 {
736   SCM x = internal_lookup_symbol (s);
737   return x ? x : internal_make_symbol (s);
738 }
739
740 SCM
741 make_vector (SCM n)
742 {
743   int k = VALUE (n);
744   g_cells[tmp_num].value = VECTOR;
745   SCM v = alloc (k);
746   SCM x = make_cell (tmp_num, k, v);
747   for (int i=0; i<k; i++) g_cells[v+i] = g_cells[vector_entry (cell_unspecified)];
748   return x;
749 }
750
751 SCM
752 values (SCM x) ///((arity . n))
753 {
754   SCM v = cons (0, x);
755   TYPE (v) = VALUES;
756   return v;
757 }
758
759 SCM
760 vector_length (SCM x)
761 {
762   assert (TYPE (x) == VECTOR);
763   return make_number (LENGTH (x));
764 }
765
766 SCM
767 vector_ref (SCM x, SCM i)
768 {
769   assert (TYPE (x) == VECTOR);
770   assert (VALUE (i) < LENGTH (x));
771   SCM e = VECTOR (x) + VALUE (i);
772   if (TYPE (e) == REF) e = g_cells[e].ref;
773   if (TYPE (e) == CHAR) e = make_char (VALUE (e));
774   if (TYPE (e) == NUMBER) e = make_number (VALUE (e));
775   return e;
776 }
777
778 SCM
779 vector_entry (SCM x) {
780   if (TYPE (x) == PAIR || TYPE (x) == SPECIAL || TYPE (x) == STRING || TYPE (x) == SYMBOL || TYPE (x) == VECTOR) x = make_ref (x);
781   return x;
782 }
783
784 SCM
785 vector_set_x (SCM x, SCM i, SCM e)
786 {
787   assert (TYPE (x) == VECTOR);
788   assert (VALUE (i) < LENGTH (x));
789   g_cells[VECTOR (x)+g_cells[i].value] = g_cells[vector_entry (e)];
790   return cell_unspecified;
791 }
792
793 SCM
794 list_to_vector (SCM x)
795 {
796   VALUE (tmp_num) = VALUE (length (x));
797   SCM v = make_vector (tmp_num);
798   SCM p = VECTOR (v);
799   while (x != cell_nil)
800     {
801       g_cells[p++] = g_cells[vector_entry (car (x))];
802       x = cdr (x);
803     }
804   return v;
805 }
806
807 FILE *g_stdin;
808 int
809 getchar ()
810 {
811   return getc (g_stdin);
812 }
813
814 int
815 ungetchar (int c)
816 {
817   return ungetc (c, g_stdin);
818 }
819
820 int
821 peekchar ()
822 {
823   int c = getchar ();
824   ungetchar (c);
825   return c;
826 }
827
828 SCM
829 peek_byte ()
830 {
831   return make_number (peekchar ());
832 }
833
834 SCM
835 read_byte ()
836 {
837   return make_number (getchar ());
838 }
839
840 SCM
841 unread_byte (SCM i)
842 {
843   return ungetchar (VALUE (i));
844 }
845
846 SCM
847 write_char (SCM x) ///((arity . n))
848 {
849   SCM c = car (x);
850   SCM p = cdr (x);
851   int fd = 1;
852   if (TYPE (p) == PAIR && TYPE (car (p)) == NUMBER) fd = VALUE (car (p));
853   FILE *f = fd == 1 ? stdout : stderr;
854   assert (TYPE (c) == NUMBER || TYPE (c) == CHAR);
855   fputc (VALUE (c), f);
856   return c;
857 }
858
859 SCM
860 symbol_to_list (SCM x)
861 {
862   assert (TYPE (x) == SYMBOL);
863   return STRING (x);
864 }
865
866 SCM
867 char_to_integer (SCM x)
868 {
869   assert (TYPE (x) == CHAR);
870   return make_number (VALUE (x));
871 }
872
873 SCM
874 integer_to_char (SCM x)
875 {
876   assert (TYPE (x) == NUMBER);
877   return make_char (VALUE (x));
878 }
879
880 void
881 make_tmps (scm* cells)
882 {
883   tmp = g_free.value++;
884   cells[tmp].type = CHAR;
885   tmp_num = g_free.value++;
886   cells[tmp_num].type = NUMBER;
887   tmp_num2 = g_free.value++;
888   cells[tmp_num2].type = NUMBER;
889   tmp_num3 = g_free.value++;
890   cells[tmp_num3].type = NUMBER;
891   tmp_num4 = g_free.value++;
892   cells[tmp_num4].type = NUMBER;
893 }
894
895 //\f Jam Collector
896 SCM g_symbol_max;
897 scm *
898 gc_news ()
899 {
900   g_news = (scm *)malloc (ARENA_SIZE*sizeof(scm));
901   g_news[0].type = VECTOR;
902   g_news[0].length = 1000;
903   g_news[0].vector = 0;
904   g_news++;
905   g_news[0].type = CHAR;
906   g_news[0].value = 'n';
907   return g_news;
908 }
909
910 bool g_debug = false;
911
912 SCM
913 gc ()
914 {
915   if (g_debug) fprintf (stderr, "***gc[%d]...", g_free.value);
916   g_free.value = 1;
917   if (!g_news)
918     gc_news ();
919   for (int i=g_free.value; i<g_symbol_max; i++)
920     gc_copy (i);
921   make_tmps (g_news);
922   g_symbols = gc_copy (g_symbols);
923   SCM new = gc_copy (stack);
924   if (g_debug) fprintf (stderr, "new=%d\n", new, stack);
925   stack = new;
926   return gc_loop (1);
927 }
928
929 SCM
930 gc_loop (SCM scan)
931 {
932   while (scan < g_free.value)
933     {
934       if (NTYPE (scan) == MACRO
935           || NTYPE (scan) == PAIR
936           || NTYPE (scan) == REF
937           || scan == 1 // null
938           || NTYPE (scan) == SPECIAL
939           || NTYPE (scan) == STRING
940           || NTYPE (scan) == SYMBOL)
941         {
942           SCM car = gc_copy (g_news[scan].car);
943           gc_relocate_car (scan, car);
944         }
945       if ((NTYPE (scan) == MACRO
946            || NTYPE (scan) == PAIR
947            || NTYPE (scan) == VALUES)
948           && g_news[scan].cdr) // allow for 0 terminated list of symbols
949         {
950           SCM cdr = gc_copy (g_news[scan].cdr);
951           gc_relocate_cdr (scan, cdr);
952         }
953       scan++;
954     }
955   return gc_flip ();
956 }
957
958 SCM
959 gc_copy (SCM old)
960 {
961   if (TYPE (old) == BROKEN_HEART) return g_cells[old].car;
962   SCM new = g_free.value++;
963   g_news[new] = g_cells[old];
964   if (NTYPE (new) == VECTOR)
965     {
966       g_news[new].vector = g_free.value;
967       for (int i=0; i<LENGTH (old); i++)
968         g_news[g_free.value++] = g_cells[VECTOR (old)+i];
969     }
970   g_cells[old].type = BROKEN_HEART;
971   g_cells[old].car = new;
972   return new;
973 }
974
975 SCM
976 gc_relocate_car (SCM new, SCM car)
977 {
978   g_news[new].car = car;
979   return cell_unspecified;
980 }
981
982 SCM
983 gc_relocate_cdr (SCM new, SCM cdr)
984 {
985   g_news[new].cdr = cdr;
986   return cell_unspecified;
987 }
988
989 SCM
990 gc_flip ()
991 {
992   scm *cells = g_cells;
993   g_cells = g_news;
994   g_news = cells;
995   if (g_debug) fprintf (stderr, " => jam[%d]\n", g_free.value);
996   return stack;
997 }
998
999 SCM
1000 gc_show ()
1001 {
1002   fprintf (stderr, "cells: ");
1003   scm *t = g_cells;
1004   display_ (stderr, -1);
1005   fprintf (stderr, "\n");
1006   if (g_news)
1007     {
1008       fprintf (stderr, "news: ");
1009       g_cells = g_news;
1010       display_ (stderr, -1);
1011       fprintf (stderr, "\n");
1012     }
1013   g_cells = t;
1014   return cell_unspecified;
1015 }
1016
1017 //\f Environment setup
1018 SCM
1019 acons (SCM key, SCM value, SCM alist)
1020 {
1021   return cons (cons (key, value), alist);
1022 }
1023
1024 SCM
1025 add_environment (SCM a, char const *name, SCM x)
1026 {
1027   return acons (make_symbol (cstring_to_list (name)), x, a);
1028 }
1029
1030 SCM
1031 mes_symbols () ///((internal))
1032 {
1033   g_cells = (scm *)malloc (ARENA_SIZE*sizeof(scm));
1034   g_cells[0].type = VECTOR;
1035   g_cells[0].length = 1000;
1036   g_cells[0].vector = 0;
1037   g_cells++;
1038
1039   g_cells[0].type = CHAR;
1040   g_cells[0].value = 'c';
1041   g_free.value = 1; // 0 is tricky
1042
1043 #include "mes.symbols.i"
1044
1045   g_symbol_max = g_free.value;
1046   make_tmps (g_cells);
1047
1048   g_symbols = 0;
1049   for (int i=1; i<g_symbol_max; i++)
1050     g_symbols = cons (i, g_symbols);
1051
1052   SCM a = cell_nil;
1053
1054 #if BOOT
1055   a = acons (cell_symbol_label, cell_t, a);
1056 #endif
1057   a = acons (cell_symbol_begin, cell_begin, a);
1058   a = add_environment (a, "sc-expand", cell_f);
1059   a = acons (cell_closure, a, a);
1060
1061   internal_lookup_symbol (cell_nil);
1062
1063   return a;
1064 }
1065
1066 SCM
1067 mes_builtins (SCM a)
1068 {
1069 #include "mes.i"
1070
1071 #include "cache.i"
1072 #include "define.i"
1073 #include "display.i"
1074 #include "lib.i"
1075 #include "math.i"
1076 #include "posix.i"
1077 #include "quasiquote.i"
1078 #include "reader.i"
1079 #include "string.i"
1080 #include "type.i"
1081
1082 #include "cache.environment.i"
1083 #include "define.environment.i"
1084 #include "display.environment.i"
1085 #include "lib.environment.i"
1086 #include "math.environment.i"
1087 #include "mes.environment.i"
1088 #include "posix.environment.i"
1089   //#include "quasiquote.environment.i"
1090 #include "reader.environment.i"
1091 #include "string.environment.i"
1092 #include "type.environment.i"
1093
1094   SCM cell_unquote = assq_ref_cache (cell_symbol_unquote, a);
1095   SCM cell_unquote_splicing = assq_ref_cache (cell_symbol_unquote_splicing, a);
1096   SCM the_unquoters = cons (cons (cell_symbol_unquote, cell_unquote),
1097                             cons (cons (cell_symbol_unquote_splicing, cell_unquote_splicing),
1098                                   cell_nil));
1099   a = acons (cell_symbol_the_unquoters, the_unquoters, a);
1100
1101   a = add_environment (a, "*foo-bar-baz*", cell_nil); // FIXME: some off-by one?
1102
1103   return a;
1104 }
1105
1106 SCM
1107 mes_stack (SCM a) ///((internal))
1108 {
1109   r0 = a;
1110   r1 = make_char (0);
1111   r2 = make_char (0);
1112   r3 = make_char (0);
1113   stack = cons (cell_nil, cell_nil);
1114   return r0;
1115 }
1116
1117 SCM
1118 mes_environment () ///((internal))
1119 {
1120   SCM a = mes_symbols ();
1121   return mes_stack (a);
1122 }
1123
1124 SCM
1125 make_lambda (SCM args, SCM body)
1126 {
1127   return cons (cell_symbol_lambda, cons (args, body));
1128 }
1129
1130 SCM
1131 make_closure (SCM args, SCM body, SCM a)
1132 {
1133   return cons (cell_closure, cons (cons (cell_circular, a), cons (args, body)));
1134 }
1135
1136 SCM
1137 lookup_macro (SCM x, SCM a)
1138 {
1139   if (TYPE (x) != SYMBOL) return cell_f;
1140   SCM m = assq_ref_cache (x, a);
1141   if (macro_p (m) == cell_t) return MACRO (m);
1142   return cell_f;
1143 }
1144
1145 SCM
1146 read_input_file_env_ (SCM e, SCM a)
1147 {
1148   if (e == cell_nil) return e;
1149   return cons (e, read_input_file_env_ (read_env (a), a));
1150 }
1151
1152 SCM
1153 read_input_file_env (SCM a)
1154 {
1155   return read_input_file_env_ (read_env (r0), r0);
1156 }
1157
1158 bool g_dump_p = false;
1159
1160 SCM
1161 load_env (SCM a)
1162 {
1163   r3 = read_input_file_env (r0);
1164   if (g_dump_p && !g_function)
1165     {
1166       r1 = g_symbols;
1167       SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
1168       stack = cons (frame, stack);
1169       stack = gc (stack);
1170       gc_frame (stack);
1171       char *p = (char*)g_cells;
1172       fputc ('M', stdout);
1173       fputc ('E', stdout);
1174       fputc ('S', stdout);
1175       fputc (stack >> 8, stdout);
1176       fputc (stack % 256, stdout);
1177       for (int i=0; i<g_free.value * sizeof(scm); i++)
1178         fputc (*p++, stdout);
1179       return 0;
1180     }
1181   if (!g_function)
1182     r0 = mes_builtins (r0);
1183   return begin_env (r3, r0);
1184 }
1185
1186 SCM
1187 bload_env (SCM a)
1188 {
1189   g_stdin = fopen ("read-0.mo", "r");
1190   char *p = (char*)g_cells;
1191   assert (getchar () == 'M');
1192   assert (getchar () == 'E');
1193   assert (getchar () == 'S');
1194   stack = getchar () << 8;
1195   stack += getchar ();
1196   int c = getchar ();
1197   while (c != EOF)
1198     {
1199       *p++ = c;
1200       c = getchar ();
1201     }
1202   g_free.value = (p-(char*)g_cells) / sizeof (scm);
1203   gc_frame (stack);
1204   g_symbols = r1;
1205   g_stdin = stdin;
1206
1207   r0 = mes_builtins (r0);
1208
1209   return begin_env (r3, r0);
1210 }
1211
1212 #include "type.c"
1213 #include "cache.c"
1214 #include "define.c"
1215 #include "display.c"
1216 #include "lib.c"
1217 #include "math.c"
1218 #include "posix.c"
1219 #include "quasiquote.c"
1220 #include "reader.c"
1221 #include "string.c"
1222
1223 int
1224 main (int argc, char *argv[])
1225 {
1226   g_debug = getenv ("MES_DEBUG");
1227   if (argc > 1 && !strcmp (argv[1], "--dump")) g_dump_p = true;
1228   if (argc > 1 && !strcmp (argv[1], "--help")) return puts ("Usage: mes < FILE\n");
1229   if (argc > 1 && !strcmp (argv[1], "--version")) return puts ("Mes 0.2\n");
1230   g_stdin = stdin;
1231   SCM a = mes_environment ();
1232   if (argc > 1 && !strcmp (argv[1], "--load"))
1233     display_ (stderr, bload_env (a));
1234   else
1235     display_ (stderr, load_env (a));
1236   fputs ("", stderr);
1237   gc (stack);
1238   if (g_debug) fprintf (stderr, "\nstats: [%d]\n", g_free.value);
1239   return 0;
1240 }