eb39096c24f9caecef87fb7c5ad16eab0363f67d
[mes.git] / mes.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #define _GNU_SOURCE
22 #include <assert.h>
23 #include <ctype.h>
24 #include <errno.h>
25 #include <limits.h>
26 #include <stdio.h>
27 #include <string.h>
28 #include <stdlib.h>
29 #include <stdbool.h>
30
31 #define DEBUG 0
32 #define QUASIQUOTE 0
33 #define QUASISYNTAX 0
34 #define ENV_CACHE 0
35 #define FIXED_PRIMITIVES 1
36 #define READER 1
37
38 #if READER
39 int ARENA_SIZE = 1000000;
40 #else
41 int ARENA_SIZE = 100000;
42 #endif
43 int MAX_ARENA_SIZE = 20000000;
44 int GC_SAFETY = 100;
45
46 typedef int SCM;
47 enum type_t {CHAR, FUNCTION, KEYWORD, MACRO, NUMBER, PAIR, SPECIAL, STRING, SYMBOL, REF, VALUES, VECTOR, BROKEN_HEART};
48 typedef SCM (*function0_t) (void);
49 typedef SCM (*function1_t) (SCM);
50 typedef SCM (*function2_t) (SCM, SCM);
51 typedef SCM (*function3_t) (SCM, SCM, SCM);
52 typedef SCM (*functionn_t) (SCM);
53 typedef struct function_t {
54   union {
55     function0_t function0;
56     function1_t function1;
57     function2_t function2;
58     function3_t function3;
59     functionn_t functionn;
60   };
61   int arity;
62 } function;
63 struct scm_t;
64 typedef struct scm_t {
65   enum type_t type;
66   union {
67     char const *name;
68     SCM string;
69     SCM car;
70     SCM ref;
71     int length;
72   };
73   union {
74     int value;
75     int function;
76     SCM cdr;
77     SCM macro;
78     SCM vector;
79     int hits;
80   };
81 } scm;
82
83 scm scm_nil = {SPECIAL, "()"};
84 scm scm_f = {SPECIAL, "#f"};
85 scm scm_t = {SPECIAL, "#t"};
86 scm scm_dot = {SPECIAL, "."};
87 scm scm_arrow = {SPECIAL, "=>"};
88 scm scm_undefined = {SPECIAL, "*undefined*"};
89 scm scm_unspecified = {SPECIAL, "*unspecified*"};
90 scm scm_closure = {SPECIAL, "*closure*"};
91 scm scm_circular = {SPECIAL, "*circular*"};
92 #if BOOT
93 scm scm_label = {
94   SPECIAL, "label"};
95 #endif
96 scm scm_begin = {SPECIAL, "*begin*"};
97
98 scm scm_symbol_lambda = {SYMBOL, "lambda"};
99 scm scm_symbol_begin = {SYMBOL, "begin"};
100 scm scm_symbol_if = {SYMBOL, "if"};
101 scm scm_symbol_define = {SYMBOL, "define"};
102 scm scm_symbol_define_macro = {SYMBOL, "define-macro"};
103 scm scm_symbol_set_x = {SYMBOL, "set!"};
104
105 scm scm_symbol_quote = {SYMBOL, "quote"};
106 scm scm_symbol_quasiquote = {SYMBOL, "quasiquote"};
107 scm scm_symbol_unquote = {SYMBOL, "unquote"};
108 scm scm_symbol_unquote_splicing = {SYMBOL, "unquote-splicing"};
109
110 scm scm_symbol_sc_expand = {SYMBOL, "sc-expand"};
111 scm scm_symbol_expand_macro = {SYMBOL, "expand-macro"};
112 scm scm_symbol_sc_expander_alist = {SYMBOL, "*sc-expander-alist*"};
113 scm scm_symbol_noexpand = {SYMBOL, "noexpand"};
114 scm scm_symbol_syntax = {SYMBOL, "syntax"};
115 scm scm_symbol_quasisyntax = {SYMBOL, "quasisyntax"};
116 scm scm_symbol_unsyntax = {SYMBOL, "unsyntax"};
117 scm scm_symbol_unsyntax_splicing = {SYMBOL, "unsyntax-splicing"};
118
119 scm scm_symbol_call_with_values = {SYMBOL, "call-with-values"};
120 scm scm_symbol_current_module = {SYMBOL, "current-module"};
121 scm scm_symbol_primitive_load = {SYMBOL, "primitive-load"};
122 scm scm_symbol_read_input_file = {SYMBOL, "read-input-file"};
123
124 scm scm_symbol_the_unquoters = {SYMBOL, "*the-unquoters*"};
125 scm scm_symbol_the_unsyntaxers = {SYMBOL, "*the-unsyntaxers*"};
126
127 scm scm_symbol_car = {SYMBOL, "car"};
128 scm scm_symbol_cdr = {SYMBOL, "cdr"};
129 scm scm_symbol_null_p = {SYMBOL, "null?"};
130 scm scm_symbol_eq_p = {SYMBOL, "eq?"};
131 scm scm_symbol_cons = {SYMBOL, "cons"};
132
133 scm char_eof = {CHAR, .name="*eof*", .value=-1};
134 scm char_nul = {CHAR, .name="nul", .value=0};
135 scm char_alarm = {CHAR, .name="alarm", .value=8};
136 scm char_backspace = {CHAR, .name="backspace", .value=8};
137 scm char_tab = {CHAR, .name="tab", .value=9};
138 scm char_newline = {CHAR, .name="newline", .value=10};
139 scm char_vtab = {CHAR, .name="vtab", .value=11};
140 scm char_page = {CHAR, .name="page", .value=12};
141 scm char_return = {CHAR, .name="return", .value=13};
142 scm char_space = {CHAR, .name="space", .value=32};
143
144 scm g_free = {NUMBER, .value=0};
145 scm *g_cells;
146 scm *g_news = 0;
147
148 #include "mes.symbols.h"
149
150 SCM tmp;
151 SCM tmp_num;
152 SCM tmp_num2;
153 SCM tmp_num3;
154 SCM tmp_num4;
155
156 function functions[200];
157 int g_function = 0;
158
159 SCM g_symbols = 0;
160 SCM stack = 0;
161 SCM r0 = 0; // a/env
162 SCM r1 = 0; // param 1
163 SCM r2 = 0; // param 2
164 SCM r3 = 0; // param 3
165
166 #include "display.h"
167 #include "lib.h"
168 #include "math.h"
169 #include "mes.h"
170 #include "posix.h"
171 #include "quasiquote.h"
172 #include "reader.h"
173 #include "string.h"
174 #include "type.h"
175
176 #define CAR(x) g_cells[x].car
177 #define CDR(x) g_cells[x].cdr
178 #define HITS(x) g_cells[x].hits
179 #define LENGTH(x) g_cells[x].length
180 #define NAME(x) g_cells[x].name
181 #define STRING(x) g_cells[x].string
182 #define TYPE(x) g_cells[x].type
183 #define MACRO(x) g_cells[x].macro
184 #define REF(x) g_cells[x].ref
185 #define VALUE(x) g_cells[x].value
186 #define VECTOR(x) g_cells[x].vector
187 #define FUNCTION(x) functions[g_cells[x].function]
188 #define NCAR(x) g_news[x].car
189 #define NTYPE(x) g_news[x].type
190
191 #define CAAR(x) CAR (CAR (x))
192 #define CDAR(x) CDR (CAR (x))
193 #define CAAR(x) CAR (CAR (x))
194 #define CADAR(x) CAR (CDR (CAR (x)))
195 #define CADDR(x) CAR (CDR (CDR (x)))
196 #define CDADAR(x) CAR (CDR (CAR (CDR (x))))
197 #define CADR(x) CAR (CDR (x))
198
199 SCM display_ (FILE* f, SCM x);
200 SCM vm_call (function0_t f, SCM p1, SCM p2, SCM a);
201
202 SCM
203 alloc (int n)
204 {
205   assert (g_free.value + n < ARENA_SIZE);
206   SCM x = g_free.value;
207   g_free.value += n;
208   return x;
209 }
210
211 SCM
212 make_cell (SCM type, SCM car, SCM cdr)
213 {
214   SCM x = alloc (1);
215   assert (TYPE (type) == NUMBER);
216   TYPE (x) = VALUE (type);
217   if (VALUE (type) == CHAR || VALUE (type) == NUMBER) {
218     if (car) CAR (x) = CAR (car);
219     if (cdr) CDR (x) = CDR (cdr);
220   } else if (VALUE (type) == FUNCTION) {
221     if (car) CAR (x) = car;
222     if (cdr) CDR (x) = CDR (cdr);
223   } else {
224     CAR (x) = car;
225     CDR (x) = cdr;
226   }
227   return x;
228 }
229
230 SCM
231 cons (SCM x, SCM y)
232 {
233   g_cells[tmp_num].value = PAIR;
234   return make_cell (tmp_num, x, y);
235 }
236
237 SCM
238 car (SCM x)
239 {
240   assert (TYPE (x) == PAIR);
241   return CAR (x);
242 }
243
244 SCM
245 cdr (SCM x)
246 {
247   assert (TYPE (x) == PAIR);
248   return CDR (x);
249 }
250
251 SCM
252 eq_p (SCM x, SCM y)
253 {
254   return (x == y
255           || ((TYPE (x) == KEYWORD && TYPE (y) == KEYWORD
256                && STRING (x) == STRING (y)))
257           || (TYPE (x) == CHAR && TYPE (y) == CHAR
258               && VALUE (x) == VALUE (y))
259           || (TYPE (x) == NUMBER && TYPE (y) == NUMBER
260               && VALUE (x) == VALUE (y)))
261     ? cell_t : cell_f;
262 }
263
264 SCM
265 set_car_x (SCM x, SCM e)
266 {
267   assert (TYPE (x) == PAIR);
268   CAR (x) = e;
269   return cell_unspecified;
270 }
271
272 SCM
273 set_cdr_x (SCM x, SCM e)
274 {
275   assert (TYPE (x) == PAIR);
276   CDR (x) = e;
277   return cell_unspecified;
278 }
279
280 SCM
281 set_env_x (SCM x, SCM e, SCM a)
282 {
283   SCM p = assert_defined (x, assq (x, a));
284   return set_cdr_x (p, e);
285 }
286
287 SCM
288 quote (SCM x)
289 {
290   return cons (cell_symbol_quote, x);
291 }
292
293 SCM
294 quasiquote (SCM x)
295 {
296   return cons (cell_symbol_quasiquote, x);
297 }
298
299 SCM
300 quasisyntax (SCM x)
301 {
302   return cons (cell_symbol_quasisyntax, x);
303 }
304
305 SCM
306 pairlis (SCM x, SCM y, SCM a)
307 {
308   if (x == cell_nil)
309     return a;
310   if (pair_p (x) == cell_f)
311     return cons (cons (x, y), a);
312   return cons (cons (car (x), car (y)),
313                pairlis (cdr (x), cdr (y), a));
314 }
315
316 SCM
317 assq (SCM x, SCM a)
318 {
319   while (a != cell_nil && eq_p (x, CAAR (a)) == cell_f)
320     {
321       if (TYPE (a) == BROKEN_HEART || TYPE (CAR (a)) == BROKEN_HEART)
322         fprintf (stderr, "oops, broken heart\n");
323       a = CDR (a);
324     }
325   return a != cell_nil ? car (a) : cell_f;
326 }
327
328 SCM
329 assq_ref_cache (SCM x, SCM a)
330 {
331   x = assq (x, a);
332   if (x == cell_f) return cell_undefined;
333   return cdr (x);
334 }
335
336 SCM
337 assert_defined (SCM x, SCM e)
338 {
339   if (e == cell_undefined)
340     {
341       fprintf (stderr, "eval: unbound variable:");
342       display_ (stderr, x);
343       fprintf (stderr, "\n");
344       assert (!"unbound variable");
345     }
346   return e;
347 }
348
349 SCM
350 vm_evlis_env ()
351 {
352   if (r1 == cell_nil) return cell_nil;
353   if (TYPE (r1) != PAIR) return eval_env (r1, r0);
354   r2 = eval_env (car (r1), r0);
355   r1 = evlis_env (cdr (r1), r0);
356   return cons (r2, r1);
357 }
358
359 SCM
360 vm_call_lambda ()
361 {
362   return vm_call (vm_begin_env, r1, cell_undefined, r0);
363 }
364
365 SCM
366 call_lambda (SCM e, SCM x, SCM aa, SCM a) ///((internal))
367 {
368   SCM cl = cons (cons (cell_closure, x), x);
369   r1 = e;
370   r0 = cl;
371   r2 = a;
372   r3 = aa;
373   return vm_call_lambda ();
374 }
375
376 SCM
377 vm_apply_env ()
378 {
379   if (TYPE (r1) != PAIR)
380     {
381       if (TYPE (r1) == FUNCTION) return call (r1, r2);
382       if (r1 == cell_symbol_call_with_values)
383         return call_with_values_env (car (r2), cadr (r2), r0);
384       if (r1 == cell_symbol_current_module) return r0;
385     }
386   else
387     switch (car (r1))
388       {
389       case cell_symbol_lambda:
390         {
391           SCM args = cadr (r1);
392           SCM body = cddr (r1);
393           SCM p = pairlis (args, r2, r0);
394           return call_lambda (body, p, p, r0);
395         }
396       case cell_closure:
397         {
398           SCM args = caddr (r1);
399           SCM body = cdddr (r1);
400           SCM aa = cdadr (r1);
401           aa = cdr (aa);
402           SCM p = pairlis (args, r2, aa);
403           return call_lambda (body, p, aa, r0);
404         }
405 #if BOOT
406       case cell_symbol_label:
407         return apply_env (caddr (r1), r2, cons (cons (cadr (r1), caddr (r1)), r0));
408 #endif
409       }
410   SCM e = eval_env (r1, r0);
411   char const* type = 0;
412   if (e == cell_f || e == cell_t) type = "bool";
413   if (TYPE (e) == CHAR) type = "char";
414   if (TYPE (e) == NUMBER) type = "number";
415   if (TYPE (e) == STRING) type = "string";
416   if (e == cell_unspecified) type = "*unspecified*";
417   if (e == cell_undefined) type =  "*undefined*";
418   if (type)
419     {
420       fprintf (stderr, "cannot apply: %s: ", type);
421       display_ (stderr, e);
422       fprintf (stderr, " [");
423       display_ (stderr, r1);
424       fprintf (stderr, "]\n");
425       assert (!"cannot apply");
426     }
427   return apply_env (e, r2, r0);
428 }
429
430 SCM
431 vm_eval_env ()
432 {
433   switch (TYPE (r1))
434     {
435     case PAIR:
436       {
437         switch (car (r1))
438           {
439 #if FIXED_PRIMITIVES
440           case cell_symbol_car: return car (eval_env (CADR (r1), r0));
441           case cell_symbol_cdr: return cdr (eval_env (CADR (r1), r0));
442           case cell_symbol_cons: {SCM m = evlis_env (CDR (r1), r0);
443               return cons (CAR (m), CADR (m));}
444           case cell_symbol_null_p: return null_p (eval_env (CADR (r1), r0));
445 #endif // FIXED_PRIMITIVES
446           case cell_symbol_quote: return cadr (r1);
447 #if QUASISYNTAX
448           case cell_symbol_syntax: return cadr (r1);
449 #endif
450           case cell_symbol_begin: return begin_env (r1, r0);
451           case cell_symbol_lambda:
452             return make_closure (cadr (r1), cddr (r1), assq (cell_closure, r0));
453           case cell_closure: return r1;
454           case cell_symbol_if: return if_env (cdr (r1), r0);
455 #if 1 //!BOOT
456           case cell_symbol_set_x: {
457             SCM x = eval_env (caddr (r1), r0); return set_env_x (cadr (r1), x, r0);
458           }
459 #endif
460 #if QUASIQUOTE
461           case cell_symbol_unquote: return eval_env (cadr (r1), r0);
462           case cell_symbol_quasiquote: return eval_quasiquote (cadr (r1), add_unquoters (r0));
463 #endif //QUASIQUOTE
464 #if QUASISYNTAX
465           case cell_symbol_unsyntax: return eval_env (cadr (r1), r0);
466           case cell_symbol_quasisyntax: return eval_quasisyntax (cadr (r1), add_unsyntaxers (r0));
467 #endif //QUASISYNTAX
468           default: {
469             SCM x = expand_macro_env (r1, r0);
470             if (x != r1)
471               {
472                 if (TYPE (x) == PAIR)
473                   {
474                     set_cdr_x (r1, cdr (x));
475                     set_car_x (r1, car (x));
476                   }
477                 else
478                   r1 = x;
479                 return eval_env (x, r0);
480               }
481             SCM m = evlis_env (CDR (r1), r0);
482             return apply_env (car (r1), m, r0);
483           }
484           }
485       }
486     case SYMBOL: return assert_defined (r1, assq_ref_cache (r1, r0));
487     default: return r1;
488     }
489 }
490
491 SCM
492 vm_expand_macro_env ()
493 {
494   if (TYPE (CAR (r1)) == STRING && string_to_symbol (CAR (r1)) == cell_symbol_noexpand)
495     return cadr (r1);
496
497   SCM macro;
498   SCM expanders;
499   if (TYPE (r1) == PAIR
500       && (macro = lookup_macro (car (r1), r0)) != cell_f)
501     return apply_env (macro, CDR (r1), r0);
502   else if (TYPE (r1) == PAIR
503            && TYPE (CAR (r1)) == SYMBOL
504            && ((expanders = assq_ref_cache (cell_symbol_sc_expander_alist, r0)) != cell_undefined)
505            && ((macro = assq (CAR (r1), expanders)) != cell_f))
506     {
507       SCM sc_expand = assq_ref_cache (cell_symbol_expand_macro, r0);
508       if (sc_expand != cell_undefined && sc_expand != cell_f)
509         r1 = apply_env (sc_expand, cons (r1, cell_nil), r0);
510     }
511   return r1;
512 }
513
514 SCM
515 vm_begin_env ()
516 {
517   SCM r = cell_unspecified;
518   while (r1 != cell_nil) {
519     if (TYPE (r1) == PAIR && TYPE (CAR (r1)) == PAIR)
520       {
521         if (caar (r1) == cell_symbol_begin)
522           r1 = append2 (cdar (r1), cdr (r1));
523         else if (caar (r1) == cell_symbol_primitive_load)
524           {
525             SCM f = read_input_file_env (r0);
526             r1 = append2 (f, cdr (r1));
527           }
528       }
529     r = eval_env (car (r1), r0);
530     r1 = CDR (r1);
531   }
532   return r;
533 }
534
535 SCM
536 vm_if_env ()
537 {
538   SCM x = eval_env (car (r1), r0);
539   if (x != cell_f)
540     return eval_env (cadr (r1), r0);
541   if (cddr (r1) != cell_nil)
542     return eval_env (caddr (r1), r0);
543   return cell_unspecified;
544 }
545
546 SCM
547 vm_call_with_values_env ()
548 {
549   SCM v = apply_env (r1, cell_nil, r0);
550   if (TYPE (v) == VALUES)
551     v = CDR (v);
552   return apply_env (r2, v, r0);
553 }
554
555 SCM
556 call (SCM fn, SCM x)
557 {
558   if ((FUNCTION (fn).arity > 0 || FUNCTION (fn).arity == -1)
559       && x != cell_nil && TYPE (CAR (x)) == VALUES)
560     x = cons (CADAR (x), CDR (x));
561   if ((FUNCTION (fn).arity > 1 || FUNCTION (fn).arity == -1)
562       && x != cell_nil && TYPE (CDR (x)) == PAIR && TYPE (CADR (x)) == VALUES)
563     x = cons (CAR (x), cons (CDADAR (x), CDR (x)));
564   switch (FUNCTION (fn).arity)
565     {
566     case 0: return FUNCTION (fn).function0 ();
567     case 1: return FUNCTION (fn).function1 (car (x));
568     case 2: return FUNCTION (fn).function2 (car (x), cadr (x));
569     case 3: return FUNCTION (fn).function3 (car (x), cadr (x), caddr (x));
570     case -1: return FUNCTION (fn).functionn (x);
571     }
572   return cell_unspecified;
573 }
574
575 SCM
576 gc_frame (SCM stack)
577 {
578   SCM frame = car (stack);
579   r1 = car (frame);
580   r2 = cadr (frame);
581   r3 = caddr (frame);
582   r0 = cadddr (frame);
583   return frame;
584 }
585
586 SCM
587 gc_stack (SCM a)
588 {
589   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
590   stack = cons (frame, stack);
591   stack = gc (stack);
592   gc_frame (stack);
593   stack = cdr (stack);
594   return stack;
595 }
596
597 SCM
598 vm_call (function0_t f, SCM p1, SCM p2, SCM a)
599 {
600   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
601   stack = cons (frame, stack);
602   r1 = p1;
603   r2 = p2;
604   r0 = a;
605   if (g_free.value + GC_SAFETY > ARENA_SIZE)
606     gc_stack (stack);
607
608   SCM r = f ();
609   frame = gc_frame (stack);
610   stack = cdr (stack);
611   return r;
612 }
613
614 SCM
615 evlis_env (SCM m, SCM a)
616 {
617   return vm_call (vm_evlis_env, m, cell_undefined, a);
618 }
619
620 SCM
621 apply_env (SCM fn, SCM x, SCM a)
622 {
623   return vm_call (vm_apply_env, fn, x, a);
624 }
625
626 SCM
627 eval_env (SCM e, SCM a)
628 {
629   return vm_call (vm_eval_env, e, cell_undefined, a);
630 }
631
632 SCM
633 expand_macro_env (SCM e, SCM a)
634 {
635   return vm_call (vm_expand_macro_env, e, cell_undefined, a);
636 }
637
638 SCM
639 begin_env (SCM e, SCM a)
640 {
641   return vm_call (vm_begin_env, e, cell_undefined, a);
642 }
643
644 SCM
645 if_env (SCM e, SCM a)
646 {
647   return vm_call (vm_if_env, e, cell_undefined, a);
648 }
649
650 SCM
651 call_with_values_env (SCM producer, SCM consumer, SCM a)
652 {
653   return vm_call (vm_call_with_values_env, producer, consumer, a);
654 }
655
656 SCM
657 append2 (SCM x, SCM y)
658 {
659   if (x == cell_nil) return y;
660   assert (TYPE (x) == PAIR);
661   return cons (car (x), append2 (cdr (x), y));
662 }
663
664 SCM
665 append (SCM x) ///((arity . n))
666  {
667   if (x == cell_nil) return cell_nil;
668   if (cdr (x) == cell_nil) return car (x);
669   return append2 (car (x), append (cdr (x)));
670  }
671
672 SCM
673 make_char (int x)
674 {
675   g_cells[tmp_num].value = CHAR;
676   g_cells[tmp_num2].value = x;
677   return make_cell (tmp_num, tmp_num2, tmp_num2);
678 }
679
680 SCM
681 make_function (SCM name, SCM id, SCM arity)
682 {
683   g_cells[tmp_num3].value = FUNCTION;
684   function *f = (function*)malloc (sizeof (function));
685   f->arity = VALUE (arity);
686   g_cells[tmp_num4].value = (long)f;
687   return make_cell (tmp_num3, name, tmp_num4);
688 }
689
690 SCM
691 make_keyword (SCM s)
692 {
693   SCM x = internal_lookup_symbol (s);
694   x = x ? x : internal_make_symbol (s);
695   g_cells[tmp_num].value = KEYWORD;
696   return make_cell (tmp_num, STRING (x), 0);
697 }
698
699 SCM
700 make_macro (SCM name, SCM x)
701 {
702   g_cells[tmp_num].value = MACRO;
703   return make_cell (tmp_num, STRING (name), x);
704 }
705
706 SCM
707 make_number (int x)
708 {
709   g_cells[tmp_num].value = NUMBER;
710   g_cells[tmp_num2].value = x;
711   return make_cell (tmp_num, tmp_num2, tmp_num2);
712 }
713
714 SCM
715 make_ref (SCM x)
716 {
717   g_cells[tmp_num].value = REF;
718   return make_cell (tmp_num, x, x);
719 }
720
721 SCM
722 make_string (SCM x)
723 {
724   g_cells[tmp_num].value = STRING;
725   return make_cell (tmp_num, x, 0);
726 }
727
728 SCM
729 cstring_to_list (char const* s)
730 {
731   SCM p = cell_nil;
732   int i = strlen (s);
733   while (i--)
734     p = cons (make_char (s[i]), p);
735   return p;
736 }
737
738 SCM
739 null_p (SCM x)
740 {
741   return x == cell_nil ? cell_t : cell_f;
742 }
743
744 SCM
745 internal_make_symbol (SCM s)
746 {
747   g_cells[tmp_num].value = SYMBOL;
748   SCM x = make_cell (tmp_num, s, 0);
749   g_symbols = cons (x, g_symbols);
750   return x;
751 }
752
753 SCM
754 make_symbol (SCM s)
755 {
756   SCM x = internal_lookup_symbol (s);
757   return x ? x : internal_make_symbol (s);
758 }
759
760 SCM
761 make_vector (SCM n)
762 {
763   int k = VALUE (n);
764   g_cells[tmp_num].value = VECTOR;
765   SCM v = alloc (k);
766   SCM x = make_cell (tmp_num, k, v);
767   for (int i=0; i<k; i++) g_cells[v+i] = g_cells[vector_entry (cell_unspecified)];
768   return x;
769 }
770
771 SCM
772 values (SCM x) ///((arity . n))
773 {
774   SCM v = cons (0, x);
775   TYPE (v) = VALUES;
776   return v;
777 }
778
779 SCM
780 vector_length (SCM x)
781 {
782   assert (TYPE (x) == VECTOR);
783   return make_number (LENGTH (x));
784 }
785
786 SCM
787 vector_ref (SCM x, SCM i)
788 {
789   assert (TYPE (x) == VECTOR);
790   assert (VALUE (i) < LENGTH (x));
791   SCM e = VECTOR (x) + VALUE (i);
792   if (TYPE (e) == REF) e = g_cells[e].ref;
793   if (TYPE (e) == CHAR) e = make_char (VALUE (e));
794   if (TYPE (e) == NUMBER) e = make_number (VALUE (e));
795   return e;
796 }
797
798 SCM
799 vector_entry (SCM x) {
800   if (TYPE (x) == PAIR || TYPE (x) == SPECIAL || TYPE (x) == STRING || TYPE (x) == SYMBOL || TYPE (x) == VECTOR) x = make_ref (x);
801   return x;
802 }
803
804 SCM
805 vector_set_x (SCM x, SCM i, SCM e)
806 {
807   assert (TYPE (x) == VECTOR);
808   assert (VALUE (i) < LENGTH (x));
809   g_cells[VECTOR (x)+g_cells[i].value] = g_cells[vector_entry (e)];
810   return cell_unspecified;
811 }
812
813 SCM
814 list_to_vector (SCM x)
815 {
816   VALUE (tmp_num) = VALUE (length (x));
817   SCM v = make_vector (tmp_num);
818   SCM p = VECTOR (v);
819   while (x != cell_nil)
820     {
821       g_cells[p++] = g_cells[vector_entry (car (x))];
822       x = cdr (x);
823     }
824   return v;
825 }
826
827 FILE *g_stdin;
828 int
829 getchar ()
830 {
831   return getc (g_stdin);
832 }
833
834 int
835 ungetchar (int c)
836 {
837   return ungetc (c, g_stdin);
838 }
839
840 int
841 peekchar ()
842 {
843   int c = getchar ();
844   ungetchar (c);
845   return c;
846 }
847
848 SCM
849 peek_byte ()
850 {
851   return make_number (peekchar ());
852 }
853
854 SCM
855 read_byte ()
856 {
857   return make_number (getchar ());
858 }
859
860 SCM
861 unread_byte (SCM i)
862 {
863   ungetchar (VALUE (i));
864   return i;
865 }
866
867 SCM
868 write_char (SCM x) ///((arity . n))
869 {
870   SCM c = car (x);
871   SCM p = cdr (x);
872   int fd = 1;
873   if (TYPE (p) == PAIR && TYPE (car (p)) == NUMBER) fd = VALUE (car (p));
874   FILE *f = fd == 1 ? stdout : stderr;
875   assert (TYPE (c) == NUMBER || TYPE (c) == CHAR);
876   fputc (VALUE (c), f);
877   return c;
878 }
879
880 SCM
881 symbol_to_list (SCM x)
882 {
883   assert (TYPE (x) == SYMBOL);
884   return STRING (x);
885 }
886
887 SCM
888 char_to_integer (SCM x)
889 {
890   assert (TYPE (x) == CHAR);
891   return make_number (VALUE (x));
892 }
893
894 SCM
895 integer_to_char (SCM x)
896 {
897   assert (TYPE (x) == NUMBER);
898   return make_char (VALUE (x));
899 }
900
901 void
902 make_tmps (scm* cells)
903 {
904   tmp = g_free.value++;
905   cells[tmp].type = CHAR;
906   tmp_num = g_free.value++;
907   cells[tmp_num].type = NUMBER;
908   tmp_num2 = g_free.value++;
909   cells[tmp_num2].type = NUMBER;
910   tmp_num3 = g_free.value++;
911   cells[tmp_num3].type = NUMBER;
912   tmp_num4 = g_free.value++;
913   cells[tmp_num4].type = NUMBER;
914 }
915
916 //\f Jam Collector
917 SCM g_symbol_max;
918 bool g_debug = false;
919
920 SCM
921 gc_up_arena ()
922 {
923   ARENA_SIZE *= 2;
924   void *p = realloc (g_cells-1, 2*ARENA_SIZE*sizeof(scm));
925   if (!p)
926     {
927       if (g_debug) fprintf (stderr, "cannot up arena: %s: arena=%d\n", strerror (errno), 2*ARENA_SIZE);
928       return cell_unspecified;
929     }
930   g_cells = (scm*)p;
931   g_cells++;
932   gc_init_news ();
933 }
934
935 SCM
936 gc ()
937 {
938   if (g_debug) fprintf (stderr, "***gc[%d]...", g_free.value);
939   g_free.value = 1;
940   if (g_cells < g_news && ARENA_SIZE < MAX_ARENA_SIZE) gc_up_arena ();
941   for (int i=g_free.value; i<g_symbol_max; i++)
942     gc_copy (i);
943   make_tmps (g_news);
944   g_symbols = gc_copy (g_symbols);
945   SCM new = gc_copy (stack);
946   if (g_debug) fprintf (stderr, "new=%d\n", new, stack);
947   stack = new;
948   return gc_loop (1);
949 }
950
951 SCM
952 gc_loop (SCM scan)
953 {
954   while (scan < g_free.value)
955     {
956       if (NTYPE (scan) == KEYWORD
957           || NTYPE (scan) == MACRO
958           || NTYPE (scan) == PAIR
959           || NTYPE (scan) == REF
960           || scan == 1 // null
961           || NTYPE (scan) == SPECIAL
962           || NTYPE (scan) == STRING
963           || NTYPE (scan) == SYMBOL)
964         {
965           SCM car = gc_copy (g_news[scan].car);
966           gc_relocate_car (scan, car);
967         }
968       if ((NTYPE (scan) == MACRO
969            || NTYPE (scan) == PAIR
970            || NTYPE (scan) == VALUES)
971           && g_news[scan].cdr) // allow for 0 terminated list of symbols
972         {
973           SCM cdr = gc_copy (g_news[scan].cdr);
974           gc_relocate_cdr (scan, cdr);
975         }
976       scan++;
977     }
978   return gc_flip ();
979 }
980
981 SCM
982 gc_copy (SCM old)
983 {
984   if (TYPE (old) == BROKEN_HEART) return g_cells[old].car;
985   SCM new = g_free.value++;
986   g_news[new] = g_cells[old];
987   if (NTYPE (new) == VECTOR)
988     {
989       g_news[new].vector = g_free.value;
990       for (int i=0; i<LENGTH (old); i++)
991         g_news[g_free.value++] = g_cells[VECTOR (old)+i];
992     }
993   g_cells[old].type = BROKEN_HEART;
994   g_cells[old].car = new;
995   return new;
996 }
997
998 SCM
999 gc_relocate_car (SCM new, SCM car)
1000 {
1001   g_news[new].car = car;
1002   return cell_unspecified;
1003 }
1004
1005 SCM
1006 gc_relocate_cdr (SCM new, SCM cdr)
1007 {
1008   g_news[new].cdr = cdr;
1009   return cell_unspecified;
1010 }
1011
1012 SCM
1013 gc_flip ()
1014 {
1015   scm *cells = g_cells;
1016   g_cells = g_news;
1017   g_news = cells;
1018   if (g_debug) fprintf (stderr, " => jam[%d]\n", g_free.value);
1019   return stack;
1020 }
1021
1022 SCM
1023 gc_show ()
1024 {
1025   fprintf (stderr, "cells: ");
1026   scm *t = g_cells;
1027   display_ (stderr, -1);
1028   fprintf (stderr, "\n");
1029   if (g_news)
1030     {
1031       fprintf (stderr, "news: ");
1032       g_cells = g_news;
1033       display_ (stderr, -1);
1034       fprintf (stderr, "\n");
1035     }
1036   g_cells = t;
1037   return cell_unspecified;
1038 }
1039
1040 //\f Environment setup
1041 SCM
1042 acons (SCM key, SCM value, SCM alist)
1043 {
1044   return cons (cons (key, value), alist);
1045 }
1046
1047 SCM
1048 add_environment (SCM a, char const *name, SCM x)
1049 {
1050   return acons (make_symbol (cstring_to_list (name)), x, a);
1051 }
1052
1053 SCM
1054 gc_init_cells ()
1055 {
1056   g_cells = (scm *)malloc (2*ARENA_SIZE*sizeof(scm));
1057   g_cells[0].type = VECTOR;
1058   g_cells[0].length = 1000;
1059   g_cells[0].vector = 0;
1060   g_cells++;
1061   g_cells[0].type = CHAR;
1062   g_cells[0].value = 'c';
1063 }
1064
1065 SCM
1066 gc_init_news ()
1067 {
1068   g_news = g_cells-1 + ARENA_SIZE;
1069   g_news[0].type = VECTOR;
1070   g_news[0].length = 1000;
1071   g_news[0].vector = 0;
1072   g_news++;
1073   g_news[0].type = CHAR;
1074   g_news[0].value = 'n';
1075 }
1076
1077 SCM
1078 mes_symbols () ///((internal))
1079 {
1080   gc_init_cells ();
1081   gc_init_news ();
1082
1083 #include "mes.symbols.i"
1084
1085   g_symbol_max = g_free.value;
1086   make_tmps (g_cells);
1087
1088   g_symbols = 0;
1089   for (int i=1; i<g_symbol_max; i++)
1090     g_symbols = cons (i, g_symbols);
1091
1092   SCM a = cell_nil;
1093
1094 #if BOOT
1095   a = acons (cell_symbol_label, cell_t, a);
1096 #endif
1097   a = acons (cell_symbol_begin, cell_begin, a);
1098   a = add_environment (a, "sc-expand", cell_f);
1099   a = acons (cell_closure, a, a);
1100
1101   internal_lookup_symbol (cell_nil);
1102
1103   return a;
1104 }
1105
1106 SCM
1107 mes_builtins (SCM a)
1108 {
1109 #include "mes.i"
1110
1111 #include "display.i"
1112 #include "lib.i"
1113 #include "math.i"
1114 #include "posix.i"
1115 #include "quasiquote.i"
1116 #include "reader.i"
1117 #include "string.i"
1118 #include "type.i"
1119
1120 #include "display.environment.i"
1121 #include "lib.environment.i"
1122 #include "math.environment.i"
1123 #include "mes.environment.i"
1124 #include "posix.environment.i"
1125   //#include "quasiquote.environment.i"
1126 #include "reader.environment.i"
1127 #include "string.environment.i"
1128 #include "type.environment.i"
1129
1130 #if QUASIQUOTE
1131   SCM cell_unquote = assq_ref_cache (cell_symbol_unquote, a);
1132   SCM cell_unquote_splicing = assq_ref_cache (cell_symbol_unquote_splicing, a);
1133   SCM the_unquoters = cons (cons (cell_symbol_unquote, cell_unquote),
1134                             cons (cons (cell_symbol_unquote_splicing, cell_unquote_splicing),
1135                                   cell_nil));
1136   a = acons (cell_symbol_the_unquoters, the_unquoters, a);
1137 #endif
1138 #if QUASISYNTAX
1139   SCM cell_unsyntax = assq_ref_cache (cell_symbol_unsyntax, a);
1140   SCM cell_unsyntax_splicing = assq_ref_cache (cell_symbol_unsyntax_splicing, a);
1141   SCM the_unsyntaxers = cons (cons (cell_symbol_unsyntax, cell_unsyntax),
1142                               cons (cons (cell_symbol_unsyntax_splicing, cell_unsyntax_splicing),
1143                                   cell_nil));
1144   a = acons (cell_symbol_the_unsyntaxers, the_unsyntaxers, a);
1145 #endif
1146
1147   a = add_environment (a, "*dot*", cell_dot);
1148   a = add_environment (a, "*foo-bar-baz*", cell_nil); // FIXME: some off-by one?
1149
1150   return a;
1151 }
1152
1153 SCM
1154 mes_stack (SCM a) ///((internal))
1155 {
1156   r0 = a;
1157   r1 = make_char (0);
1158   r2 = make_char (0);
1159   r3 = make_char (0);
1160   stack = cons (cell_nil, cell_nil);
1161   return r0;
1162 }
1163
1164 SCM
1165 mes_environment () ///((internal))
1166 {
1167   SCM a = mes_symbols ();
1168   return mes_stack (a);
1169 }
1170
1171 SCM
1172 make_lambda (SCM args, SCM body)
1173 {
1174   return cons (cell_symbol_lambda, cons (args, body));
1175 }
1176
1177 SCM
1178 make_closure (SCM args, SCM body, SCM a)
1179 {
1180   return cons (cell_closure, cons (cons (cell_circular, a), cons (args, body)));
1181 }
1182
1183 SCM
1184 lookup_macro (SCM x, SCM a)
1185 {
1186   if (TYPE (x) != SYMBOL) return cell_f;
1187   SCM m = assq_ref_cache (x, a);
1188   if (macro_p (m) == cell_t) return MACRO (m);
1189   return cell_f;
1190 }
1191
1192 SCM
1193 read_input_file_env_ (SCM e, SCM a)
1194 {
1195   if (e == cell_nil) return e;
1196   return cons (e, read_input_file_env_ (read_env (a), a));
1197 }
1198
1199 SCM
1200 read_input_file_env (SCM a)
1201 {
1202   r0 = a;
1203 #if READER
1204   return read_input_file_env_ (read_env (r0), r0);
1205 #endif
1206   return apply_env (cell_symbol_read_input_file, cell_nil, r0);
1207 }
1208
1209 SCM
1210 load_env (SCM a) ///((internal))
1211 {
1212   r0 =a;
1213 #if 1 //!READER
1214   g_stdin = fopen ("module/mes/read-0.mes", "r");
1215   g_stdin = g_stdin ? g_stdin : fopen (PREFIX "module/mes/read-0.mes", "r");
1216 #endif
1217   if (!g_function) r0 = mes_builtins (r0);
1218   r3 = read_input_file_env (r0);
1219   g_stdin = stdin;
1220   return r3;
1221 }
1222
1223 SCM
1224 bload_env (SCM a) ///((internal))
1225 {
1226   g_stdin = fopen ("module/mes/read-0.mo", "r");
1227   g_stdin = g_stdin ? g_stdin : fopen (PREFIX "module/mes/read-0.mo", "r");
1228   char *p = (char*)g_cells;
1229   assert (getchar () == 'M');
1230   assert (getchar () == 'E');
1231   assert (getchar () == 'S');
1232   stack = getchar () << 8;
1233   stack += getchar ();
1234   int c = getchar ();
1235   while (c != EOF)
1236     {
1237       *p++ = c;
1238       c = getchar ();
1239     }
1240   g_free.value = (p-(char*)g_cells) / sizeof (scm);
1241   gc_frame (stack);
1242   g_symbols = r1;
1243   g_stdin = stdin;
1244
1245   r0 = mes_builtins (r0);
1246   return r3;
1247 }
1248
1249 int
1250 dump ()
1251 {
1252   r1 = g_symbols;
1253   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
1254   stack = cons (frame, stack);
1255   stack = gc (stack);
1256   gc_frame (stack);
1257   char *p = (char*)g_cells;
1258   fputc ('M', stdout);
1259   fputc ('E', stdout);
1260   fputc ('S', stdout);
1261   fputc (stack >> 8, stdout);
1262   fputc (stack % 256, stdout);
1263   for (int i=0; i<g_free.value * sizeof(scm); i++)
1264     fputc (*p++, stdout);
1265   return 0;
1266 }
1267
1268 #include "type.c"
1269 #include "display.c"
1270 #include "lib.c"
1271 #include "math.c"
1272 #include "posix.c"
1273 #include "quasiquote.c"
1274 #include "reader.c"
1275 #include "string.c"
1276
1277 int
1278 main (int argc, char *argv[])
1279 {
1280   g_debug = getenv ("MES_DEBUG");
1281   if (getenv ("MES_ARENA")) ARENA_SIZE = atoi (getenv ("MES_ARENA"));
1282   if (argc > 1 && !strcmp (argv[1], "--help")) return puts ("Usage: mes < FILE\n");
1283   if (argc > 1 && !strcmp (argv[1], "--version")) return puts ("Mes 0.3\n");
1284   g_stdin = stdin;
1285   r0 = mes_environment ();
1286   SCM program = (argc > 1 && !strcmp (argv[1], "--load"))
1287     ? bload_env (r0) : load_env (r0);
1288   if (argc > 1 && !strcmp (argv[1], "--dump")) return dump ();
1289   display_ (stderr, begin_env (program, r0));
1290   fputs ("", stderr);
1291   gc (stack);
1292   if (g_debug) fprintf (stderr, "\nstats: [%d]\n", g_free.value);
1293   return 0;
1294 }