e1956300eaf78ac43be2d234ec11569567a2bfee
[mes.git] / mes.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #define _GNU_SOURCE
22 #include <assert.h>
23 #include <ctype.h>
24 #include <errno.h>
25 #include <limits.h>
26 #include <stdio.h>
27 #include <string.h>
28 #include <stdlib.h>
29 #include <stdbool.h>
30
31 #define DEBUG 0
32 #define QUASIQUOTE 1
33 #define QUASISYNTAX 0
34 #define ENV_CACHE 0
35 #define FIXED_PRIMITIVES 1
36
37 int ARENA_SIZE = 100000;
38 int MAX_ARENA_SIZE = 20000000;
39 int GC_SAFETY = 100;
40
41 typedef long SCM;
42 enum type_t {CHAR, FUNCTION, MACRO, NUMBER, PAIR, SPECIAL, STRING, SYMBOL, REF, VALUES, VECTOR, BROKEN_HEART};
43 typedef SCM (*function0_t) (void);
44 typedef SCM (*function1_t) (SCM);
45 typedef SCM (*function2_t) (SCM, SCM);
46 typedef SCM (*function3_t) (SCM, SCM, SCM);
47 typedef SCM (*functionn_t) (SCM);
48 typedef struct function_t {
49   union {
50     function0_t function0;
51     function1_t function1;
52     function2_t function2;
53     function3_t function3;
54     functionn_t functionn;
55   };
56   int arity;
57 } function;
58 struct scm_t;
59 typedef struct scm_t {
60   enum type_t type;
61   union {
62     char const *name;
63     SCM string;
64     SCM car;
65     SCM ref;
66     int length;
67   };
68   union {
69     int value;
70     int function;
71     SCM cdr;
72     SCM macro;
73     SCM vector;
74     int hits;
75   };
76 } scm;
77
78 function functions[200];
79 int g_function = 0;
80
81 #include "mes.symbols.h"
82 #include "define.h"
83 #include "display.h"
84 #include "lib.h"
85 #include "math.h"
86 #include "mes.h"
87 #include "posix.h"
88 #include "quasiquote.h"
89 #include "reader.h"
90 #include "string.h"
91 #include "type.h"
92
93 SCM g_symbols = 0;
94 SCM stack = 0;
95 SCM r0 = 0; // a/env
96 SCM r1 = 0; // param 1
97 SCM r2 = 0; // param 2
98 SCM r3 = 0; // param 3
99
100 SCM tmp;
101 SCM tmp_num;
102 SCM tmp_num2;
103 SCM tmp_num3;
104 SCM tmp_num4;
105
106 scm scm_nil = {SPECIAL, "()"};
107 scm scm_f = {SPECIAL, "#f"};
108 scm scm_t = {SPECIAL, "#t"};
109 scm scm_dot = {SPECIAL, "."};
110 scm scm_undefined = {SPECIAL, "*undefined*"};
111 scm scm_unspecified = {SPECIAL, "*unspecified*"};
112 scm scm_closure = {SPECIAL, "*closure*"};
113 scm scm_circular = {SPECIAL, "*circular*"};
114 #if BOOT
115 scm scm_label = {
116   SPECIAL, "label"};
117 #endif
118 scm scm_begin = {SPECIAL, "*begin*"};
119
120 scm scm_symbol_lambda = {SYMBOL, "lambda"};
121 scm scm_symbol_begin = {SYMBOL, "begin"};
122 scm scm_symbol_if = {SYMBOL, "if"};
123 scm scm_symbol_define = {SYMBOL, "define"};
124 scm scm_symbol_define_macro = {SYMBOL, "define-macro"};
125 scm scm_symbol_set_x = {SYMBOL, "set!"};
126
127 scm scm_symbol_quote = {SYMBOL, "quote"};
128 scm scm_symbol_quasiquote = {SYMBOL, "quasiquote"};
129 scm scm_symbol_unquote = {SYMBOL, "unquote"};
130 scm scm_symbol_unquote_splicing = {SYMBOL, "unquote-splicing"};
131
132 scm scm_symbol_sc_expand = {SYMBOL, "sc-expand"};
133 scm scm_symbol_expand_macro = {SYMBOL, "expand-macro"};
134 scm scm_symbol_sc_expander_alist = {SYMBOL, "*sc-expander-alist*"};
135 scm scm_symbol_noexpand = {SYMBOL, "noexpand"};
136 scm scm_symbol_syntax = {SYMBOL, "syntax"};
137 scm scm_symbol_quasisyntax = {SYMBOL, "quasisyntax"};
138 scm scm_symbol_unsyntax = {SYMBOL, "unsyntax"};
139 scm scm_symbol_unsyntax_splicing = {SYMBOL, "unsyntax-splicing"};
140
141 scm scm_symbol_call_with_values = {SYMBOL, "call-with-values"};
142 scm scm_symbol_current_module = {SYMBOL, "current-module"};
143 scm scm_symbol_primitive_load = {SYMBOL, "primitive-load"};
144
145 scm scm_symbol_the_unquoters = {SYMBOL, "*the-unquoters*"};
146
147 scm scm_symbol_car = {SYMBOL, "car"};
148 scm scm_symbol_cdr = {SYMBOL, "cdr"};
149 scm scm_symbol_null_p = {SYMBOL, "null?"};
150 scm scm_symbol_eq_p = {SYMBOL, "eq?"};
151 scm scm_symbol_cons = {SYMBOL, "cons"};
152
153 scm char_eof = {CHAR, .name="*eof*", .value=-1};
154 scm char_nul = {CHAR, .name="nul", .value=0};
155 scm char_backspace = {CHAR, .name="backspace", .value=8};
156 scm char_tab = {CHAR, .name="tab", .value=9};
157 scm char_newline = {CHAR, .name="newline", .value=10};
158 scm char_vt = {CHAR, .name="vt", .value=11};
159 scm char_page = {CHAR, .name="page", .value=12};
160 scm char_return = {CHAR, .name="return", .value=13};
161 scm char_space = {CHAR, .name="space", .value=32};
162
163 scm g_free = {NUMBER, .value=0};
164 scm *g_cells;
165 scm *g_news = 0;
166
167 #define CAR(x) g_cells[x].car
168 #define CDR(x) g_cells[x].cdr
169 #define HITS(x) g_cells[x].hits
170 #define LENGTH(x) g_cells[x].length
171 #define NAME(x) g_cells[x].name
172 #define STRING(x) g_cells[x].string
173 #define TYPE(x) g_cells[x].type
174 #define MACRO(x) g_cells[x].macro
175 #define REF(x) g_cells[x].ref
176 #define VALUE(x) g_cells[x].value
177 #define VECTOR(x) g_cells[x].vector
178 #define FUNCTION(x) functions[g_cells[x].function]
179 #define NCAR(x) g_news[x].car
180 #define NTYPE(x) g_news[x].type
181
182 #define CAAR(x) CAR (CAR (x))
183 #define CDAR(x) CDR (CAR (x))
184 #define CAAR(x) CAR (CAR (x))
185 #define CADAR(x) CAR (CDR (CAR (x)))
186 #define CADDR(x) CAR (CDR (CDR (x)))
187 #define CDADAR(x) CAR (CDR (CAR (CDR (x))))
188 #define CADR(x) CAR (CDR (x))
189
190 SCM display_ (FILE* f, SCM x);
191 SCM vm_call (function0_t f, SCM p1, SCM p2, SCM a);
192
193 SCM
194 alloc (int n)
195 {
196   assert (g_free.value + n < ARENA_SIZE);
197   SCM x = g_free.value;
198   g_free.value += n;
199   return x;
200 }
201
202 SCM
203 make_cell (SCM type, SCM car, SCM cdr)
204 {
205   SCM x = alloc (1);
206   assert (TYPE (type) == NUMBER);
207   TYPE (x) = VALUE (type);
208   if (VALUE (type) == CHAR || VALUE (type) == NUMBER) {
209     if (car) CAR (x) = CAR (car);
210     if (cdr) CDR (x) = CDR (cdr);
211   } else if (VALUE (type) == FUNCTION) {
212     if (car) CAR (x) = car;
213     if (cdr) CDR (x) = CDR (cdr);
214   } else {
215     CAR (x) = car;
216     CDR (x) = cdr;
217   }
218   return x;
219 }
220
221 SCM
222 cons (SCM x, SCM y)
223 {
224   g_cells[tmp_num].value = PAIR;
225   return make_cell (tmp_num, x, y);
226 }
227
228 SCM
229 car (SCM x)
230 {
231   assert (TYPE (x) == PAIR);
232   return CAR (x);
233 }
234
235 SCM
236 cdr (SCM x)
237 {
238   assert (TYPE (x) == PAIR);
239   return CDR (x);
240 }
241
242 SCM
243 eq_p (SCM x, SCM y)
244 {
245   return (x == y
246           || (TYPE (x) == CHAR && TYPE (y) == CHAR
247               && VALUE (x) == VALUE (y))
248           || (TYPE (x) == NUMBER && TYPE (y) == NUMBER
249               && VALUE (x) == VALUE (y)))
250     ? cell_t : cell_f;
251 }
252
253 SCM
254 set_car_x (SCM x, SCM e)
255 {
256   assert (TYPE (x) == PAIR);
257   CAR (x) = e;
258   return cell_unspecified;
259 }
260
261 SCM
262 set_cdr_x (SCM x, SCM e)
263 {
264   assert (TYPE (x) == PAIR);
265   CDR (x) = e;
266   return cell_unspecified;
267 }
268
269 SCM
270 set_env_x (SCM x, SCM e, SCM a)
271 {
272   SCM p = assert_defined (x, assq (x, a));
273   return set_cdr_x (p, e);
274 }
275
276 SCM
277 quote (SCM x)
278 {
279   return cons (cell_symbol_quote, x);
280 }
281
282 SCM
283 quasiquote (SCM x)
284 {
285   return cons (cell_symbol_quasiquote, x);
286 }
287
288 SCM
289 quasisyntax (SCM x)
290 {
291   return cons (cell_symbol_quasisyntax, x);
292 }
293
294 SCM
295 pairlis (SCM x, SCM y, SCM a)
296 {
297   if (x == cell_nil)
298     return a;
299   if (pair_p (x) == cell_f)
300     return cons (cons (x, y), a);
301   return cons (cons (car (x), car (y)),
302                pairlis (cdr (x), cdr (y), a));
303 }
304
305 SCM
306 assq (SCM x, SCM a)
307 {
308   while (a != cell_nil && eq_p (x, CAAR (a)) == cell_f)
309     {
310       if (TYPE (a) == BROKEN_HEART || TYPE (CAR (a)) == BROKEN_HEART)
311         fprintf (stderr, "oops, broken heart\n");
312       a = CDR (a);
313     }
314   return a != cell_nil ? car (a) : cell_f;
315 }
316
317 SCM
318 assq_ref_cache (SCM x, SCM a)
319 {
320   x = assq (x, a);
321   if (x == cell_f) return cell_undefined;
322   return cdr (x);
323 }
324
325 SCM
326 assert_defined (SCM x, SCM e)
327 {
328   if (e == cell_undefined)
329     {
330       fprintf (stderr, "eval: unbound variable:");
331       display_ (stderr, x);
332       fprintf (stderr, "\n");
333       assert (!"unbound variable");
334     }
335   return e;
336 }
337
338 SCM
339 vm_evlis_env ()
340 {
341   if (r1 == cell_nil) return cell_nil;
342   if (TYPE (r1) != PAIR) return eval_env (r1, r0);
343   r2 = eval_env (car (r1), r0);
344   r1 = evlis_env (cdr (r1), r0);
345   return cons (r2, r1);
346 }
347
348 SCM
349 vm_call_lambda ()
350 {
351   return vm_call (vm_begin_env, r1, cell_undefined, r0);
352 }
353
354 SCM
355 call_lambda (SCM e, SCM x, SCM aa, SCM a) ///((internal))
356 {
357   SCM cl = cons (cons (cell_closure, x), x);
358   r1 = e;
359   r0 = cl;
360   r2 = a;
361   r3 = aa;
362   return vm_call_lambda ();
363 }
364
365 SCM
366 vm_apply_env ()
367 {
368   if (TYPE (r1) != PAIR)
369     {
370       if (TYPE (r1) == FUNCTION) return call (r1, r2);
371       if (r1 == cell_symbol_call_with_values)
372         return call_with_values_env (car (r2), cadr (r2), r0);
373       if (r1 == cell_symbol_current_module) return r0;
374     }
375   else if (car (r1) == cell_symbol_lambda) {
376     SCM args = cadr (r1);
377     SCM body = cddr (r1);
378     SCM p = pairlis (args, r2, r0);
379     return call_lambda (body, p, p, r0);
380   }
381   else if (car (r1) == cell_closure) {
382     SCM args = caddr (r1);
383     SCM body = cdddr (r1);
384     SCM aa = cdadr (r1);
385     aa = cdr (aa);
386     SCM p = pairlis (args, r2, aa);
387     return call_lambda (body, p, aa, r0);
388   }
389 #if BOOT
390   else if (car (r1) == cell_symbol_label)
391     return apply_env (caddr (r1), r2, cons (cons (cadr (r1), caddr (r1)), r0));
392 #endif
393   SCM e = eval_env (r1, r0);
394   char const* type = 0;
395   if (e == cell_f || e == cell_t) type = "bool";
396   if (TYPE (e) == CHAR) type = "char";
397   if (TYPE (e) == NUMBER) type = "number";
398   if (TYPE (e) == STRING) type = "string";
399   if (e == cell_unspecified) type = "*unspecified*";
400   if (e == cell_undefined) type =  "*undefined*";
401   if (type)
402     {
403       fprintf (stderr, "cannot apply: %s: ", type);
404       display_ (stderr, e);
405       fprintf (stderr, " [");
406       display_ (stderr, r1);
407       fprintf (stderr, "]\n");
408       assert (!"cannot apply");
409     }
410   return apply_env (e, r2, r0);
411 }
412
413 SCM
414 vm_eval_env ()
415 {
416   switch (TYPE (r1))
417     {
418     case PAIR:
419       {
420 #if FIXED_PRIMITIVES
421         if (car (r1) == cell_symbol_car)
422           return car (eval_env (CADR (r1), r0));
423         if (car (r1) == cell_symbol_cdr)
424           return cdr (eval_env (CADR (r1), r0));
425         if (car (r1) == cell_symbol_cons) {
426           SCM m = evlis_env (CDR (r1), r0);
427           return cons (CAR (m), CADR (m));
428         }
429         if (car (r1) == cell_symbol_null_p)
430           return null_p (eval_env (CADR (r1), r0));
431 #endif // FIXED_PRIMITIVES
432         if (car (r1) == cell_symbol_quote)
433           return cadr (r1);
434 #if QUASISYNTAX
435         if (car (r1) == cell_symbol_syntax)
436           return r1;
437 #endif
438         if (car (r1) == cell_symbol_begin)
439           return begin_env (r1, r0);
440         if (car (r1) == cell_symbol_lambda)
441           return make_closure (cadr (r1), cddr (r1), assq (cell_closure, r0));
442         if (car (r1) == cell_closure)
443           return r1;
444         if (car (r1) == cell_symbol_if)
445           return if_env (cdr (r1), r0);
446 #if !BOOT
447         if (car (r1) == cell_symbol_define)
448           return define_env (r1, r0);
449         if (car (r1) == cell_symbol_define_macro)
450           return define_env (r1, r0);
451         if (car (r1) == cell_symbol_primitive_load)
452           return begin_env (read_input_file_env (r0), r0);
453 #else
454         if (car (r1) == cell_symbol_define) {
455         fprintf (stderr, "C DEFINE: ");
456         display_ (stderr,
457                   TYPE (cadr (r1)) == SYMBOL
458                   ? STRING (cadr (r1))
459                   : STRING (caadr (r1)));
460         fprintf (stderr, "\n");
461       }
462       assert (car (r1) != cell_symbol_define);
463       assert (car (r1) != cell_symbol_define_macro);
464 #endif
465 #if 1 //!BOOT
466       if (car (r1) == cell_symbol_set_x)
467         {
468           SCM x = eval_env (caddr (r1), r0);
469           return set_env_x (cadr (r1), x, r0);
470         }
471 #else
472       assert (car (r1) != cell_symbol_set_x);
473 #endif
474 #if QUASIQUOTE
475       if (car (r1) == cell_symbol_unquote)
476         return eval_env (cadr (r1), r0);
477       if (car (r1) == cell_symbol_quasiquote)
478         return eval_quasiquote (cadr (r1), add_unquoters (r0));
479 #endif //QUASIQUOTE
480 #if QUASISYNTAX
481       if (car (r1) == cell_symbol_unsyntax)
482         return eval_env (cadr (r1), r0);
483       if (car (r1) == cell_symbol_quasisyntax)
484         return eval_quasisyntax (cadr (r1), add_unsyntaxers (r0));
485 #endif //QUASISYNTAX
486       SCM x = expand_macro_env (r1, r0);
487       if (x != r1)
488           return eval_env (x, r0);
489       SCM m = evlis_env (CDR (r1), r0);
490       return apply_env (car (r1), m, r0);
491       }
492     case SYMBOL: return assert_defined (r1, assq_ref_cache (r1, r0));
493     default: return r1;
494     }
495 }
496
497 SCM
498 vm_expand_macro_env ()
499 {
500   if (TYPE (CAR (r1)) == STRING && string_to_symbol (CAR (r1)) == cell_symbol_noexpand)
501     return cadr (r1);
502
503   SCM macro;
504   SCM expanders;
505   if (TYPE (r1) == PAIR
506       && (macro = lookup_macro (car (r1), r0)) != cell_f)
507     return apply_env (macro, CDR (r1), r0);
508   else if (TYPE (r1) == PAIR
509            && TYPE (CAR (r1)) == SYMBOL
510            && ((expanders = assq_ref_cache (cell_symbol_sc_expander_alist, r0)) != cell_undefined)
511            && ((macro = assq (CAR (r1), expanders)) != cell_f))
512     {
513       SCM sc_expand = assq_ref_cache (cell_symbol_expand_macro, r0);
514       if (sc_expand != cell_undefined && sc_expand != cell_f)
515         r1 = apply_env (sc_expand, cons (r1, cell_nil), r0);
516     }
517   return r1;
518 }
519
520 SCM
521 vm_begin_env ()
522 {
523   SCM r = cell_unspecified;
524   while (r1 != cell_nil) {
525     if (TYPE (r1) == PAIR && TYPE (CAR (r1)) == PAIR && caar (r1) == cell_symbol_begin)
526       r1 = append2 (cdar (r1), cdr (r1));
527     r = eval_env (car (r1), r0);
528     r1 = CDR (r1);
529   }
530   return r;
531 }
532
533 SCM
534 vm_if_env ()
535 {
536   SCM x = eval_env (car (r1), r0);
537   if (x != cell_f)
538     return eval_env (cadr (r1), r0);
539   if (cddr (r1) != cell_nil)
540     return eval_env (caddr (r1), r0);
541   return cell_unspecified;
542 }
543
544 SCM
545 vm_call_with_values_env ()
546 {
547   SCM v = apply_env (r1, cell_nil, r0);
548   if (TYPE (v) == VALUES)
549     v = CDR (v);
550   return apply_env (r2, v, r0);
551 }
552
553 SCM
554 call (SCM fn, SCM x)
555 {
556   if ((FUNCTION (fn).arity > 0 || FUNCTION (fn).arity == -1)
557       && x != cell_nil && TYPE (CAR (x)) == VALUES)
558     x = cons (CADAR (x), CDR (x));
559   if ((FUNCTION (fn).arity > 1 || FUNCTION (fn).arity == -1)
560       && x != cell_nil && TYPE (CDR (x)) == PAIR && TYPE (CADR (x)) == VALUES)
561     x = cons (CAR (x), cons (CDADAR (x), CDR (x)));
562   switch (FUNCTION (fn).arity)
563     {
564     case 0: return FUNCTION (fn).function0 ();
565     case 1: return FUNCTION (fn).function1 (car (x));
566     case 2: return FUNCTION (fn).function2 (car (x), cadr (x));
567     case 3: return FUNCTION (fn).function3 (car (x), cadr (x), caddr (x));
568     case -1: return FUNCTION (fn).functionn (x);
569     }
570   return cell_unspecified;
571 }
572
573 SCM
574 gc_frame (SCM stack)
575 {
576   SCM frame = car (stack);
577   r1 = car (frame);
578   r2 = cadr (frame);
579   r3 = caddr (frame);
580   r0 = cadddr (frame);
581   return frame;
582 }
583
584 SCM
585 gc_stack (SCM a)
586 {
587   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
588   stack = cons (frame, stack);
589   stack = gc (stack);
590   gc_frame (stack);
591   stack = cdr (stack);
592   return stack;
593 }
594
595 SCM
596 vm_call (function0_t f, SCM p1, SCM p2, SCM a)
597 {
598   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
599   stack = cons (frame, stack);
600   r1 = p1;
601   r2 = p2;
602   r0 = a;
603   if (g_free.value + GC_SAFETY > ARENA_SIZE)
604     gc_stack (stack);
605
606   SCM r = f ();
607   frame = gc_frame (stack);
608   stack = cdr (stack);
609   return r;
610 }
611
612 SCM
613 evlis_env (SCM m, SCM a)
614 {
615   return vm_call (vm_evlis_env, m, cell_undefined, a);
616 }
617
618 SCM
619 apply_env (SCM fn, SCM x, SCM a)
620 {
621   return vm_call (vm_apply_env, fn, x, a);
622 }
623
624 SCM
625 eval_env (SCM e, SCM a)
626 {
627   return vm_call (vm_eval_env, e, cell_undefined, a);
628 }
629
630 SCM
631 expand_macro_env (SCM e, SCM a)
632 {
633   return vm_call (vm_expand_macro_env, e, cell_undefined, a);
634 }
635
636 SCM
637 begin_env (SCM e, SCM a)
638 {
639   return vm_call (vm_begin_env, e, cell_undefined, a);
640 }
641
642 SCM
643 if_env (SCM e, SCM a)
644 {
645   return vm_call (vm_if_env, e, cell_undefined, a);
646 }
647
648 SCM
649 call_with_values_env (SCM producer, SCM consumer, SCM a)
650 {
651   return vm_call (vm_call_with_values_env, producer, consumer, a);
652 }
653
654 SCM
655 append2 (SCM x, SCM y)
656 {
657   if (x == cell_nil) return y;
658   assert (TYPE (x) == PAIR);
659   return cons (car (x), append2 (cdr (x), y));
660 }
661
662 SCM
663 append (SCM x) ///((arity . n))
664  {
665   if (x == cell_nil) return cell_nil;
666   return append2 (car (x), append (cdr (x)));
667  }
668
669 SCM
670 make_char (int x)
671 {
672   g_cells[tmp_num].value = CHAR;
673   g_cells[tmp_num2].value = x;
674   return make_cell (tmp_num, tmp_num2, tmp_num2);
675 }
676
677 SCM
678 make_function (SCM name, SCM id, SCM arity)
679 {
680   g_cells[tmp_num3].value = FUNCTION;
681   function *f = (function*)malloc (sizeof (function));
682   f->arity = VALUE (arity);
683   g_cells[tmp_num4].value = (long)f;
684   return make_cell (tmp_num3, name, tmp_num4);
685 }
686
687 SCM
688 make_macro (SCM name, SCM x)
689 {
690   g_cells[tmp_num].value = MACRO;
691   return make_cell (tmp_num, STRING (name), x);
692 }
693
694 SCM
695 make_number (int x)
696 {
697   g_cells[tmp_num].value = NUMBER;
698   g_cells[tmp_num2].value = x;
699   return make_cell (tmp_num, tmp_num2, tmp_num2);
700 }
701
702 SCM
703 make_ref (SCM x)
704 {
705   g_cells[tmp_num].value = REF;
706   return make_cell (tmp_num, x, x);
707 }
708
709 SCM
710 make_string (SCM x)
711 {
712   g_cells[tmp_num].value = STRING;
713   return make_cell (tmp_num, x, 0);
714 }
715
716 SCM
717 cstring_to_list (char const* s)
718 {
719   SCM p = cell_nil;
720   int i = strlen (s);
721   while (i--)
722     p = cons (make_char (s[i]), p);
723   return p;
724 }
725
726 SCM
727 null_p (SCM x)
728 {
729   return x == cell_nil ? cell_t : cell_f;
730 }
731
732 SCM
733 internal_make_symbol (SCM s)
734 {
735   g_cells[tmp_num].value = SYMBOL;
736   SCM x = make_cell (tmp_num, s, 0);
737   g_symbols = cons (x, g_symbols);
738   return x;
739 }
740
741 SCM
742 make_symbol (SCM s)
743 {
744   SCM x = internal_lookup_symbol (s);
745   return x ? x : internal_make_symbol (s);
746 }
747
748 SCM
749 make_vector (SCM n)
750 {
751   int k = VALUE (n);
752   g_cells[tmp_num].value = VECTOR;
753   SCM v = alloc (k);
754   SCM x = make_cell (tmp_num, k, v);
755   for (int i=0; i<k; i++) g_cells[v+i] = g_cells[vector_entry (cell_unspecified)];
756   return x;
757 }
758
759 SCM
760 values (SCM x) ///((arity . n))
761 {
762   SCM v = cons (0, x);
763   TYPE (v) = VALUES;
764   return v;
765 }
766
767 SCM
768 vector_length (SCM x)
769 {
770   assert (TYPE (x) == VECTOR);
771   return make_number (LENGTH (x));
772 }
773
774 SCM
775 vector_ref (SCM x, SCM i)
776 {
777   assert (TYPE (x) == VECTOR);
778   assert (VALUE (i) < LENGTH (x));
779   SCM e = VECTOR (x) + VALUE (i);
780   if (TYPE (e) == REF) e = g_cells[e].ref;
781   if (TYPE (e) == CHAR) e = make_char (VALUE (e));
782   if (TYPE (e) == NUMBER) e = make_number (VALUE (e));
783   return e;
784 }
785
786 SCM
787 vector_entry (SCM x) {
788   if (TYPE (x) == PAIR || TYPE (x) == SPECIAL || TYPE (x) == STRING || TYPE (x) == SYMBOL || TYPE (x) == VECTOR) x = make_ref (x);
789   return x;
790 }
791
792 SCM
793 vector_set_x (SCM x, SCM i, SCM e)
794 {
795   assert (TYPE (x) == VECTOR);
796   assert (VALUE (i) < LENGTH (x));
797   g_cells[VECTOR (x)+g_cells[i].value] = g_cells[vector_entry (e)];
798   return cell_unspecified;
799 }
800
801 SCM
802 list_to_vector (SCM x)
803 {
804   VALUE (tmp_num) = VALUE (length (x));
805   SCM v = make_vector (tmp_num);
806   SCM p = VECTOR (v);
807   while (x != cell_nil)
808     {
809       g_cells[p++] = g_cells[vector_entry (car (x))];
810       x = cdr (x);
811     }
812   return v;
813 }
814
815 FILE *g_stdin;
816 int
817 getchar ()
818 {
819   return getc (g_stdin);
820 }
821
822 int
823 ungetchar (int c)
824 {
825   return ungetc (c, g_stdin);
826 }
827
828 int
829 peekchar ()
830 {
831   int c = getchar ();
832   ungetchar (c);
833   return c;
834 }
835
836 SCM
837 peek_byte ()
838 {
839   return make_number (peekchar ());
840 }
841
842 SCM
843 read_byte ()
844 {
845   return make_number (getchar ());
846 }
847
848 SCM
849 unread_byte (SCM i)
850 {
851   return ungetchar (VALUE (i));
852 }
853
854 SCM
855 write_char (SCM x) ///((arity . n))
856 {
857   SCM c = car (x);
858   SCM p = cdr (x);
859   int fd = 1;
860   if (TYPE (p) == PAIR && TYPE (car (p)) == NUMBER) fd = VALUE (car (p));
861   FILE *f = fd == 1 ? stdout : stderr;
862   assert (TYPE (c) == NUMBER || TYPE (c) == CHAR);
863   fputc (VALUE (c), f);
864   return c;
865 }
866
867 SCM
868 symbol_to_list (SCM x)
869 {
870   assert (TYPE (x) == SYMBOL);
871   return STRING (x);
872 }
873
874 SCM
875 char_to_integer (SCM x)
876 {
877   assert (TYPE (x) == CHAR);
878   return make_number (VALUE (x));
879 }
880
881 SCM
882 integer_to_char (SCM x)
883 {
884   assert (TYPE (x) == NUMBER);
885   return make_char (VALUE (x));
886 }
887
888 void
889 make_tmps (scm* cells)
890 {
891   tmp = g_free.value++;
892   cells[tmp].type = CHAR;
893   tmp_num = g_free.value++;
894   cells[tmp_num].type = NUMBER;
895   tmp_num2 = g_free.value++;
896   cells[tmp_num2].type = NUMBER;
897   tmp_num3 = g_free.value++;
898   cells[tmp_num3].type = NUMBER;
899   tmp_num4 = g_free.value++;
900   cells[tmp_num4].type = NUMBER;
901 }
902
903 //\f Jam Collector
904 SCM g_symbol_max;
905 bool g_debug = false;
906
907 SCM
908 gc_up_arena ()
909 {
910   ARENA_SIZE *= 2;
911   void *p = realloc (g_cells-1, 2*ARENA_SIZE*sizeof(scm));
912   if (!p)
913     {
914       if (g_debug) fprintf (stderr, "cannot up arena: %s: arena=%d\n", strerror (errno), 2*ARENA_SIZE);
915       return cell_unspecified;
916     }
917   g_cells = (scm*)p;
918   g_cells++;
919   gc_init_news ();
920 }
921
922 SCM
923 gc ()
924 {
925   if (g_debug) fprintf (stderr, "***gc[%d]...", g_free.value);
926   g_free.value = 1;
927   if (g_cells < g_news && ARENA_SIZE < MAX_ARENA_SIZE) gc_up_arena ();
928   for (int i=g_free.value; i<g_symbol_max; i++)
929     gc_copy (i);
930   make_tmps (g_news);
931   g_symbols = gc_copy (g_symbols);
932   SCM new = gc_copy (stack);
933   if (g_debug) fprintf (stderr, "new=%d\n", new, stack);
934   stack = new;
935   return gc_loop (1);
936 }
937
938 SCM
939 gc_loop (SCM scan)
940 {
941   while (scan < g_free.value)
942     {
943       if (NTYPE (scan) == MACRO
944           || NTYPE (scan) == PAIR
945           || NTYPE (scan) == REF
946           || scan == 1 // null
947           || NTYPE (scan) == SPECIAL
948           || NTYPE (scan) == STRING
949           || NTYPE (scan) == SYMBOL)
950         {
951           SCM car = gc_copy (g_news[scan].car);
952           gc_relocate_car (scan, car);
953         }
954       if ((NTYPE (scan) == MACRO
955            || NTYPE (scan) == PAIR
956            || NTYPE (scan) == VALUES)
957           && g_news[scan].cdr) // allow for 0 terminated list of symbols
958         {
959           SCM cdr = gc_copy (g_news[scan].cdr);
960           gc_relocate_cdr (scan, cdr);
961         }
962       scan++;
963     }
964   return gc_flip ();
965 }
966
967 SCM
968 gc_copy (SCM old)
969 {
970   if (TYPE (old) == BROKEN_HEART) return g_cells[old].car;
971   SCM new = g_free.value++;
972   g_news[new] = g_cells[old];
973   if (NTYPE (new) == VECTOR)
974     {
975       g_news[new].vector = g_free.value;
976       for (int i=0; i<LENGTH (old); i++)
977         g_news[g_free.value++] = g_cells[VECTOR (old)+i];
978     }
979   g_cells[old].type = BROKEN_HEART;
980   g_cells[old].car = new;
981   return new;
982 }
983
984 SCM
985 gc_relocate_car (SCM new, SCM car)
986 {
987   g_news[new].car = car;
988   return cell_unspecified;
989 }
990
991 SCM
992 gc_relocate_cdr (SCM new, SCM cdr)
993 {
994   g_news[new].cdr = cdr;
995   return cell_unspecified;
996 }
997
998 SCM
999 gc_flip ()
1000 {
1001   scm *cells = g_cells;
1002   g_cells = g_news;
1003   g_news = cells;
1004   if (g_debug) fprintf (stderr, " => jam[%d]\n", g_free.value);
1005   return stack;
1006 }
1007
1008 SCM
1009 gc_show ()
1010 {
1011   fprintf (stderr, "cells: ");
1012   scm *t = g_cells;
1013   display_ (stderr, -1);
1014   fprintf (stderr, "\n");
1015   if (g_news)
1016     {
1017       fprintf (stderr, "news: ");
1018       g_cells = g_news;
1019       display_ (stderr, -1);
1020       fprintf (stderr, "\n");
1021     }
1022   g_cells = t;
1023   return cell_unspecified;
1024 }
1025
1026 //\f Environment setup
1027 SCM
1028 acons (SCM key, SCM value, SCM alist)
1029 {
1030   return cons (cons (key, value), alist);
1031 }
1032
1033 SCM
1034 add_environment (SCM a, char const *name, SCM x)
1035 {
1036   return acons (make_symbol (cstring_to_list (name)), x, a);
1037 }
1038
1039 SCM
1040 gc_init_cells ()
1041 {
1042   g_cells = (scm *)malloc (2*ARENA_SIZE*sizeof(scm));
1043   g_cells[0].type = VECTOR;
1044   g_cells[0].length = 1000;
1045   g_cells[0].vector = 0;
1046   g_cells++;
1047   g_cells[0].type = CHAR;
1048   g_cells[0].value = 'c';
1049   g_free.value = 1; // 0 is tricky
1050 }
1051
1052 SCM
1053 gc_init_news ()
1054 {
1055   g_news = g_cells-1 + ARENA_SIZE;
1056   g_news[0].type = VECTOR;
1057   g_news[0].length = 1000;
1058   g_news[0].vector = 0;
1059   g_news++;
1060   g_news[0].type = CHAR;
1061   g_news[0].value = 'n';
1062 }
1063
1064 SCM
1065 mes_symbols () ///((internal))
1066 {
1067   gc_init_cells ();
1068   gc_init_news ();
1069
1070 #include "mes.symbols.i"
1071
1072   g_symbol_max = g_free.value;
1073   make_tmps (g_cells);
1074
1075   g_symbols = 0;
1076   for (int i=1; i<g_symbol_max; i++)
1077     g_symbols = cons (i, g_symbols);
1078
1079   SCM a = cell_nil;
1080
1081 #if BOOT
1082   a = acons (cell_symbol_label, cell_t, a);
1083 #endif
1084   a = acons (cell_symbol_begin, cell_begin, a);
1085   a = add_environment (a, "sc-expand", cell_f);
1086   a = acons (cell_closure, a, a);
1087
1088   internal_lookup_symbol (cell_nil);
1089
1090   return a;
1091 }
1092
1093 SCM
1094 mes_builtins (SCM a)
1095 {
1096 #include "mes.i"
1097
1098 #include "define.i"
1099 #include "display.i"
1100 #include "lib.i"
1101 #include "math.i"
1102 #include "posix.i"
1103 #include "quasiquote.i"
1104 #include "reader.i"
1105 #include "string.i"
1106 #include "type.i"
1107
1108 #include "define.environment.i"
1109 #include "display.environment.i"
1110 #include "lib.environment.i"
1111 #include "math.environment.i"
1112 #include "mes.environment.i"
1113 #include "posix.environment.i"
1114   //#include "quasiquote.environment.i"
1115 #include "reader.environment.i"
1116 #include "string.environment.i"
1117 #include "type.environment.i"
1118
1119   SCM cell_unquote = assq_ref_cache (cell_symbol_unquote, a);
1120   SCM cell_unquote_splicing = assq_ref_cache (cell_symbol_unquote_splicing, a);
1121   SCM the_unquoters = cons (cons (cell_symbol_unquote, cell_unquote),
1122                             cons (cons (cell_symbol_unquote_splicing, cell_unquote_splicing),
1123                                   cell_nil));
1124   a = acons (cell_symbol_the_unquoters, the_unquoters, a);
1125
1126   a = add_environment (a, "*foo-bar-baz*", cell_nil); // FIXME: some off-by one?
1127
1128   return a;
1129 }
1130
1131 SCM
1132 mes_stack (SCM a) ///((internal))
1133 {
1134   r0 = a;
1135   r1 = make_char (0);
1136   r2 = make_char (0);
1137   r3 = make_char (0);
1138   stack = cons (cell_nil, cell_nil);
1139   return r0;
1140 }
1141
1142 SCM
1143 mes_environment () ///((internal))
1144 {
1145   SCM a = mes_symbols ();
1146   return mes_stack (a);
1147 }
1148
1149 SCM
1150 make_lambda (SCM args, SCM body)
1151 {
1152   return cons (cell_symbol_lambda, cons (args, body));
1153 }
1154
1155 SCM
1156 make_closure (SCM args, SCM body, SCM a)
1157 {
1158   return cons (cell_closure, cons (cons (cell_circular, a), cons (args, body)));
1159 }
1160
1161 SCM
1162 lookup_macro (SCM x, SCM a)
1163 {
1164   if (TYPE (x) != SYMBOL) return cell_f;
1165   SCM m = assq_ref_cache (x, a);
1166   if (macro_p (m) == cell_t) return MACRO (m);
1167   return cell_f;
1168 }
1169
1170 SCM
1171 read_input_file_env_ (SCM e, SCM a)
1172 {
1173   if (e == cell_nil) return e;
1174   return cons (e, read_input_file_env_ (read_env (a), a));
1175 }
1176
1177 SCM
1178 read_input_file_env (SCM a)
1179 {
1180   return read_input_file_env_ (read_env (r0), r0);
1181 }
1182
1183 bool g_dump_p = false;
1184
1185 SCM
1186 load_env (SCM a)
1187 {
1188   r3 = read_input_file_env (r0);
1189   if (g_dump_p && !g_function)
1190     {
1191       r1 = g_symbols;
1192       SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
1193       stack = cons (frame, stack);
1194       stack = gc (stack);
1195       gc_frame (stack);
1196       char *p = (char*)g_cells;
1197       fputc ('M', stdout);
1198       fputc ('E', stdout);
1199       fputc ('S', stdout);
1200       fputc (stack >> 8, stdout);
1201       fputc (stack % 256, stdout);
1202       for (int i=0; i<g_free.value * sizeof(scm); i++)
1203         fputc (*p++, stdout);
1204       return 0;
1205     }
1206   if (!g_function)
1207     r0 = mes_builtins (r0);
1208   return begin_env (r3, r0);
1209 }
1210
1211 SCM
1212 bload_env (SCM a)
1213 {
1214   g_stdin = fopen ("read-0.mo", "r");
1215   char *p = (char*)g_cells;
1216   assert (getchar () == 'M');
1217   assert (getchar () == 'E');
1218   assert (getchar () == 'S');
1219   stack = getchar () << 8;
1220   stack += getchar ();
1221   int c = getchar ();
1222   while (c != EOF)
1223     {
1224       *p++ = c;
1225       c = getchar ();
1226     }
1227   g_free.value = (p-(char*)g_cells) / sizeof (scm);
1228   gc_frame (stack);
1229   g_symbols = r1;
1230   g_stdin = stdin;
1231
1232   r0 = mes_builtins (r0);
1233
1234   return begin_env (r3, r0);
1235 }
1236
1237 #include "type.c"
1238 #include "define.c"
1239 #include "display.c"
1240 #include "lib.c"
1241 #include "math.c"
1242 #include "posix.c"
1243 #include "quasiquote.c"
1244 #include "reader.c"
1245 #include "string.c"
1246
1247 int
1248 main (int argc, char *argv[])
1249 {
1250   g_debug = getenv ("MES_DEBUG");
1251   if (getenv ("MES_ARENA"))
1252     ARENA_SIZE = atoi (getenv ("MES_ARENA"));
1253   if (argc > 1 && !strcmp (argv[1], "--dump")) g_dump_p = true;
1254   if (argc > 1 && !strcmp (argv[1], "--help")) return puts ("Usage: mes < FILE\n");
1255   if (argc > 1 && !strcmp (argv[1], "--version")) return puts ("Mes 0.2\n");
1256   g_stdin = stdin;
1257   SCM a = mes_environment ();
1258   if (argc > 1 && !strcmp (argv[1], "--load"))
1259     display_ (stderr, bload_env (a));
1260   else
1261     display_ (stderr, load_env (a));
1262   fputs ("", stderr);
1263   gc (stack);
1264   if (g_debug) fprintf (stderr, "\nstats: [%d]\n", g_free.value);
1265   return 0;
1266 }