fdb66ca5af1f81a104e73cc49336edb1c858ac46
[mes.git] / mes.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #define _GNU_SOURCE
22 #include <assert.h>
23 #include <ctype.h>
24 #include <errno.h>
25 #include <limits.h>
26 #include <stdio.h>
27 #include <string.h>
28 #include <stdlib.h>
29 #include <stdbool.h>
30
31 #define DEBUG 0
32 #define QUASIQUOTE 1
33 #define QUASISYNTAX 0
34 #define ENV_CACHE 0
35 #define FIXED_PRIMITIVES 1
36 #define READER 1
37
38 #if READER
39 int ARENA_SIZE = 1000000;
40 #else
41 int ARENA_SIZE = 100000;
42 #endif
43 int MAX_ARENA_SIZE = 20000000;
44 int GC_SAFETY = 100;
45
46 typedef int SCM;
47 enum type_t {CHAR, FUNCTION, KEYWORD, MACRO, NUMBER, PAIR, SPECIAL, STRING, SYMBOL, REF, VALUES, VECTOR, BROKEN_HEART};
48 typedef SCM (*function0_t) (void);
49 typedef SCM (*function1_t) (SCM);
50 typedef SCM (*function2_t) (SCM, SCM);
51 typedef SCM (*function3_t) (SCM, SCM, SCM);
52 typedef SCM (*functionn_t) (SCM);
53 typedef struct function_t {
54   union {
55     function0_t function0;
56     function1_t function1;
57     function2_t function2;
58     function3_t function3;
59     functionn_t functionn;
60   };
61   int arity;
62 } function;
63 struct scm_t;
64 typedef struct scm_t {
65   enum type_t type;
66   union {
67     char const *name;
68     SCM string;
69     SCM car;
70     SCM ref;
71     int length;
72   };
73   union {
74     int value;
75     int function;
76     SCM cdr;
77     SCM macro;
78     SCM vector;
79     int hits;
80   };
81 } scm;
82
83 scm scm_nil = {SPECIAL, "()"};
84 scm scm_f = {SPECIAL, "#f"};
85 scm scm_t = {SPECIAL, "#t"};
86 scm scm_dot = {SPECIAL, "."};
87 scm scm_undefined = {SPECIAL, "*undefined*"};
88 scm scm_unspecified = {SPECIAL, "*unspecified*"};
89 scm scm_closure = {SPECIAL, "*closure*"};
90 scm scm_circular = {SPECIAL, "*circular*"};
91 #if BOOT
92 scm scm_label = {
93   SPECIAL, "label"};
94 #endif
95 scm scm_begin = {SPECIAL, "*begin*"};
96
97 scm scm_symbol_lambda = {SYMBOL, "lambda"};
98 scm scm_symbol_begin = {SYMBOL, "begin"};
99 scm scm_symbol_if = {SYMBOL, "if"};
100 scm scm_symbol_define = {SYMBOL, "define"};
101 scm scm_symbol_define_macro = {SYMBOL, "define-macro"};
102 scm scm_symbol_set_x = {SYMBOL, "set!"};
103
104 scm scm_symbol_quote = {SYMBOL, "quote"};
105 scm scm_symbol_quasiquote = {SYMBOL, "quasiquote"};
106 scm scm_symbol_unquote = {SYMBOL, "unquote"};
107 scm scm_symbol_unquote_splicing = {SYMBOL, "unquote-splicing"};
108
109 scm scm_symbol_sc_expand = {SYMBOL, "sc-expand"};
110 scm scm_symbol_expand_macro = {SYMBOL, "expand-macro"};
111 scm scm_symbol_sc_expander_alist = {SYMBOL, "*sc-expander-alist*"};
112 scm scm_symbol_noexpand = {SYMBOL, "noexpand"};
113 scm scm_symbol_syntax = {SYMBOL, "syntax"};
114 scm scm_symbol_quasisyntax = {SYMBOL, "quasisyntax"};
115 scm scm_symbol_unsyntax = {SYMBOL, "unsyntax"};
116 scm scm_symbol_unsyntax_splicing = {SYMBOL, "unsyntax-splicing"};
117
118 scm scm_symbol_call_with_values = {SYMBOL, "call-with-values"};
119 scm scm_symbol_current_module = {SYMBOL, "current-module"};
120 scm scm_symbol_primitive_load = {SYMBOL, "primitive-load"};
121 scm scm_symbol_read_input_file = {SYMBOL, "read-input-file"};
122
123 scm scm_symbol_the_unquoters = {SYMBOL, "*the-unquoters*"};
124
125 scm scm_symbol_car = {SYMBOL, "car"};
126 scm scm_symbol_cdr = {SYMBOL, "cdr"};
127 scm scm_symbol_null_p = {SYMBOL, "null?"};
128 scm scm_symbol_eq_p = {SYMBOL, "eq?"};
129 scm scm_symbol_cons = {SYMBOL, "cons"};
130
131 scm char_eof = {CHAR, .name="*eof*", .value=-1};
132 scm char_nul = {CHAR, .name="nul", .value=0};
133 scm char_backspace = {CHAR, .name="backspace", .value=8};
134 scm char_tab = {CHAR, .name="tab", .value=9};
135 scm char_newline = {CHAR, .name="newline", .value=10};
136 scm char_vt = {CHAR, .name="vt", .value=11};
137 scm char_page = {CHAR, .name="page", .value=12};
138 scm char_return = {CHAR, .name="return", .value=13};
139 scm char_space = {CHAR, .name="space", .value=32};
140
141 scm g_free = {NUMBER, .value=0};
142 scm *g_cells;
143 scm *g_news = 0;
144
145 #include "mes.symbols.h"
146
147 SCM tmp;
148 SCM tmp_num;
149 SCM tmp_num2;
150 SCM tmp_num3;
151 SCM tmp_num4;
152
153 function functions[200];
154 int g_function = 0;
155
156 SCM g_symbols = 0;
157 SCM stack = 0;
158 SCM r0 = 0; // a/env
159 SCM r1 = 0; // param 1
160 SCM r2 = 0; // param 2
161 SCM r3 = 0; // param 3
162
163 #include "define.h"
164 #include "display.h"
165 #include "lib.h"
166 #include "math.h"
167 #include "mes.h"
168 #include "posix.h"
169 #include "quasiquote.h"
170 #include "reader.h"
171 #include "string.h"
172 #include "type.h"
173
174 #define CAR(x) g_cells[x].car
175 #define CDR(x) g_cells[x].cdr
176 #define HITS(x) g_cells[x].hits
177 #define LENGTH(x) g_cells[x].length
178 #define NAME(x) g_cells[x].name
179 #define STRING(x) g_cells[x].string
180 #define TYPE(x) g_cells[x].type
181 #define MACRO(x) g_cells[x].macro
182 #define REF(x) g_cells[x].ref
183 #define VALUE(x) g_cells[x].value
184 #define VECTOR(x) g_cells[x].vector
185 #define FUNCTION(x) functions[g_cells[x].function]
186 #define NCAR(x) g_news[x].car
187 #define NTYPE(x) g_news[x].type
188
189 #define CAAR(x) CAR (CAR (x))
190 #define CDAR(x) CDR (CAR (x))
191 #define CAAR(x) CAR (CAR (x))
192 #define CADAR(x) CAR (CDR (CAR (x)))
193 #define CADDR(x) CAR (CDR (CDR (x)))
194 #define CDADAR(x) CAR (CDR (CAR (CDR (x))))
195 #define CADR(x) CAR (CDR (x))
196
197 SCM display_ (FILE* f, SCM x);
198 SCM vm_call (function0_t f, SCM p1, SCM p2, SCM a);
199
200 SCM
201 alloc (int n)
202 {
203   assert (g_free.value + n < ARENA_SIZE);
204   SCM x = g_free.value;
205   g_free.value += n;
206   return x;
207 }
208
209 SCM
210 make_cell (SCM type, SCM car, SCM cdr)
211 {
212   SCM x = alloc (1);
213   assert (TYPE (type) == NUMBER);
214   TYPE (x) = VALUE (type);
215   if (VALUE (type) == CHAR || VALUE (type) == NUMBER) {
216     if (car) CAR (x) = CAR (car);
217     if (cdr) CDR (x) = CDR (cdr);
218   } else if (VALUE (type) == FUNCTION) {
219     if (car) CAR (x) = car;
220     if (cdr) CDR (x) = CDR (cdr);
221   } else {
222     CAR (x) = car;
223     CDR (x) = cdr;
224   }
225   return x;
226 }
227
228 SCM
229 cons (SCM x, SCM y)
230 {
231   g_cells[tmp_num].value = PAIR;
232   return make_cell (tmp_num, x, y);
233 }
234
235 SCM
236 car (SCM x)
237 {
238   assert (TYPE (x) == PAIR);
239   return CAR (x);
240 }
241
242 SCM
243 cdr (SCM x)
244 {
245   assert (TYPE (x) == PAIR);
246   return CDR (x);
247 }
248
249 SCM
250 eq_p (SCM x, SCM y)
251 {
252   return (x == y
253           || ((TYPE (x) == KEYWORD && TYPE (y) == KEYWORD
254                && STRING (x) == STRING (y)))
255           || (TYPE (x) == CHAR && TYPE (y) == CHAR
256               && VALUE (x) == VALUE (y))
257           || (TYPE (x) == NUMBER && TYPE (y) == NUMBER
258               && VALUE (x) == VALUE (y)))
259     ? cell_t : cell_f;
260 }
261
262 SCM
263 set_car_x (SCM x, SCM e)
264 {
265   assert (TYPE (x) == PAIR);
266   CAR (x) = e;
267   return cell_unspecified;
268 }
269
270 SCM
271 set_cdr_x (SCM x, SCM e)
272 {
273   assert (TYPE (x) == PAIR);
274   CDR (x) = e;
275   return cell_unspecified;
276 }
277
278 SCM
279 set_env_x (SCM x, SCM e, SCM a)
280 {
281   SCM p = assert_defined (x, assq (x, a));
282   return set_cdr_x (p, e);
283 }
284
285 SCM
286 quote (SCM x)
287 {
288   return cons (cell_symbol_quote, x);
289 }
290
291 SCM
292 quasiquote (SCM x)
293 {
294   return cons (cell_symbol_quasiquote, x);
295 }
296
297 SCM
298 quasisyntax (SCM x)
299 {
300   return cons (cell_symbol_quasisyntax, x);
301 }
302
303 SCM
304 pairlis (SCM x, SCM y, SCM a)
305 {
306   if (x == cell_nil)
307     return a;
308   if (pair_p (x) == cell_f)
309     return cons (cons (x, y), a);
310   return cons (cons (car (x), car (y)),
311                pairlis (cdr (x), cdr (y), a));
312 }
313
314 SCM
315 assq (SCM x, SCM a)
316 {
317   while (a != cell_nil && eq_p (x, CAAR (a)) == cell_f)
318     {
319       if (TYPE (a) == BROKEN_HEART || TYPE (CAR (a)) == BROKEN_HEART)
320         fprintf (stderr, "oops, broken heart\n");
321       a = CDR (a);
322     }
323   return a != cell_nil ? car (a) : cell_f;
324 }
325
326 SCM
327 assq_ref_cache (SCM x, SCM a)
328 {
329   x = assq (x, a);
330   if (x == cell_f) return cell_undefined;
331   return cdr (x);
332 }
333
334 SCM
335 assert_defined (SCM x, SCM e)
336 {
337   if (e == cell_undefined)
338     {
339       fprintf (stderr, "eval: unbound variable:");
340       display_ (stderr, x);
341       fprintf (stderr, "\n");
342       assert (!"unbound variable");
343     }
344   return e;
345 }
346
347 SCM
348 vm_evlis_env ()
349 {
350   if (r1 == cell_nil) return cell_nil;
351   if (TYPE (r1) != PAIR) return eval_env (r1, r0);
352   r2 = eval_env (car (r1), r0);
353   r1 = evlis_env (cdr (r1), r0);
354   return cons (r2, r1);
355 }
356
357 SCM
358 vm_call_lambda ()
359 {
360   return vm_call (vm_begin_env, r1, cell_undefined, r0);
361 }
362
363 SCM
364 call_lambda (SCM e, SCM x, SCM aa, SCM a) ///((internal))
365 {
366   SCM cl = cons (cons (cell_closure, x), x);
367   r1 = e;
368   r0 = cl;
369   r2 = a;
370   r3 = aa;
371   return vm_call_lambda ();
372 }
373
374 SCM
375 vm_apply_env ()
376 {
377   if (TYPE (r1) != PAIR)
378     {
379       if (TYPE (r1) == FUNCTION) return call (r1, r2);
380       if (r1 == cell_symbol_call_with_values)
381         return call_with_values_env (car (r2), cadr (r2), r0);
382       if (r1 == cell_symbol_current_module) return r0;
383     }
384   else
385     switch (car (r1))
386       {
387       case cell_symbol_lambda:
388         {
389           SCM args = cadr (r1);
390           SCM body = cddr (r1);
391           SCM p = pairlis (args, r2, r0);
392           return call_lambda (body, p, p, r0);
393         }
394       case cell_closure:
395         {
396           SCM args = caddr (r1);
397           SCM body = cdddr (r1);
398           SCM aa = cdadr (r1);
399           aa = cdr (aa);
400           SCM p = pairlis (args, r2, aa);
401           return call_lambda (body, p, aa, r0);
402         }
403 #if BOOT
404       case cell_symbol_label:
405         return apply_env (caddr (r1), r2, cons (cons (cadr (r1), caddr (r1)), r0));
406 #endif
407       }
408   SCM e = eval_env (r1, r0);
409   char const* type = 0;
410   if (e == cell_f || e == cell_t) type = "bool";
411   if (TYPE (e) == CHAR) type = "char";
412   if (TYPE (e) == NUMBER) type = "number";
413   if (TYPE (e) == STRING) type = "string";
414   if (e == cell_unspecified) type = "*unspecified*";
415   if (e == cell_undefined) type =  "*undefined*";
416   if (type)
417     {
418       fprintf (stderr, "cannot apply: %s: ", type);
419       display_ (stderr, e);
420       fprintf (stderr, " [");
421       display_ (stderr, r1);
422       fprintf (stderr, "]\n");
423       assert (!"cannot apply");
424     }
425   return apply_env (e, r2, r0);
426 }
427
428 SCM
429 vm_eval_env ()
430 {
431   switch (TYPE (r1))
432     {
433     case PAIR:
434       {
435         switch (car (r1))
436           {
437 #if FIXED_PRIMITIVES
438           case cell_symbol_car: return car (eval_env (CADR (r1), r0));
439           case cell_symbol_cdr: return cdr (eval_env (CADR (r1), r0));
440           case cell_symbol_cons: {SCM m = evlis_env (CDR (r1), r0);
441               return cons (CAR (m), CADR (m));}
442           case cell_symbol_null_p: return null_p (eval_env (CADR (r1), r0));
443 #endif // FIXED_PRIMITIVES
444           case cell_symbol_quote: return cadr (r1);
445 #if QUASISYNTAX
446           case cell_symbol_syntax: return r1;
447 #endif
448           case cell_symbol_begin: return begin_env (r1, r0);
449           case cell_symbol_lambda:
450             return make_closure (cadr (r1), cddr (r1), assq (cell_closure, r0));
451           case cell_closure: return r1;
452           case cell_symbol_if: return if_env (cdr (r1), r0);
453 #if !BOOT
454           case cell_symbol_define: return define_env (r1, r0);
455           case cell_symbol_define_macro: return define_env (r1, r0);
456 #endif
457 #if 1 //!BOOT
458           case cell_symbol_set_x: {
459             SCM x = eval_env (caddr (r1), r0); return set_env_x (cadr (r1), x, r0);
460           }
461 #endif
462 #if QUASIQUOTE
463           case cell_symbol_unquote: return eval_env (cadr (r1), r0);
464           case cell_symbol_quasiquote: return eval_quasiquote (cadr (r1), add_unquoters (r0));
465 #endif //QUASIQUOTE
466 #if QUASISYNTAX
467           case cell_symbol_unsyntax: return eval_env (cadr (r1), r0);
468           case cell_symbol_quasisyntax: return eval_quasisyntax (cadr (r1), add_unsyntaxers (r0));
469 #endif //QUASISYNTAX
470           default: {
471             SCM x = expand_macro_env (r1, r0);
472             if (x != r1) return eval_env (x, r0);
473             SCM m = evlis_env (CDR (r1), r0);
474             return apply_env (car (r1), m, r0);
475           }
476           }
477       }
478     case SYMBOL: return assert_defined (r1, assq_ref_cache (r1, r0));
479     default: return r1;
480     }
481 }
482
483 SCM
484 vm_expand_macro_env ()
485 {
486   if (TYPE (CAR (r1)) == STRING && string_to_symbol (CAR (r1)) == cell_symbol_noexpand)
487     return cadr (r1);
488
489   SCM macro;
490   SCM expanders;
491   if (TYPE (r1) == PAIR
492       && (macro = lookup_macro (car (r1), r0)) != cell_f)
493     return apply_env (macro, CDR (r1), r0);
494   else if (TYPE (r1) == PAIR
495            && TYPE (CAR (r1)) == SYMBOL
496            && ((expanders = assq_ref_cache (cell_symbol_sc_expander_alist, r0)) != cell_undefined)
497            && ((macro = assq (CAR (r1), expanders)) != cell_f))
498     {
499       SCM sc_expand = assq_ref_cache (cell_symbol_expand_macro, r0);
500       if (sc_expand != cell_undefined && sc_expand != cell_f)
501         r1 = apply_env (sc_expand, cons (r1, cell_nil), r0);
502     }
503   return r1;
504 }
505
506 SCM
507 vm_begin_env ()
508 {
509   SCM r = cell_unspecified;
510   while (r1 != cell_nil) {
511     if (TYPE (r1) == PAIR && TYPE (CAR (r1)) == PAIR)
512       {
513         if (caar (r1) == cell_symbol_begin)
514           r1 = append2 (cdar (r1), cdr (r1));
515         else if (caar (r1) == cell_symbol_primitive_load)
516           {
517             SCM f = read_input_file_env (r0);
518             r1 = append2 (f, cdr (r1));
519           }
520       }
521     r = eval_env (car (r1), r0);
522     r1 = CDR (r1);
523   }
524   return r;
525 }
526
527 SCM
528 vm_if_env ()
529 {
530   SCM x = eval_env (car (r1), r0);
531   if (x != cell_f)
532     return eval_env (cadr (r1), r0);
533   if (cddr (r1) != cell_nil)
534     return eval_env (caddr (r1), r0);
535   return cell_unspecified;
536 }
537
538 SCM
539 vm_call_with_values_env ()
540 {
541   SCM v = apply_env (r1, cell_nil, r0);
542   if (TYPE (v) == VALUES)
543     v = CDR (v);
544   return apply_env (r2, v, r0);
545 }
546
547 SCM
548 call (SCM fn, SCM x)
549 {
550   if ((FUNCTION (fn).arity > 0 || FUNCTION (fn).arity == -1)
551       && x != cell_nil && TYPE (CAR (x)) == VALUES)
552     x = cons (CADAR (x), CDR (x));
553   if ((FUNCTION (fn).arity > 1 || FUNCTION (fn).arity == -1)
554       && x != cell_nil && TYPE (CDR (x)) == PAIR && TYPE (CADR (x)) == VALUES)
555     x = cons (CAR (x), cons (CDADAR (x), CDR (x)));
556   switch (FUNCTION (fn).arity)
557     {
558     case 0: return FUNCTION (fn).function0 ();
559     case 1: return FUNCTION (fn).function1 (car (x));
560     case 2: return FUNCTION (fn).function2 (car (x), cadr (x));
561     case 3: return FUNCTION (fn).function3 (car (x), cadr (x), caddr (x));
562     case -1: return FUNCTION (fn).functionn (x);
563     }
564   return cell_unspecified;
565 }
566
567 SCM
568 gc_frame (SCM stack)
569 {
570   SCM frame = car (stack);
571   r1 = car (frame);
572   r2 = cadr (frame);
573   r3 = caddr (frame);
574   r0 = cadddr (frame);
575   return frame;
576 }
577
578 SCM
579 gc_stack (SCM a)
580 {
581   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
582   stack = cons (frame, stack);
583   stack = gc (stack);
584   gc_frame (stack);
585   stack = cdr (stack);
586   return stack;
587 }
588
589 SCM
590 vm_call (function0_t f, SCM p1, SCM p2, SCM a)
591 {
592   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
593   stack = cons (frame, stack);
594   r1 = p1;
595   r2 = p2;
596   r0 = a;
597   if (g_free.value + GC_SAFETY > ARENA_SIZE)
598     gc_stack (stack);
599
600   SCM r = f ();
601   frame = gc_frame (stack);
602   stack = cdr (stack);
603   return r;
604 }
605
606 SCM
607 evlis_env (SCM m, SCM a)
608 {
609   return vm_call (vm_evlis_env, m, cell_undefined, a);
610 }
611
612 SCM
613 apply_env (SCM fn, SCM x, SCM a)
614 {
615   return vm_call (vm_apply_env, fn, x, a);
616 }
617
618 SCM
619 eval_env (SCM e, SCM a)
620 {
621   return vm_call (vm_eval_env, e, cell_undefined, a);
622 }
623
624 SCM
625 expand_macro_env (SCM e, SCM a)
626 {
627   return vm_call (vm_expand_macro_env, e, cell_undefined, a);
628 }
629
630 SCM
631 begin_env (SCM e, SCM a)
632 {
633   return vm_call (vm_begin_env, e, cell_undefined, a);
634 }
635
636 SCM
637 if_env (SCM e, SCM a)
638 {
639   return vm_call (vm_if_env, e, cell_undefined, a);
640 }
641
642 SCM
643 call_with_values_env (SCM producer, SCM consumer, SCM a)
644 {
645   return vm_call (vm_call_with_values_env, producer, consumer, a);
646 }
647
648 SCM
649 append2 (SCM x, SCM y)
650 {
651   if (x == cell_nil) return y;
652   assert (TYPE (x) == PAIR);
653   return cons (car (x), append2 (cdr (x), y));
654 }
655
656 SCM
657 append (SCM x) ///((arity . n))
658  {
659   if (x == cell_nil) return cell_nil;
660   return append2 (car (x), append (cdr (x)));
661  }
662
663 SCM
664 make_char (int x)
665 {
666   g_cells[tmp_num].value = CHAR;
667   g_cells[tmp_num2].value = x;
668   return make_cell (tmp_num, tmp_num2, tmp_num2);
669 }
670
671 SCM
672 make_function (SCM name, SCM id, SCM arity)
673 {
674   g_cells[tmp_num3].value = FUNCTION;
675   function *f = (function*)malloc (sizeof (function));
676   f->arity = VALUE (arity);
677   g_cells[tmp_num4].value = (long)f;
678   return make_cell (tmp_num3, name, tmp_num4);
679 }
680
681 SCM
682 make_keyword (SCM s)
683 {
684   SCM x = internal_lookup_symbol (s);
685   x = x ? x : internal_make_symbol (s);
686   g_cells[tmp_num].value = KEYWORD;
687   return make_cell (tmp_num, STRING (x), 0);
688 }
689
690 SCM
691 make_macro (SCM name, SCM x)
692 {
693   g_cells[tmp_num].value = MACRO;
694   return make_cell (tmp_num, STRING (name), x);
695 }
696
697 SCM
698 make_number (int x)
699 {
700   g_cells[tmp_num].value = NUMBER;
701   g_cells[tmp_num2].value = x;
702   return make_cell (tmp_num, tmp_num2, tmp_num2);
703 }
704
705 SCM
706 make_ref (SCM x)
707 {
708   g_cells[tmp_num].value = REF;
709   return make_cell (tmp_num, x, x);
710 }
711
712 SCM
713 make_string (SCM x)
714 {
715   g_cells[tmp_num].value = STRING;
716   return make_cell (tmp_num, x, 0);
717 }
718
719 SCM
720 cstring_to_list (char const* s)
721 {
722   SCM p = cell_nil;
723   int i = strlen (s);
724   while (i--)
725     p = cons (make_char (s[i]), p);
726   return p;
727 }
728
729 SCM
730 null_p (SCM x)
731 {
732   return x == cell_nil ? cell_t : cell_f;
733 }
734
735 SCM
736 internal_make_symbol (SCM s)
737 {
738   g_cells[tmp_num].value = SYMBOL;
739   SCM x = make_cell (tmp_num, s, 0);
740   g_symbols = cons (x, g_symbols);
741   return x;
742 }
743
744 SCM
745 make_symbol (SCM s)
746 {
747   SCM x = internal_lookup_symbol (s);
748   return x ? x : internal_make_symbol (s);
749 }
750
751 SCM
752 make_vector (SCM n)
753 {
754   int k = VALUE (n);
755   g_cells[tmp_num].value = VECTOR;
756   SCM v = alloc (k);
757   SCM x = make_cell (tmp_num, k, v);
758   for (int i=0; i<k; i++) g_cells[v+i] = g_cells[vector_entry (cell_unspecified)];
759   return x;
760 }
761
762 SCM
763 values (SCM x) ///((arity . n))
764 {
765   SCM v = cons (0, x);
766   TYPE (v) = VALUES;
767   return v;
768 }
769
770 SCM
771 vector_length (SCM x)
772 {
773   assert (TYPE (x) == VECTOR);
774   return make_number (LENGTH (x));
775 }
776
777 SCM
778 vector_ref (SCM x, SCM i)
779 {
780   assert (TYPE (x) == VECTOR);
781   assert (VALUE (i) < LENGTH (x));
782   SCM e = VECTOR (x) + VALUE (i);
783   if (TYPE (e) == REF) e = g_cells[e].ref;
784   if (TYPE (e) == CHAR) e = make_char (VALUE (e));
785   if (TYPE (e) == NUMBER) e = make_number (VALUE (e));
786   return e;
787 }
788
789 SCM
790 vector_entry (SCM x) {
791   if (TYPE (x) == PAIR || TYPE (x) == SPECIAL || TYPE (x) == STRING || TYPE (x) == SYMBOL || TYPE (x) == VECTOR) x = make_ref (x);
792   return x;
793 }
794
795 SCM
796 vector_set_x (SCM x, SCM i, SCM e)
797 {
798   assert (TYPE (x) == VECTOR);
799   assert (VALUE (i) < LENGTH (x));
800   g_cells[VECTOR (x)+g_cells[i].value] = g_cells[vector_entry (e)];
801   return cell_unspecified;
802 }
803
804 SCM
805 list_to_vector (SCM x)
806 {
807   VALUE (tmp_num) = VALUE (length (x));
808   SCM v = make_vector (tmp_num);
809   SCM p = VECTOR (v);
810   while (x != cell_nil)
811     {
812       g_cells[p++] = g_cells[vector_entry (car (x))];
813       x = cdr (x);
814     }
815   return v;
816 }
817
818 FILE *g_stdin;
819 int
820 getchar ()
821 {
822   return getc (g_stdin);
823 }
824
825 int
826 ungetchar (int c)
827 {
828   return ungetc (c, g_stdin);
829 }
830
831 int
832 peekchar ()
833 {
834   int c = getchar ();
835   ungetchar (c);
836   return c;
837 }
838
839 SCM
840 peek_byte ()
841 {
842   return make_number (peekchar ());
843 }
844
845 SCM
846 read_byte ()
847 {
848   return make_number (getchar ());
849 }
850
851 SCM
852 unread_byte (SCM i)
853 {
854   return ungetchar (VALUE (i));
855 }
856
857 SCM
858 write_char (SCM x) ///((arity . n))
859 {
860   SCM c = car (x);
861   SCM p = cdr (x);
862   int fd = 1;
863   if (TYPE (p) == PAIR && TYPE (car (p)) == NUMBER) fd = VALUE (car (p));
864   FILE *f = fd == 1 ? stdout : stderr;
865   assert (TYPE (c) == NUMBER || TYPE (c) == CHAR);
866   fputc (VALUE (c), f);
867   return c;
868 }
869
870 SCM
871 symbol_to_list (SCM x)
872 {
873   assert (TYPE (x) == SYMBOL);
874   return STRING (x);
875 }
876
877 SCM
878 char_to_integer (SCM x)
879 {
880   assert (TYPE (x) == CHAR);
881   return make_number (VALUE (x));
882 }
883
884 SCM
885 integer_to_char (SCM x)
886 {
887   assert (TYPE (x) == NUMBER);
888   return make_char (VALUE (x));
889 }
890
891 void
892 make_tmps (scm* cells)
893 {
894   tmp = g_free.value++;
895   cells[tmp].type = CHAR;
896   tmp_num = g_free.value++;
897   cells[tmp_num].type = NUMBER;
898   tmp_num2 = g_free.value++;
899   cells[tmp_num2].type = NUMBER;
900   tmp_num3 = g_free.value++;
901   cells[tmp_num3].type = NUMBER;
902   tmp_num4 = g_free.value++;
903   cells[tmp_num4].type = NUMBER;
904 }
905
906 //\f Jam Collector
907 SCM g_symbol_max;
908 bool g_debug = false;
909
910 SCM
911 gc_up_arena ()
912 {
913   ARENA_SIZE *= 2;
914   void *p = realloc (g_cells-1, 2*ARENA_SIZE*sizeof(scm));
915   if (!p)
916     {
917       if (g_debug) fprintf (stderr, "cannot up arena: %s: arena=%d\n", strerror (errno), 2*ARENA_SIZE);
918       return cell_unspecified;
919     }
920   g_cells = (scm*)p;
921   g_cells++;
922   gc_init_news ();
923 }
924
925 SCM
926 gc ()
927 {
928   if (g_debug) fprintf (stderr, "***gc[%d]...", g_free.value);
929   g_free.value = 1;
930   if (g_cells < g_news && ARENA_SIZE < MAX_ARENA_SIZE) gc_up_arena ();
931   for (int i=g_free.value; i<g_symbol_max; i++)
932     gc_copy (i);
933   make_tmps (g_news);
934   g_symbols = gc_copy (g_symbols);
935   SCM new = gc_copy (stack);
936   if (g_debug) fprintf (stderr, "new=%d\n", new, stack);
937   stack = new;
938   return gc_loop (1);
939 }
940
941 SCM
942 gc_loop (SCM scan)
943 {
944   while (scan < g_free.value)
945     {
946       if (NTYPE (scan) == KEYWORD
947           || NTYPE (scan) == MACRO
948           || NTYPE (scan) == PAIR
949           || NTYPE (scan) == REF
950           || scan == 1 // null
951           || NTYPE (scan) == SPECIAL
952           || NTYPE (scan) == STRING
953           || NTYPE (scan) == SYMBOL)
954         {
955           SCM car = gc_copy (g_news[scan].car);
956           gc_relocate_car (scan, car);
957         }
958       if ((NTYPE (scan) == MACRO
959            || NTYPE (scan) == PAIR
960            || NTYPE (scan) == VALUES)
961           && g_news[scan].cdr) // allow for 0 terminated list of symbols
962         {
963           SCM cdr = gc_copy (g_news[scan].cdr);
964           gc_relocate_cdr (scan, cdr);
965         }
966       scan++;
967     }
968   return gc_flip ();
969 }
970
971 SCM
972 gc_copy (SCM old)
973 {
974   if (TYPE (old) == BROKEN_HEART) return g_cells[old].car;
975   SCM new = g_free.value++;
976   g_news[new] = g_cells[old];
977   if (NTYPE (new) == VECTOR)
978     {
979       g_news[new].vector = g_free.value;
980       for (int i=0; i<LENGTH (old); i++)
981         g_news[g_free.value++] = g_cells[VECTOR (old)+i];
982     }
983   g_cells[old].type = BROKEN_HEART;
984   g_cells[old].car = new;
985   return new;
986 }
987
988 SCM
989 gc_relocate_car (SCM new, SCM car)
990 {
991   g_news[new].car = car;
992   return cell_unspecified;
993 }
994
995 SCM
996 gc_relocate_cdr (SCM new, SCM cdr)
997 {
998   g_news[new].cdr = cdr;
999   return cell_unspecified;
1000 }
1001
1002 SCM
1003 gc_flip ()
1004 {
1005   scm *cells = g_cells;
1006   g_cells = g_news;
1007   g_news = cells;
1008   if (g_debug) fprintf (stderr, " => jam[%d]\n", g_free.value);
1009   return stack;
1010 }
1011
1012 SCM
1013 gc_show ()
1014 {
1015   fprintf (stderr, "cells: ");
1016   scm *t = g_cells;
1017   display_ (stderr, -1);
1018   fprintf (stderr, "\n");
1019   if (g_news)
1020     {
1021       fprintf (stderr, "news: ");
1022       g_cells = g_news;
1023       display_ (stderr, -1);
1024       fprintf (stderr, "\n");
1025     }
1026   g_cells = t;
1027   return cell_unspecified;
1028 }
1029
1030 //\f Environment setup
1031 SCM
1032 acons (SCM key, SCM value, SCM alist)
1033 {
1034   return cons (cons (key, value), alist);
1035 }
1036
1037 SCM
1038 add_environment (SCM a, char const *name, SCM x)
1039 {
1040   return acons (make_symbol (cstring_to_list (name)), x, a);
1041 }
1042
1043 SCM
1044 gc_init_cells ()
1045 {
1046   g_cells = (scm *)malloc (2*ARENA_SIZE*sizeof(scm));
1047   g_cells[0].type = VECTOR;
1048   g_cells[0].length = 1000;
1049   g_cells[0].vector = 0;
1050   g_cells++;
1051   g_cells[0].type = CHAR;
1052   g_cells[0].value = 'c';
1053 }
1054
1055 SCM
1056 gc_init_news ()
1057 {
1058   g_news = g_cells-1 + ARENA_SIZE;
1059   g_news[0].type = VECTOR;
1060   g_news[0].length = 1000;
1061   g_news[0].vector = 0;
1062   g_news++;
1063   g_news[0].type = CHAR;
1064   g_news[0].value = 'n';
1065 }
1066
1067 SCM
1068 mes_symbols () ///((internal))
1069 {
1070   gc_init_cells ();
1071   gc_init_news ();
1072
1073 #include "mes.symbols.i"
1074
1075   g_symbol_max = g_free.value;
1076   make_tmps (g_cells);
1077
1078   g_symbols = 0;
1079   for (int i=1; i<g_symbol_max; i++)
1080     g_symbols = cons (i, g_symbols);
1081
1082   SCM a = cell_nil;
1083
1084 #if BOOT
1085   a = acons (cell_symbol_label, cell_t, a);
1086 #endif
1087   a = acons (cell_symbol_begin, cell_begin, a);
1088   a = add_environment (a, "sc-expand", cell_f);
1089   a = acons (cell_closure, a, a);
1090
1091   internal_lookup_symbol (cell_nil);
1092
1093   return a;
1094 }
1095
1096 SCM
1097 mes_builtins (SCM a)
1098 {
1099 #include "mes.i"
1100
1101 #include "define.i"
1102 #include "display.i"
1103 #include "lib.i"
1104 #include "math.i"
1105 #include "posix.i"
1106 #include "quasiquote.i"
1107 #include "reader.i"
1108 #include "string.i"
1109 #include "type.i"
1110
1111 #include "define.environment.i"
1112 #include "display.environment.i"
1113 #include "lib.environment.i"
1114 #include "math.environment.i"
1115 #include "mes.environment.i"
1116 #include "posix.environment.i"
1117   //#include "quasiquote.environment.i"
1118 #include "reader.environment.i"
1119 #include "string.environment.i"
1120 #include "type.environment.i"
1121
1122 #if QUASIQUOTE
1123   SCM cell_unquote = assq_ref_cache (cell_symbol_unquote, a);
1124   SCM cell_unquote_splicing = assq_ref_cache (cell_symbol_unquote_splicing, a);
1125   SCM the_unquoters = cons (cons (cell_symbol_unquote, cell_unquote),
1126                             cons (cons (cell_symbol_unquote_splicing, cell_unquote_splicing),
1127                                   cell_nil));
1128   a = acons (cell_symbol_the_unquoters, the_unquoters, a);
1129 #endif
1130
1131   a = add_environment (a, "*dot*", cell_dot);
1132   a = add_environment (a, "*foo-bar-baz*", cell_nil); // FIXME: some off-by one?
1133
1134   return a;
1135 }
1136
1137 SCM
1138 mes_stack (SCM a) ///((internal))
1139 {
1140   r0 = a;
1141   r1 = make_char (0);
1142   r2 = make_char (0);
1143   r3 = make_char (0);
1144   stack = cons (cell_nil, cell_nil);
1145   return r0;
1146 }
1147
1148 SCM
1149 mes_environment () ///((internal))
1150 {
1151   SCM a = mes_symbols ();
1152   return mes_stack (a);
1153 }
1154
1155 SCM
1156 make_lambda (SCM args, SCM body)
1157 {
1158   return cons (cell_symbol_lambda, cons (args, body));
1159 }
1160
1161 SCM
1162 make_closure (SCM args, SCM body, SCM a)
1163 {
1164   return cons (cell_closure, cons (cons (cell_circular, a), cons (args, body)));
1165 }
1166
1167 SCM
1168 lookup_macro (SCM x, SCM a)
1169 {
1170   if (TYPE (x) != SYMBOL) return cell_f;
1171   SCM m = assq_ref_cache (x, a);
1172   if (macro_p (m) == cell_t) return MACRO (m);
1173   return cell_f;
1174 }
1175
1176 SCM
1177 read_input_file_env_ (SCM e, SCM a)
1178 {
1179   if (e == cell_nil) return e;
1180   return cons (e, read_input_file_env_ (read_env (a), a));
1181 }
1182
1183 SCM
1184 read_input_file_env (SCM a)
1185 {
1186   r0 = a;
1187 #if READER
1188   return read_input_file_env_ (read_env (r0), r0);
1189 #endif
1190   return apply_env (cell_symbol_read_input_file, cell_nil, r0);
1191 }
1192
1193 SCM
1194 load_env (SCM a) ///((internal))
1195 {
1196   r0 =a;
1197 #if !READER
1198   g_stdin = fopen ("module/mes/read-0.mes", "r");
1199   g_stdin = g_stdin ? g_stdin : fopen (PREFIX "module/mes/read-0.mes", "r");
1200 #endif
1201   if (!g_function) r0 = mes_builtins (r0);
1202   r3 = read_input_file_env (r0);
1203   g_stdin = stdin;
1204   return r3;
1205 }
1206
1207 SCM
1208 bload_env (SCM a) ///((internal))
1209 {
1210   g_stdin = fopen ("module/mes/read-0.mo", "r");
1211   g_stdin = g_stdin ? g_stdin : fopen (PREFIX "module/mes/read-0.mo", "r");
1212   char *p = (char*)g_cells;
1213   assert (getchar () == 'M');
1214   assert (getchar () == 'E');
1215   assert (getchar () == 'S');
1216   stack = getchar () << 8;
1217   stack += getchar ();
1218   int c = getchar ();
1219   while (c != EOF)
1220     {
1221       *p++ = c;
1222       c = getchar ();
1223     }
1224   g_free.value = (p-(char*)g_cells) / sizeof (scm);
1225   gc_frame (stack);
1226   g_symbols = r1;
1227   g_stdin = stdin;
1228
1229   r0 = mes_builtins (r0);
1230   return r3;
1231 }
1232
1233 int
1234 dump ()
1235 {
1236   r1 = g_symbols;
1237   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
1238   stack = cons (frame, stack);
1239   stack = gc (stack);
1240   gc_frame (stack);
1241   char *p = (char*)g_cells;
1242   fputc ('M', stdout);
1243   fputc ('E', stdout);
1244   fputc ('S', stdout);
1245   fputc (stack >> 8, stdout);
1246   fputc (stack % 256, stdout);
1247   for (int i=0; i<g_free.value * sizeof(scm); i++)
1248     fputc (*p++, stdout);
1249   return 0;
1250 }
1251
1252 #include "type.c"
1253 #include "define.c"
1254 #include "display.c"
1255 #include "lib.c"
1256 #include "math.c"
1257 #include "posix.c"
1258 #include "quasiquote.c"
1259 #include "reader.c"
1260 #include "string.c"
1261
1262 int
1263 main (int argc, char *argv[])
1264 {
1265   g_debug = getenv ("MES_DEBUG");
1266   if (getenv ("MES_ARENA")) ARENA_SIZE = atoi (getenv ("MES_ARENA"));
1267   if (argc > 1 && !strcmp (argv[1], "--help")) return puts ("Usage: mes < FILE\n");
1268   if (argc > 1 && !strcmp (argv[1], "--version")) return puts ("Mes 0.3\n");
1269   g_stdin = stdin;
1270   r0 = mes_environment ();
1271   SCM program = (argc > 1 && !strcmp (argv[1], "--load"))
1272     ? bload_env (r0) : load_env (r0);
1273   if (argc > 1 && !strcmp (argv[1], "--dump")) return dump ();
1274   display_ (stderr, begin_env (program, r0));
1275   fputs ("", stderr);
1276   gc (stack);
1277   if (g_debug) fprintf (stderr, "\nstats: [%d]\n", g_free.value);
1278   return 0;
1279 }