5c553126244faed81f95366bc49e8cdc69c0713b
[mes.git] / mes.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #define _GNU_SOURCE
22 #include <assert.h>
23 #include <ctype.h>
24 #include <errno.h>
25 #include <limits.h>
26 #include <stdio.h>
27 #include <string.h>
28 #include <stdlib.h>
29 #include <stdbool.h>
30
31 #define DEBUG 0
32 #define FIXED_PRIMITIVES 1
33
34 int ARENA_SIZE = 100000;
35 int MAX_ARENA_SIZE = 20000000;
36 int GC_SAFETY = 100;
37
38 typedef int SCM;
39 enum type_t {CHAR, FUNCTION, KEYWORD, MACRO, NUMBER, PAIR, SPECIAL, STRING, SYMBOL, REF, VALUES, VECTOR, BROKEN_HEART};
40 typedef SCM (*function0_t) (void);
41 typedef SCM (*function1_t) (SCM);
42 typedef SCM (*function2_t) (SCM, SCM);
43 typedef SCM (*function3_t) (SCM, SCM, SCM);
44 typedef SCM (*functionn_t) (SCM);
45 typedef struct function_t {
46   union {
47     function0_t function0;
48     function1_t function1;
49     function2_t function2;
50     function3_t function3;
51     functionn_t functionn;
52   };
53   int arity;
54 } function;
55 struct scm_t;
56 typedef struct scm_t {
57   enum type_t type;
58   union {
59     char const *name;
60     SCM string;
61     SCM car;
62     SCM ref;
63     int length;
64   };
65   union {
66     int value;
67     int function;
68     SCM cdr;
69     SCM macro;
70     SCM vector;
71     int hits;
72   };
73 } scm;
74
75 scm scm_nil = {SPECIAL, "()"};
76 scm scm_f = {SPECIAL, "#f"};
77 scm scm_t = {SPECIAL, "#t"};
78 scm scm_dot = {SPECIAL, "."};
79 scm scm_arrow = {SPECIAL, "=>"};
80 scm scm_undefined = {SPECIAL, "*undefined*"};
81 scm scm_unspecified = {SPECIAL, "*unspecified*"};
82 scm scm_closure = {SPECIAL, "*closure*"};
83 scm scm_circular = {SPECIAL, "*circular*"};
84 scm scm_label = {SPECIAL, "label"};
85 scm scm_begin = {SPECIAL, "*begin*"};
86
87 scm scm_symbol_lambda = {SYMBOL, "lambda"};
88 scm scm_symbol_begin = {SYMBOL, "begin"};
89 scm scm_symbol_if = {SYMBOL, "if"};
90 scm scm_symbol_define = {SYMBOL, "define"};
91 scm scm_symbol_define_macro = {SYMBOL, "define-macro"};
92 scm scm_symbol_set_x = {SYMBOL, "set!"};
93
94 scm scm_symbol_quote = {SYMBOL, "quote"};
95 scm scm_symbol_quasiquote = {SYMBOL, "quasiquote"};
96 scm scm_symbol_unquote = {SYMBOL, "unquote"};
97 scm scm_symbol_unquote_splicing = {SYMBOL, "unquote-splicing"};
98
99 scm scm_symbol_sc_expand = {SYMBOL, "sc-expand"};
100 scm scm_symbol_macro_expand = {SYMBOL, "macro-expand"};
101 scm scm_symbol_sc_expander_alist = {SYMBOL, "*sc-expander-alist*"};
102 scm scm_symbol_noexpand = {SYMBOL, "noexpand"};
103 scm scm_symbol_syntax = {SYMBOL, "syntax"};
104 scm scm_symbol_quasisyntax = {SYMBOL, "quasisyntax"};
105 scm scm_symbol_unsyntax = {SYMBOL, "unsyntax"};
106 scm scm_symbol_unsyntax_splicing = {SYMBOL, "unsyntax-splicing"};
107
108 scm scm_symbol_call_with_values = {SYMBOL, "call-with-values"};
109 scm scm_symbol_current_module = {SYMBOL, "current-module"};
110 scm scm_symbol_primitive_load = {SYMBOL, "primitive-load"};
111 scm scm_symbol_read_input_file = {SYMBOL, "read-input-file"};
112
113 scm scm_symbol_car = {SYMBOL, "car"};
114 scm scm_symbol_cdr = {SYMBOL, "cdr"};
115 scm scm_symbol_null_p = {SYMBOL, "null?"};
116 scm scm_symbol_eq_p = {SYMBOL, "eq?"};
117 scm scm_symbol_cons = {SYMBOL, "cons"};
118
119 scm char_eof = {CHAR, .name="*eof*", .value=-1};
120 scm char_nul = {CHAR, .name="nul", .value=0};
121 scm char_alarm = {CHAR, .name="alarm", .value=8};
122 scm char_backspace = {CHAR, .name="backspace", .value=8};
123 scm char_tab = {CHAR, .name="tab", .value=9};
124 scm char_newline = {CHAR, .name="newline", .value=10};
125 scm char_vtab = {CHAR, .name="vtab", .value=11};
126 scm char_page = {CHAR, .name="page", .value=12};
127 scm char_return = {CHAR, .name="return", .value=13};
128 scm char_space = {CHAR, .name="space", .value=32};
129
130 scm g_free = {NUMBER, .value=0};
131 scm *g_cells;
132 scm *g_news = 0;
133
134 #include "mes.symbols.h"
135
136 SCM tmp;
137 SCM tmp_num;
138 SCM tmp_num2;
139 SCM tmp_num3;
140 SCM tmp_num4;
141
142 function functions[200];
143 int g_function = 0;
144
145 SCM g_symbols = 0;
146 SCM stack = 0;
147 SCM r0 = 0; // a/env
148 SCM r1 = 0; // param 1
149 SCM r2 = 0; // param 2
150 SCM r3 = 0; // param 3
151
152 #include "display.h"
153 #include "lib.h"
154 #include "math.h"
155 #include "mes.h"
156 #include "posix.h"
157 #include "reader.h"
158 #include "string.h"
159 #include "type.h"
160
161 #define CAR(x) g_cells[x].car
162 #define CDR(x) g_cells[x].cdr
163 #define HITS(x) g_cells[x].hits
164 #define LENGTH(x) g_cells[x].length
165 #define NAME(x) g_cells[x].name
166 #define STRING(x) g_cells[x].string
167 #define TYPE(x) g_cells[x].type
168 #define MACRO(x) g_cells[x].macro
169 #define REF(x) g_cells[x].ref
170 #define VALUE(x) g_cells[x].value
171 #define VECTOR(x) g_cells[x].vector
172 #define FUNCTION(x) functions[g_cells[x].function]
173 #define NCAR(x) g_news[x].car
174 #define NTYPE(x) g_news[x].type
175
176 #define CAAR(x) CAR (CAR (x))
177 #define CDAR(x) CDR (CAR (x))
178 #define CAAR(x) CAR (CAR (x))
179 #define CADAR(x) CAR (CDR (CAR (x)))
180 #define CADDR(x) CAR (CDR (CDR (x)))
181 #define CDADAR(x) CAR (CDR (CAR (CDR (x))))
182 #define CADR(x) CAR (CDR (x))
183
184 #define MAKE_NUMBER(n) make_cell (tmp_num_ (NUMBER), 0, tmp_num2_ (n))
185
186 SCM display_ (FILE* f, SCM x);
187 SCM vm_call (function0_t f, SCM p1, SCM p2, SCM a);
188
189 SCM
190 alloc (int n)
191 {
192   assert (g_free.value + n < ARENA_SIZE);
193   SCM x = g_free.value;
194   g_free.value += n;
195   return x;
196 }
197
198 SCM
199 make_cell (SCM type, SCM car, SCM cdr)
200 {
201   SCM x = alloc (1);
202   assert (TYPE (type) == NUMBER);
203   TYPE (x) = VALUE (type);
204   if (VALUE (type) == CHAR || VALUE (type) == NUMBER) {
205     if (car) CAR (x) = CAR (car);
206     if (cdr) CDR (x) = CDR (cdr);
207   } else if (VALUE (type) == FUNCTION) {
208     if (car) CAR (x) = car;
209     if (cdr) CDR (x) = CDR (cdr);
210   } else {
211     CAR (x) = car;
212     CDR (x) = cdr;
213   }
214   return x;
215 }
216
217 SCM
218 cons (SCM x, SCM y)
219 {
220   g_cells[tmp_num].value = PAIR;
221   return make_cell (tmp_num, x, y);
222 }
223
224 SCM
225 car (SCM x)
226 {
227   assert (TYPE (x) == PAIR);
228   return CAR (x);
229 }
230
231 SCM
232 cdr (SCM x)
233 {
234   assert (TYPE (x) == PAIR);
235   return CDR (x);
236 }
237
238 SCM
239 eq_p (SCM x, SCM y)
240 {
241   return (x == y
242           || ((TYPE (x) == KEYWORD && TYPE (y) == KEYWORD
243                && STRING (x) == STRING (y)))
244           || (TYPE (x) == CHAR && TYPE (y) == CHAR
245               && VALUE (x) == VALUE (y))
246           || (TYPE (x) == NUMBER && TYPE (y) == NUMBER
247               && VALUE (x) == VALUE (y)))
248     ? cell_t : cell_f;
249 }
250
251 SCM
252 set_car_x (SCM x, SCM e)
253 {
254   assert (TYPE (x) == PAIR);
255   CAR (x) = e;
256   return cell_unspecified;
257 }
258
259 SCM
260 set_cdr_x (SCM x, SCM e)
261 {
262   assert (TYPE (x) == PAIR);
263   CDR (x) = e;
264   return cell_unspecified;
265 }
266
267 SCM
268 set_env_x (SCM x, SCM e, SCM a)
269 {
270   SCM p = assert_defined (x, assq (x, a));
271   return set_cdr_x (p, e);
272 }
273
274 SCM
275 quote (SCM x)
276 {
277   return cons (cell_symbol_quote, x);
278 }
279
280 SCM
281 quasiquote (SCM x)
282 {
283   return cons (cell_symbol_quasiquote, x);
284 }
285
286 SCM
287 quasisyntax (SCM x)
288 {
289   return cons (cell_symbol_quasisyntax, x);
290 }
291
292 SCM
293 pairlis (SCM x, SCM y, SCM a)
294 {
295   if (x == cell_nil)
296     return a;
297   if (pair_p (x) == cell_f)
298     return cons (cons (x, y), a);
299   return cons (cons (car (x), car (y)),
300                pairlis (cdr (x), cdr (y), a));
301 }
302
303 SCM
304 assq (SCM x, SCM a)
305 {
306   while (a != cell_nil && eq_p (x, CAAR (a)) == cell_f)
307     {
308       if (TYPE (a) == BROKEN_HEART || TYPE (CAR (a)) == BROKEN_HEART)
309         fprintf (stderr, "oops, broken heart\n");
310       a = CDR (a);
311     }
312   return a != cell_nil ? car (a) : cell_f;
313 }
314
315 SCM
316 assq_ref_cache (SCM x, SCM a)
317 {
318   x = assq (x, a);
319   if (x == cell_f) return cell_undefined;
320   return cdr (x);
321 }
322
323 SCM
324 assert_defined (SCM x, SCM e)
325 {
326   if (e == cell_undefined)
327     {
328       fprintf (stderr, "eval: unbound variable:");
329       display_ (stderr, x);
330       fprintf (stderr, "\n");
331       assert (!"unbound variable");
332     }
333   return e;
334 }
335
336 enum eval_apply_t {EVLIS, APPLY, EVAL, MACRO_EXPAND, BEGIN, IF, CALL_WITH_VALUES};
337 enum eval_apply_t g_target;
338
339 SCM
340 call_lambda (SCM e, SCM x, SCM aa, SCM a) ///((internal))
341 {
342   SCM cl = cons (cons (cell_closure, x), x);
343   r1 = e;
344   r0 = cl;
345   r2 = a;
346   r3 = aa;
347   return cell_unspecified;
348 }
349
350 SCM
351 eval_apply ()
352 {
353   switch (g_target)
354     {
355     case EVLIS: goto evlis;
356     case APPLY: goto apply;
357     case EVAL: goto eval;
358     case MACRO_EXPAND: goto macro_expand;
359     case BEGIN: goto begin;
360     case IF: goto label_if;
361     case CALL_WITH_VALUES: goto call_with_values;
362     }
363
364  evlis:
365   if (r1 == cell_nil) return cell_nil;
366   if (TYPE (r1) != PAIR) goto eval;
367   r2 = eval_env (car (r1), r0);
368   r1 = evlis_env (cdr (r1), r0);
369   return cons (r2, r1);
370
371  apply:
372   if (TYPE (r1) != PAIR)
373     {
374       if (TYPE (r1) == FUNCTION) return call (r1, r2);
375       if (r1 == cell_symbol_call_with_values)
376         {
377           r1 = car (r2);
378           r2 = cadr (r2);
379           goto call_with_values;
380         }
381       if (r1 == cell_symbol_current_module) return r0;
382     }
383   else
384     switch (car (r1))
385       {
386       case cell_symbol_lambda:
387         {
388           SCM args = cadr (r1);
389           SCM body = cddr (r1);
390           SCM p = pairlis (args, r2, r0);
391           call_lambda (body, p, p, r0);
392           goto begin;
393         }
394       case cell_closure:
395         {
396           SCM args = caddr (r1);
397           SCM body = cdddr (r1);
398           SCM aa = cdadr (r1);
399           aa = cdr (aa);
400           SCM p = pairlis (args, r2, aa);
401           call_lambda (body, p, aa, r0);
402           goto begin;
403         }
404 #if BOOT
405       case cell_symbol_label:
406         {
407           r0 = cons (cons (cadr (r1), caddr (r1)), r0);
408           r1 = caddr (r1);
409           goto apply;
410         }
411 #endif
412       }
413   SCM e = eval_env (r1, r0);
414   char const* type = 0;
415   if (e == cell_f || e == cell_t) type = "bool";
416   if (TYPE (e) == CHAR) type = "char";
417   if (TYPE (e) == NUMBER) type = "number";
418   if (TYPE (e) == STRING) type = "string";
419   if (e == cell_unspecified) type = "*unspecified*";
420   if (e == cell_undefined) type =  "*undefined*";
421   if (type)
422     {
423       fprintf (stderr, "cannot apply: %s: ", type);
424       display_ (stderr, e);
425       fprintf (stderr, " [");
426       display_ (stderr, r1);
427       fprintf (stderr, "]\n");
428       assert (!"cannot apply");
429     }
430   r1 = e;
431   goto apply;
432
433  eval:
434   switch (TYPE (r1))
435     {
436     case PAIR:
437       {
438         switch (car (r1))
439           {
440 #if FIXED_PRIMITIVES
441           case cell_symbol_car: return car (eval_env (CADR (r1), r0));
442           case cell_symbol_cdr: return cdr (eval_env (CADR (r1), r0));
443           case cell_symbol_cons: {SCM m = evlis_env (CDR (r1), r0);
444               return cons (CAR (m), CADR (m));}
445           case cell_symbol_null_p: return null_p (eval_env (CADR (r1), r0));
446 #endif // FIXED_PRIMITIVES
447           case cell_symbol_quote: return cadr (r1);
448           case cell_symbol_begin: goto begin;
449           case cell_symbol_lambda:
450             return make_closure (cadr (r1), cddr (r1), assq (cell_closure, r0));
451           case cell_closure: return r1;
452           case cell_symbol_if: {r1=cdr (r1); goto label_if;}
453           case cell_symbol_set_x: {
454             SCM x = eval_env (caddr (r1), r0); return set_env_x (cadr (r1), x, r0);
455           }
456           default: {
457             SCM x = macro_expand_env (r1, r0);
458             if (x != r1)
459               {
460                 if (TYPE (x) == PAIR)
461                   {
462                     set_cdr_x (r1, cdr (x));
463                     set_car_x (r1, car (x));
464                   }
465                 r1 = x;
466                 goto eval;
467               }
468             SCM m = evlis_env (CDR (r1), r0);
469             r1 = car (r1);
470             r2 = m;
471             goto apply;
472           }
473           }
474       }
475     case SYMBOL: return assert_defined (r1, assq_ref_cache (r1, r0));
476     default: return r1;
477     }
478
479  macro_expand:
480   if (TYPE (CAR (r1)) == STRING && string_to_symbol (CAR (r1)) == cell_symbol_noexpand)
481     return cadr (r1);
482
483   SCM macro;
484   SCM expanders;
485   if (TYPE (r1) == PAIR
486       && (macro = lookup_macro (car (r1), r0)) != cell_f)
487     {
488       r2 = CDR (r1);
489       r1 = macro;
490       goto apply;
491     }
492   else if (TYPE (r1) == PAIR
493            && TYPE (CAR (r1)) == SYMBOL
494            && ((expanders = assq_ref_cache (cell_symbol_sc_expander_alist, r0)) != cell_undefined)
495            && ((macro = assq (CAR (r1), expanders)) != cell_f))
496     {
497       SCM sc_expand = assq_ref_cache (cell_symbol_macro_expand, r0);
498       if (sc_expand != cell_undefined && sc_expand != cell_f)
499         {
500           r2 = cons (r1, cell_nil);
501           r1 = sc_expand;
502           goto apply;
503         }
504     }
505   return r1;
506
507   SCM r;
508  begin:
509   r = cell_unspecified;
510   while (r1 != cell_nil) {
511     if (TYPE (r1) == PAIR && TYPE (CAR (r1)) == PAIR)
512       {
513         if (caar (r1) == cell_symbol_begin)
514           r1 = append2 (cdar (r1), cdr (r1));
515         else if (caar (r1) == cell_symbol_primitive_load)
516           {
517             SCM f = read_input_file_env (r0);
518             r1 = append2 (f, cdr (r1));
519           }
520       }
521     if (CDR (r1) == cell_nil)
522       {
523         r1 = car (r1);
524         goto eval;
525       }
526     r = eval_env (car (r1), r0);
527     r1 = CDR (r1);
528   }
529   return r;
530
531   SCM x;
532  label_if:
533   x = eval_env (car (r1), r0);
534   if (x != cell_f)
535     {
536       r1 = cadr (r1);
537       goto eval;
538     }
539   if (cddr (r1) != cell_nil)
540     {
541       r1 = caddr (r1);
542       goto eval;
543     }
544   return cell_unspecified;
545
546   SCM v;
547  call_with_values:
548   v = apply_env (r1, cell_nil, r0);
549   if (TYPE (v) == VALUES)
550     v = CDR (v);
551   r1 = r2;
552   r2 = v;
553   goto apply;
554 }
555
556 SCM
557 call (SCM fn, SCM x)
558 {
559   if ((FUNCTION (fn).arity > 0 || FUNCTION (fn).arity == -1)
560       && x != cell_nil && TYPE (CAR (x)) == VALUES)
561     x = cons (CADAR (x), CDR (x));
562   if ((FUNCTION (fn).arity > 1 || FUNCTION (fn).arity == -1)
563       && x != cell_nil && TYPE (CDR (x)) == PAIR && TYPE (CADR (x)) == VALUES)
564     x = cons (CAR (x), cons (CDADAR (x), CDR (x)));
565   switch (FUNCTION (fn).arity)
566     {
567     case 0: return FUNCTION (fn).function0 ();
568     case 1: return FUNCTION (fn).function1 (car (x));
569     case 2: return FUNCTION (fn).function2 (car (x), cadr (x));
570     case 3: return FUNCTION (fn).function3 (car (x), cadr (x), caddr (x));
571     case -1: return FUNCTION (fn).functionn (x);
572     }
573   return cell_unspecified;
574 }
575
576 SCM
577 gc_frame (SCM stack)
578 {
579   SCM frame = car (stack);
580   r1 = car (frame);
581   r2 = cadr (frame);
582   r3 = caddr (frame);
583   r0 = cadddr (frame);
584   return frame;
585 }
586
587 SCM
588 gc_stack (SCM a)
589 {
590   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
591   stack = cons (frame, stack);
592   stack = gc (stack);
593   gc_frame (stack);
594   stack = cdr (stack);
595   return stack;
596 }
597
598 SCM
599 vm_call (function0_t f, SCM p1, SCM p2, SCM a)
600 {
601   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
602   stack = cons (frame, stack);
603   r1 = p1;
604   r2 = p2;
605   r0 = a;
606   if (g_free.value + GC_SAFETY > ARENA_SIZE)
607     gc_stack (stack);
608
609   SCM r = f ();
610   frame = gc_frame (stack);
611   stack = cdr (stack);
612   return r;
613 }
614
615 SCM
616 evlis_env (SCM m, SCM a)
617 {
618   g_target = EVLIS;
619   return vm_call (eval_apply, m, cell_undefined, a);
620 }
621
622 SCM
623 apply_env (SCM fn, SCM x, SCM a)
624 {
625   g_target = APPLY;
626   return vm_call (eval_apply, fn, x, a);
627 }
628
629 SCM
630 eval_env (SCM e, SCM a)
631 {
632   g_target = EVAL;
633   return vm_call (eval_apply, e, cell_undefined, a);
634 }
635
636 SCM
637 macro_expand_env (SCM e, SCM a)
638 {
639   g_target = MACRO_EXPAND;
640   return vm_call (eval_apply, e, cell_undefined, a);
641 }
642
643 SCM
644 begin_env (SCM e, SCM a)
645 {
646   g_target = BEGIN;
647   return vm_call (eval_apply, e, cell_undefined, a);
648 }
649
650 SCM
651 if_env (SCM e, SCM a)
652 {
653   g_target = IF;
654   return vm_call (eval_apply, e, cell_undefined, a);
655 }
656
657 SCM
658 call_with_values_env (SCM producer, SCM consumer, SCM a)
659 {
660   g_target = CALL_WITH_VALUES;
661   return vm_call (eval_apply, producer, consumer, a);
662 }
663
664 SCM
665 append2 (SCM x, SCM y)
666 {
667   if (x == cell_nil) return y;
668   assert (TYPE (x) == PAIR);
669   return cons (car (x), append2 (cdr (x), y));
670 }
671
672 SCM
673 append (SCM x) ///((arity . n))
674  {
675   if (x == cell_nil) return cell_nil;
676   if (cdr (x) == cell_nil) return car (x);
677   return append2 (car (x), append (cdr (x)));
678  }
679
680 SCM
681 make_char (int x)
682 {
683   g_cells[tmp_num].value = CHAR;
684   g_cells[tmp_num2].value = x;
685   return make_cell (tmp_num, tmp_num2, tmp_num2);
686 }
687
688 SCM
689 tmp_num_ (int x)
690 {
691   g_cells[tmp_num].value = x;
692   return tmp_num;
693 }
694
695 SCM
696 tmp_num2_ (int x)
697 {
698   g_cells[tmp_num2].value = x;
699   return tmp_num2;
700 }
701
702 SCM
703 make_ref (SCM x)
704 {
705   g_cells[tmp_num].value = REF;
706   return make_cell (tmp_num, x, x);
707 }
708
709 SCM
710 make_string (SCM x)
711 {
712   g_cells[tmp_num].value = STRING;
713   return make_cell (tmp_num, x, 0);
714 }
715
716 SCM
717 cstring_to_list (char const* s)
718 {
719   SCM p = cell_nil;
720   int i = strlen (s);
721   while (i--)
722     p = cons (make_char (s[i]), p);
723   return p;
724 }
725
726 SCM
727 null_p (SCM x)
728 {
729   return x == cell_nil ? cell_t : cell_f;
730 }
731
732 SCM
733 make_symbol_ (SCM s)
734 {
735   g_cells[tmp_num].value = SYMBOL;
736   SCM x = make_cell (tmp_num, s, 0);
737   g_symbols = cons (x, g_symbols);
738   return x;
739 }
740
741 SCM
742 make_symbol (SCM s)
743 {
744   SCM x = lookup_symbol_ (s);
745   return x ? x : make_symbol_ (s);
746 }
747
748 SCM
749 make_vector (SCM n)
750 {
751   int k = VALUE (n);
752   g_cells[tmp_num].value = VECTOR;
753   SCM v = alloc (k);
754   SCM x = make_cell (tmp_num, k, v);
755   for (int i=0; i<k; i++) g_cells[v+i] = g_cells[vector_entry (cell_unspecified)];
756   return x;
757 }
758
759 SCM
760 values (SCM x) ///((arity . n))
761 {
762   SCM v = cons (0, x);
763   TYPE (v) = VALUES;
764   return v;
765 }
766
767 SCM
768 vector_length (SCM x)
769 {
770   assert (TYPE (x) == VECTOR);
771   return MAKE_NUMBER (LENGTH (x));
772 }
773
774 SCM
775 vector_ref (SCM x, SCM i)
776 {
777   assert (TYPE (x) == VECTOR);
778   assert (VALUE (i) < LENGTH (x));
779   SCM e = VECTOR (x) + VALUE (i);
780   if (TYPE (e) == REF) e = g_cells[e].ref;
781   if (TYPE (e) == CHAR) e = make_char (VALUE (e));
782   if (TYPE (e) == NUMBER) e = MAKE_NUMBER (VALUE (e));
783   return e;
784 }
785
786 SCM
787 vector_entry (SCM x) {
788   if (TYPE (x) == PAIR || TYPE (x) == SPECIAL || TYPE (x) == STRING || TYPE (x) == SYMBOL || TYPE (x) == VECTOR) x = make_ref (x);
789   return x;
790 }
791
792 SCM
793 vector_set_x (SCM x, SCM i, SCM e)
794 {
795   assert (TYPE (x) == VECTOR);
796   assert (VALUE (i) < LENGTH (x));
797   g_cells[VECTOR (x)+g_cells[i].value] = g_cells[vector_entry (e)];
798   return cell_unspecified;
799 }
800
801 SCM
802 list_to_vector (SCM x)
803 {
804   VALUE (tmp_num) = VALUE (length (x));
805   SCM v = make_vector (tmp_num);
806   SCM p = VECTOR (v);
807   while (x != cell_nil)
808     {
809       g_cells[p++] = g_cells[vector_entry (car (x))];
810       x = cdr (x);
811     }
812   return v;
813 }
814
815 FILE *g_stdin;
816 int
817 getchar ()
818 {
819   return getc (g_stdin);
820 }
821
822 int
823 ungetchar (int c)
824 {
825   return ungetc (c, g_stdin);
826 }
827
828 int
829 peekchar ()
830 {
831   int c = getchar ();
832   ungetchar (c);
833   return c;
834 }
835
836 SCM
837 peek_byte ()
838 {
839   return MAKE_NUMBER (peekchar ());
840 }
841
842 SCM
843 read_byte ()
844 {
845   return MAKE_NUMBER (getchar ());
846 }
847
848 SCM
849 unread_byte (SCM i)
850 {
851   ungetchar (VALUE (i));
852   return i;
853 }
854
855 SCM
856 write_char (SCM x) ///((arity . n))
857 {
858   SCM c = car (x);
859   SCM p = cdr (x);
860   int fd = 1;
861   if (TYPE (p) == PAIR && TYPE (car (p)) == NUMBER) fd = VALUE (car (p));
862   FILE *f = fd == 1 ? stdout : stderr;
863   assert (TYPE (c) == NUMBER || TYPE (c) == CHAR);
864   fputc (VALUE (c), f);
865   return c;
866 }
867
868 SCM
869 symbol_to_list (SCM x)
870 {
871   assert (TYPE (x) == SYMBOL);
872   return STRING (x);
873 }
874
875 SCM
876 char_to_integer (SCM x)
877 {
878   assert (TYPE (x) == CHAR);
879   return MAKE_NUMBER (VALUE (x));
880 }
881
882 SCM
883 integer_to_char (SCM x)
884 {
885   assert (TYPE (x) == NUMBER);
886   return make_char (VALUE (x));
887 }
888
889 void
890 make_tmps (scm* cells)
891 {
892   tmp = g_free.value++;
893   cells[tmp].type = CHAR;
894   tmp_num = g_free.value++;
895   cells[tmp_num].type = NUMBER;
896   tmp_num2 = g_free.value++;
897   cells[tmp_num2].type = NUMBER;
898   tmp_num3 = g_free.value++;
899   cells[tmp_num3].type = NUMBER;
900   tmp_num4 = g_free.value++;
901   cells[tmp_num4].type = NUMBER;
902 }
903
904 //\f Jam Collector
905 SCM g_symbol_max;
906 bool g_debug = false;
907
908 SCM
909 gc_up_arena ()
910 {
911   ARENA_SIZE *= 2;
912   void *p = realloc (g_cells-1, 2*ARENA_SIZE*sizeof(scm));
913   if (!p)
914     {
915       if (g_debug) fprintf (stderr, "cannot up arena: %s: arena=%d\n", strerror (errno), 2*ARENA_SIZE);
916       return cell_unspecified;
917     }
918   g_cells = (scm*)p;
919   g_cells++;
920   gc_init_news ();
921 }
922
923 SCM
924 gc ()
925 {
926   if (g_debug) fprintf (stderr, "***gc[%d]...", g_free.value);
927   g_free.value = 1;
928   if (g_cells < g_news && ARENA_SIZE < MAX_ARENA_SIZE) gc_up_arena ();
929   for (int i=g_free.value; i<g_symbol_max; i++)
930     gc_copy (i);
931   make_tmps (g_news);
932   g_symbols = gc_copy (g_symbols);
933   SCM new = gc_copy (stack);
934   if (g_debug) fprintf (stderr, "new=%d\n", new, stack);
935   stack = new;
936   return gc_loop (1);
937 }
938
939 SCM
940 gc_loop (SCM scan)
941 {
942   while (scan < g_free.value)
943     {
944       if (NTYPE (scan) == KEYWORD
945           || NTYPE (scan) == MACRO
946           || NTYPE (scan) == PAIR
947           || NTYPE (scan) == REF
948           || scan == 1 // null
949           || NTYPE (scan) == SPECIAL
950           || NTYPE (scan) == STRING
951           || NTYPE (scan) == SYMBOL)
952         {
953           SCM car = gc_copy (g_news[scan].car);
954           gc_relocate_car (scan, car);
955         }
956       if ((NTYPE (scan) == MACRO
957            || NTYPE (scan) == PAIR
958            || NTYPE (scan) == VALUES)
959           && g_news[scan].cdr) // allow for 0 terminated list of symbols
960         {
961           SCM cdr = gc_copy (g_news[scan].cdr);
962           gc_relocate_cdr (scan, cdr);
963         }
964       scan++;
965     }
966   return gc_flip ();
967 }
968
969 SCM
970 gc_copy (SCM old)
971 {
972   if (TYPE (old) == BROKEN_HEART) return g_cells[old].car;
973   SCM new = g_free.value++;
974   g_news[new] = g_cells[old];
975   if (NTYPE (new) == VECTOR)
976     {
977       g_news[new].vector = g_free.value;
978       for (int i=0; i<LENGTH (old); i++)
979         g_news[g_free.value++] = g_cells[VECTOR (old)+i];
980     }
981   g_cells[old].type = BROKEN_HEART;
982   g_cells[old].car = new;
983   return new;
984 }
985
986 SCM
987 gc_relocate_car (SCM new, SCM car)
988 {
989   g_news[new].car = car;
990   return cell_unspecified;
991 }
992
993 SCM
994 gc_relocate_cdr (SCM new, SCM cdr)
995 {
996   g_news[new].cdr = cdr;
997   return cell_unspecified;
998 }
999
1000 SCM
1001 gc_flip ()
1002 {
1003   scm *cells = g_cells;
1004   g_cells = g_news;
1005   g_news = cells;
1006   if (g_debug) fprintf (stderr, " => jam[%d]\n", g_free.value);
1007   return stack;
1008 }
1009
1010 SCM
1011 gc_show ()
1012 {
1013   fprintf (stderr, "cells: ");
1014   scm *t = g_cells;
1015   display_ (stderr, -1);
1016   fprintf (stderr, "\n");
1017   if (g_news)
1018     {
1019       fprintf (stderr, "news: ");
1020       g_cells = g_news;
1021       display_ (stderr, -1);
1022       fprintf (stderr, "\n");
1023     }
1024   g_cells = t;
1025   return cell_unspecified;
1026 }
1027
1028 //\f Environment setup
1029 SCM
1030 acons (SCM key, SCM value, SCM alist)
1031 {
1032   return cons (cons (key, value), alist);
1033 }
1034
1035 SCM
1036 add_environment (SCM a, char const *name, SCM x)
1037 {
1038   return acons (make_symbol (cstring_to_list (name)), x, a);
1039 }
1040
1041 SCM
1042 gc_init_cells ()
1043 {
1044   g_cells = (scm *)malloc (2*ARENA_SIZE*sizeof(scm));
1045   g_cells[0].type = VECTOR;
1046   g_cells[0].length = 1000;
1047   g_cells[0].vector = 0;
1048   g_cells++;
1049   g_cells[0].type = CHAR;
1050   g_cells[0].value = 'c';
1051 }
1052
1053 SCM
1054 gc_init_news ()
1055 {
1056   g_news = g_cells-1 + ARENA_SIZE;
1057   g_news[0].type = VECTOR;
1058   g_news[0].length = 1000;
1059   g_news[0].vector = 0;
1060   g_news++;
1061   g_news[0].type = CHAR;
1062   g_news[0].value = 'n';
1063 }
1064
1065 SCM
1066 mes_symbols () ///((internal))
1067 {
1068   gc_init_cells ();
1069   gc_init_news ();
1070
1071 #include "mes.symbols.i"
1072
1073   g_symbol_max = g_free.value;
1074   make_tmps (g_cells);
1075
1076   g_symbols = 0;
1077   for (int i=1; i<g_symbol_max; i++)
1078     g_symbols = cons (i, g_symbols);
1079
1080   SCM a = cell_nil;
1081
1082 #include "mes.symbol-names.i"
1083
1084 #if BOOT
1085   a = acons (cell_symbol_label, cell_t, a);
1086 #endif
1087   a = acons (cell_symbol_begin, cell_begin, a);
1088   a = add_environment (a, "sc-expand", cell_f);
1089   a = acons (cell_closure, a, a);
1090
1091   return a;
1092 }
1093
1094 SCM
1095 mes_builtins (SCM a)
1096 {
1097 #include "mes.i"
1098
1099 #include "display.i"
1100 #include "lib.i"
1101 #include "math.i"
1102 #include "posix.i"
1103 #include "reader.i"
1104 #include "string.i"
1105 #include "type.i"
1106
1107 #include "display.environment.i"
1108 #include "lib.environment.i"
1109 #include "math.environment.i"
1110 #include "mes.environment.i"
1111 #include "posix.environment.i"
1112 #include "reader.environment.i"
1113 #include "string.environment.i"
1114 #include "type.environment.i"
1115
1116   a = add_environment (a, "*dot*", cell_dot);
1117   a = add_environment (a, "*foo-bar-baz*", cell_nil); // FIXME: some off-by one?
1118
1119   return a;
1120 }
1121
1122 SCM
1123 mes_stack (SCM a) ///((internal))
1124 {
1125   r0 = a;
1126   r1 = make_char (0);
1127   r2 = make_char (0);
1128   r3 = make_char (0);
1129   stack = cons (cell_nil, cell_nil);
1130   return r0;
1131 }
1132
1133 SCM
1134 mes_environment () ///((internal))
1135 {
1136   SCM a = mes_symbols ();
1137   return mes_stack (a);
1138 }
1139
1140 SCM
1141 make_lambda (SCM args, SCM body)
1142 {
1143   return cons (cell_symbol_lambda, cons (args, body));
1144 }
1145
1146 SCM
1147 make_closure (SCM args, SCM body, SCM a)
1148 {
1149   return cons (cell_closure, cons (cons (cell_circular, a), cons (args, body)));
1150 }
1151
1152 SCM
1153 lookup_macro (SCM x, SCM a)
1154 {
1155   if (TYPE (x) != SYMBOL) return cell_f;
1156   SCM m = assq_ref_cache (x, a);
1157   if (macro_p (m) == cell_t) return MACRO (m);
1158   return cell_f;
1159 }
1160
1161 SCM
1162 read_input_file_env_ (SCM e, SCM a)
1163 {
1164   if (e == cell_nil) return e;
1165   return cons (e, read_input_file_env_ (read_env (a), a));
1166 }
1167
1168 SCM
1169 read_input_file_env (SCM a)
1170 {
1171   r0 = a;
1172   if (assq_ref_cache (cell_symbol_read_input_file, r0) != cell_undefined)
1173     return apply_env (cell_symbol_read_input_file, cell_nil, r0);
1174   return read_input_file_env_ (read_env (r0), r0);
1175 }
1176
1177 SCM
1178 load_env (SCM a) ///((internal))
1179 {
1180   r0 =a;
1181   g_stdin = fopen ("module/mes/read-0.mes", "r");
1182   g_stdin = g_stdin ? g_stdin : fopen (PREFIX "module/mes/read-0.mes", "r");
1183   if (!g_function) r0 = mes_builtins (r0);
1184   r3 = read_input_file_env (r0);
1185   g_stdin = stdin;
1186   return r3;
1187 }
1188
1189 SCM
1190 bload_env (SCM a) ///((internal))
1191 {
1192   g_stdin = fopen ("module/mes/read-0.mo", "r");
1193   g_stdin = g_stdin ? g_stdin : fopen (PREFIX "module/mes/read-0.mo", "r");
1194   char *p = (char*)g_cells;
1195   assert (getchar () == 'M');
1196   assert (getchar () == 'E');
1197   assert (getchar () == 'S');
1198   stack = getchar () << 8;
1199   stack += getchar ();
1200   int c = getchar ();
1201   while (c != EOF)
1202     {
1203       *p++ = c;
1204       c = getchar ();
1205     }
1206   g_free.value = (p-(char*)g_cells) / sizeof (scm);
1207   gc_frame (stack);
1208   g_symbols = r1;
1209   g_stdin = stdin;
1210
1211   r0 = mes_builtins (r0);
1212   return r3;
1213 }
1214
1215 int
1216 dump ()
1217 {
1218   r1 = g_symbols;
1219   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
1220   stack = cons (frame, stack);
1221   stack = gc (stack);
1222   gc_frame (stack);
1223   char *p = (char*)g_cells;
1224   fputc ('M', stdout);
1225   fputc ('E', stdout);
1226   fputc ('S', stdout);
1227   fputc (stack >> 8, stdout);
1228   fputc (stack % 256, stdout);
1229   for (int i=0; i<g_free.value * sizeof(scm); i++)
1230     fputc (*p++, stdout);
1231   return 0;
1232 }
1233
1234 #include "type.c"
1235 #include "display.c"
1236 #include "lib.c"
1237 #include "math.c"
1238 #include "posix.c"
1239 #include "reader.c"
1240 #include "string.c"
1241
1242 int
1243 main (int argc, char *argv[])
1244 {
1245   g_debug = getenv ("MES_DEBUG");
1246   if (getenv ("MES_ARENA")) ARENA_SIZE = atoi (getenv ("MES_ARENA"));
1247   if (argc > 1 && !strcmp (argv[1], "--help")) return puts ("Usage: mes < FILE\n");
1248   if (argc > 1 && !strcmp (argv[1], "--version")) return puts ("Mes 0.3\n");
1249   g_stdin = stdin;
1250   r0 = mes_environment ();
1251   SCM program = (argc > 1 && !strcmp (argv[1], "--load"))
1252     ? bload_env (r0) : load_env (r0);
1253   if (argc > 1 && !strcmp (argv[1], "--dump")) return dump ();
1254   display_ (stderr, begin_env (program, r0));
1255   fputs ("", stderr);
1256   gc (stack);
1257   if (g_debug) fprintf (stderr, "\nstats: [%d]\n", g_free.value);
1258   return 0;
1259 }