core: Remove string.
[mes.git] / mes.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #define _GNU_SOURCE
22 #include <assert.h>
23 #include <ctype.h>
24 #include <errno.h>
25 #include <limits.h>
26 #include <stdio.h>
27 #include <string.h>
28 #include <stdlib.h>
29 #include <stdbool.h>
30
31 #define DEBUG 0
32 #define FIXED_PRIMITIVES 1
33
34 int ARENA_SIZE = 100000;
35 int MAX_ARENA_SIZE = 20000000;
36 int GC_SAFETY = 100;
37
38 typedef int SCM;
39 enum type_t {CHAR, CLOSURE, FUNCTION, KEYWORD, MACRO, NUMBER, PAIR, REF, SPECIAL, STRING, SYMBOL, VALUES, VECTOR, BROKEN_HEART};
40 typedef SCM (*function0_t) (void);
41 typedef SCM (*function1_t) (SCM);
42 typedef SCM (*function2_t) (SCM, SCM);
43 typedef SCM (*function3_t) (SCM, SCM, SCM);
44 typedef SCM (*functionn_t) (SCM);
45 typedef struct function_t {
46   union {
47     function0_t function0;
48     function1_t function1;
49     function2_t function2;
50     function3_t function3;
51     functionn_t functionn;
52   };
53   int arity;
54 } function;
55 struct scm_t;
56 typedef struct scm_t {
57   enum type_t type;
58   union {
59     char const *name;
60     SCM string;
61     SCM car;
62     SCM ref;
63     int length;
64   };
65   union {
66     int value;
67     int function;
68     SCM cdr;
69     SCM closure;
70     SCM macro;
71     SCM vector;
72     int hits;
73   };
74 } scm;
75
76 scm scm_nil = {SPECIAL, "()"};
77 scm scm_f = {SPECIAL, "#f"};
78 scm scm_t = {SPECIAL, "#t"};
79 scm scm_dot = {SPECIAL, "."};
80 scm scm_arrow = {SPECIAL, "=>"};
81 scm scm_undefined = {SPECIAL, "*undefined*"};
82 scm scm_unspecified = {SPECIAL, "*unspecified*"};
83 scm scm_closure = {SPECIAL, "*closure*"};
84 scm scm_circular = {SPECIAL, "*circular*"};
85 scm scm_label = {SPECIAL, "label"};
86 scm scm_begin = {SPECIAL, "*begin*"};
87
88 scm scm_symbol_dot = {SYMBOL, "*dot*"};
89 scm scm_symbol_lambda = {SYMBOL, "lambda"};
90 scm scm_symbol_begin = {SYMBOL, "begin"};
91 scm scm_symbol_if = {SYMBOL, "if"};
92 scm scm_symbol_define = {SYMBOL, "define"};
93 scm scm_symbol_define_macro = {SYMBOL, "define-macro"};
94 scm scm_symbol_set_x = {SYMBOL, "set!"};
95
96 scm scm_symbol_quote = {SYMBOL, "quote"};
97 scm scm_symbol_quasiquote = {SYMBOL, "quasiquote"};
98 scm scm_symbol_unquote = {SYMBOL, "unquote"};
99 scm scm_symbol_unquote_splicing = {SYMBOL, "unquote-splicing"};
100
101 scm scm_symbol_sc_expand = {SYMBOL, "sc-expand"};
102 scm scm_symbol_macro_expand = {SYMBOL, "macro-expand"};
103 scm scm_symbol_sc_expander_alist = {SYMBOL, "*sc-expander-alist*"};
104 scm scm_symbol_noexpand = {SYMBOL, "noexpand"};
105 scm scm_symbol_syntax = {SYMBOL, "syntax"};
106 scm scm_symbol_quasisyntax = {SYMBOL, "quasisyntax"};
107 scm scm_symbol_unsyntax = {SYMBOL, "unsyntax"};
108 scm scm_symbol_unsyntax_splicing = {SYMBOL, "unsyntax-splicing"};
109
110 scm scm_symbol_call_with_values = {SYMBOL, "call-with-values"};
111 scm scm_symbol_current_module = {SYMBOL, "current-module"};
112 scm scm_symbol_primitive_load = {SYMBOL, "primitive-load"};
113 scm scm_symbol_read_input_file = {SYMBOL, "read-input-file"};
114
115 scm scm_symbol_car = {SYMBOL, "car"};
116 scm scm_symbol_cdr = {SYMBOL, "cdr"};
117 scm scm_symbol_null_p = {SYMBOL, "null?"};
118 scm scm_symbol_eq_p = {SYMBOL, "eq?"};
119 scm scm_symbol_cons = {SYMBOL, "cons"};
120
121 scm char_eof = {CHAR, .name="*eof*", .value=-1};
122 scm char_nul = {CHAR, .name="nul", .value=0};
123 scm char_alarm = {CHAR, .name="alarm", .value=8};
124 scm char_backspace = {CHAR, .name="backspace", .value=8};
125 scm char_tab = {CHAR, .name="tab", .value=9};
126 scm char_newline = {CHAR, .name="newline", .value=10};
127 scm char_vtab = {CHAR, .name="vtab", .value=11};
128 scm char_page = {CHAR, .name="page", .value=12};
129 scm char_return = {CHAR, .name="return", .value=13};
130 scm char_space = {CHAR, .name="space", .value=32};
131
132 scm g_free = {NUMBER, .value=0};
133 scm *g_cells;
134 scm *g_news = 0;
135
136 #include "mes.symbols.h"
137
138 SCM tmp;
139 SCM tmp_num;
140 SCM tmp_num2;
141 SCM tmp_num3;
142 SCM tmp_num4;
143
144 function functions[200];
145 int g_function = 0;
146
147 SCM g_symbols = 0;
148 SCM stack = 0;
149 SCM r0 = 0; // a/env
150 SCM r1 = 0; // param 1
151 SCM r2 = 0; // param 2
152 SCM r3 = 0; // param 3
153
154 #include "display.h"
155 #include "lib.h"
156 #include "math.h"
157 #include "mes.h"
158 #include "posix.h"
159 #include "reader.h"
160 #include "string.h"
161
162 #define CAR(x) g_cells[x].car
163 #define CDR(x) g_cells[x].cdr
164 #define HITS(x) g_cells[x].hits
165 #define LENGTH(x) g_cells[x].length
166 #define NAME(x) g_cells[x].name
167 #define STRING(x) g_cells[x].string
168 #define TYPE(x) g_cells[x].type
169 #define CLOSURE(x) g_cells[x].closure
170 #define MACRO(x) g_cells[x].macro
171 #define REF(x) g_cells[x].ref
172 #define VALUE(x) g_cells[x].value
173 #define VECTOR(x) g_cells[x].vector
174 #define FUNCTION(x) functions[g_cells[x].function]
175 #define NCAR(x) g_news[x].car
176 #define NTYPE(x) g_news[x].type
177
178 #define CAAR(x) CAR (CAR (x))
179 #define CDAR(x) CDR (CAR (x))
180 #define CAAR(x) CAR (CAR (x))
181 #define CADAR(x) CAR (CDR (CAR (x)))
182 #define CADDR(x) CAR (CDR (CDR (x)))
183 #define CDADAR(x) CAR (CDR (CAR (CDR (x))))
184 #define CADR(x) CAR (CDR (x))
185
186 #define MAKE_CHAR(n) make_cell (tmp_num_ (CHAR), 0, tmp_num2_ (n))
187 #define MAKE_NUMBER(n) make_cell (tmp_num_ (NUMBER), 0, tmp_num2_ (n))
188 #define MAKE_REF(n) make_cell (tmp_num_ (REF), n, 0);
189 #define MAKE_STRING(x) make_cell (tmp_num_ (STRING), x, 0);
190
191 SCM display_ (FILE* f, SCM x);
192 SCM vm_call (function0_t f, SCM p1, SCM p2, SCM a);
193
194 SCM
195 tmp_num_ (int x)
196 {
197   g_cells[tmp_num].value = x;
198   return tmp_num;
199 }
200
201 SCM
202 tmp_num2_ (int x)
203 {
204   g_cells[tmp_num2].value = x;
205   return tmp_num2;
206 }
207
208 SCM
209 alloc (int n)
210 {
211   assert (g_free.value + n < ARENA_SIZE);
212   SCM x = g_free.value;
213   g_free.value += n;
214   return x;
215 }
216
217 SCM
218 make_cell (SCM type, SCM car, SCM cdr)
219 {
220   SCM x = alloc (1);
221   assert (TYPE (type) == NUMBER);
222   TYPE (x) = VALUE (type);
223   if (VALUE (type) == CHAR || VALUE (type) == NUMBER) {
224     if (car) CAR (x) = CAR (car);
225     if (cdr) CDR (x) = CDR (cdr);
226   } else if (VALUE (type) == FUNCTION) {
227     if (car) CAR (x) = car;
228     if (cdr) CDR (x) = CDR (cdr);
229   } else {
230     CAR (x) = car;
231     CDR (x) = cdr;
232   }
233   return x;
234 }
235
236 SCM
237 cons (SCM x, SCM y)
238 {
239   g_cells[tmp_num].value = PAIR;
240   return make_cell (tmp_num, x, y);
241 }
242
243 SCM
244 car (SCM x)
245 {
246   assert (TYPE (x) == PAIR);
247   return CAR (x);
248 }
249
250 SCM
251 cdr (SCM x)
252 {
253   assert (TYPE (x) == PAIR);
254   return CDR (x);
255 }
256
257 SCM
258 type_ (SCM x)
259 {
260   return MAKE_NUMBER (TYPE (x));
261 }
262
263 SCM
264 car_ (SCM x)
265 {
266   return (TYPE (CAR (x)) == PAIR
267           || TYPE (CAR (x)) == REF
268           || TYPE (CAR (x)) == SYMBOL
269           || TYPE (CAR (x)) == STRING) ? CAR (x) : MAKE_NUMBER (CAR (x));
270 }
271
272 SCM
273 cdr_ (SCM x)
274 {
275   return (TYPE (CDR (x)) == PAIR
276           || TYPE (CDR (x)) == REF
277           || TYPE (CDR (x)) == SYMBOL
278           || TYPE (CDR (x)) == STRING) ? CDR (x) : MAKE_NUMBER (CDR (x));
279 }
280
281 SCM
282 eq_p (SCM x, SCM y)
283 {
284   return (x == y
285           || ((TYPE (x) == KEYWORD && TYPE (y) == KEYWORD
286                && STRING (x) == STRING (y)))
287           || (TYPE (x) == CHAR && TYPE (y) == CHAR
288               && VALUE (x) == VALUE (y))
289           || (TYPE (x) == NUMBER && TYPE (y) == NUMBER
290               && VALUE (x) == VALUE (y)))
291     ? cell_t : cell_f;
292 }
293
294 SCM
295 set_car_x (SCM x, SCM e)
296 {
297   assert (TYPE (x) == PAIR);
298   CAR (x) = e;
299   return cell_unspecified;
300 }
301
302 SCM
303 set_cdr_x (SCM x, SCM e)
304 {
305   assert (TYPE (x) == PAIR);
306   CDR (x) = e;
307   return cell_unspecified;
308 }
309
310 SCM
311 set_env_x (SCM x, SCM e, SCM a)
312 {
313   SCM p = assert_defined (x, assq (x, a));
314   return set_cdr_x (p, e);
315 }
316
317 SCM
318 pairlis (SCM x, SCM y, SCM a)
319 {
320   if (x == cell_nil)
321     return a;
322   if (TYPE (x) != PAIR)
323     return cons (cons (x, y), a);
324   return cons (cons (car (x), car (y)),
325                pairlis (cdr (x), cdr (y), a));
326 }
327
328 SCM
329 assq (SCM x, SCM a)
330 {
331   while (a != cell_nil && eq_p (x, CAAR (a)) == cell_f)
332     {
333       if (TYPE (a) == BROKEN_HEART || TYPE (CAR (a)) == BROKEN_HEART)
334         fprintf (stderr, "oops, broken heart\n");
335       a = CDR (a);
336     }
337   return a != cell_nil ? car (a) : cell_f;
338 }
339
340 SCM
341 assq_ref_cache (SCM x, SCM a)
342 {
343   x = assq (x, a);
344   if (x == cell_f) return cell_undefined;
345   return cdr (x);
346 }
347
348 SCM
349 assert_defined (SCM x, SCM e)
350 {
351   if (e == cell_undefined)
352     {
353       fprintf (stderr, "eval: unbound variable:");
354       display_ (stderr, x);
355       fprintf (stderr, "\n");
356       assert (!"unbound variable");
357     }
358   return e;
359 }
360
361 enum eval_apply_t {EVLIS, APPLY, EVAL, MACRO_EXPAND, BEGIN, IF, CALL_WITH_VALUES};
362 enum eval_apply_t g_target;
363
364 SCM
365 call_lambda (SCM e, SCM x, SCM aa, SCM a) ///((internal))
366 {
367   SCM cl = cons (cons (cell_closure, x), x);
368   r1 = e;
369   r0 = cl;
370   r2 = a;
371   r3 = aa;
372   return cell_unspecified;
373 }
374
375 SCM
376 eval_apply ()
377 {
378   switch (g_target)
379     {
380     case EVLIS: goto evlis;
381     case APPLY: goto apply;
382     case EVAL: goto eval;
383     case MACRO_EXPAND: goto macro_expand;
384     case BEGIN: goto begin;
385     case IF: goto label_if;
386     case CALL_WITH_VALUES: goto call_with_values;
387     }
388
389  evlis:
390   if (r1 == cell_nil) return cell_nil;
391   if (TYPE (r1) != PAIR) goto eval;
392   r2 = eval_env (car (r1), r0);
393   r1 = evlis_env (cdr (r1), r0);
394   return cons (r2, r1);
395
396  apply:
397   switch (TYPE (r1))
398     {
399     case FUNCTION: return call (r1, r2);
400     case CLOSURE:
401       {
402         SCM cl = CLOSURE (r1);
403         SCM args = cadr (cl);
404         SCM body = cddr (cl);
405         SCM aa = cdar (cl);
406         aa = cdr (aa);
407         SCM p = pairlis (args, r2, aa);
408         call_lambda (body, p, aa, r0);
409         goto begin;
410       }
411     case SYMBOL:
412       {
413         if (r1 == cell_symbol_call_with_values)
414           {
415             r1 = car (r2);
416             r2 = cadr (r2);
417             goto call_with_values;
418           }
419         if (r1 == cell_symbol_current_module) return r0;
420         break;
421       }
422     case PAIR:
423       {
424         switch (car (r1))
425           {
426           case cell_symbol_lambda:
427             {
428               SCM args = cadr (r1);
429               SCM body = cddr (r1);
430               SCM p = pairlis (args, r2, r0);
431               call_lambda (body, p, p, r0);
432               goto begin;
433             }
434 #if BOOT
435           case cell_symbol_label:
436             {
437               r0 = cons (cons (cadr (r1), caddr (r1)), r0);
438               r1 = caddr (r1);
439               goto apply;
440             }
441 #endif
442           }
443       }
444     }
445   SCM e = eval_env (r1, r0);
446   char const* type = 0;
447   if (e == cell_f || e == cell_t) type = "bool";
448   if (TYPE (e) == CHAR) type = "char";
449   if (TYPE (e) == NUMBER) type = "number";
450   if (TYPE (e) == STRING) type = "string";
451   if (e == cell_unspecified) type = "*unspecified*";
452   if (e == cell_undefined) type =  "*undefined*";
453   if (type)
454     {
455       fprintf (stderr, "cannot apply: %s: ", type);
456       display_ (stderr, e);
457       fprintf (stderr, " [");
458       display_ (stderr, r1);
459       fprintf (stderr, "]\n");
460       assert (!"cannot apply");
461     }
462   r1 = e;
463   goto apply;
464
465  eval:
466   switch (TYPE (r1))
467     {
468     case PAIR:
469       {
470         switch (car (r1))
471           {
472 #if FIXED_PRIMITIVES
473           case cell_symbol_car: return car (eval_env (CADR (r1), r0));
474           case cell_symbol_cdr: return cdr (eval_env (CADR (r1), r0));
475           case cell_symbol_cons: {SCM m = evlis_env (CDR (r1), r0);
476               return cons (CAR (m), CADR (m));}
477           case cell_symbol_null_p: return null_p (eval_env (CADR (r1), r0));
478 #endif // FIXED_PRIMITIVES
479           case cell_symbol_quote: return cadr (r1);
480           case cell_symbol_begin: goto begin;
481           case cell_symbol_lambda:
482             return make_closure (cadr (r1), cddr (r1), assq (cell_closure, r0));
483           case cell_symbol_if: {r1=cdr (r1); goto label_if;}
484           case cell_symbol_set_x: {
485             SCM x = eval_env (caddr (r1), r0); return set_env_x (cadr (r1), x, r0);
486           }
487           default: {
488             SCM x = macro_expand_env (r1, r0);
489             if (x != r1)
490               {
491                 if (TYPE (x) == PAIR)
492                   {
493                     set_cdr_x (r1, cdr (x));
494                     set_car_x (r1, car (x));
495                   }
496                 r1 = x;
497                 goto eval;
498               }
499             SCM m = evlis_env (CDR (r1), r0);
500             r1 = car (r1);
501             r2 = m;
502             goto apply;
503           }
504           }
505       }
506     case SYMBOL: return assert_defined (r1, assq_ref_cache (r1, r0));
507     default: return r1;
508     }
509
510  macro_expand:
511   if (TYPE (CAR (r1)) == STRING && string_to_symbol (CAR (r1)) == cell_symbol_noexpand)
512     return cadr (r1);
513
514   SCM macro;
515   SCM expanders;
516   if (TYPE (r1) == PAIR
517       && (macro = lookup_macro (car (r1), r0)) != cell_f)
518     {
519       r2 = CDR (r1);
520       r1 = macro;
521       goto apply;
522     }
523   else if (TYPE (r1) == PAIR
524            && TYPE (CAR (r1)) == SYMBOL
525            && ((expanders = assq_ref_cache (cell_symbol_sc_expander_alist, r0)) != cell_undefined)
526            && ((macro = assq (CAR (r1), expanders)) != cell_f))
527     {
528       SCM sc_expand = assq_ref_cache (cell_symbol_macro_expand, r0);
529       if (sc_expand != cell_undefined && sc_expand != cell_f)
530         {
531           r2 = cons (r1, cell_nil);
532           r1 = sc_expand;
533           goto apply;
534         }
535     }
536   return r1;
537
538   SCM r;
539  begin:
540   r = cell_unspecified;
541   while (r1 != cell_nil) {
542     if (TYPE (r1) == PAIR && TYPE (CAR (r1)) == PAIR)
543       {
544         if (caar (r1) == cell_symbol_begin)
545           r1 = append2 (cdar (r1), cdr (r1));
546         else if (caar (r1) == cell_symbol_primitive_load)
547           {
548             SCM f = read_input_file_env (r0);
549             r1 = append2 (f, cdr (r1));
550           }
551       }
552     if (CDR (r1) == cell_nil)
553       {
554         r1 = car (r1);
555         goto eval;
556       }
557     r = eval_env (car (r1), r0);
558     r1 = CDR (r1);
559   }
560   return r;
561
562   SCM x;
563  label_if:
564   x = eval_env (car (r1), r0);
565   if (x != cell_f)
566     {
567       r1 = cadr (r1);
568       goto eval;
569     }
570   if (cddr (r1) != cell_nil)
571     {
572       r1 = caddr (r1);
573       goto eval;
574     }
575   return cell_unspecified;
576
577   SCM v;
578  call_with_values:
579   v = apply_env (r1, cell_nil, r0);
580   if (TYPE (v) == VALUES)
581     v = CDR (v);
582   r1 = r2;
583   r2 = v;
584   goto apply;
585 }
586
587 SCM
588 call (SCM fn, SCM x)
589 {
590   if ((FUNCTION (fn).arity > 0 || FUNCTION (fn).arity == -1)
591       && x != cell_nil && TYPE (CAR (x)) == VALUES)
592     x = cons (CADAR (x), CDR (x));
593   if ((FUNCTION (fn).arity > 1 || FUNCTION (fn).arity == -1)
594       && x != cell_nil && TYPE (CDR (x)) == PAIR && TYPE (CADR (x)) == VALUES)
595     x = cons (CAR (x), cons (CDADAR (x), CDR (x)));
596   switch (FUNCTION (fn).arity)
597     {
598     case 0: return FUNCTION (fn).function0 ();
599     case 1: return FUNCTION (fn).function1 (car (x));
600     case 2: return FUNCTION (fn).function2 (car (x), cadr (x));
601     case 3: return FUNCTION (fn).function3 (car (x), cadr (x), caddr (x));
602     case -1: return FUNCTION (fn).functionn (x);
603     }
604   return cell_unspecified;
605 }
606
607 SCM
608 gc_frame (SCM stack)
609 {
610   SCM frame = car (stack);
611   r1 = car (frame);
612   r2 = cadr (frame);
613   r3 = caddr (frame);
614   r0 = cadddr (frame);
615   return frame;
616 }
617
618 SCM
619 gc_stack (SCM a)
620 {
621   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
622   stack = cons (frame, stack);
623   stack = gc (stack);
624   gc_frame (stack);
625   stack = cdr (stack);
626   return stack;
627 }
628
629 SCM
630 vm_call (function0_t f, SCM p1, SCM p2, SCM a)
631 {
632   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
633   stack = cons (frame, stack);
634   r1 = p1;
635   r2 = p2;
636   r0 = a;
637   if (g_free.value + GC_SAFETY > ARENA_SIZE)
638     gc_stack (stack);
639
640   SCM r = f ();
641   frame = gc_frame (stack);
642   stack = cdr (stack);
643   return r;
644 }
645
646 SCM
647 evlis_env (SCM m, SCM a)
648 {
649   g_target = EVLIS;
650   return vm_call (eval_apply, m, cell_undefined, a);
651 }
652
653 SCM
654 apply_env (SCM fn, SCM x, SCM a)
655 {
656   g_target = APPLY;
657   return vm_call (eval_apply, fn, x, a);
658 }
659
660 SCM
661 eval_env (SCM e, SCM a)
662 {
663   g_target = EVAL;
664   return vm_call (eval_apply, e, cell_undefined, a);
665 }
666
667 SCM
668 macro_expand_env (SCM e, SCM a)
669 {
670   g_target = MACRO_EXPAND;
671   return vm_call (eval_apply, e, cell_undefined, a);
672 }
673
674 SCM
675 begin_env (SCM e, SCM a)
676 {
677   g_target = BEGIN;
678   return vm_call (eval_apply, e, cell_undefined, a);
679 }
680
681 SCM
682 if_env (SCM e, SCM a)
683 {
684   g_target = IF;
685   return vm_call (eval_apply, e, cell_undefined, a);
686 }
687
688 SCM
689 call_with_values_env (SCM producer, SCM consumer, SCM a)
690 {
691   g_target = CALL_WITH_VALUES;
692   return vm_call (eval_apply, producer, consumer, a);
693 }
694
695 SCM
696 append2 (SCM x, SCM y)
697 {
698   if (x == cell_nil) return y;
699   assert (TYPE (x) == PAIR);
700   return cons (car (x), append2 (cdr (x), y));
701 }
702
703 SCM
704 append (SCM x) ///((arity . n))
705  {
706   if (x == cell_nil) return cell_nil;
707   if (cdr (x) == cell_nil) return car (x);
708   return append2 (car (x), append (cdr (x)));
709  }
710
711 SCM
712 cstring_to_list (char const* s)
713 {
714   SCM p = cell_nil;
715   int i = strlen (s);
716   while (i--)
717     p = cons (MAKE_CHAR (s[i]), p);
718   return p;
719 }
720
721 SCM
722 null_p (SCM x)
723 {
724   return x == cell_nil ? cell_t : cell_f;
725 }
726
727 SCM
728 make_symbol_ (SCM s)
729 {
730   g_cells[tmp_num].value = SYMBOL;
731   SCM x = make_cell (tmp_num, s, 0);
732   g_symbols = cons (x, g_symbols);
733   return x;
734 }
735
736 SCM
737 make_symbol (SCM s)
738 {
739   SCM x = lookup_symbol_ (s);
740   return x ? x : make_symbol_ (s);
741 }
742
743 SCM
744 make_vector (SCM n)
745 {
746   int k = VALUE (n);
747   g_cells[tmp_num].value = VECTOR;
748   SCM v = alloc (k);
749   SCM x = make_cell (tmp_num, k, v);
750   for (int i=0; i<k; i++) g_cells[v+i] = g_cells[vector_entry (cell_unspecified)];
751   return x;
752 }
753
754 SCM
755 values (SCM x) ///((arity . n))
756 {
757   SCM v = cons (0, x);
758   TYPE (v) = VALUES;
759   return v;
760 }
761
762 SCM
763 vector_length (SCM x)
764 {
765   assert (TYPE (x) == VECTOR);
766   return MAKE_NUMBER (LENGTH (x));
767 }
768
769 SCM
770 vector_ref (SCM x, SCM i)
771 {
772   assert (TYPE (x) == VECTOR);
773   assert (VALUE (i) < LENGTH (x));
774   SCM e = VECTOR (x) + VALUE (i);
775   if (TYPE (e) == REF) e = g_cells[e].ref;
776   if (TYPE (e) == CHAR) e = MAKE_CHAR (VALUE (e));
777   if (TYPE (e) == NUMBER) e = MAKE_NUMBER (VALUE (e));
778   return e;
779 }
780
781 SCM
782 vector_entry (SCM x) {
783   if (TYPE (x) == PAIR || TYPE (x) == SPECIAL || TYPE (x) == STRING || TYPE (x) == SYMBOL || TYPE (x) == VECTOR) x = MAKE_REF (x);
784   return x;
785 }
786
787 SCM
788 vector_set_x (SCM x, SCM i, SCM e)
789 {
790   assert (TYPE (x) == VECTOR);
791   assert (VALUE (i) < LENGTH (x));
792   g_cells[VECTOR (x)+g_cells[i].value] = g_cells[vector_entry (e)];
793   return cell_unspecified;
794 }
795
796 SCM
797 list_to_vector (SCM x)
798 {
799   VALUE (tmp_num) = VALUE (length (x));
800   SCM v = make_vector (tmp_num);
801   SCM p = VECTOR (v);
802   while (x != cell_nil)
803     {
804       g_cells[p++] = g_cells[vector_entry (car (x))];
805       x = cdr (x);
806     }
807   return v;
808 }
809
810 SCM
811 vector_to_list (SCM v)
812 {
813   SCM x = cell_nil;
814   for (int i = 0; i < LENGTH (v); i++) {
815     SCM e = VECTOR (v)+i;
816     if (TYPE (e) == REF) e = g_cells[e].ref;
817     x = append2 (x, cons (e, cell_nil));
818   }
819   return x;
820 }
821
822 FILE *g_stdin;
823 int
824 getchar ()
825 {
826   return getc (g_stdin);
827 }
828
829 int
830 ungetchar (int c)
831 {
832   return ungetc (c, g_stdin);
833 }
834
835 int
836 peekchar ()
837 {
838   int c = getchar ();
839   ungetchar (c);
840   return c;
841 }
842
843 SCM
844 peek_byte ()
845 {
846   return MAKE_NUMBER (peekchar ());
847 }
848
849 SCM
850 read_byte ()
851 {
852   return MAKE_NUMBER (getchar ());
853 }
854
855 SCM
856 unread_byte (SCM i)
857 {
858   ungetchar (VALUE (i));
859   return i;
860 }
861
862 SCM
863 write_char (SCM x) ///((arity . n))
864 {
865   SCM c = car (x);
866   SCM p = cdr (x);
867   int fd = 1;
868   if (TYPE (p) == PAIR && TYPE (car (p)) == NUMBER) fd = VALUE (car (p));
869   FILE *f = fd == 1 ? stdout : stderr;
870   assert (TYPE (c) == NUMBER || TYPE (c) == CHAR);
871   fputc (VALUE (c), f);
872   return c;
873 }
874
875 SCM
876 symbol_to_list (SCM x)
877 {
878   assert (TYPE (x) == SYMBOL);
879   return STRING (x);
880 }
881
882 SCM
883 char_to_integer (SCM x)
884 {
885   assert (TYPE (x) == CHAR);
886   return MAKE_NUMBER (VALUE (x));
887 }
888
889 SCM
890 integer_to_char (SCM x)
891 {
892   assert (TYPE (x) == NUMBER);
893   return MAKE_CHAR (VALUE (x));
894 }
895
896 void
897 make_tmps (scm* cells)
898 {
899   tmp = g_free.value++;
900   cells[tmp].type = CHAR;
901   tmp_num = g_free.value++;
902   cells[tmp_num].type = NUMBER;
903   tmp_num2 = g_free.value++;
904   cells[tmp_num2].type = NUMBER;
905   tmp_num3 = g_free.value++;
906   cells[tmp_num3].type = NUMBER;
907   tmp_num4 = g_free.value++;
908   cells[tmp_num4].type = NUMBER;
909 }
910
911 //\f Jam Collector
912 SCM g_symbol_max;
913 bool g_debug = false;
914
915 SCM
916 gc_up_arena ()
917 {
918   ARENA_SIZE *= 2;
919   void *p = realloc (g_cells-1, 2*ARENA_SIZE*sizeof(scm));
920   if (!p)
921     {
922       if (g_debug) fprintf (stderr, "cannot up arena: %s: arena=%d\n", strerror (errno), 2*ARENA_SIZE);
923       return cell_unspecified;
924     }
925   g_cells = (scm*)p;
926   g_cells++;
927   gc_init_news ();
928 }
929
930 SCM
931 gc ()
932 {
933   if (g_debug) fprintf (stderr, "***gc[%d]...", g_free.value);
934   g_free.value = 1;
935   if (g_cells < g_news && ARENA_SIZE < MAX_ARENA_SIZE) gc_up_arena ();
936   for (int i=g_free.value; i<g_symbol_max; i++)
937     gc_copy (i);
938   make_tmps (g_news);
939   g_symbols = gc_copy (g_symbols);
940   SCM new = gc_copy (stack);
941   if (g_debug) fprintf (stderr, "new=%d\n", new, stack);
942   stack = new;
943   return gc_loop (1);
944 }
945
946 SCM
947 gc_loop (SCM scan)
948 {
949   while (scan < g_free.value)
950     {
951       if (NTYPE (scan) == CLOSURE
952           || NTYPE (scan) == KEYWORD
953           || NTYPE (scan) == MACRO
954           || NTYPE (scan) == PAIR
955           || NTYPE (scan) == REF
956           || scan == 1 // null
957           || NTYPE (scan) == SPECIAL
958           || NTYPE (scan) == STRING
959           || NTYPE (scan) == SYMBOL)
960         {
961           SCM car = gc_copy (g_news[scan].car);
962           gc_relocate_car (scan, car);
963         }
964       if ((NTYPE (scan) == CLOSURE
965            || NTYPE (scan) == MACRO
966            || NTYPE (scan) == PAIR
967            || NTYPE (scan) == VALUES)
968           && g_news[scan].cdr) // allow for 0 terminated list of symbols
969         {
970           SCM cdr = gc_copy (g_news[scan].cdr);
971           gc_relocate_cdr (scan, cdr);
972         }
973       scan++;
974     }
975   return gc_flip ();
976 }
977
978 SCM
979 gc_copy (SCM old)
980 {
981   if (TYPE (old) == BROKEN_HEART) return g_cells[old].car;
982   SCM new = g_free.value++;
983   g_news[new] = g_cells[old];
984   if (NTYPE (new) == VECTOR)
985     {
986       g_news[new].vector = g_free.value;
987       for (int i=0; i<LENGTH (old); i++)
988         g_news[g_free.value++] = g_cells[VECTOR (old)+i];
989     }
990   g_cells[old].type = BROKEN_HEART;
991   g_cells[old].car = new;
992   return new;
993 }
994
995 SCM
996 gc_relocate_car (SCM new, SCM car)
997 {
998   g_news[new].car = car;
999   return cell_unspecified;
1000 }
1001
1002 SCM
1003 gc_relocate_cdr (SCM new, SCM cdr)
1004 {
1005   g_news[new].cdr = cdr;
1006   return cell_unspecified;
1007 }
1008
1009 SCM
1010 gc_flip ()
1011 {
1012   scm *cells = g_cells;
1013   g_cells = g_news;
1014   g_news = cells;
1015   if (g_debug) fprintf (stderr, " => jam[%d]\n", g_free.value);
1016   return stack;
1017 }
1018
1019 //\f Environment setup
1020 SCM
1021 acons (SCM key, SCM value, SCM alist)
1022 {
1023   return cons (cons (key, value), alist);
1024 }
1025
1026 SCM
1027 gc_init_cells ()
1028 {
1029   g_cells = (scm *)malloc (2*ARENA_SIZE*sizeof(scm));
1030   g_cells[0].type = VECTOR;
1031   g_cells[0].length = 1000;
1032   g_cells[0].vector = 0;
1033   g_cells++;
1034   g_cells[0].type = CHAR;
1035   g_cells[0].value = 'c';
1036 }
1037
1038 SCM
1039 gc_init_news ()
1040 {
1041   g_news = g_cells-1 + ARENA_SIZE;
1042   g_news[0].type = VECTOR;
1043   g_news[0].length = 1000;
1044   g_news[0].vector = 0;
1045   g_news++;
1046   g_news[0].type = CHAR;
1047   g_news[0].value = 'n';
1048 }
1049
1050 SCM
1051 mes_symbols () ///((internal))
1052 {
1053   gc_init_cells ();
1054   gc_init_news ();
1055
1056 #include "mes.symbols.i"
1057
1058   g_symbol_max = g_free.value;
1059   make_tmps (g_cells);
1060
1061   g_symbols = 0;
1062   for (int i=1; i<g_symbol_max; i++)
1063     g_symbols = cons (i, g_symbols);
1064
1065   SCM a = cell_nil;
1066
1067 #include "mes.symbol-names.i"
1068
1069 #if BOOT
1070   a = acons (cell_symbol_label, cell_t, a);
1071 #endif
1072   a = acons (cell_symbol_dot, cell_dot, a);
1073   a = acons (cell_symbol_begin, cell_begin, a);
1074   a = acons (cell_symbol_sc_expand, cell_f, a);
1075   a = acons (cell_closure, a, a);
1076
1077   return a;
1078 }
1079
1080 SCM
1081 mes_builtins (SCM a)
1082 {
1083 #include "mes.i"
1084
1085 #include "display.i"
1086 #include "lib.i"
1087 #include "math.i"
1088 #include "posix.i"
1089 #include "reader.i"
1090 #include "string.i"
1091
1092 #include "display.environment.i"
1093 #include "lib.environment.i"
1094 #include "math.environment.i"
1095 #include "mes.environment.i"
1096 #include "posix.environment.i"
1097 #include "reader.environment.i"
1098 #include "string.environment.i"
1099
1100   return a;
1101 }
1102
1103 SCM
1104 mes_stack (SCM a) ///((internal))
1105 {
1106   r0 = a;
1107   r1 = MAKE_CHAR (0);
1108   r2 = MAKE_CHAR (0);
1109   r3 = MAKE_CHAR (0);
1110   stack = cons (cell_nil, cell_nil);
1111   return r0;
1112 }
1113
1114 SCM
1115 mes_environment () ///((internal))
1116 {
1117   SCM a = mes_symbols ();
1118   return mes_stack (a);
1119 }
1120
1121 SCM
1122 make_closure (SCM args, SCM body, SCM a)
1123 {
1124   return make_cell (tmp_num_ (CLOSURE), cell_f, cons (cons (cell_circular, a), cons (args, body)));
1125 }
1126
1127 SCM
1128 lookup_macro (SCM x, SCM a)
1129 {
1130   if (TYPE (x) != SYMBOL) return cell_f;
1131   SCM m = assq_ref_cache (x, a);
1132   if (TYPE (m) == MACRO) return MACRO (m);
1133   return cell_f;
1134 }
1135
1136 SCM
1137 read_input_file_env_ (SCM e, SCM a)
1138 {
1139   if (e == cell_nil) return e;
1140   return cons (e, read_input_file_env_ (read_env (a), a));
1141 }
1142
1143 SCM
1144 read_input_file_env (SCM a)
1145 {
1146   r0 = a;
1147   if (assq_ref_cache (cell_symbol_read_input_file, r0) != cell_undefined)
1148     return apply_env (cell_symbol_read_input_file, cell_nil, r0);
1149   return read_input_file_env_ (read_env (r0), r0);
1150 }
1151
1152 SCM
1153 load_env (SCM a) ///((internal))
1154 {
1155   r0 =a;
1156   g_stdin = fopen ("module/mes/read-0.mes", "r");
1157   g_stdin = g_stdin ? g_stdin : fopen (PREFIX "module/mes/read-0.mes", "r");
1158   if (!g_function) r0 = mes_builtins (r0);
1159   r3 = read_input_file_env (r0);
1160   g_stdin = stdin;
1161   return r3;
1162 }
1163
1164 SCM
1165 bload_env (SCM a) ///((internal))
1166 {
1167   g_stdin = fopen ("module/mes/read-0.mo", "r");
1168   g_stdin = g_stdin ? g_stdin : fopen (PREFIX "module/mes/read-0.mo", "r");
1169   char *p = (char*)g_cells;
1170   assert (getchar () == 'M');
1171   assert (getchar () == 'E');
1172   assert (getchar () == 'S');
1173   stack = getchar () << 8;
1174   stack += getchar ();
1175   int c = getchar ();
1176   while (c != EOF)
1177     {
1178       *p++ = c;
1179       c = getchar ();
1180     }
1181   g_free.value = (p-(char*)g_cells) / sizeof (scm);
1182   gc_frame (stack);
1183   g_symbols = r1;
1184   g_stdin = stdin;
1185
1186   r0 = mes_builtins (r0);
1187   return r3;
1188 }
1189
1190 int
1191 dump ()
1192 {
1193   r1 = g_symbols;
1194   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
1195   stack = cons (frame, stack);
1196   stack = gc (stack);
1197   gc_frame (stack);
1198   char *p = (char*)g_cells;
1199   fputc ('M', stdout);
1200   fputc ('E', stdout);
1201   fputc ('S', stdout);
1202   fputc (stack >> 8, stdout);
1203   fputc (stack % 256, stdout);
1204   for (int i=0; i<g_free.value * sizeof(scm); i++)
1205     fputc (*p++, stdout);
1206   return 0;
1207 }
1208
1209 #include "display.c"
1210 #include "lib.c"
1211 #include "math.c"
1212 #include "posix.c"
1213 #include "reader.c"
1214 #include "string.c"
1215
1216 int
1217 main (int argc, char *argv[])
1218 {
1219   g_debug = getenv ("MES_DEBUG");
1220   if (getenv ("MES_ARENA")) ARENA_SIZE = atoi (getenv ("MES_ARENA"));
1221   if (argc > 1 && !strcmp (argv[1], "--help")) return puts ("Usage: mes < FILE\n");
1222   if (argc > 1 && !strcmp (argv[1], "--version")) return puts ("Mes 0.3\n");
1223   g_stdin = stdin;
1224   r0 = mes_environment ();
1225   SCM program = (argc > 1 && !strcmp (argv[1], "--load"))
1226     ? bload_env (r0) : load_env (r0);
1227   if (argc > 1 && !strcmp (argv[1], "--dump")) return dump ();
1228   display_ (stderr, begin_env (program, r0));
1229   fputs ("", stderr);
1230   gc (stack);
1231   if (g_debug) fprintf (stderr, "\nstats: [%d]\n", g_free.value);
1232   return 0;
1233 }