core: Remove most of reader.
[mes.git] / mes.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #define _GNU_SOURCE
22 #include <assert.h>
23 #include <ctype.h>
24 #include <errno.h>
25 #include <limits.h>
26 #include <stdio.h>
27 #include <string.h>
28 #include <stdlib.h>
29 #include <stdbool.h>
30
31 #define DEBUG 0
32 #define FIXED_PRIMITIVES 1
33
34 int ARENA_SIZE = 100000;
35
36 int MAX_ARENA_SIZE = 20000000;
37 int GC_SAFETY = 100;
38
39 typedef int SCM;
40 enum type_t {CHAR, FUNCTION, KEYWORD, MACRO, NUMBER, PAIR, SPECIAL, STRING, SYMBOL, REF, VALUES, VECTOR, BROKEN_HEART};
41 typedef SCM (*function0_t) (void);
42 typedef SCM (*function1_t) (SCM);
43 typedef SCM (*function2_t) (SCM, SCM);
44 typedef SCM (*function3_t) (SCM, SCM, SCM);
45 typedef SCM (*functionn_t) (SCM);
46 typedef struct function_t {
47   union {
48     function0_t function0;
49     function1_t function1;
50     function2_t function2;
51     function3_t function3;
52     functionn_t functionn;
53   };
54   int arity;
55 } function;
56 struct scm_t;
57 typedef struct scm_t {
58   enum type_t type;
59   union {
60     char const *name;
61     SCM string;
62     SCM car;
63     SCM ref;
64     int length;
65   };
66   union {
67     int value;
68     int function;
69     SCM cdr;
70     SCM macro;
71     SCM vector;
72     int hits;
73   };
74 } scm;
75
76 scm scm_nil = {SPECIAL, "()"};
77 scm scm_f = {SPECIAL, "#f"};
78 scm scm_t = {SPECIAL, "#t"};
79 scm scm_dot = {SPECIAL, "."};
80 scm scm_arrow = {SPECIAL, "=>"};
81 scm scm_undefined = {SPECIAL, "*undefined*"};
82 scm scm_unspecified = {SPECIAL, "*unspecified*"};
83 scm scm_closure = {SPECIAL, "*closure*"};
84 scm scm_circular = {SPECIAL, "*circular*"};
85 #if BOOT
86 scm scm_label = {
87   SPECIAL, "label"};
88 #endif
89 scm scm_begin = {SPECIAL, "*begin*"};
90
91 scm scm_symbol_lambda = {SYMBOL, "lambda"};
92 scm scm_symbol_begin = {SYMBOL, "begin"};
93 scm scm_symbol_if = {SYMBOL, "if"};
94 scm scm_symbol_define = {SYMBOL, "define"};
95 scm scm_symbol_define_macro = {SYMBOL, "define-macro"};
96 scm scm_symbol_set_x = {SYMBOL, "set!"};
97
98 scm scm_symbol_quote = {SYMBOL, "quote"};
99 scm scm_symbol_quasiquote = {SYMBOL, "quasiquote"};
100 scm scm_symbol_unquote = {SYMBOL, "unquote"};
101 scm scm_symbol_unquote_splicing = {SYMBOL, "unquote-splicing"};
102
103 scm scm_symbol_sc_expand = {SYMBOL, "sc-expand"};
104 scm scm_symbol_macro_expand = {SYMBOL, "macro-expand"};
105 scm scm_symbol_sc_expander_alist = {SYMBOL, "*sc-expander-alist*"};
106 scm scm_symbol_noexpand = {SYMBOL, "noexpand"};
107 scm scm_symbol_syntax = {SYMBOL, "syntax"};
108 scm scm_symbol_quasisyntax = {SYMBOL, "quasisyntax"};
109 scm scm_symbol_unsyntax = {SYMBOL, "unsyntax"};
110 scm scm_symbol_unsyntax_splicing = {SYMBOL, "unsyntax-splicing"};
111
112 scm scm_symbol_call_with_values = {SYMBOL, "call-with-values"};
113 scm scm_symbol_current_module = {SYMBOL, "current-module"};
114 scm scm_symbol_primitive_load = {SYMBOL, "primitive-load"};
115 scm scm_symbol_read_input_file = {SYMBOL, "read-input-file"};
116
117 scm scm_symbol_car = {SYMBOL, "car"};
118 scm scm_symbol_cdr = {SYMBOL, "cdr"};
119 scm scm_symbol_null_p = {SYMBOL, "null?"};
120 scm scm_symbol_eq_p = {SYMBOL, "eq?"};
121 scm scm_symbol_cons = {SYMBOL, "cons"};
122
123 scm char_eof = {CHAR, .name="*eof*", .value=-1};
124 scm char_nul = {CHAR, .name="nul", .value=0};
125 scm char_alarm = {CHAR, .name="alarm", .value=8};
126 scm char_backspace = {CHAR, .name="backspace", .value=8};
127 scm char_tab = {CHAR, .name="tab", .value=9};
128 scm char_newline = {CHAR, .name="newline", .value=10};
129 scm char_vtab = {CHAR, .name="vtab", .value=11};
130 scm char_page = {CHAR, .name="page", .value=12};
131 scm char_return = {CHAR, .name="return", .value=13};
132 scm char_space = {CHAR, .name="space", .value=32};
133
134 scm g_free = {NUMBER, .value=0};
135 scm *g_cells;
136 scm *g_news = 0;
137
138 #include "mes.symbols.h"
139
140 SCM tmp;
141 SCM tmp_num;
142 SCM tmp_num2;
143 SCM tmp_num3;
144 SCM tmp_num4;
145
146 function functions[200];
147 int g_function = 0;
148
149 SCM g_symbols = 0;
150 SCM stack = 0;
151 SCM r0 = 0; // a/env
152 SCM r1 = 0; // param 1
153 SCM r2 = 0; // param 2
154 SCM r3 = 0; // param 3
155
156 #include "display.h"
157 #include "lib.h"
158 #include "math.h"
159 #include "mes.h"
160 #include "posix.h"
161 #include "reader.h"
162 #include "string.h"
163 #include "type.h"
164
165 #define CAR(x) g_cells[x].car
166 #define CDR(x) g_cells[x].cdr
167 #define HITS(x) g_cells[x].hits
168 #define LENGTH(x) g_cells[x].length
169 #define NAME(x) g_cells[x].name
170 #define STRING(x) g_cells[x].string
171 #define TYPE(x) g_cells[x].type
172 #define MACRO(x) g_cells[x].macro
173 #define REF(x) g_cells[x].ref
174 #define VALUE(x) g_cells[x].value
175 #define VECTOR(x) g_cells[x].vector
176 #define FUNCTION(x) functions[g_cells[x].function]
177 #define NCAR(x) g_news[x].car
178 #define NTYPE(x) g_news[x].type
179
180 #define CAAR(x) CAR (CAR (x))
181 #define CDAR(x) CDR (CAR (x))
182 #define CAAR(x) CAR (CAR (x))
183 #define CADAR(x) CAR (CDR (CAR (x)))
184 #define CADDR(x) CAR (CDR (CDR (x)))
185 #define CDADAR(x) CAR (CDR (CAR (CDR (x))))
186 #define CADR(x) CAR (CDR (x))
187
188 SCM display_ (FILE* f, SCM x);
189 SCM vm_call (function0_t f, SCM p1, SCM p2, SCM a);
190
191 SCM
192 alloc (int n)
193 {
194   assert (g_free.value + n < ARENA_SIZE);
195   SCM x = g_free.value;
196   g_free.value += n;
197   return x;
198 }
199
200 SCM
201 make_cell (SCM type, SCM car, SCM cdr)
202 {
203   SCM x = alloc (1);
204   assert (TYPE (type) == NUMBER);
205   TYPE (x) = VALUE (type);
206   if (VALUE (type) == CHAR || VALUE (type) == NUMBER) {
207     if (car) CAR (x) = CAR (car);
208     if (cdr) CDR (x) = CDR (cdr);
209   } else if (VALUE (type) == FUNCTION) {
210     if (car) CAR (x) = car;
211     if (cdr) CDR (x) = CDR (cdr);
212   } else {
213     CAR (x) = car;
214     CDR (x) = cdr;
215   }
216   return x;
217 }
218
219 SCM
220 cons (SCM x, SCM y)
221 {
222   g_cells[tmp_num].value = PAIR;
223   return make_cell (tmp_num, x, y);
224 }
225
226 SCM
227 car (SCM x)
228 {
229   assert (TYPE (x) == PAIR);
230   return CAR (x);
231 }
232
233 SCM
234 cdr (SCM x)
235 {
236   assert (TYPE (x) == PAIR);
237   return CDR (x);
238 }
239
240 SCM
241 eq_p (SCM x, SCM y)
242 {
243   return (x == y
244           || ((TYPE (x) == KEYWORD && TYPE (y) == KEYWORD
245                && STRING (x) == STRING (y)))
246           || (TYPE (x) == CHAR && TYPE (y) == CHAR
247               && VALUE (x) == VALUE (y))
248           || (TYPE (x) == NUMBER && TYPE (y) == NUMBER
249               && VALUE (x) == VALUE (y)))
250     ? cell_t : cell_f;
251 }
252
253 SCM
254 set_car_x (SCM x, SCM e)
255 {
256   assert (TYPE (x) == PAIR);
257   CAR (x) = e;
258   return cell_unspecified;
259 }
260
261 SCM
262 set_cdr_x (SCM x, SCM e)
263 {
264   assert (TYPE (x) == PAIR);
265   CDR (x) = e;
266   return cell_unspecified;
267 }
268
269 SCM
270 set_env_x (SCM x, SCM e, SCM a)
271 {
272   SCM p = assert_defined (x, assq (x, a));
273   return set_cdr_x (p, e);
274 }
275
276 SCM
277 quote (SCM x)
278 {
279   return cons (cell_symbol_quote, x);
280 }
281
282 SCM
283 quasiquote (SCM x)
284 {
285   return cons (cell_symbol_quasiquote, x);
286 }
287
288 SCM
289 quasisyntax (SCM x)
290 {
291   return cons (cell_symbol_quasisyntax, x);
292 }
293
294 SCM
295 pairlis (SCM x, SCM y, SCM a)
296 {
297   if (x == cell_nil)
298     return a;
299   if (pair_p (x) == cell_f)
300     return cons (cons (x, y), a);
301   return cons (cons (car (x), car (y)),
302                pairlis (cdr (x), cdr (y), a));
303 }
304
305 SCM
306 assq (SCM x, SCM a)
307 {
308   while (a != cell_nil && eq_p (x, CAAR (a)) == cell_f)
309     {
310       if (TYPE (a) == BROKEN_HEART || TYPE (CAR (a)) == BROKEN_HEART)
311         fprintf (stderr, "oops, broken heart\n");
312       a = CDR (a);
313     }
314   return a != cell_nil ? car (a) : cell_f;
315 }
316
317 SCM
318 assq_ref_cache (SCM x, SCM a)
319 {
320   x = assq (x, a);
321   if (x == cell_f) return cell_undefined;
322   return cdr (x);
323 }
324
325 SCM
326 assert_defined (SCM x, SCM e)
327 {
328   if (e == cell_undefined)
329     {
330       fprintf (stderr, "eval: unbound variable:");
331       display_ (stderr, x);
332       fprintf (stderr, "\n");
333       assert (!"unbound variable");
334     }
335   return e;
336 }
337
338 enum eval_apply_t {EVLIS, APPLY, EVAL, MACRO_EXPAND, BEGIN, IF, CALL_WITH_VALUES};
339 enum eval_apply_t g_target;
340
341 SCM
342 call_lambda (SCM e, SCM x, SCM aa, SCM a) ///((internal))
343 {
344   SCM cl = cons (cons (cell_closure, x), x);
345   r1 = e;
346   r0 = cl;
347   r2 = a;
348   r3 = aa;
349   return cell_unspecified;
350 }
351
352 SCM
353 eval_apply ()
354 {
355   switch (g_target)
356     {
357     case EVLIS: goto evlis;
358     case APPLY: goto apply;
359     case EVAL: goto eval;
360     case MACRO_EXPAND: goto macro_expand;
361     case BEGIN: goto begin;
362     case IF: goto label_if;
363     case CALL_WITH_VALUES: goto call_with_values;
364     }
365
366  evlis:
367   if (r1 == cell_nil) return cell_nil;
368   if (TYPE (r1) != PAIR) goto eval;
369   r2 = eval_env (car (r1), r0);
370   r1 = evlis_env (cdr (r1), r0);
371   return cons (r2, r1);
372
373  apply:
374   if (TYPE (r1) != PAIR)
375     {
376       if (TYPE (r1) == FUNCTION) return call (r1, r2);
377       if (r1 == cell_symbol_call_with_values)
378         {
379           r1 = car (r2);
380           r2 = cadr (r2);
381           goto call_with_values;
382         }
383       if (r1 == cell_symbol_current_module) return r0;
384     }
385   else
386     switch (car (r1))
387       {
388       case cell_symbol_lambda:
389         {
390           SCM args = cadr (r1);
391           SCM body = cddr (r1);
392           SCM p = pairlis (args, r2, r0);
393           call_lambda (body, p, p, r0);
394           goto begin;
395         }
396       case cell_closure:
397         {
398           SCM args = caddr (r1);
399           SCM body = cdddr (r1);
400           SCM aa = cdadr (r1);
401           aa = cdr (aa);
402           SCM p = pairlis (args, r2, aa);
403           call_lambda (body, p, aa, r0);
404           goto begin;
405         }
406 #if BOOT
407       case cell_symbol_label:
408         {
409           r0 = cons (cons (cadr (r1), caddr (r1)), r0);
410           r1 = caddr (r1);
411           goto apply;
412         }
413 #endif
414       }
415   SCM e = eval_env (r1, r0);
416   char const* type = 0;
417   if (e == cell_f || e == cell_t) type = "bool";
418   if (TYPE (e) == CHAR) type = "char";
419   if (TYPE (e) == NUMBER) type = "number";
420   if (TYPE (e) == STRING) type = "string";
421   if (e == cell_unspecified) type = "*unspecified*";
422   if (e == cell_undefined) type =  "*undefined*";
423   if (type)
424     {
425       fprintf (stderr, "cannot apply: %s: ", type);
426       display_ (stderr, e);
427       fprintf (stderr, " [");
428       display_ (stderr, r1);
429       fprintf (stderr, "]\n");
430       assert (!"cannot apply");
431     }
432   r1 = e;
433   goto apply;
434
435  eval:
436   switch (TYPE (r1))
437     {
438     case PAIR:
439       {
440         switch (car (r1))
441           {
442 #if FIXED_PRIMITIVES
443           case cell_symbol_car: return car (eval_env (CADR (r1), r0));
444           case cell_symbol_cdr: return cdr (eval_env (CADR (r1), r0));
445           case cell_symbol_cons: {SCM m = evlis_env (CDR (r1), r0);
446               return cons (CAR (m), CADR (m));}
447           case cell_symbol_null_p: return null_p (eval_env (CADR (r1), r0));
448 #endif // FIXED_PRIMITIVES
449           case cell_symbol_quote: return cadr (r1);
450           case cell_symbol_begin: goto begin;
451           case cell_symbol_lambda:
452             return make_closure (cadr (r1), cddr (r1), assq (cell_closure, r0));
453           case cell_closure: return r1;
454           case cell_symbol_if: {r1=cdr (r1); goto label_if;}
455           case cell_symbol_set_x: {
456             SCM x = eval_env (caddr (r1), r0); return set_env_x (cadr (r1), x, r0);
457           }
458           default: {
459             SCM x = macro_expand_env (r1, r0);
460             if (x != r1)
461               {
462                 if (TYPE (x) == PAIR)
463                   {
464                     set_cdr_x (r1, cdr (x));
465                     set_car_x (r1, car (x));
466                   }
467                 r1 = x;
468                 goto eval;
469               }
470             SCM m = evlis_env (CDR (r1), r0);
471             r1 = car (r1);
472             r2 = m;
473             goto apply;
474           }
475           }
476       }
477     case SYMBOL: return assert_defined (r1, assq_ref_cache (r1, r0));
478     default: return r1;
479     }
480
481  macro_expand:
482   if (TYPE (CAR (r1)) == STRING && string_to_symbol (CAR (r1)) == cell_symbol_noexpand)
483     return cadr (r1);
484
485   SCM macro;
486   SCM expanders;
487   if (TYPE (r1) == PAIR
488       && (macro = lookup_macro (car (r1), r0)) != cell_f)
489     {
490       r2 = CDR (r1);
491       r1 = macro;
492       goto apply;
493     }
494   else if (TYPE (r1) == PAIR
495            && TYPE (CAR (r1)) == SYMBOL
496            && ((expanders = assq_ref_cache (cell_symbol_sc_expander_alist, r0)) != cell_undefined)
497            && ((macro = assq (CAR (r1), expanders)) != cell_f))
498     {
499       SCM sc_expand = assq_ref_cache (cell_symbol_macro_expand, r0);
500       if (sc_expand != cell_undefined && sc_expand != cell_f)
501         {
502           r2 = cons (r1, cell_nil);
503           r1 = sc_expand;
504           goto apply;
505         }
506     }
507   return r1;
508
509   SCM r;
510  begin:
511   r = cell_unspecified;
512   while (r1 != cell_nil) {
513     if (TYPE (r1) == PAIR && TYPE (CAR (r1)) == PAIR)
514       {
515         if (caar (r1) == cell_symbol_begin)
516           r1 = append2 (cdar (r1), cdr (r1));
517         else if (caar (r1) == cell_symbol_primitive_load)
518           {
519             SCM f = read_input_file_env (r0);
520             r1 = append2 (f, cdr (r1));
521           }
522       }
523     if (CDR (r1) == cell_nil)
524       {
525         r1 = car (r1);
526         goto eval;
527       }
528     r = eval_env (car (r1), r0);
529     r1 = CDR (r1);
530   }
531   return r;
532
533   SCM x;
534  label_if:
535   x = eval_env (car (r1), r0);
536   if (x != cell_f)
537     {
538       r1 = cadr (r1);
539       goto eval;
540     }
541   if (cddr (r1) != cell_nil)
542     {
543       r1 = caddr (r1);
544       goto eval;
545     }
546   return cell_unspecified;
547
548   SCM v;
549  call_with_values:
550   v = apply_env (r1, cell_nil, r0);
551   if (TYPE (v) == VALUES)
552     v = CDR (v);
553   r1 = r2;
554   r2 = v;
555   goto apply;
556 }
557
558 SCM
559 call (SCM fn, SCM x)
560 {
561   if ((FUNCTION (fn).arity > 0 || FUNCTION (fn).arity == -1)
562       && x != cell_nil && TYPE (CAR (x)) == VALUES)
563     x = cons (CADAR (x), CDR (x));
564   if ((FUNCTION (fn).arity > 1 || FUNCTION (fn).arity == -1)
565       && x != cell_nil && TYPE (CDR (x)) == PAIR && TYPE (CADR (x)) == VALUES)
566     x = cons (CAR (x), cons (CDADAR (x), CDR (x)));
567   switch (FUNCTION (fn).arity)
568     {
569     case 0: return FUNCTION (fn).function0 ();
570     case 1: return FUNCTION (fn).function1 (car (x));
571     case 2: return FUNCTION (fn).function2 (car (x), cadr (x));
572     case 3: return FUNCTION (fn).function3 (car (x), cadr (x), caddr (x));
573     case -1: return FUNCTION (fn).functionn (x);
574     }
575   return cell_unspecified;
576 }
577
578 SCM
579 gc_frame (SCM stack)
580 {
581   SCM frame = car (stack);
582   r1 = car (frame);
583   r2 = cadr (frame);
584   r3 = caddr (frame);
585   r0 = cadddr (frame);
586   return frame;
587 }
588
589 SCM
590 gc_stack (SCM a)
591 {
592   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
593   stack = cons (frame, stack);
594   stack = gc (stack);
595   gc_frame (stack);
596   stack = cdr (stack);
597   return stack;
598 }
599
600 SCM
601 vm_call (function0_t f, SCM p1, SCM p2, SCM a)
602 {
603   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
604   stack = cons (frame, stack);
605   r1 = p1;
606   r2 = p2;
607   r0 = a;
608   if (g_free.value + GC_SAFETY > ARENA_SIZE)
609     gc_stack (stack);
610
611   SCM r = f ();
612   frame = gc_frame (stack);
613   stack = cdr (stack);
614   return r;
615 }
616
617 SCM
618 evlis_env (SCM m, SCM a)
619 {
620   g_target = EVLIS;
621   return vm_call (eval_apply, m, cell_undefined, a);
622 }
623
624 SCM
625 apply_env (SCM fn, SCM x, SCM a)
626 {
627   g_target = APPLY;
628   return vm_call (eval_apply, fn, x, a);
629 }
630
631 SCM
632 eval_env (SCM e, SCM a)
633 {
634   g_target = EVAL;
635   return vm_call (eval_apply, e, cell_undefined, a);
636 }
637
638 SCM
639 macro_expand_env (SCM e, SCM a)
640 {
641   g_target = MACRO_EXPAND;
642   return vm_call (eval_apply, e, cell_undefined, a);
643 }
644
645 SCM
646 begin_env (SCM e, SCM a)
647 {
648   g_target = BEGIN;
649   return vm_call (eval_apply, e, cell_undefined, a);
650 }
651
652 SCM
653 if_env (SCM e, SCM a)
654 {
655   g_target = IF;
656   return vm_call (eval_apply, e, cell_undefined, a);
657 }
658
659 SCM
660 call_with_values_env (SCM producer, SCM consumer, SCM a)
661 {
662   g_target = CALL_WITH_VALUES;
663   return vm_call (eval_apply, producer, consumer, a);
664 }
665
666 SCM
667 append2 (SCM x, SCM y)
668 {
669   if (x == cell_nil) return y;
670   assert (TYPE (x) == PAIR);
671   return cons (car (x), append2 (cdr (x), y));
672 }
673
674 SCM
675 append (SCM x) ///((arity . n))
676  {
677   if (x == cell_nil) return cell_nil;
678   if (cdr (x) == cell_nil) return car (x);
679   return append2 (car (x), append (cdr (x)));
680  }
681
682 SCM
683 make_char (int x)
684 {
685   g_cells[tmp_num].value = CHAR;
686   g_cells[tmp_num2].value = x;
687   return make_cell (tmp_num, tmp_num2, tmp_num2);
688 }
689
690 SCM
691 make_function (SCM name, SCM id, SCM arity)
692 {
693   g_cells[tmp_num3].value = FUNCTION;
694   function *f = (function*)malloc (sizeof (function));
695   f->arity = VALUE (arity);
696   g_cells[tmp_num4].value = (long)f;
697   return make_cell (tmp_num3, name, tmp_num4);
698 }
699
700 SCM
701 make_keyword (SCM s)
702 {
703   SCM x = internal_lookup_symbol (s);
704   x = x ? x : internal_make_symbol (s);
705   g_cells[tmp_num].value = KEYWORD;
706   return make_cell (tmp_num, STRING (x), 0);
707 }
708
709 SCM
710 make_macro (SCM name, SCM x)
711 {
712   g_cells[tmp_num].value = MACRO;
713   return make_cell (tmp_num, STRING (name), x);
714 }
715
716 SCM
717 make_number (int x)
718 {
719   g_cells[tmp_num].value = NUMBER;
720   g_cells[tmp_num2].value = x;
721   return make_cell (tmp_num, tmp_num2, tmp_num2);
722 }
723
724 SCM
725 make_ref (SCM x)
726 {
727   g_cells[tmp_num].value = REF;
728   return make_cell (tmp_num, x, x);
729 }
730
731 SCM
732 make_string (SCM x)
733 {
734   g_cells[tmp_num].value = STRING;
735   return make_cell (tmp_num, x, 0);
736 }
737
738 SCM
739 cstring_to_list (char const* s)
740 {
741   SCM p = cell_nil;
742   int i = strlen (s);
743   while (i--)
744     p = cons (make_char (s[i]), p);
745   return p;
746 }
747
748 SCM
749 null_p (SCM x)
750 {
751   return x == cell_nil ? cell_t : cell_f;
752 }
753
754 SCM
755 internal_make_symbol (SCM s)
756 {
757   g_cells[tmp_num].value = SYMBOL;
758   SCM x = make_cell (tmp_num, s, 0);
759   g_symbols = cons (x, g_symbols);
760   return x;
761 }
762
763 SCM
764 make_symbol (SCM s)
765 {
766   SCM x = internal_lookup_symbol (s);
767   return x ? x : internal_make_symbol (s);
768 }
769
770 SCM
771 make_vector (SCM n)
772 {
773   int k = VALUE (n);
774   g_cells[tmp_num].value = VECTOR;
775   SCM v = alloc (k);
776   SCM x = make_cell (tmp_num, k, v);
777   for (int i=0; i<k; i++) g_cells[v+i] = g_cells[vector_entry (cell_unspecified)];
778   return x;
779 }
780
781 SCM
782 values (SCM x) ///((arity . n))
783 {
784   SCM v = cons (0, x);
785   TYPE (v) = VALUES;
786   return v;
787 }
788
789 SCM
790 vector_length (SCM x)
791 {
792   assert (TYPE (x) == VECTOR);
793   return make_number (LENGTH (x));
794 }
795
796 SCM
797 vector_ref (SCM x, SCM i)
798 {
799   assert (TYPE (x) == VECTOR);
800   assert (VALUE (i) < LENGTH (x));
801   SCM e = VECTOR (x) + VALUE (i);
802   if (TYPE (e) == REF) e = g_cells[e].ref;
803   if (TYPE (e) == CHAR) e = make_char (VALUE (e));
804   if (TYPE (e) == NUMBER) e = make_number (VALUE (e));
805   return e;
806 }
807
808 SCM
809 vector_entry (SCM x) {
810   if (TYPE (x) == PAIR || TYPE (x) == SPECIAL || TYPE (x) == STRING || TYPE (x) == SYMBOL || TYPE (x) == VECTOR) x = make_ref (x);
811   return x;
812 }
813
814 SCM
815 vector_set_x (SCM x, SCM i, SCM e)
816 {
817   assert (TYPE (x) == VECTOR);
818   assert (VALUE (i) < LENGTH (x));
819   g_cells[VECTOR (x)+g_cells[i].value] = g_cells[vector_entry (e)];
820   return cell_unspecified;
821 }
822
823 SCM
824 list_to_vector (SCM x)
825 {
826   VALUE (tmp_num) = VALUE (length (x));
827   SCM v = make_vector (tmp_num);
828   SCM p = VECTOR (v);
829   while (x != cell_nil)
830     {
831       g_cells[p++] = g_cells[vector_entry (car (x))];
832       x = cdr (x);
833     }
834   return v;
835 }
836
837 FILE *g_stdin;
838 int
839 getchar ()
840 {
841   return getc (g_stdin);
842 }
843
844 int
845 ungetchar (int c)
846 {
847   return ungetc (c, g_stdin);
848 }
849
850 int
851 peekchar ()
852 {
853   int c = getchar ();
854   ungetchar (c);
855   return c;
856 }
857
858 SCM
859 peek_byte ()
860 {
861   return make_number (peekchar ());
862 }
863
864 SCM
865 read_byte ()
866 {
867   return make_number (getchar ());
868 }
869
870 SCM
871 unread_byte (SCM i)
872 {
873   ungetchar (VALUE (i));
874   return i;
875 }
876
877 SCM
878 write_char (SCM x) ///((arity . n))
879 {
880   SCM c = car (x);
881   SCM p = cdr (x);
882   int fd = 1;
883   if (TYPE (p) == PAIR && TYPE (car (p)) == NUMBER) fd = VALUE (car (p));
884   FILE *f = fd == 1 ? stdout : stderr;
885   assert (TYPE (c) == NUMBER || TYPE (c) == CHAR);
886   fputc (VALUE (c), f);
887   return c;
888 }
889
890 SCM
891 symbol_to_list (SCM x)
892 {
893   assert (TYPE (x) == SYMBOL);
894   return STRING (x);
895 }
896
897 SCM
898 char_to_integer (SCM x)
899 {
900   assert (TYPE (x) == CHAR);
901   return make_number (VALUE (x));
902 }
903
904 SCM
905 integer_to_char (SCM x)
906 {
907   assert (TYPE (x) == NUMBER);
908   return make_char (VALUE (x));
909 }
910
911 void
912 make_tmps (scm* cells)
913 {
914   tmp = g_free.value++;
915   cells[tmp].type = CHAR;
916   tmp_num = g_free.value++;
917   cells[tmp_num].type = NUMBER;
918   tmp_num2 = g_free.value++;
919   cells[tmp_num2].type = NUMBER;
920   tmp_num3 = g_free.value++;
921   cells[tmp_num3].type = NUMBER;
922   tmp_num4 = g_free.value++;
923   cells[tmp_num4].type = NUMBER;
924 }
925
926 //\f Jam Collector
927 SCM g_symbol_max;
928 bool g_debug = false;
929
930 SCM
931 gc_up_arena ()
932 {
933   ARENA_SIZE *= 2;
934   void *p = realloc (g_cells-1, 2*ARENA_SIZE*sizeof(scm));
935   if (!p)
936     {
937       if (g_debug) fprintf (stderr, "cannot up arena: %s: arena=%d\n", strerror (errno), 2*ARENA_SIZE);
938       return cell_unspecified;
939     }
940   g_cells = (scm*)p;
941   g_cells++;
942   gc_init_news ();
943 }
944
945 SCM
946 gc ()
947 {
948   if (g_debug) fprintf (stderr, "***gc[%d]...", g_free.value);
949   g_free.value = 1;
950   if (g_cells < g_news && ARENA_SIZE < MAX_ARENA_SIZE) gc_up_arena ();
951   for (int i=g_free.value; i<g_symbol_max; i++)
952     gc_copy (i);
953   make_tmps (g_news);
954   g_symbols = gc_copy (g_symbols);
955   SCM new = gc_copy (stack);
956   if (g_debug) fprintf (stderr, "new=%d\n", new, stack);
957   stack = new;
958   return gc_loop (1);
959 }
960
961 SCM
962 gc_loop (SCM scan)
963 {
964   while (scan < g_free.value)
965     {
966       if (NTYPE (scan) == KEYWORD
967           || NTYPE (scan) == MACRO
968           || NTYPE (scan) == PAIR
969           || NTYPE (scan) == REF
970           || scan == 1 // null
971           || NTYPE (scan) == SPECIAL
972           || NTYPE (scan) == STRING
973           || NTYPE (scan) == SYMBOL)
974         {
975           SCM car = gc_copy (g_news[scan].car);
976           gc_relocate_car (scan, car);
977         }
978       if ((NTYPE (scan) == MACRO
979            || NTYPE (scan) == PAIR
980            || NTYPE (scan) == VALUES)
981           && g_news[scan].cdr) // allow for 0 terminated list of symbols
982         {
983           SCM cdr = gc_copy (g_news[scan].cdr);
984           gc_relocate_cdr (scan, cdr);
985         }
986       scan++;
987     }
988   return gc_flip ();
989 }
990
991 SCM
992 gc_copy (SCM old)
993 {
994   if (TYPE (old) == BROKEN_HEART) return g_cells[old].car;
995   SCM new = g_free.value++;
996   g_news[new] = g_cells[old];
997   if (NTYPE (new) == VECTOR)
998     {
999       g_news[new].vector = g_free.value;
1000       for (int i=0; i<LENGTH (old); i++)
1001         g_news[g_free.value++] = g_cells[VECTOR (old)+i];
1002     }
1003   g_cells[old].type = BROKEN_HEART;
1004   g_cells[old].car = new;
1005   return new;
1006 }
1007
1008 SCM
1009 gc_relocate_car (SCM new, SCM car)
1010 {
1011   g_news[new].car = car;
1012   return cell_unspecified;
1013 }
1014
1015 SCM
1016 gc_relocate_cdr (SCM new, SCM cdr)
1017 {
1018   g_news[new].cdr = cdr;
1019   return cell_unspecified;
1020 }
1021
1022 SCM
1023 gc_flip ()
1024 {
1025   scm *cells = g_cells;
1026   g_cells = g_news;
1027   g_news = cells;
1028   if (g_debug) fprintf (stderr, " => jam[%d]\n", g_free.value);
1029   return stack;
1030 }
1031
1032 SCM
1033 gc_show ()
1034 {
1035   fprintf (stderr, "cells: ");
1036   scm *t = g_cells;
1037   display_ (stderr, -1);
1038   fprintf (stderr, "\n");
1039   if (g_news)
1040     {
1041       fprintf (stderr, "news: ");
1042       g_cells = g_news;
1043       display_ (stderr, -1);
1044       fprintf (stderr, "\n");
1045     }
1046   g_cells = t;
1047   return cell_unspecified;
1048 }
1049
1050 //\f Environment setup
1051 SCM
1052 acons (SCM key, SCM value, SCM alist)
1053 {
1054   return cons (cons (key, value), alist);
1055 }
1056
1057 SCM
1058 add_environment (SCM a, char const *name, SCM x)
1059 {
1060   return acons (make_symbol (cstring_to_list (name)), x, a);
1061 }
1062
1063 SCM
1064 gc_init_cells ()
1065 {
1066   g_cells = (scm *)malloc (2*ARENA_SIZE*sizeof(scm));
1067   g_cells[0].type = VECTOR;
1068   g_cells[0].length = 1000;
1069   g_cells[0].vector = 0;
1070   g_cells++;
1071   g_cells[0].type = CHAR;
1072   g_cells[0].value = 'c';
1073 }
1074
1075 SCM
1076 gc_init_news ()
1077 {
1078   g_news = g_cells-1 + ARENA_SIZE;
1079   g_news[0].type = VECTOR;
1080   g_news[0].length = 1000;
1081   g_news[0].vector = 0;
1082   g_news++;
1083   g_news[0].type = CHAR;
1084   g_news[0].value = 'n';
1085 }
1086
1087 SCM
1088 mes_symbols () ///((internal))
1089 {
1090   gc_init_cells ();
1091   gc_init_news ();
1092
1093 #include "mes.symbols.i"
1094
1095   g_symbol_max = g_free.value;
1096   make_tmps (g_cells);
1097
1098   g_symbols = 0;
1099   for (int i=1; i<g_symbol_max; i++)
1100     g_symbols = cons (i, g_symbols);
1101
1102   SCM a = cell_nil;
1103
1104 #if BOOT
1105   a = acons (cell_symbol_label, cell_t, a);
1106 #endif
1107   a = acons (cell_symbol_begin, cell_begin, a);
1108   a = add_environment (a, "sc-expand", cell_f);
1109   a = acons (cell_closure, a, a);
1110
1111   internal_lookup_symbol (cell_nil);
1112
1113   return a;
1114 }
1115
1116 SCM
1117 mes_builtins (SCM a)
1118 {
1119 #include "mes.i"
1120
1121 #include "display.i"
1122 #include "lib.i"
1123 #include "math.i"
1124 #include "posix.i"
1125 #include "reader.i"
1126 #include "string.i"
1127 #include "type.i"
1128
1129 #include "display.environment.i"
1130 #include "lib.environment.i"
1131 #include "math.environment.i"
1132 #include "mes.environment.i"
1133 #include "posix.environment.i"
1134 #include "reader.environment.i"
1135 #include "string.environment.i"
1136 #include "type.environment.i"
1137
1138   a = add_environment (a, "*dot*", cell_dot);
1139   a = add_environment (a, "*foo-bar-baz*", cell_nil); // FIXME: some off-by one?
1140
1141   return a;
1142 }
1143
1144 SCM
1145 mes_stack (SCM a) ///((internal))
1146 {
1147   r0 = a;
1148   r1 = make_char (0);
1149   r2 = make_char (0);
1150   r3 = make_char (0);
1151   stack = cons (cell_nil, cell_nil);
1152   return r0;
1153 }
1154
1155 SCM
1156 mes_environment () ///((internal))
1157 {
1158   SCM a = mes_symbols ();
1159   return mes_stack (a);
1160 }
1161
1162 SCM
1163 make_lambda (SCM args, SCM body)
1164 {
1165   return cons (cell_symbol_lambda, cons (args, body));
1166 }
1167
1168 SCM
1169 make_closure (SCM args, SCM body, SCM a)
1170 {
1171   return cons (cell_closure, cons (cons (cell_circular, a), cons (args, body)));
1172 }
1173
1174 SCM
1175 lookup_macro (SCM x, SCM a)
1176 {
1177   if (TYPE (x) != SYMBOL) return cell_f;
1178   SCM m = assq_ref_cache (x, a);
1179   if (macro_p (m) == cell_t) return MACRO (m);
1180   return cell_f;
1181 }
1182
1183 SCM
1184 read_input_file_env_ (SCM e, SCM a)
1185 {
1186   if (e == cell_nil) return e;
1187   return cons (e, read_input_file_env_ (read_env (a), a));
1188 }
1189
1190 SCM
1191 read_input_file_env (SCM a)
1192 {
1193   r0 = a;
1194   if (assq_ref_cache (cell_symbol_read_input_file, r0) != cell_undefined)
1195     return apply_env (cell_symbol_read_input_file, cell_nil, r0);
1196   return read_input_file_env_ (read_env (r0), r0);
1197 }
1198
1199 SCM
1200 load_env (SCM a) ///((internal))
1201 {
1202   r0 =a;
1203   g_stdin = fopen ("module/mes/read-0.mes", "r");
1204   g_stdin = g_stdin ? g_stdin : fopen (PREFIX "module/mes/read-0.mes", "r");
1205   if (!g_function) r0 = mes_builtins (r0);
1206   r3 = read_input_file_env (r0);
1207   g_stdin = stdin;
1208   return r3;
1209 }
1210
1211 SCM
1212 bload_env (SCM a) ///((internal))
1213 {
1214   g_stdin = fopen ("module/mes/read-0.mo", "r");
1215   g_stdin = g_stdin ? g_stdin : fopen (PREFIX "module/mes/read-0.mo", "r");
1216   char *p = (char*)g_cells;
1217   assert (getchar () == 'M');
1218   assert (getchar () == 'E');
1219   assert (getchar () == 'S');
1220   stack = getchar () << 8;
1221   stack += getchar ();
1222   int c = getchar ();
1223   while (c != EOF)
1224     {
1225       *p++ = c;
1226       c = getchar ();
1227     }
1228   g_free.value = (p-(char*)g_cells) / sizeof (scm);
1229   gc_frame (stack);
1230   g_symbols = r1;
1231   g_stdin = stdin;
1232
1233   r0 = mes_builtins (r0);
1234   return r3;
1235 }
1236
1237 int
1238 dump ()
1239 {
1240   r1 = g_symbols;
1241   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
1242   stack = cons (frame, stack);
1243   stack = gc (stack);
1244   gc_frame (stack);
1245   char *p = (char*)g_cells;
1246   fputc ('M', stdout);
1247   fputc ('E', stdout);
1248   fputc ('S', stdout);
1249   fputc (stack >> 8, stdout);
1250   fputc (stack % 256, stdout);
1251   for (int i=0; i<g_free.value * sizeof(scm); i++)
1252     fputc (*p++, stdout);
1253   return 0;
1254 }
1255
1256 #include "type.c"
1257 #include "display.c"
1258 #include "lib.c"
1259 #include "math.c"
1260 #include "posix.c"
1261 #include "reader.c"
1262 #include "string.c"
1263
1264 int
1265 main (int argc, char *argv[])
1266 {
1267   g_debug = getenv ("MES_DEBUG");
1268   if (getenv ("MES_ARENA")) ARENA_SIZE = atoi (getenv ("MES_ARENA"));
1269   if (argc > 1 && !strcmp (argv[1], "--help")) return puts ("Usage: mes < FILE\n");
1270   if (argc > 1 && !strcmp (argv[1], "--version")) return puts ("Mes 0.3\n");
1271   g_stdin = stdin;
1272   r0 = mes_environment ();
1273   SCM program = (argc > 1 && !strcmp (argv[1], "--load"))
1274     ? bload_env (r0) : load_env (r0);
1275   if (argc > 1 && !strcmp (argv[1], "--dump")) return dump ();
1276   display_ (stderr, begin_env (program, r0));
1277   fputs ("", stderr);
1278   gc (stack);
1279   if (g_debug) fprintf (stderr, "\nstats: [%d]\n", g_free.value);
1280   return 0;
1281 }