core: Bugfix unread_byte.
[mes.git] / mes.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #define _GNU_SOURCE
22 #include <assert.h>
23 #include <ctype.h>
24 #include <errno.h>
25 #include <limits.h>
26 #include <stdio.h>
27 #include <string.h>
28 #include <stdlib.h>
29 #include <stdbool.h>
30
31 #define DEBUG 0
32 #define QUASIQUOTE 1
33 #define QUASISYNTAX 0
34 #define ENV_CACHE 0
35 #define FIXED_PRIMITIVES 1
36 #define READER 1
37
38 #if READER
39 int ARENA_SIZE = 1000000;
40 #else
41 int ARENA_SIZE = 100000;
42 #endif
43 int MAX_ARENA_SIZE = 20000000;
44 int GC_SAFETY = 100;
45
46 typedef int SCM;
47 enum type_t {CHAR, FUNCTION, KEYWORD, MACRO, NUMBER, PAIR, SPECIAL, STRING, SYMBOL, REF, VALUES, VECTOR, BROKEN_HEART};
48 typedef SCM (*function0_t) (void);
49 typedef SCM (*function1_t) (SCM);
50 typedef SCM (*function2_t) (SCM, SCM);
51 typedef SCM (*function3_t) (SCM, SCM, SCM);
52 typedef SCM (*functionn_t) (SCM);
53 typedef struct function_t {
54   union {
55     function0_t function0;
56     function1_t function1;
57     function2_t function2;
58     function3_t function3;
59     functionn_t functionn;
60   };
61   int arity;
62 } function;
63 struct scm_t;
64 typedef struct scm_t {
65   enum type_t type;
66   union {
67     char const *name;
68     SCM string;
69     SCM car;
70     SCM ref;
71     int length;
72   };
73   union {
74     int value;
75     int function;
76     SCM cdr;
77     SCM macro;
78     SCM vector;
79     int hits;
80   };
81 } scm;
82
83 scm scm_nil = {SPECIAL, "()"};
84 scm scm_f = {SPECIAL, "#f"};
85 scm scm_t = {SPECIAL, "#t"};
86 scm scm_dot = {SPECIAL, "."};
87 scm scm_arrow = {SPECIAL, "=>"};
88 scm scm_undefined = {SPECIAL, "*undefined*"};
89 scm scm_unspecified = {SPECIAL, "*unspecified*"};
90 scm scm_closure = {SPECIAL, "*closure*"};
91 scm scm_circular = {SPECIAL, "*circular*"};
92 #if BOOT
93 scm scm_label = {
94   SPECIAL, "label"};
95 #endif
96 scm scm_begin = {SPECIAL, "*begin*"};
97
98 scm scm_symbol_lambda = {SYMBOL, "lambda"};
99 scm scm_symbol_begin = {SYMBOL, "begin"};
100 scm scm_symbol_if = {SYMBOL, "if"};
101 scm scm_symbol_define = {SYMBOL, "define"};
102 scm scm_symbol_define_macro = {SYMBOL, "define-macro"};
103 scm scm_symbol_set_x = {SYMBOL, "set!"};
104
105 scm scm_symbol_quote = {SYMBOL, "quote"};
106 scm scm_symbol_quasiquote = {SYMBOL, "quasiquote"};
107 scm scm_symbol_unquote = {SYMBOL, "unquote"};
108 scm scm_symbol_unquote_splicing = {SYMBOL, "unquote-splicing"};
109
110 scm scm_symbol_sc_expand = {SYMBOL, "sc-expand"};
111 scm scm_symbol_expand_macro = {SYMBOL, "expand-macro"};
112 scm scm_symbol_sc_expander_alist = {SYMBOL, "*sc-expander-alist*"};
113 scm scm_symbol_noexpand = {SYMBOL, "noexpand"};
114 scm scm_symbol_syntax = {SYMBOL, "syntax"};
115 scm scm_symbol_quasisyntax = {SYMBOL, "quasisyntax"};
116 scm scm_symbol_unsyntax = {SYMBOL, "unsyntax"};
117 scm scm_symbol_unsyntax_splicing = {SYMBOL, "unsyntax-splicing"};
118
119 scm scm_symbol_call_with_values = {SYMBOL, "call-with-values"};
120 scm scm_symbol_current_module = {SYMBOL, "current-module"};
121 scm scm_symbol_primitive_load = {SYMBOL, "primitive-load"};
122 scm scm_symbol_read_input_file = {SYMBOL, "read-input-file"};
123
124 scm scm_symbol_the_unquoters = {SYMBOL, "*the-unquoters*"};
125 scm scm_symbol_the_unsyntaxers = {SYMBOL, "*the-unsyntaxers*"};
126
127 scm scm_symbol_car = {SYMBOL, "car"};
128 scm scm_symbol_cdr = {SYMBOL, "cdr"};
129 scm scm_symbol_null_p = {SYMBOL, "null?"};
130 scm scm_symbol_eq_p = {SYMBOL, "eq?"};
131 scm scm_symbol_cons = {SYMBOL, "cons"};
132
133 scm char_eof = {CHAR, .name="*eof*", .value=-1};
134 scm char_nul = {CHAR, .name="nul", .value=0};
135 scm char_alarm = {CHAR, .name="alarm", .value=8};
136 scm char_backspace = {CHAR, .name="backspace", .value=8};
137 scm char_tab = {CHAR, .name="tab", .value=9};
138 scm char_newline = {CHAR, .name="newline", .value=10};
139 scm char_vtab = {CHAR, .name="vtab", .value=11};
140 scm char_page = {CHAR, .name="page", .value=12};
141 scm char_return = {CHAR, .name="return", .value=13};
142 scm char_space = {CHAR, .name="space", .value=32};
143
144 scm g_free = {NUMBER, .value=0};
145 scm *g_cells;
146 scm *g_news = 0;
147
148 #include "mes.symbols.h"
149
150 SCM tmp;
151 SCM tmp_num;
152 SCM tmp_num2;
153 SCM tmp_num3;
154 SCM tmp_num4;
155
156 function functions[200];
157 int g_function = 0;
158
159 SCM g_symbols = 0;
160 SCM stack = 0;
161 SCM r0 = 0; // a/env
162 SCM r1 = 0; // param 1
163 SCM r2 = 0; // param 2
164 SCM r3 = 0; // param 3
165
166 #include "define.h"
167 #include "display.h"
168 #include "lib.h"
169 #include "math.h"
170 #include "mes.h"
171 #include "posix.h"
172 #include "quasiquote.h"
173 #include "reader.h"
174 #include "string.h"
175 #include "type.h"
176
177 #define CAR(x) g_cells[x].car
178 #define CDR(x) g_cells[x].cdr
179 #define HITS(x) g_cells[x].hits
180 #define LENGTH(x) g_cells[x].length
181 #define NAME(x) g_cells[x].name
182 #define STRING(x) g_cells[x].string
183 #define TYPE(x) g_cells[x].type
184 #define MACRO(x) g_cells[x].macro
185 #define REF(x) g_cells[x].ref
186 #define VALUE(x) g_cells[x].value
187 #define VECTOR(x) g_cells[x].vector
188 #define FUNCTION(x) functions[g_cells[x].function]
189 #define NCAR(x) g_news[x].car
190 #define NTYPE(x) g_news[x].type
191
192 #define CAAR(x) CAR (CAR (x))
193 #define CDAR(x) CDR (CAR (x))
194 #define CAAR(x) CAR (CAR (x))
195 #define CADAR(x) CAR (CDR (CAR (x)))
196 #define CADDR(x) CAR (CDR (CDR (x)))
197 #define CDADAR(x) CAR (CDR (CAR (CDR (x))))
198 #define CADR(x) CAR (CDR (x))
199
200 SCM display_ (FILE* f, SCM x);
201 SCM vm_call (function0_t f, SCM p1, SCM p2, SCM a);
202
203 SCM
204 alloc (int n)
205 {
206   assert (g_free.value + n < ARENA_SIZE);
207   SCM x = g_free.value;
208   g_free.value += n;
209   return x;
210 }
211
212 SCM
213 make_cell (SCM type, SCM car, SCM cdr)
214 {
215   SCM x = alloc (1);
216   assert (TYPE (type) == NUMBER);
217   TYPE (x) = VALUE (type);
218   if (VALUE (type) == CHAR || VALUE (type) == NUMBER) {
219     if (car) CAR (x) = CAR (car);
220     if (cdr) CDR (x) = CDR (cdr);
221   } else if (VALUE (type) == FUNCTION) {
222     if (car) CAR (x) = car;
223     if (cdr) CDR (x) = CDR (cdr);
224   } else {
225     CAR (x) = car;
226     CDR (x) = cdr;
227   }
228   return x;
229 }
230
231 SCM
232 cons (SCM x, SCM y)
233 {
234   g_cells[tmp_num].value = PAIR;
235   return make_cell (tmp_num, x, y);
236 }
237
238 SCM
239 car (SCM x)
240 {
241   assert (TYPE (x) == PAIR);
242   return CAR (x);
243 }
244
245 SCM
246 cdr (SCM x)
247 {
248   assert (TYPE (x) == PAIR);
249   return CDR (x);
250 }
251
252 SCM
253 eq_p (SCM x, SCM y)
254 {
255   return (x == y
256           || ((TYPE (x) == KEYWORD && TYPE (y) == KEYWORD
257                && STRING (x) == STRING (y)))
258           || (TYPE (x) == CHAR && TYPE (y) == CHAR
259               && VALUE (x) == VALUE (y))
260           || (TYPE (x) == NUMBER && TYPE (y) == NUMBER
261               && VALUE (x) == VALUE (y)))
262     ? cell_t : cell_f;
263 }
264
265 SCM
266 set_car_x (SCM x, SCM e)
267 {
268   assert (TYPE (x) == PAIR);
269   CAR (x) = e;
270   return cell_unspecified;
271 }
272
273 SCM
274 set_cdr_x (SCM x, SCM e)
275 {
276   assert (TYPE (x) == PAIR);
277   CDR (x) = e;
278   return cell_unspecified;
279 }
280
281 SCM
282 set_env_x (SCM x, SCM e, SCM a)
283 {
284   SCM p = assert_defined (x, assq (x, a));
285   return set_cdr_x (p, e);
286 }
287
288 SCM
289 quote (SCM x)
290 {
291   return cons (cell_symbol_quote, x);
292 }
293
294 SCM
295 quasiquote (SCM x)
296 {
297   return cons (cell_symbol_quasiquote, x);
298 }
299
300 SCM
301 quasisyntax (SCM x)
302 {
303   return cons (cell_symbol_quasisyntax, x);
304 }
305
306 SCM
307 pairlis (SCM x, SCM y, SCM a)
308 {
309   if (x == cell_nil)
310     return a;
311   if (pair_p (x) == cell_f)
312     return cons (cons (x, y), a);
313   return cons (cons (car (x), car (y)),
314                pairlis (cdr (x), cdr (y), a));
315 }
316
317 SCM
318 assq (SCM x, SCM a)
319 {
320   while (a != cell_nil && eq_p (x, CAAR (a)) == cell_f)
321     {
322       if (TYPE (a) == BROKEN_HEART || TYPE (CAR (a)) == BROKEN_HEART)
323         fprintf (stderr, "oops, broken heart\n");
324       a = CDR (a);
325     }
326   return a != cell_nil ? car (a) : cell_f;
327 }
328
329 SCM
330 assq_ref_cache (SCM x, SCM a)
331 {
332   x = assq (x, a);
333   if (x == cell_f) return cell_undefined;
334   return cdr (x);
335 }
336
337 SCM
338 assert_defined (SCM x, SCM e)
339 {
340   if (e == cell_undefined)
341     {
342       fprintf (stderr, "eval: unbound variable:");
343       display_ (stderr, x);
344       fprintf (stderr, "\n");
345       assert (!"unbound variable");
346     }
347   return e;
348 }
349
350 SCM
351 vm_evlis_env ()
352 {
353   if (r1 == cell_nil) return cell_nil;
354   if (TYPE (r1) != PAIR) return eval_env (r1, r0);
355   r2 = eval_env (car (r1), r0);
356   r1 = evlis_env (cdr (r1), r0);
357   return cons (r2, r1);
358 }
359
360 SCM
361 vm_call_lambda ()
362 {
363   return vm_call (vm_begin_env, r1, cell_undefined, r0);
364 }
365
366 SCM
367 call_lambda (SCM e, SCM x, SCM aa, SCM a) ///((internal))
368 {
369   SCM cl = cons (cons (cell_closure, x), x);
370   r1 = e;
371   r0 = cl;
372   r2 = a;
373   r3 = aa;
374   return vm_call_lambda ();
375 }
376
377 SCM
378 vm_apply_env ()
379 {
380   if (TYPE (r1) != PAIR)
381     {
382       if (TYPE (r1) == FUNCTION) return call (r1, r2);
383       if (r1 == cell_symbol_call_with_values)
384         return call_with_values_env (car (r2), cadr (r2), r0);
385       if (r1 == cell_symbol_current_module) return r0;
386     }
387   else
388     switch (car (r1))
389       {
390       case cell_symbol_lambda:
391         {
392           SCM args = cadr (r1);
393           SCM body = cddr (r1);
394           SCM p = pairlis (args, r2, r0);
395           return call_lambda (body, p, p, r0);
396         }
397       case cell_closure:
398         {
399           SCM args = caddr (r1);
400           SCM body = cdddr (r1);
401           SCM aa = cdadr (r1);
402           aa = cdr (aa);
403           SCM p = pairlis (args, r2, aa);
404           return call_lambda (body, p, aa, r0);
405         }
406 #if BOOT
407       case cell_symbol_label:
408         return apply_env (caddr (r1), r2, cons (cons (cadr (r1), caddr (r1)), r0));
409 #endif
410       }
411   SCM e = eval_env (r1, r0);
412   char const* type = 0;
413   if (e == cell_f || e == cell_t) type = "bool";
414   if (TYPE (e) == CHAR) type = "char";
415   if (TYPE (e) == NUMBER) type = "number";
416   if (TYPE (e) == STRING) type = "string";
417   if (e == cell_unspecified) type = "*unspecified*";
418   if (e == cell_undefined) type =  "*undefined*";
419   if (type)
420     {
421       fprintf (stderr, "cannot apply: %s: ", type);
422       display_ (stderr, e);
423       fprintf (stderr, " [");
424       display_ (stderr, r1);
425       fprintf (stderr, "]\n");
426       assert (!"cannot apply");
427     }
428   return apply_env (e, r2, r0);
429 }
430
431 SCM
432 vm_eval_env ()
433 {
434   switch (TYPE (r1))
435     {
436     case PAIR:
437       {
438         switch (car (r1))
439           {
440 #if FIXED_PRIMITIVES
441           case cell_symbol_car: return car (eval_env (CADR (r1), r0));
442           case cell_symbol_cdr: return cdr (eval_env (CADR (r1), r0));
443           case cell_symbol_cons: {SCM m = evlis_env (CDR (r1), r0);
444               return cons (CAR (m), CADR (m));}
445           case cell_symbol_null_p: return null_p (eval_env (CADR (r1), r0));
446 #endif // FIXED_PRIMITIVES
447           case cell_symbol_quote: return cadr (r1);
448 #if QUASISYNTAX
449           case cell_symbol_syntax: return cadr (r1);
450 #endif
451           case cell_symbol_begin: return begin_env (r1, r0);
452           case cell_symbol_lambda:
453             return make_closure (cadr (r1), cddr (r1), assq (cell_closure, r0));
454           case cell_closure: return r1;
455           case cell_symbol_if: return if_env (cdr (r1), r0);
456 #if !BOOT
457           case cell_symbol_define: return define_env (r1, r0);
458           case cell_symbol_define_macro: return define_env (r1, r0);
459 #endif
460 #if 1 //!BOOT
461           case cell_symbol_set_x: {
462             SCM x = eval_env (caddr (r1), r0); return set_env_x (cadr (r1), x, r0);
463           }
464 #endif
465 #if QUASIQUOTE
466           case cell_symbol_unquote: return eval_env (cadr (r1), r0);
467           case cell_symbol_quasiquote: return eval_quasiquote (cadr (r1), add_unquoters (r0));
468 #endif //QUASIQUOTE
469 #if QUASISYNTAX
470           case cell_symbol_unsyntax: return eval_env (cadr (r1), r0);
471           case cell_symbol_quasisyntax: return eval_quasisyntax (cadr (r1), add_unsyntaxers (r0));
472 #endif //QUASISYNTAX
473           default: {
474             SCM x = expand_macro_env (r1, r0);
475             if (x != r1) return eval_env (x, r0);
476             SCM m = evlis_env (CDR (r1), r0);
477             return apply_env (car (r1), m, r0);
478           }
479           }
480       }
481     case SYMBOL: return assert_defined (r1, assq_ref_cache (r1, r0));
482     default: return r1;
483     }
484 }
485
486 SCM
487 vm_expand_macro_env ()
488 {
489   if (TYPE (CAR (r1)) == STRING && string_to_symbol (CAR (r1)) == cell_symbol_noexpand)
490     return cadr (r1);
491
492   SCM macro;
493   SCM expanders;
494   if (TYPE (r1) == PAIR
495       && (macro = lookup_macro (car (r1), r0)) != cell_f)
496     return apply_env (macro, CDR (r1), r0);
497   else if (TYPE (r1) == PAIR
498            && TYPE (CAR (r1)) == SYMBOL
499            && ((expanders = assq_ref_cache (cell_symbol_sc_expander_alist, r0)) != cell_undefined)
500            && ((macro = assq (CAR (r1), expanders)) != cell_f))
501     {
502       SCM sc_expand = assq_ref_cache (cell_symbol_expand_macro, r0);
503       if (sc_expand != cell_undefined && sc_expand != cell_f)
504         r1 = apply_env (sc_expand, cons (r1, cell_nil), r0);
505     }
506   return r1;
507 }
508
509 SCM
510 vm_begin_env ()
511 {
512   SCM r = cell_unspecified;
513   while (r1 != cell_nil) {
514     if (TYPE (r1) == PAIR && TYPE (CAR (r1)) == PAIR)
515       {
516         if (caar (r1) == cell_symbol_begin)
517           r1 = append2 (cdar (r1), cdr (r1));
518         else if (caar (r1) == cell_symbol_primitive_load)
519           {
520             SCM f = read_input_file_env (r0);
521             r1 = append2 (f, cdr (r1));
522           }
523       }
524     r = eval_env (car (r1), r0);
525     r1 = CDR (r1);
526   }
527   return r;
528 }
529
530 SCM
531 vm_if_env ()
532 {
533   SCM x = eval_env (car (r1), r0);
534   if (x != cell_f)
535     return eval_env (cadr (r1), r0);
536   if (cddr (r1) != cell_nil)
537     return eval_env (caddr (r1), r0);
538   return cell_unspecified;
539 }
540
541 SCM
542 vm_call_with_values_env ()
543 {
544   SCM v = apply_env (r1, cell_nil, r0);
545   if (TYPE (v) == VALUES)
546     v = CDR (v);
547   return apply_env (r2, v, r0);
548 }
549
550 SCM
551 call (SCM fn, SCM x)
552 {
553   if ((FUNCTION (fn).arity > 0 || FUNCTION (fn).arity == -1)
554       && x != cell_nil && TYPE (CAR (x)) == VALUES)
555     x = cons (CADAR (x), CDR (x));
556   if ((FUNCTION (fn).arity > 1 || FUNCTION (fn).arity == -1)
557       && x != cell_nil && TYPE (CDR (x)) == PAIR && TYPE (CADR (x)) == VALUES)
558     x = cons (CAR (x), cons (CDADAR (x), CDR (x)));
559   switch (FUNCTION (fn).arity)
560     {
561     case 0: return FUNCTION (fn).function0 ();
562     case 1: return FUNCTION (fn).function1 (car (x));
563     case 2: return FUNCTION (fn).function2 (car (x), cadr (x));
564     case 3: return FUNCTION (fn).function3 (car (x), cadr (x), caddr (x));
565     case -1: return FUNCTION (fn).functionn (x);
566     }
567   return cell_unspecified;
568 }
569
570 SCM
571 gc_frame (SCM stack)
572 {
573   SCM frame = car (stack);
574   r1 = car (frame);
575   r2 = cadr (frame);
576   r3 = caddr (frame);
577   r0 = cadddr (frame);
578   return frame;
579 }
580
581 SCM
582 gc_stack (SCM a)
583 {
584   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
585   stack = cons (frame, stack);
586   stack = gc (stack);
587   gc_frame (stack);
588   stack = cdr (stack);
589   return stack;
590 }
591
592 SCM
593 vm_call (function0_t f, SCM p1, SCM p2, SCM a)
594 {
595   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
596   stack = cons (frame, stack);
597   r1 = p1;
598   r2 = p2;
599   r0 = a;
600   if (g_free.value + GC_SAFETY > ARENA_SIZE)
601     gc_stack (stack);
602
603   SCM r = f ();
604   frame = gc_frame (stack);
605   stack = cdr (stack);
606   return r;
607 }
608
609 SCM
610 evlis_env (SCM m, SCM a)
611 {
612   return vm_call (vm_evlis_env, m, cell_undefined, a);
613 }
614
615 SCM
616 apply_env (SCM fn, SCM x, SCM a)
617 {
618   return vm_call (vm_apply_env, fn, x, a);
619 }
620
621 SCM
622 eval_env (SCM e, SCM a)
623 {
624   return vm_call (vm_eval_env, e, cell_undefined, a);
625 }
626
627 SCM
628 expand_macro_env (SCM e, SCM a)
629 {
630   return vm_call (vm_expand_macro_env, e, cell_undefined, a);
631 }
632
633 SCM
634 begin_env (SCM e, SCM a)
635 {
636   return vm_call (vm_begin_env, e, cell_undefined, a);
637 }
638
639 SCM
640 if_env (SCM e, SCM a)
641 {
642   return vm_call (vm_if_env, e, cell_undefined, a);
643 }
644
645 SCM
646 call_with_values_env (SCM producer, SCM consumer, SCM a)
647 {
648   return vm_call (vm_call_with_values_env, producer, consumer, a);
649 }
650
651 SCM
652 append2 (SCM x, SCM y)
653 {
654   if (x == cell_nil) return y;
655   assert (TYPE (x) == PAIR);
656   return cons (car (x), append2 (cdr (x), y));
657 }
658
659 SCM
660 append (SCM x) ///((arity . n))
661  {
662   if (x == cell_nil) return cell_nil;
663   return append2 (car (x), append (cdr (x)));
664  }
665
666 SCM
667 make_char (int x)
668 {
669   g_cells[tmp_num].value = CHAR;
670   g_cells[tmp_num2].value = x;
671   return make_cell (tmp_num, tmp_num2, tmp_num2);
672 }
673
674 SCM
675 make_function (SCM name, SCM id, SCM arity)
676 {
677   g_cells[tmp_num3].value = FUNCTION;
678   function *f = (function*)malloc (sizeof (function));
679   f->arity = VALUE (arity);
680   g_cells[tmp_num4].value = (long)f;
681   return make_cell (tmp_num3, name, tmp_num4);
682 }
683
684 SCM
685 make_keyword (SCM s)
686 {
687   SCM x = internal_lookup_symbol (s);
688   x = x ? x : internal_make_symbol (s);
689   g_cells[tmp_num].value = KEYWORD;
690   return make_cell (tmp_num, STRING (x), 0);
691 }
692
693 SCM
694 make_macro (SCM name, SCM x)
695 {
696   g_cells[tmp_num].value = MACRO;
697   return make_cell (tmp_num, STRING (name), x);
698 }
699
700 SCM
701 make_number (int x)
702 {
703   g_cells[tmp_num].value = NUMBER;
704   g_cells[tmp_num2].value = x;
705   return make_cell (tmp_num, tmp_num2, tmp_num2);
706 }
707
708 SCM
709 make_ref (SCM x)
710 {
711   g_cells[tmp_num].value = REF;
712   return make_cell (tmp_num, x, x);
713 }
714
715 SCM
716 make_string (SCM x)
717 {
718   g_cells[tmp_num].value = STRING;
719   return make_cell (tmp_num, x, 0);
720 }
721
722 SCM
723 cstring_to_list (char const* s)
724 {
725   SCM p = cell_nil;
726   int i = strlen (s);
727   while (i--)
728     p = cons (make_char (s[i]), p);
729   return p;
730 }
731
732 SCM
733 null_p (SCM x)
734 {
735   return x == cell_nil ? cell_t : cell_f;
736 }
737
738 SCM
739 internal_make_symbol (SCM s)
740 {
741   g_cells[tmp_num].value = SYMBOL;
742   SCM x = make_cell (tmp_num, s, 0);
743   g_symbols = cons (x, g_symbols);
744   return x;
745 }
746
747 SCM
748 make_symbol (SCM s)
749 {
750   SCM x = internal_lookup_symbol (s);
751   return x ? x : internal_make_symbol (s);
752 }
753
754 SCM
755 make_vector (SCM n)
756 {
757   int k = VALUE (n);
758   g_cells[tmp_num].value = VECTOR;
759   SCM v = alloc (k);
760   SCM x = make_cell (tmp_num, k, v);
761   for (int i=0; i<k; i++) g_cells[v+i] = g_cells[vector_entry (cell_unspecified)];
762   return x;
763 }
764
765 SCM
766 values (SCM x) ///((arity . n))
767 {
768   SCM v = cons (0, x);
769   TYPE (v) = VALUES;
770   return v;
771 }
772
773 SCM
774 vector_length (SCM x)
775 {
776   assert (TYPE (x) == VECTOR);
777   return make_number (LENGTH (x));
778 }
779
780 SCM
781 vector_ref (SCM x, SCM i)
782 {
783   assert (TYPE (x) == VECTOR);
784   assert (VALUE (i) < LENGTH (x));
785   SCM e = VECTOR (x) + VALUE (i);
786   if (TYPE (e) == REF) e = g_cells[e].ref;
787   if (TYPE (e) == CHAR) e = make_char (VALUE (e));
788   if (TYPE (e) == NUMBER) e = make_number (VALUE (e));
789   return e;
790 }
791
792 SCM
793 vector_entry (SCM x) {
794   if (TYPE (x) == PAIR || TYPE (x) == SPECIAL || TYPE (x) == STRING || TYPE (x) == SYMBOL || TYPE (x) == VECTOR) x = make_ref (x);
795   return x;
796 }
797
798 SCM
799 vector_set_x (SCM x, SCM i, SCM e)
800 {
801   assert (TYPE (x) == VECTOR);
802   assert (VALUE (i) < LENGTH (x));
803   g_cells[VECTOR (x)+g_cells[i].value] = g_cells[vector_entry (e)];
804   return cell_unspecified;
805 }
806
807 SCM
808 list_to_vector (SCM x)
809 {
810   VALUE (tmp_num) = VALUE (length (x));
811   SCM v = make_vector (tmp_num);
812   SCM p = VECTOR (v);
813   while (x != cell_nil)
814     {
815       g_cells[p++] = g_cells[vector_entry (car (x))];
816       x = cdr (x);
817     }
818   return v;
819 }
820
821 FILE *g_stdin;
822 int
823 getchar ()
824 {
825   return getc (g_stdin);
826 }
827
828 int
829 ungetchar (int c)
830 {
831   return ungetc (c, g_stdin);
832 }
833
834 int
835 peekchar ()
836 {
837   int c = getchar ();
838   ungetchar (c);
839   return c;
840 }
841
842 SCM
843 peek_byte ()
844 {
845   return make_number (peekchar ());
846 }
847
848 SCM
849 read_byte ()
850 {
851   return make_number (getchar ());
852 }
853
854 SCM
855 unread_byte (SCM i)
856 {
857   ungetchar (VALUE (i));
858   return i;
859 }
860
861 SCM
862 write_char (SCM x) ///((arity . n))
863 {
864   SCM c = car (x);
865   SCM p = cdr (x);
866   int fd = 1;
867   if (TYPE (p) == PAIR && TYPE (car (p)) == NUMBER) fd = VALUE (car (p));
868   FILE *f = fd == 1 ? stdout : stderr;
869   assert (TYPE (c) == NUMBER || TYPE (c) == CHAR);
870   fputc (VALUE (c), f);
871   return c;
872 }
873
874 SCM
875 symbol_to_list (SCM x)
876 {
877   assert (TYPE (x) == SYMBOL);
878   return STRING (x);
879 }
880
881 SCM
882 char_to_integer (SCM x)
883 {
884   assert (TYPE (x) == CHAR);
885   return make_number (VALUE (x));
886 }
887
888 SCM
889 integer_to_char (SCM x)
890 {
891   assert (TYPE (x) == NUMBER);
892   return make_char (VALUE (x));
893 }
894
895 void
896 make_tmps (scm* cells)
897 {
898   tmp = g_free.value++;
899   cells[tmp].type = CHAR;
900   tmp_num = g_free.value++;
901   cells[tmp_num].type = NUMBER;
902   tmp_num2 = g_free.value++;
903   cells[tmp_num2].type = NUMBER;
904   tmp_num3 = g_free.value++;
905   cells[tmp_num3].type = NUMBER;
906   tmp_num4 = g_free.value++;
907   cells[tmp_num4].type = NUMBER;
908 }
909
910 //\f Jam Collector
911 SCM g_symbol_max;
912 bool g_debug = false;
913
914 SCM
915 gc_up_arena ()
916 {
917   ARENA_SIZE *= 2;
918   void *p = realloc (g_cells-1, 2*ARENA_SIZE*sizeof(scm));
919   if (!p)
920     {
921       if (g_debug) fprintf (stderr, "cannot up arena: %s: arena=%d\n", strerror (errno), 2*ARENA_SIZE);
922       return cell_unspecified;
923     }
924   g_cells = (scm*)p;
925   g_cells++;
926   gc_init_news ();
927 }
928
929 SCM
930 gc ()
931 {
932   if (g_debug) fprintf (stderr, "***gc[%d]...", g_free.value);
933   g_free.value = 1;
934   if (g_cells < g_news && ARENA_SIZE < MAX_ARENA_SIZE) gc_up_arena ();
935   for (int i=g_free.value; i<g_symbol_max; i++)
936     gc_copy (i);
937   make_tmps (g_news);
938   g_symbols = gc_copy (g_symbols);
939   SCM new = gc_copy (stack);
940   if (g_debug) fprintf (stderr, "new=%d\n", new, stack);
941   stack = new;
942   return gc_loop (1);
943 }
944
945 SCM
946 gc_loop (SCM scan)
947 {
948   while (scan < g_free.value)
949     {
950       if (NTYPE (scan) == KEYWORD
951           || NTYPE (scan) == MACRO
952           || NTYPE (scan) == PAIR
953           || NTYPE (scan) == REF
954           || scan == 1 // null
955           || NTYPE (scan) == SPECIAL
956           || NTYPE (scan) == STRING
957           || NTYPE (scan) == SYMBOL)
958         {
959           SCM car = gc_copy (g_news[scan].car);
960           gc_relocate_car (scan, car);
961         }
962       if ((NTYPE (scan) == MACRO
963            || NTYPE (scan) == PAIR
964            || NTYPE (scan) == VALUES)
965           && g_news[scan].cdr) // allow for 0 terminated list of symbols
966         {
967           SCM cdr = gc_copy (g_news[scan].cdr);
968           gc_relocate_cdr (scan, cdr);
969         }
970       scan++;
971     }
972   return gc_flip ();
973 }
974
975 SCM
976 gc_copy (SCM old)
977 {
978   if (TYPE (old) == BROKEN_HEART) return g_cells[old].car;
979   SCM new = g_free.value++;
980   g_news[new] = g_cells[old];
981   if (NTYPE (new) == VECTOR)
982     {
983       g_news[new].vector = g_free.value;
984       for (int i=0; i<LENGTH (old); i++)
985         g_news[g_free.value++] = g_cells[VECTOR (old)+i];
986     }
987   g_cells[old].type = BROKEN_HEART;
988   g_cells[old].car = new;
989   return new;
990 }
991
992 SCM
993 gc_relocate_car (SCM new, SCM car)
994 {
995   g_news[new].car = car;
996   return cell_unspecified;
997 }
998
999 SCM
1000 gc_relocate_cdr (SCM new, SCM cdr)
1001 {
1002   g_news[new].cdr = cdr;
1003   return cell_unspecified;
1004 }
1005
1006 SCM
1007 gc_flip ()
1008 {
1009   scm *cells = g_cells;
1010   g_cells = g_news;
1011   g_news = cells;
1012   if (g_debug) fprintf (stderr, " => jam[%d]\n", g_free.value);
1013   return stack;
1014 }
1015
1016 SCM
1017 gc_show ()
1018 {
1019   fprintf (stderr, "cells: ");
1020   scm *t = g_cells;
1021   display_ (stderr, -1);
1022   fprintf (stderr, "\n");
1023   if (g_news)
1024     {
1025       fprintf (stderr, "news: ");
1026       g_cells = g_news;
1027       display_ (stderr, -1);
1028       fprintf (stderr, "\n");
1029     }
1030   g_cells = t;
1031   return cell_unspecified;
1032 }
1033
1034 //\f Environment setup
1035 SCM
1036 acons (SCM key, SCM value, SCM alist)
1037 {
1038   return cons (cons (key, value), alist);
1039 }
1040
1041 SCM
1042 add_environment (SCM a, char const *name, SCM x)
1043 {
1044   return acons (make_symbol (cstring_to_list (name)), x, a);
1045 }
1046
1047 SCM
1048 gc_init_cells ()
1049 {
1050   g_cells = (scm *)malloc (2*ARENA_SIZE*sizeof(scm));
1051   g_cells[0].type = VECTOR;
1052   g_cells[0].length = 1000;
1053   g_cells[0].vector = 0;
1054   g_cells++;
1055   g_cells[0].type = CHAR;
1056   g_cells[0].value = 'c';
1057 }
1058
1059 SCM
1060 gc_init_news ()
1061 {
1062   g_news = g_cells-1 + ARENA_SIZE;
1063   g_news[0].type = VECTOR;
1064   g_news[0].length = 1000;
1065   g_news[0].vector = 0;
1066   g_news++;
1067   g_news[0].type = CHAR;
1068   g_news[0].value = 'n';
1069 }
1070
1071 SCM
1072 mes_symbols () ///((internal))
1073 {
1074   gc_init_cells ();
1075   gc_init_news ();
1076
1077 #include "mes.symbols.i"
1078
1079   g_symbol_max = g_free.value;
1080   make_tmps (g_cells);
1081
1082   g_symbols = 0;
1083   for (int i=1; i<g_symbol_max; i++)
1084     g_symbols = cons (i, g_symbols);
1085
1086   SCM a = cell_nil;
1087
1088 #if BOOT
1089   a = acons (cell_symbol_label, cell_t, a);
1090 #endif
1091   a = acons (cell_symbol_begin, cell_begin, a);
1092   a = add_environment (a, "sc-expand", cell_f);
1093   a = acons (cell_closure, a, a);
1094
1095   internal_lookup_symbol (cell_nil);
1096
1097   return a;
1098 }
1099
1100 SCM
1101 mes_builtins (SCM a)
1102 {
1103 #include "mes.i"
1104
1105 #include "define.i"
1106 #include "display.i"
1107 #include "lib.i"
1108 #include "math.i"
1109 #include "posix.i"
1110 #include "quasiquote.i"
1111 #include "reader.i"
1112 #include "string.i"
1113 #include "type.i"
1114
1115 #include "define.environment.i"
1116 #include "display.environment.i"
1117 #include "lib.environment.i"
1118 #include "math.environment.i"
1119 #include "mes.environment.i"
1120 #include "posix.environment.i"
1121   //#include "quasiquote.environment.i"
1122 #include "reader.environment.i"
1123 #include "string.environment.i"
1124 #include "type.environment.i"
1125
1126 #if QUASIQUOTE
1127   SCM cell_unquote = assq_ref_cache (cell_symbol_unquote, a);
1128   SCM cell_unquote_splicing = assq_ref_cache (cell_symbol_unquote_splicing, a);
1129   SCM the_unquoters = cons (cons (cell_symbol_unquote, cell_unquote),
1130                             cons (cons (cell_symbol_unquote_splicing, cell_unquote_splicing),
1131                                   cell_nil));
1132   a = acons (cell_symbol_the_unquoters, the_unquoters, a);
1133 #endif
1134 #if QUASISYNTAX
1135   SCM cell_unsyntax = assq_ref_cache (cell_symbol_unsyntax, a);
1136   SCM cell_unsyntax_splicing = assq_ref_cache (cell_symbol_unsyntax_splicing, a);
1137   SCM the_unsyntaxers = cons (cons (cell_symbol_unsyntax, cell_unsyntax),
1138                               cons (cons (cell_symbol_unsyntax_splicing, cell_unsyntax_splicing),
1139                                   cell_nil));
1140   a = acons (cell_symbol_the_unsyntaxers, the_unsyntaxers, a);
1141 #endif
1142
1143   a = add_environment (a, "*dot*", cell_dot);
1144   a = add_environment (a, "*foo-bar-baz*", cell_nil); // FIXME: some off-by one?
1145
1146   return a;
1147 }
1148
1149 SCM
1150 mes_stack (SCM a) ///((internal))
1151 {
1152   r0 = a;
1153   r1 = make_char (0);
1154   r2 = make_char (0);
1155   r3 = make_char (0);
1156   stack = cons (cell_nil, cell_nil);
1157   return r0;
1158 }
1159
1160 SCM
1161 mes_environment () ///((internal))
1162 {
1163   SCM a = mes_symbols ();
1164   return mes_stack (a);
1165 }
1166
1167 SCM
1168 make_lambda (SCM args, SCM body)
1169 {
1170   return cons (cell_symbol_lambda, cons (args, body));
1171 }
1172
1173 SCM
1174 make_closure (SCM args, SCM body, SCM a)
1175 {
1176   return cons (cell_closure, cons (cons (cell_circular, a), cons (args, body)));
1177 }
1178
1179 SCM
1180 lookup_macro (SCM x, SCM a)
1181 {
1182   if (TYPE (x) != SYMBOL) return cell_f;
1183   SCM m = assq_ref_cache (x, a);
1184   if (macro_p (m) == cell_t) return MACRO (m);
1185   return cell_f;
1186 }
1187
1188 SCM
1189 read_input_file_env_ (SCM e, SCM a)
1190 {
1191   if (e == cell_nil) return e;
1192   return cons (e, read_input_file_env_ (read_env (a), a));
1193 }
1194
1195 SCM
1196 read_input_file_env (SCM a)
1197 {
1198   r0 = a;
1199 #if READER
1200   return read_input_file_env_ (read_env (r0), r0);
1201 #endif
1202   return apply_env (cell_symbol_read_input_file, cell_nil, r0);
1203 }
1204
1205 SCM
1206 load_env (SCM a) ///((internal))
1207 {
1208   r0 =a;
1209 #if !READER
1210   g_stdin = fopen ("module/mes/read-0.mes", "r");
1211   g_stdin = g_stdin ? g_stdin : fopen (PREFIX "module/mes/read-0.mes", "r");
1212 #endif
1213   if (!g_function) r0 = mes_builtins (r0);
1214   r3 = read_input_file_env (r0);
1215   g_stdin = stdin;
1216   return r3;
1217 }
1218
1219 SCM
1220 bload_env (SCM a) ///((internal))
1221 {
1222   g_stdin = fopen ("module/mes/read-0.mo", "r");
1223   g_stdin = g_stdin ? g_stdin : fopen (PREFIX "module/mes/read-0.mo", "r");
1224   char *p = (char*)g_cells;
1225   assert (getchar () == 'M');
1226   assert (getchar () == 'E');
1227   assert (getchar () == 'S');
1228   stack = getchar () << 8;
1229   stack += getchar ();
1230   int c = getchar ();
1231   while (c != EOF)
1232     {
1233       *p++ = c;
1234       c = getchar ();
1235     }
1236   g_free.value = (p-(char*)g_cells) / sizeof (scm);
1237   gc_frame (stack);
1238   g_symbols = r1;
1239   g_stdin = stdin;
1240
1241   r0 = mes_builtins (r0);
1242   return r3;
1243 }
1244
1245 int
1246 dump ()
1247 {
1248   r1 = g_symbols;
1249   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
1250   stack = cons (frame, stack);
1251   stack = gc (stack);
1252   gc_frame (stack);
1253   char *p = (char*)g_cells;
1254   fputc ('M', stdout);
1255   fputc ('E', stdout);
1256   fputc ('S', stdout);
1257   fputc (stack >> 8, stdout);
1258   fputc (stack % 256, stdout);
1259   for (int i=0; i<g_free.value * sizeof(scm); i++)
1260     fputc (*p++, stdout);
1261   return 0;
1262 }
1263
1264 #include "type.c"
1265 #include "define.c"
1266 #include "display.c"
1267 #include "lib.c"
1268 #include "math.c"
1269 #include "posix.c"
1270 #include "quasiquote.c"
1271 #include "reader.c"
1272 #include "string.c"
1273
1274 int
1275 main (int argc, char *argv[])
1276 {
1277   g_debug = getenv ("MES_DEBUG");
1278   if (getenv ("MES_ARENA")) ARENA_SIZE = atoi (getenv ("MES_ARENA"));
1279   if (argc > 1 && !strcmp (argv[1], "--help")) return puts ("Usage: mes < FILE\n");
1280   if (argc > 1 && !strcmp (argv[1], "--version")) return puts ("Mes 0.3\n");
1281   g_stdin = stdin;
1282   r0 = mes_environment ();
1283   SCM program = (argc > 1 && !strcmp (argv[1], "--load"))
1284     ? bload_env (r0) : load_env (r0);
1285   if (argc > 1 && !strcmp (argv[1], "--dump")) return dump ();
1286   display_ (stderr, begin_env (program, r0));
1287   fputs ("", stderr);
1288   gc (stack);
1289   if (g_debug) fprintf (stderr, "\nstats: [%d]\n", g_free.value);
1290   return 0;
1291 }