core: Split-off cache, display, reader.
[mes.git] / mes.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #define _GNU_SOURCE
22 #include <assert.h>
23 #include <ctype.h>
24 #include <limits.h>
25 #include <stdio.h>
26 #include <string.h>
27 #include <stdlib.h>
28 #include <stdbool.h>
29
30 #define DEBUG 0
31 #define QUASIQUOTE 1
32 #define QUASISYNTAX 0
33 #define ENV_CACHE 1
34
35 int ARENA_SIZE = 200000000;
36 int GC_SAFETY = 10000;
37 int GC_FREE = 20000;
38
39 typedef long SCM;
40 enum type_t {CHAR, FUNCTION, MACRO, NUMBER, PAIR, SPECIAL, STRING, SYMBOL, REF, VALUES, VECTOR, BROKEN_HEART};
41 typedef SCM (*function0_t) (void);
42 typedef SCM (*function1_t) (SCM);
43 typedef SCM (*function2_t) (SCM, SCM);
44 typedef SCM (*function3_t) (SCM, SCM, SCM);
45 typedef SCM (*functionn_t) (SCM);
46 typedef struct function_t {
47   union {
48     function0_t function0;
49     function1_t function1;
50     function2_t function2;
51     function3_t function3;
52     functionn_t functionn;
53   };
54   int arity;
55 } function;
56 struct scm_t;
57 typedef struct scm_t {
58   enum type_t type;
59   union {
60     char const *name;
61     SCM string;
62     SCM car;
63     SCM ref;
64     int length;
65   };
66   union {
67     int value;
68     int function;
69     SCM cdr;
70     SCM macro;
71     SCM vector;
72     int hits;
73   };
74 } scm;
75
76 function functions[200];
77 int g_function = 0;
78
79 #include "mes.symbols.h"
80 #include "cache.h"
81 #include "define.h"
82 #include "display.h"
83 #include "lib.h"
84 #include "math.h"
85 #include "mes.h"
86 #include "posix.h"
87 #include "quasiquote.h"
88 #include "reader.h"
89 #include "string.h"
90 #include "type.h"
91
92 SCM symbols = 0;
93 SCM stack = 0;
94 SCM r0 = 0; // a/env
95 SCM r1 = 0; // param 1
96 SCM r2 = 0; // param 2
97 SCM r3 = 0; // param 3
98
99 SCM tmp;
100 SCM tmp_num;
101 SCM tmp_num2;
102 SCM tmp_num3;
103 SCM tmp_num4;
104
105 scm scm_nil = {SPECIAL, "()"};
106 scm scm_f = {SPECIAL, "#f"};
107 scm scm_t = {SPECIAL, "#t"};
108 scm scm_dot = {SPECIAL, "."};
109 scm scm_undefined = {SPECIAL, "*undefined*"};
110 scm scm_unspecified = {SPECIAL, "*unspecified*"};
111 scm scm_closure = {SPECIAL, "*closure*"};
112 scm scm_circular = {SPECIAL, "*circular*"};
113 #if BOOT
114 scm scm_label = {
115   SPECIAL, "label"};
116 #endif
117 scm scm_begin = {SPECIAL, "*begin*"};
118
119 scm scm_symbol_lambda = {SYMBOL, "lambda"};
120 scm scm_symbol_begin = {SYMBOL, "begin"};
121 scm scm_symbol_if = {SYMBOL, "if"};
122 scm scm_symbol_define = {SYMBOL, "define"};
123 scm scm_symbol_define_macro = {SYMBOL, "define-macro"};
124 scm scm_symbol_set_x = {SYMBOL, "set!"};
125
126 scm scm_symbol_quote = {SYMBOL, "quote"};
127 scm scm_symbol_quasiquote = {SYMBOL, "quasiquote"};
128 scm scm_symbol_unquote = {SYMBOL, "unquote"};
129 scm scm_symbol_unquote_splicing = {SYMBOL, "unquote-splicing"};
130
131 scm scm_symbol_sc_expand = {SYMBOL, "sc-expand"};
132 scm scm_symbol_expand_macro = {SYMBOL, "expand-macro"};
133 scm scm_symbol_sc_expander_alist = {SYMBOL, "*sc-expander-alist*"};
134 scm scm_symbol_noexpand = {SYMBOL, "noexpand"};
135 scm scm_symbol_syntax = {SYMBOL, "syntax"};
136 scm scm_symbol_quasisyntax = {SYMBOL, "quasisyntax"};
137 scm scm_symbol_unsyntax = {SYMBOL, "unsyntax"};
138 scm scm_symbol_unsyntax_splicing = {SYMBOL, "unsyntax-splicing"};
139
140 scm scm_symbol_call_with_values = {SYMBOL, "call-with-values"};
141 scm scm_symbol_current_module = {SYMBOL, "current-module"};
142 scm scm_symbol_primitive_load = {SYMBOL, "primitive-load"};
143
144 scm scm_symbol_the_unquoters = {SYMBOL, "*the-unquoters*"};
145
146 scm char_eof = {CHAR, .name="*eof*", .value=-1};
147 scm char_nul = {CHAR, .name="nul", .value=0};
148 scm char_backspace = {CHAR, .name="backspace", .value=8};
149 scm char_tab = {CHAR, .name="tab", .value=9};
150 scm char_newline = {CHAR, .name="newline", .value=10};
151 scm char_vt = {CHAR, .name="vt", .value=11};
152 scm char_page = {CHAR, .name="page", .value=12};
153 scm char_return = {CHAR, .name="return", .value=13};
154 scm char_space = {CHAR, .name="space", .value=32};
155
156 scm g_free = {NUMBER, .value=0};
157 scm *g_cells;
158 scm *g_news = 0;
159
160 #define CAR(x) g_cells[x].car
161 #define CDR(x) g_cells[x].cdr
162 #define HITS(x) g_cells[x].hits
163 #define LENGTH(x) g_cells[x].length
164 #define NAME(x) g_cells[x].name
165 #define STRING(x) g_cells[x].string
166 #define TYPE(x) g_cells[x].type
167 #define MACRO(x) g_cells[x].macro
168 #define REF(x) g_cells[x].ref
169 #define VALUE(x) g_cells[x].value
170 #define VECTOR(x) g_cells[x].vector
171 #define FUNCTION(x) functions[g_cells[x].function]
172 #define NCAR(x) g_news[x].car
173 #define NTYPE(x) g_news[x].type
174
175 #define CAAR(x) CAR (CAR (x))
176 #define CDAR(x) CDR (CAR (x))
177 #define CAAR(x) CAR (CAR (x))
178 #define CADAR(x) CAR (CDR (CAR (x)))
179 #define CDADAR(x) CAR (CDR (CAR (CDR (x))))
180 #define CADR(x) CAR (CDR (x))
181
182 SCM display_ (FILE* f, SCM x);
183 SCM vm_call (function0_t f, SCM p1, SCM p2, SCM a);
184
185 SCM
186 alloc (int n)
187 {
188   assert (g_free.value + n < ARENA_SIZE);
189   SCM x = g_free.value;
190   g_free.value += n;
191   return x;
192 }
193
194 SCM
195 make_cell (SCM type, SCM car, SCM cdr)
196 {
197   SCM x = alloc (1);
198   assert (TYPE (type) == NUMBER);
199   TYPE (x) = VALUE (type);
200   if (VALUE (type) == CHAR || VALUE (type) == NUMBER) {
201     if (car) CAR (x) = CAR (car);
202     if (cdr) CDR (x) = CDR (cdr);
203   } else if (VALUE (type) == FUNCTION) {
204     if (car) CAR (x) = car;
205     if (cdr) CDR (x) = CDR (cdr);
206   } else {
207     CAR (x) = car;
208     CDR (x) = cdr;
209   }
210   return x;
211 }
212
213 SCM
214 cons (SCM x, SCM y)
215 {
216   g_cells[tmp_num].value = PAIR;
217   return make_cell (tmp_num, x, y);
218 }
219
220 SCM
221 car (SCM x)
222 {
223   assert (TYPE (x) == PAIR);
224   return CAR (x);
225 }
226
227 SCM
228 cdr (SCM x)
229 {
230   assert (TYPE (x) == PAIR);
231   return CDR (x);
232 }
233
234 SCM
235 eq_p (SCM x, SCM y)
236 {
237   return (x == y
238           || (TYPE (x) == CHAR && TYPE (y) == CHAR
239               && VALUE (x) == VALUE (y))
240           || (TYPE (x) == NUMBER && TYPE (y) == NUMBER
241               && VALUE (x) == VALUE (y)))
242     ? cell_t : cell_f;
243 }
244
245 SCM
246 set_car_x (SCM x, SCM e)
247 {
248   assert (TYPE (x) == PAIR);
249   CAR (x) = e;
250   return cell_unspecified;
251 }
252
253 SCM
254 set_cdr_x (SCM x, SCM e)
255 {
256   assert (TYPE (x) == PAIR);
257   cache_invalidate (cdr (x));
258   CDR (x) = e;
259   return cell_unspecified;
260 }
261
262 SCM
263 set_env_x (SCM x, SCM e, SCM a)
264 {
265   cache_invalidate (x);
266   SCM p = assert_defined (x, assq (x, a));
267   return set_cdr_x (p, e);
268 }
269
270 SCM
271 quote (SCM x)
272 {
273   return cons (cell_symbol_quote, x);
274 }
275
276 SCM
277 quasiquote (SCM x)
278 {
279   return cons (cell_symbol_quasiquote, x);
280 }
281
282 SCM
283 quasisyntax (SCM x)
284 {
285   return cons (cell_symbol_quasisyntax, x);
286 }
287
288 SCM
289 pairlis (SCM x, SCM y, SCM a)
290 {
291   if (x == cell_nil)
292     return a;
293   if (pair_p (x) == cell_f)
294     return cons (cons (x, y), a);
295   return cons (cons (car (x), car (y)),
296                pairlis (cdr (x), cdr (y), a));
297 }
298
299 SCM
300 assq (SCM x, SCM a)
301 {
302   while (a != cell_nil && eq_p (x, CAAR (a)) == cell_f)
303     {
304       if (TYPE (a) == BROKEN_HEART || TYPE (CAR (a)) == BROKEN_HEART)
305         fprintf (stderr, "oops, broken heart\n");
306       a = CDR (a);
307     }
308   return a != cell_nil ? car (a) : cell_f;
309 }
310
311 #if! ENV_CACHE
312 SCM
313 assq_ref_cache (SCM x, SCM a)
314 {
315   x = assq (x, a);
316   if (x == cell_f) return cell_undefined;
317   return cdr (x);
318 }
319 #endif // !ENV_CACHE
320
321 SCM
322 assert_defined (SCM x, SCM e)
323 {
324   if (e == cell_undefined)
325     {
326       fprintf (stderr, "eval: unbound variable:");
327       display_ (stderr, x);
328       fprintf (stderr, "\n");
329       assert (!"unbound variable");
330     }
331   return e;
332 }
333
334 SCM
335 vm_evlis_env ()
336 {
337   if (r1 == cell_nil) return cell_nil;
338   if (TYPE (r1) != PAIR) return eval_env (r1, r0);
339   r2 = eval_env (car (r1), r0);
340   r1 = evlis_env (cdr (r1), r0);
341   return cons (r2, r1);
342 }
343
344 SCM
345 vm_call_lambda ()
346 {
347   return vm_call (vm_begin_env, r1, cell_undefined, r0);
348 }
349
350 SCM
351 call_lambda (SCM e, SCM x, SCM aa, SCM a) ///((internal))
352 {
353   SCM cl = cons (cons (cell_closure, x), x);
354   r1 = e;
355   r0 = cl;
356   r2 = a;
357   r3 = aa;
358   cache_invalidate_range (r0, CDR (r3));
359   SCM r = vm_call_lambda ();
360   cache_invalidate_range (r0, CDR (r3));
361   return r;
362 }
363
364 SCM
365 vm_apply_env ()
366 {
367   if (TYPE (r1) != PAIR)
368     {
369       if (TYPE (r1) == FUNCTION) return call (r1, r2);
370       if (r1 == cell_symbol_call_with_values)
371         return call_with_values_env (car (r2), cadr (r2), r0);
372       if (r1 == cell_symbol_current_module) return r0;
373     }
374   else if (car (r1) == cell_symbol_lambda) {
375     SCM args = cadr (r1);
376     SCM body = cddr (r1);
377     SCM p = pairlis (args, r2, r0);
378     return call_lambda (body, p, p, r0);
379   }
380   else if (car (r1) == cell_closure) {
381     SCM args = caddr (r1);
382     SCM body = cdddr (r1);
383     SCM aa = cdadr (r1);
384     aa = cdr (aa);
385     SCM p = pairlis (args, r2, aa);
386     return call_lambda (body, p, aa, r0);
387   }
388 #if BOOT
389   else if (car (r1) == cell_symbol_label)
390     return apply_env (caddr (r1), r2, cons (cons (cadr (r1), caddr (r1)), r0));
391 #endif
392   SCM e = eval_env (r1, r0);
393   char const* type = 0;
394   if (e == cell_f || e == cell_t) type = "bool";
395   if (TYPE (e) == CHAR) type = "char";
396   if (TYPE (e) == NUMBER) type = "number";
397   if (TYPE (e) == STRING) type = "string";
398   if (e == cell_unspecified) type = "*unspecified*";
399   if (e == cell_undefined) type =  "*undefined*";
400   if (type)
401     {
402       fprintf (stderr, "cannot apply: %s: ", type);
403       display_ (stderr, e);
404       fprintf (stderr, " [");
405       display_ (stderr, r1);
406       fprintf (stderr, "]\n");
407       assert (!"cannot apply");
408     }
409   return apply_env (e, r2, r0);
410 }
411
412 SCM
413 vm_eval_env ()
414 {
415   switch (TYPE (r1))
416     {
417     case PAIR:
418       {
419         if (car (r1) == cell_symbol_quote)
420           return cadr (r1);
421 #if QUASISYNTAX
422         if (car (r1) == cell_symbol_syntax)
423           return r1;
424 #endif
425         if (car (r1) == cell_symbol_begin)
426           return begin_env (r1, r0);
427         if (car (r1) == cell_symbol_lambda)
428           return make_closure (cadr (r1), cddr (r1), assq (cell_closure, r0));
429         if (car (r1) == cell_closure)
430           return r1;
431         if (car (r1) == cell_symbol_if)
432           return if_env (cdr (r1), r0);
433 #if !BOOT
434         if (car (r1) == cell_symbol_define)
435           return define_env (r1, r0);
436         if (car (r1) == cell_symbol_define_macro)
437           return define_env (r1, r0);
438         if (car (r1) == cell_symbol_primitive_load)
439           return begin_env (read_input_file_env (r0), r0);
440 #else
441         if (car (r1) == cell_symbol_define) {
442         fprintf (stderr, "C DEFINE: ");
443         display_ (stderr,
444                   TYPE (cadr (r1)) == SYMBOL
445                   ? STRING (cadr (r1))
446                   : STRING (caadr (r1)));
447         fprintf (stderr, "\n");
448       }
449       assert (car (r1) != cell_symbol_define);
450       assert (car (r1) != cell_symbol_define_macro);
451 #endif
452 #if 1 //!BOOT
453       if (car (r1) == cell_symbol_set_x)
454         return set_env_x (cadr (r1), eval_env (caddr (r1), r0), r0);
455 #else
456       assert (car (r1) != cell_symbol_set_x);
457 #endif
458 #if QUASIQUOTE
459       if (car (r1) == cell_symbol_unquote)
460         return eval_env (cadr (r1), r0);
461       if (car (r1) == cell_symbol_quasiquote)
462         return eval_quasiquote (cadr (r1), add_unquoters (r0));
463 #endif //QUASIQUOTE
464 #if QUASISYNTAX
465       if (car (r1) == cell_symbol_unsyntax)
466         return eval_env (cadr (r1), r0);
467       if (car (r1) == cell_symbol_quasisyntax)
468         return eval_quasisyntax (cadr (r1), add_unsyntaxers (r0));
469 #endif //QUASISYNTAX
470       SCM x = expand_macro_env (r1, r0);
471       if (x != r1)
472           return eval_env (x, r0);
473       SCM m = evlis_env (CDR (r1), r0);
474       return apply_env (car (r1), m, r0);
475       }
476     case SYMBOL: return assert_defined (r1, assq_ref_cache (r1, r0));
477     default: return r1;
478     }
479 }
480
481 SCM
482 vm_expand_macro_env ()
483 {
484   if (TYPE (CAR (r1)) == STRING && string_to_symbol (CAR (r1)) == cell_symbol_noexpand)
485     return cadr (r1);
486
487   SCM macro;
488   SCM expanders;
489   if (TYPE (r1) == PAIR
490       && (macro = lookup_macro (car (r1), r0)) != cell_f)
491     return apply_env (macro, CDR (r1), r0);
492   else if (TYPE (r1) == PAIR
493            && TYPE (CAR (r1)) == SYMBOL
494            && ((expanders = assq_ref_cache (cell_symbol_sc_expander_alist, r0)) != cell_undefined)
495            && ((macro = assq (CAR (r1), expanders)) != cell_f))
496     {
497       SCM sc_expand = assq_ref_cache (cell_symbol_expand_macro, r0);
498       if (sc_expand != cell_undefined && sc_expand != cell_f)
499         r1 = apply_env (sc_expand, cons (r1, cell_nil), r0);
500     }
501   return r1;
502 }
503
504 SCM
505 vm_begin_env ()
506 {
507   SCM r = cell_unspecified;
508   while (r1 != cell_nil) {
509     if (TYPE (r1) == PAIR && TYPE (CAR (r1)) == PAIR && caar (r1) == cell_symbol_begin)
510       r1 = append2 (cdar (r1), cdr (r1));
511     r = eval_env (car (r1), r0);
512     r1 = CDR (r1);
513   }
514   return r;
515 }
516
517 SCM
518 vm_if_env ()
519 {
520   SCM x = eval_env (car (r1), r0);
521   if (x != cell_f)
522     return eval_env (cadr (r1), r0);
523   if (cddr (r1) != cell_nil)
524     return eval_env (caddr (r1), r0);
525   return cell_unspecified;
526 }
527
528 SCM
529 call (SCM fn, SCM x)
530 {
531   if ((FUNCTION (fn).arity > 0 || FUNCTION (fn).arity == -1)
532       && x != cell_nil && TYPE (CAR (x)) == VALUES)
533     x = cons (CADAR (x), CDR (x));
534   if ((FUNCTION (fn).arity > 1 || FUNCTION (fn).arity == -1)
535       && x != cell_nil && TYPE (CDR (x)) == PAIR && TYPE (CADR (x)) == VALUES)
536     x = cons (CAR (x), cons (CDADAR (x), CDR (x)));
537   switch (FUNCTION (fn).arity)
538     {
539     case 0: return FUNCTION (fn).function0 ();
540     case 1: return FUNCTION (fn).function1 (car (x));
541     case 2: return FUNCTION (fn).function2 (car (x), cadr (x));
542     case 3: return FUNCTION (fn).function3 (car (x), cadr (x), caddr (x));
543     case -1: return FUNCTION (fn).functionn (x);
544     }
545   return cell_unspecified;
546 }
547
548 SCM
549 gc_frame (SCM stack)
550 {
551   SCM frame = car (stack);
552   r1 = car (frame);
553   r2 = cadr (frame);
554   r3 = caddr (frame);
555   r0 = cadddr (frame);
556   return frame;
557 }
558
559 SCM
560 gc_stack (SCM a)
561 {
562   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
563   stack = cons (frame, stack);
564   stack = gc (stack);
565   gc_frame (stack);
566   stack = cdr (stack);
567   return stack;
568 }
569
570 SCM
571 vm_call (function0_t f, SCM p1, SCM p2, SCM a)
572 {
573   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
574   stack = cons (frame, stack);
575   r1 = p1;
576   r2 = p2;
577   r0 = a;
578   if (g_free.value + GC_SAFETY > ARENA_SIZE)
579     {
580       cache_invalidate_range (r0, cell_nil);
581       gc_stack (stack);
582       frame = car (stack);
583     }
584
585   SCM r = f ();
586   frame = gc_frame (stack);
587   stack = cdr (stack);
588   return r;
589 }
590
591 SCM
592 evlis_env (SCM m, SCM a)
593 {
594   return vm_call (vm_evlis_env, m, cell_undefined, a);
595 }
596
597 SCM
598 apply_env (SCM fn, SCM x, SCM a)
599 {
600   return vm_call (vm_apply_env, fn, x, a);
601 }
602
603 SCM
604 eval_env (SCM e, SCM a)
605 {
606   return vm_call (vm_eval_env, e, cell_undefined, a);
607 }
608
609 SCM
610 expand_macro_env (SCM e, SCM a)
611 {
612   return vm_call (vm_expand_macro_env, e, cell_undefined, a);
613 }
614
615 SCM
616 begin_env (SCM e, SCM a)
617 {
618   return vm_call (vm_begin_env, e, cell_undefined, a);
619 }
620
621 SCM
622 if_env (SCM e, SCM a)
623 {
624   return vm_call (vm_if_env, e, cell_undefined, a);
625 }
626
627 SCM
628 append2 (SCM x, SCM y)
629 {
630   if (x == cell_nil) return y;
631   assert (TYPE (x) == PAIR);
632   return cons (car (x), append2 (cdr (x), y));
633 }
634
635 SCM
636 append (SCM x) ///((arity . n))
637  {
638   if (x == cell_nil) return cell_nil;
639   return append2 (car (x), append (cdr (x)));
640  }
641
642 SCM
643 make_char (int x)
644 {
645   g_cells[tmp_num].value = CHAR;
646   g_cells[tmp_num2].value = x;
647   return make_cell (tmp_num, tmp_num2, tmp_num2);
648 }
649
650 SCM
651 make_function (SCM name, SCM id, SCM arity)
652 {
653   g_cells[tmp_num3].value = FUNCTION;
654   function *f = (function*)malloc (sizeof (function));
655   f->arity = VALUE (arity);
656   g_cells[tmp_num4].value = (long)f;
657   return make_cell (tmp_num3, name, tmp_num4);
658 }
659
660 SCM
661 make_macro (SCM name, SCM x)
662 {
663   g_cells[tmp_num].value = MACRO;
664   return make_cell (tmp_num, STRING (name), x);
665 }
666
667 SCM
668 make_number (int x)
669 {
670   g_cells[tmp_num].value = NUMBER;
671   g_cells[tmp_num2].value = x;
672   return make_cell (tmp_num, tmp_num2, tmp_num2);
673 }
674
675 SCM
676 make_ref (SCM x)
677 {
678   g_cells[tmp_num].value = REF;
679   return make_cell (tmp_num, x, x);
680 }
681
682 SCM
683 make_string (SCM x)
684 {
685   g_cells[tmp_num].value = STRING;
686   return make_cell (tmp_num, x, 0);
687 }
688
689 SCM
690 cstring_to_list (char const* s)
691 {
692   SCM p = cell_nil;
693   int i = strlen (s);
694   while (i--)
695     p = cons (make_char (s[i]), p);
696   return p;
697 }
698
699 SCM
700 null_p (SCM x)
701 {
702   return x == cell_nil ? cell_t : cell_f;
703 }
704
705 SCM
706 internal_make_symbol (SCM s)
707 {
708   g_cells[tmp_num].value = SYMBOL;
709   SCM x = make_cell (tmp_num, s, 0);
710   symbols = cons (x, symbols);
711   return x;
712 }
713
714 SCM
715 make_symbol (SCM s)
716 {
717   SCM x = internal_lookup_symbol (s);
718   return x ? x : internal_make_symbol (s);
719 }
720
721 SCM
722 make_vector (SCM n)
723 {
724   int k = VALUE (n);
725   g_cells[tmp_num].value = VECTOR;
726   SCM v = alloc (k);
727   SCM x = make_cell (tmp_num, k, v);
728   for (int i=0; i<k; i++) g_cells[v+i] = g_cells[vector_entry (cell_unspecified)];
729   return x;
730 }
731
732 SCM
733 values (SCM x) ///((arity . n))
734 {
735   SCM v = cons (0, x);
736   TYPE (v) = VALUES;
737   return v;
738 }
739
740 SCM
741 call_with_values_env (SCM producer, SCM consumer, SCM a)
742 {
743   SCM v = apply_env (producer, cell_nil, a);
744   if (TYPE (v) == VALUES)
745     v = CDR (v);
746   return apply_env (consumer, v, a);
747 }
748
749 SCM
750 vector_length (SCM x)
751 {
752   assert (TYPE (x) == VECTOR);
753   return make_number (LENGTH (x));
754 }
755
756 SCM
757 vector_ref (SCM x, SCM i)
758 {
759   assert (TYPE (x) == VECTOR);
760   assert (VALUE (i) < LENGTH (x));
761   SCM e = VECTOR (x) + VALUE (i);
762   if (TYPE (e) == REF) e = g_cells[e].ref;
763   if (TYPE (e) == CHAR) e = make_char (VALUE (e));
764   if (TYPE (e) == NUMBER) e = make_number (VALUE (e));
765   return e;
766 }
767
768 SCM
769 vector_entry (SCM x) {
770   if (TYPE (x) == PAIR || TYPE (x) == SPECIAL || TYPE (x) == STRING || TYPE (x) == SYMBOL || TYPE (x) == VECTOR) x = make_ref (x);
771   return x;
772 }
773
774 SCM
775 vector_set_x (SCM x, SCM i, SCM e)
776 {
777   assert (TYPE (x) == VECTOR);
778   assert (VALUE (i) < LENGTH (x));
779   g_cells[VECTOR (x)+g_cells[i].value] = g_cells[vector_entry (e)];
780   return cell_unspecified;
781 }
782
783 SCM
784 list_to_vector (SCM x)
785 {
786   VALUE (tmp_num) = VALUE (length (x));
787   SCM v = make_vector (tmp_num);
788   SCM p = VECTOR (v);
789   while (x != cell_nil)
790     {
791       g_cells[p++] = g_cells[vector_entry (car (x))];
792       x = cdr (x);
793     }
794   return v;
795 }
796
797 FILE *g_stdin;
798 int
799 getchar ()
800 {
801   return getc (g_stdin);
802 }
803
804 int
805 ungetchar (int c)
806 {
807   return ungetc (c, g_stdin);
808 }
809
810 int
811 peekchar ()
812 {
813   int c = getchar ();
814   ungetchar (c);
815   return c;
816 }
817
818 SCM
819 peek_byte ()
820 {
821   return make_number (peekchar ());
822 }
823
824 SCM
825 read_byte ()
826 {
827   return make_number (getchar ());
828 }
829
830 SCM
831 unread_byte (SCM i)
832 {
833   return ungetchar (VALUE (i));
834 }
835
836 SCM
837 write_char (SCM x) ///((arity . n))
838 {
839   SCM c = car (x);
840   SCM p = cdr (x);
841   int fd = 1;
842   if (TYPE (p) == PAIR && TYPE (car (p)) == NUMBER) fd = VALUE (car (p));
843   FILE *f = fd == 1 ? stdout : stderr;
844   assert (TYPE (c) == NUMBER || TYPE (c) == CHAR);
845   fputc (VALUE (c), f);
846   return c;
847 }
848
849 SCM
850 symbol_to_list (SCM x)
851 {
852   assert (TYPE (x) == SYMBOL);
853   return STRING (x);
854 }
855
856 SCM
857 char_to_integer (SCM x)
858 {
859   assert (TYPE (x) == CHAR);
860   return make_number (VALUE (x));
861 }
862
863 SCM
864 integer_to_char (SCM x)
865 {
866   assert (TYPE (x) == NUMBER);
867   return make_char (VALUE (x));
868 }
869
870 //\f Jam Collector
871 SCM g_start;
872 scm *
873 gc_news ()
874 {
875   g_news = (scm *)malloc (ARENA_SIZE*sizeof(scm));
876   g_news[0].type = VECTOR;
877   g_news[0].length = 1000;
878   g_news[0].vector = 0;
879   g_news++;
880   g_news[0].type = CHAR;
881   g_news[0].value = 'n';
882   return g_news;
883 }
884
885 SCM
886 gc ()
887 {
888   fprintf (stderr, "***gc[%d]...", g_free.value);
889   g_free.value = 1;
890   if (!g_news)
891     gc_news ();
892   for (int i=g_free.value; i<g_start; i++)
893     gc_copy (i);
894   symbols = gc_copy (symbols);
895   SCM new = gc_copy (stack);
896   fprintf (stderr, "new=%d, start=%d\n", new, stack);
897   stack = new;
898   return gc_loop (1);
899 }
900
901 SCM
902 gc_loop (SCM scan)
903 {
904   while (scan < g_free.value)
905     {
906       if (NTYPE (scan) == MACRO
907           || NTYPE (scan) == PAIR
908           || NTYPE (scan) == REF
909           || scan == 1
910           || ((NTYPE (scan) == SPECIAL && TYPE (NCAR (scan)) == PAIR)
911               || (NTYPE (scan) == STRING && TYPE (NCAR (scan)) == PAIR)
912               || (NTYPE (scan) == SYMBOL && TYPE (NCAR (scan)) == PAIR)))
913         {
914           SCM car = gc_copy (g_news[scan].car);
915           gc_relocate_car (scan, car);
916         }
917       if ((NTYPE (scan) == MACRO
918            || NTYPE (scan) == PAIR
919            || NTYPE (scan) == VALUES)
920           && g_news[scan].cdr) // allow for 0 terminated list of symbols
921         {
922           SCM cdr = gc_copy (g_news[scan].cdr);
923           gc_relocate_cdr (scan, cdr);
924         }
925       scan++;
926     }
927   return gc_flip ();
928 }
929
930 SCM
931 gc_copy (SCM old)
932 {
933   if (TYPE (old) == BROKEN_HEART) return g_cells[old].car;
934   SCM new = g_free.value++;
935   g_news[new] = g_cells[old];
936   if (NTYPE (new) == VECTOR)
937     {
938       g_news[new].vector = g_free.value;
939       for (int i=0; i<LENGTH (old); i++)
940         g_news[g_free.value++] = g_cells[VECTOR (old)+i];
941     }
942   g_cells[old].type = BROKEN_HEART;
943   g_cells[old].car = new;
944   return new;
945 }
946
947 SCM
948 gc_relocate_car (SCM new, SCM car)
949 {
950   g_news[new].car = car;
951   return cell_unspecified;
952 }
953
954 SCM
955 gc_relocate_cdr (SCM new, SCM cdr)
956 {
957   g_news[new].cdr = cdr;
958   return cell_unspecified;
959 }
960
961 SCM
962 gc_flip ()
963 {
964   scm *cells = g_cells;
965   g_cells = g_news;
966   g_news = cells;
967   fprintf (stderr, " => jam[%d]\n", g_free.value);
968   return stack;
969 }
970
971 SCM
972 gc_show ()
973 {
974   fprintf (stderr, "cells: ");
975   scm *t = g_cells;
976   display_ (stderr, -1);
977   fprintf (stderr, "\n");
978   if (g_news)
979     {
980       fprintf (stderr, "news: ");
981       g_cells = g_news;
982       display_ (stderr, -1);
983       fprintf (stderr, "\n");
984     }
985   g_cells = t;
986   return cell_unspecified;
987 }
988
989 //\f Environment setup
990 SCM
991 acons (SCM key, SCM value, SCM alist)
992 {
993   return cons (cons (key, value), alist);
994 }
995
996 SCM
997 add_environment (SCM a, char const *name, SCM x)
998 {
999   return acons (make_symbol (cstring_to_list (name)), x, a);
1000 }
1001
1002 SCM
1003 mes_symbols () ///((internal))
1004 {
1005   g_cells = (scm *)malloc (ARENA_SIZE*sizeof(scm));
1006   g_cells[0].type = VECTOR;
1007   g_cells[0].length = 1000;
1008   g_cells[0].vector = 0;
1009   g_cells++;
1010
1011   g_cells[0].type = CHAR;
1012   g_cells[0].value = 'c';
1013   g_free.value = 1; // 0 is tricky
1014
1015 #include "mes.symbols.i"
1016
1017   SCM symbol_max = g_free.value;
1018
1019   tmp = g_free.value++;
1020   tmp_num = g_free.value++;
1021   g_cells[tmp_num].type = NUMBER;
1022   tmp_num2 = g_free.value++;
1023   g_cells[tmp_num2].type = NUMBER;
1024   tmp_num3 = g_free.value++;
1025   g_cells[tmp_num3].type = NUMBER;
1026   tmp_num4 = g_free.value++;
1027   g_cells[tmp_num4].type = NUMBER;
1028
1029   g_start = g_free.value;
1030
1031   symbols = 0;
1032   for (int i=1; i<symbol_max; i++)
1033     symbols = cons (i, symbols);
1034
1035   SCM a = cell_nil;
1036
1037 #if BOOT
1038   a = acons (cell_symbol_label, cell_t, a);
1039 #endif
1040   a = acons (cell_symbol_begin, cell_begin, a);
1041   a = add_environment (a, "sc-expand", cell_f);
1042   a = acons (cell_closure, a, a);
1043
1044   internal_lookup_symbol (cell_nil);
1045
1046   return a;
1047 }
1048
1049 SCM
1050 mes_builtins (SCM a)
1051 {
1052 #include "mes.i"
1053
1054 #include "cache.i"
1055 #include "define.i"
1056 #include "display.i"
1057 #include "lib.i"
1058 #include "math.i"
1059 #include "posix.i"
1060 #include "quasiquote.i"
1061 #include "reader.i"
1062 #include "string.i"
1063 #include "type.i"
1064
1065 #include "cache.environment.i"
1066 #include "define.environment.i"
1067 #include "display.environment.i"
1068 #include "lib.environment.i"
1069 #include "math.environment.i"
1070 #include "mes.environment.i"
1071 #include "posix.environment.i"
1072   //#include "quasiquote.environment.i"
1073 #include "reader.environment.i"
1074 #include "string.environment.i"
1075 #include "type.environment.i"
1076
1077   SCM cell_unquote = assq_ref_cache (cell_symbol_unquote, a);
1078   SCM cell_unquote_splicing = assq_ref_cache (cell_symbol_unquote_splicing, a);
1079   SCM the_unquoters = cons (cons (cell_symbol_unquote, cell_unquote),
1080                             cons (cons (cell_symbol_unquote_splicing, cell_unquote_splicing),
1081                                   cell_nil));
1082   a = acons (cell_symbol_the_unquoters, the_unquoters, a);
1083
1084   a = add_environment (a, "*foo-bar-baz*", cell_nil); // FIXME: some off-by one?
1085
1086   return a;
1087 }
1088
1089 SCM
1090 mes_stack (SCM a) ///((internal))
1091 {
1092   r0 = a;
1093   r1 = make_char (0);
1094   r2 = make_char (0);
1095   r3 = make_char (0);
1096   stack = cons (cell_nil, cell_nil);
1097   return r0;
1098 }
1099
1100 SCM
1101 mes_environment () ///((internal))
1102 {
1103   SCM a = mes_symbols ();
1104   return mes_stack (a);
1105 }
1106
1107 SCM
1108 make_lambda (SCM args, SCM body)
1109 {
1110   return cons (cell_symbol_lambda, cons (args, body));
1111 }
1112
1113 SCM
1114 make_closure (SCM args, SCM body, SCM a)
1115 {
1116   return cons (cell_closure, cons (cons (cell_circular, a), cons (args, body)));
1117 }
1118
1119 SCM
1120 lookup_macro (SCM x, SCM a)
1121 {
1122   if (TYPE (x) != SYMBOL) return cell_f;
1123   SCM m = assq_ref_cache (x, a);
1124   if (macro_p (m) == cell_t) return MACRO (m);
1125   return cell_f;
1126 }
1127
1128 SCM
1129 read_input_file_env_ (SCM e, SCM a)
1130 {
1131   if (e == cell_nil) return e;
1132   return cons (e, read_input_file_env_ (read_env (a), a));
1133 }
1134
1135 SCM
1136 read_input_file_env (SCM a)
1137 {
1138   return read_input_file_env_ (read_env (r0), r0);
1139 }
1140
1141 bool g_dump_p = false;
1142
1143 SCM
1144 load_env (SCM a)
1145 {
1146   r3 = read_input_file_env (r0);
1147   if (g_dump_p && !g_function)
1148     {
1149       r1 = symbols;
1150       SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
1151       stack = cons (frame, stack);
1152       stack = gc (stack);
1153       gc_frame (stack);
1154       char *p = (char*)g_cells;
1155       fputc ('M', stdout);
1156       fputc ('E', stdout);
1157       fputc ('S', stdout);
1158       fputc (stack >> 8, stdout);
1159       fputc (stack % 256, stdout);
1160       for (int i=0; i<g_free.value * sizeof(scm); i++)
1161         fputc (*p++, stdout);
1162       return 0;
1163     }
1164   if (!g_function)
1165     r0 = mes_builtins (r0);
1166   return begin_env (r3, r0);
1167 }
1168
1169 SCM
1170 bload_env (SCM a)
1171 {
1172   g_stdin = fopen ("read-0.mo", "r");
1173   char *p = (char*)g_cells;
1174   assert (getchar () == 'M');
1175   assert (getchar () == 'E');
1176   assert (getchar () == 'S');
1177   stack = getchar () << 8;
1178   stack += getchar ();
1179   int c = getchar ();
1180   while (c != EOF)
1181     {
1182       *p++ = c;
1183       c = getchar ();
1184     }
1185   g_free.value = (p-(char*)g_cells) / sizeof (scm);
1186   gc_frame (stack);
1187   symbols = r1;
1188   g_stdin = stdin;
1189
1190   r0 = mes_builtins (r0);
1191
1192   return begin_env (r3, r0);
1193 }
1194
1195 #include "type.c"
1196 #include "cache.c"
1197 #include "define.c"
1198 #include "display.c"
1199 #include "lib.c"
1200 #include "math.c"
1201 #include "posix.c"
1202 #include "quasiquote.c"
1203 #include "reader.c"
1204 #include "string.c"
1205
1206 int
1207 main (int argc, char *argv[])
1208 {
1209   if (argc > 1 && !strcmp (argv[1], "--dump")) g_dump_p = true;
1210   if (argc > 1 && !strcmp (argv[1], "--help")) return puts ("Usage: mes < FILE\n");
1211   if (argc > 1 && !strcmp (argv[1], "--version")) return puts ("Mes 0.2\n");
1212   g_stdin = stdin;
1213   SCM a = mes_environment ();
1214   if (argc > 1 && !strcmp (argv[1], "--load"))
1215     display_ (stderr, bload_env (a));
1216   else
1217     display_ (stderr, load_env (a));
1218   fputs ("", stderr);
1219   gc (stack);
1220   fprintf (stderr, "\nstats: [%d]\n", g_free.value);
1221   return 0;
1222 }