bee6a3946255e564f0ec2c296bed43a94156dbc4
[mes.git] / mes.c
1 /* -*-comment-start: "//";comment-end:""-*-
2  * Mes --- Maxwell Equations of Software
3  * Copyright © 2016 Jan Nieuwenhuizen <janneke@gnu.org>
4  *
5  * This file is part of Mes.
6  *
7  * Mes is free software; you can redistribute it and/or modify it
8  * under the terms of the GNU General Public License as published by
9  * the Free Software Foundation; either version 3 of the License, or (at
10  * your option) any later version.
11  *
12  * Mes is distributed in the hope that it will be useful, but
13  * WITHOUT ANY WARRANTY; without even the implied warranty of
14  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
15  * GNU General Public License for more details.
16  *
17  * You should have received a copy of the GNU General Public License
18  * along with Mes.  If not, see <http://www.gnu.org/licenses/>.
19  */
20
21 #define _GNU_SOURCE
22 #include <assert.h>
23 #include <ctype.h>
24 #include <errno.h>
25 #include <limits.h>
26 #include <stdio.h>
27 #include <string.h>
28 #include <stdlib.h>
29 #include <stdbool.h>
30
31 #define DEBUG 0
32 #define QUASIQUOTE 1
33 #define QUASISYNTAX 0
34 #define ENV_CACHE 0
35 #define FIXED_PRIMITIVES 1
36 #define READER 1
37
38 #if READER
39 int ARENA_SIZE = 1000000;
40 #else
41 int ARENA_SIZE = 100000;
42 #endif
43 int MAX_ARENA_SIZE = 20000000;
44 int GC_SAFETY = 100;
45
46 typedef long SCM;
47 enum type_t {CHAR, FUNCTION, MACRO, NUMBER, PAIR, SPECIAL, STRING, SYMBOL, REF, VALUES, VECTOR, BROKEN_HEART};
48 typedef SCM (*function0_t) (void);
49 typedef SCM (*function1_t) (SCM);
50 typedef SCM (*function2_t) (SCM, SCM);
51 typedef SCM (*function3_t) (SCM, SCM, SCM);
52 typedef SCM (*functionn_t) (SCM);
53 typedef struct function_t {
54   union {
55     function0_t function0;
56     function1_t function1;
57     function2_t function2;
58     function3_t function3;
59     functionn_t functionn;
60   };
61   int arity;
62 } function;
63 struct scm_t;
64 typedef struct scm_t {
65   enum type_t type;
66   union {
67     char const *name;
68     SCM string;
69     SCM car;
70     SCM ref;
71     int length;
72   };
73   union {
74     int value;
75     int function;
76     SCM cdr;
77     SCM macro;
78     SCM vector;
79     int hits;
80   };
81 } scm;
82
83 function functions[200];
84 int g_function = 0;
85
86 #include "mes.symbols.h"
87 #include "define.h"
88 #include "display.h"
89 #include "lib.h"
90 #include "math.h"
91 #include "mes.h"
92 #include "posix.h"
93 #include "quasiquote.h"
94 #include "reader.h"
95 #include "string.h"
96 #include "type.h"
97
98 SCM g_symbols = 0;
99 SCM stack = 0;
100 SCM r0 = 0; // a/env
101 SCM r1 = 0; // param 1
102 SCM r2 = 0; // param 2
103 SCM r3 = 0; // param 3
104
105 SCM tmp;
106 SCM tmp_num;
107 SCM tmp_num2;
108 SCM tmp_num3;
109 SCM tmp_num4;
110
111 scm scm_nil = {SPECIAL, "()"};
112 scm scm_f = {SPECIAL, "#f"};
113 scm scm_t = {SPECIAL, "#t"};
114 scm scm_dot = {SPECIAL, "."};
115 scm scm_undefined = {SPECIAL, "*undefined*"};
116 scm scm_unspecified = {SPECIAL, "*unspecified*"};
117 scm scm_closure = {SPECIAL, "*closure*"};
118 scm scm_circular = {SPECIAL, "*circular*"};
119 #if BOOT
120 scm scm_label = {
121   SPECIAL, "label"};
122 #endif
123 scm scm_begin = {SPECIAL, "*begin*"};
124
125 scm scm_symbol_lambda = {SYMBOL, "lambda"};
126 scm scm_symbol_begin = {SYMBOL, "begin"};
127 scm scm_symbol_if = {SYMBOL, "if"};
128 scm scm_symbol_define = {SYMBOL, "define"};
129 scm scm_symbol_define_macro = {SYMBOL, "define-macro"};
130 scm scm_symbol_set_x = {SYMBOL, "set!"};
131
132 scm scm_symbol_quote = {SYMBOL, "quote"};
133 scm scm_symbol_quasiquote = {SYMBOL, "quasiquote"};
134 scm scm_symbol_unquote = {SYMBOL, "unquote"};
135 scm scm_symbol_unquote_splicing = {SYMBOL, "unquote-splicing"};
136
137 scm scm_symbol_sc_expand = {SYMBOL, "sc-expand"};
138 scm scm_symbol_expand_macro = {SYMBOL, "expand-macro"};
139 scm scm_symbol_sc_expander_alist = {SYMBOL, "*sc-expander-alist*"};
140 scm scm_symbol_noexpand = {SYMBOL, "noexpand"};
141 scm scm_symbol_syntax = {SYMBOL, "syntax"};
142 scm scm_symbol_quasisyntax = {SYMBOL, "quasisyntax"};
143 scm scm_symbol_unsyntax = {SYMBOL, "unsyntax"};
144 scm scm_symbol_unsyntax_splicing = {SYMBOL, "unsyntax-splicing"};
145
146 scm scm_symbol_call_with_values = {SYMBOL, "call-with-values"};
147 scm scm_symbol_current_module = {SYMBOL, "current-module"};
148 scm scm_symbol_primitive_load = {SYMBOL, "primitive-load"};
149 scm scm_symbol_read_input_file = {SYMBOL, "read-input-file"};
150
151 scm scm_symbol_the_unquoters = {SYMBOL, "*the-unquoters*"};
152
153 scm scm_symbol_car = {SYMBOL, "car"};
154 scm scm_symbol_cdr = {SYMBOL, "cdr"};
155 scm scm_symbol_null_p = {SYMBOL, "null?"};
156 scm scm_symbol_eq_p = {SYMBOL, "eq?"};
157 scm scm_symbol_cons = {SYMBOL, "cons"};
158
159 scm char_eof = {CHAR, .name="*eof*", .value=-1};
160 scm char_nul = {CHAR, .name="nul", .value=0};
161 scm char_backspace = {CHAR, .name="backspace", .value=8};
162 scm char_tab = {CHAR, .name="tab", .value=9};
163 scm char_newline = {CHAR, .name="newline", .value=10};
164 scm char_vt = {CHAR, .name="vt", .value=11};
165 scm char_page = {CHAR, .name="page", .value=12};
166 scm char_return = {CHAR, .name="return", .value=13};
167 scm char_space = {CHAR, .name="space", .value=32};
168
169 scm g_free = {NUMBER, .value=0};
170 scm *g_cells;
171 scm *g_news = 0;
172
173 #define CAR(x) g_cells[x].car
174 #define CDR(x) g_cells[x].cdr
175 #define HITS(x) g_cells[x].hits
176 #define LENGTH(x) g_cells[x].length
177 #define NAME(x) g_cells[x].name
178 #define STRING(x) g_cells[x].string
179 #define TYPE(x) g_cells[x].type
180 #define MACRO(x) g_cells[x].macro
181 #define REF(x) g_cells[x].ref
182 #define VALUE(x) g_cells[x].value
183 #define VECTOR(x) g_cells[x].vector
184 #define FUNCTION(x) functions[g_cells[x].function]
185 #define NCAR(x) g_news[x].car
186 #define NTYPE(x) g_news[x].type
187
188 #define CAAR(x) CAR (CAR (x))
189 #define CDAR(x) CDR (CAR (x))
190 #define CAAR(x) CAR (CAR (x))
191 #define CADAR(x) CAR (CDR (CAR (x)))
192 #define CADDR(x) CAR (CDR (CDR (x)))
193 #define CDADAR(x) CAR (CDR (CAR (CDR (x))))
194 #define CADR(x) CAR (CDR (x))
195
196 SCM display_ (FILE* f, SCM x);
197 SCM vm_call (function0_t f, SCM p1, SCM p2, SCM a);
198
199 SCM
200 alloc (int n)
201 {
202   assert (g_free.value + n < ARENA_SIZE);
203   SCM x = g_free.value;
204   g_free.value += n;
205   return x;
206 }
207
208 SCM
209 make_cell (SCM type, SCM car, SCM cdr)
210 {
211   SCM x = alloc (1);
212   assert (TYPE (type) == NUMBER);
213   TYPE (x) = VALUE (type);
214   if (VALUE (type) == CHAR || VALUE (type) == NUMBER) {
215     if (car) CAR (x) = CAR (car);
216     if (cdr) CDR (x) = CDR (cdr);
217   } else if (VALUE (type) == FUNCTION) {
218     if (car) CAR (x) = car;
219     if (cdr) CDR (x) = CDR (cdr);
220   } else {
221     CAR (x) = car;
222     CDR (x) = cdr;
223   }
224   return x;
225 }
226
227 SCM
228 cons (SCM x, SCM y)
229 {
230   g_cells[tmp_num].value = PAIR;
231   return make_cell (tmp_num, x, y);
232 }
233
234 SCM
235 car (SCM x)
236 {
237   assert (TYPE (x) == PAIR);
238   return CAR (x);
239 }
240
241 SCM
242 cdr (SCM x)
243 {
244   assert (TYPE (x) == PAIR);
245   return CDR (x);
246 }
247
248 SCM
249 eq_p (SCM x, SCM y)
250 {
251   return (x == y
252           || (TYPE (x) == CHAR && TYPE (y) == CHAR
253               && VALUE (x) == VALUE (y))
254           || (TYPE (x) == NUMBER && TYPE (y) == NUMBER
255               && VALUE (x) == VALUE (y)))
256     ? cell_t : cell_f;
257 }
258
259 SCM
260 set_car_x (SCM x, SCM e)
261 {
262   assert (TYPE (x) == PAIR);
263   CAR (x) = e;
264   return cell_unspecified;
265 }
266
267 SCM
268 set_cdr_x (SCM x, SCM e)
269 {
270   assert (TYPE (x) == PAIR);
271   CDR (x) = e;
272   return cell_unspecified;
273 }
274
275 SCM
276 set_env_x (SCM x, SCM e, SCM a)
277 {
278   SCM p = assert_defined (x, assq (x, a));
279   return set_cdr_x (p, e);
280 }
281
282 SCM
283 quote (SCM x)
284 {
285   return cons (cell_symbol_quote, x);
286 }
287
288 SCM
289 quasiquote (SCM x)
290 {
291   return cons (cell_symbol_quasiquote, x);
292 }
293
294 SCM
295 quasisyntax (SCM x)
296 {
297   return cons (cell_symbol_quasisyntax, x);
298 }
299
300 SCM
301 pairlis (SCM x, SCM y, SCM a)
302 {
303   if (x == cell_nil)
304     return a;
305   if (pair_p (x) == cell_f)
306     return cons (cons (x, y), a);
307   return cons (cons (car (x), car (y)),
308                pairlis (cdr (x), cdr (y), a));
309 }
310
311 SCM
312 assq (SCM x, SCM a)
313 {
314   while (a != cell_nil && eq_p (x, CAAR (a)) == cell_f)
315     {
316       if (TYPE (a) == BROKEN_HEART || TYPE (CAR (a)) == BROKEN_HEART)
317         fprintf (stderr, "oops, broken heart\n");
318       a = CDR (a);
319     }
320   return a != cell_nil ? car (a) : cell_f;
321 }
322
323 SCM
324 assq_ref_cache (SCM x, SCM a)
325 {
326   x = assq (x, a);
327   if (x == cell_f) return cell_undefined;
328   return cdr (x);
329 }
330
331 SCM
332 assert_defined (SCM x, SCM e)
333 {
334   if (e == cell_undefined)
335     {
336       fprintf (stderr, "eval: unbound variable:");
337       display_ (stderr, x);
338       fprintf (stderr, "\n");
339       assert (!"unbound variable");
340     }
341   return e;
342 }
343
344 SCM
345 vm_evlis_env ()
346 {
347   if (r1 == cell_nil) return cell_nil;
348   if (TYPE (r1) != PAIR) return eval_env (r1, r0);
349   r2 = eval_env (car (r1), r0);
350   r1 = evlis_env (cdr (r1), r0);
351   return cons (r2, r1);
352 }
353
354 SCM
355 vm_call_lambda ()
356 {
357   return vm_call (vm_begin_env, r1, cell_undefined, r0);
358 }
359
360 SCM
361 call_lambda (SCM e, SCM x, SCM aa, SCM a) ///((internal))
362 {
363   SCM cl = cons (cons (cell_closure, x), x);
364   r1 = e;
365   r0 = cl;
366   r2 = a;
367   r3 = aa;
368   return vm_call_lambda ();
369 }
370
371 SCM
372 vm_apply_env ()
373 {
374   if (TYPE (r1) != PAIR)
375     {
376       if (TYPE (r1) == FUNCTION) return call (r1, r2);
377       if (r1 == cell_symbol_call_with_values)
378         return call_with_values_env (car (r2), cadr (r2), r0);
379       if (r1 == cell_symbol_current_module) return r0;
380     }
381   else if (car (r1) == cell_symbol_lambda) {
382     SCM args = cadr (r1);
383     SCM body = cddr (r1);
384     SCM p = pairlis (args, r2, r0);
385     return call_lambda (body, p, p, r0);
386   }
387   else if (car (r1) == cell_closure) {
388     SCM args = caddr (r1);
389     SCM body = cdddr (r1);
390     SCM aa = cdadr (r1);
391     aa = cdr (aa);
392     SCM p = pairlis (args, r2, aa);
393     return call_lambda (body, p, aa, r0);
394   }
395 #if BOOT
396   else if (car (r1) == cell_symbol_label)
397     return apply_env (caddr (r1), r2, cons (cons (cadr (r1), caddr (r1)), r0));
398 #endif
399   SCM e = eval_env (r1, r0);
400   char const* type = 0;
401   if (e == cell_f || e == cell_t) type = "bool";
402   if (TYPE (e) == CHAR) type = "char";
403   if (TYPE (e) == NUMBER) type = "number";
404   if (TYPE (e) == STRING) type = "string";
405   if (e == cell_unspecified) type = "*unspecified*";
406   if (e == cell_undefined) type =  "*undefined*";
407   if (type)
408     {
409       fprintf (stderr, "cannot apply: %s: ", type);
410       display_ (stderr, e);
411       fprintf (stderr, " [");
412       display_ (stderr, r1);
413       fprintf (stderr, "]\n");
414       assert (!"cannot apply");
415     }
416   return apply_env (e, r2, r0);
417 }
418
419 SCM
420 vm_eval_env ()
421 {
422   switch (TYPE (r1))
423     {
424     case PAIR:
425       {
426 #if FIXED_PRIMITIVES
427         if (car (r1) == cell_symbol_car)
428           return car (eval_env (CADR (r1), r0));
429         if (car (r1) == cell_symbol_cdr)
430           return cdr (eval_env (CADR (r1), r0));
431         if (car (r1) == cell_symbol_cons) {
432           SCM m = evlis_env (CDR (r1), r0);
433           return cons (CAR (m), CADR (m));
434         }
435         if (car (r1) == cell_symbol_null_p)
436           return null_p (eval_env (CADR (r1), r0));
437 #endif // FIXED_PRIMITIVES
438         if (car (r1) == cell_symbol_quote)
439           return cadr (r1);
440 #if QUASISYNTAX
441         if (car (r1) == cell_symbol_syntax)
442           return r1;
443 #endif
444         if (car (r1) == cell_symbol_begin)
445           return begin_env (r1, r0);
446         if (car (r1) == cell_symbol_lambda)
447           return make_closure (cadr (r1), cddr (r1), assq (cell_closure, r0));
448         if (car (r1) == cell_closure)
449           return r1;
450         if (car (r1) == cell_symbol_if)
451           return if_env (cdr (r1), r0);
452 #if !BOOT
453         if (car (r1) == cell_symbol_define)
454           return define_env (r1, r0);
455         if (car (r1) == cell_symbol_define_macro)
456           return define_env (r1, r0);
457         if (car (r1) == cell_symbol_primitive_load)
458           return begin_env (read_input_file_env (r0), r0);
459 #else
460         if (car (r1) == cell_symbol_define) {
461         fprintf (stderr, "C DEFINE: ");
462         display_ (stderr,
463                   TYPE (cadr (r1)) == SYMBOL
464                   ? STRING (cadr (r1))
465                   : STRING (caadr (r1)));
466         fprintf (stderr, "\n");
467       }
468       assert (car (r1) != cell_symbol_define);
469       assert (car (r1) != cell_symbol_define_macro);
470 #endif
471 #if 1 //!BOOT
472       if (car (r1) == cell_symbol_set_x)
473         {
474           SCM x = eval_env (caddr (r1), r0);
475           return set_env_x (cadr (r1), x, r0);
476         }
477 #else
478       assert (car (r1) != cell_symbol_set_x);
479 #endif
480 #if QUASIQUOTE
481       if (car (r1) == cell_symbol_unquote)
482         return eval_env (cadr (r1), r0);
483       if (car (r1) == cell_symbol_quasiquote)
484         return eval_quasiquote (cadr (r1), add_unquoters (r0));
485 #endif //QUASIQUOTE
486 #if QUASISYNTAX
487       if (car (r1) == cell_symbol_unsyntax)
488         return eval_env (cadr (r1), r0);
489       if (car (r1) == cell_symbol_quasisyntax)
490         return eval_quasisyntax (cadr (r1), add_unsyntaxers (r0));
491 #endif //QUASISYNTAX
492       SCM x = expand_macro_env (r1, r0);
493       if (x != r1)
494           return eval_env (x, r0);
495       SCM m = evlis_env (CDR (r1), r0);
496       return apply_env (car (r1), m, r0);
497       }
498     case SYMBOL: return assert_defined (r1, assq_ref_cache (r1, r0));
499     default: return r1;
500     }
501 }
502
503 SCM
504 vm_expand_macro_env ()
505 {
506   if (TYPE (CAR (r1)) == STRING && string_to_symbol (CAR (r1)) == cell_symbol_noexpand)
507     return cadr (r1);
508
509   SCM macro;
510   SCM expanders;
511   if (TYPE (r1) == PAIR
512       && (macro = lookup_macro (car (r1), r0)) != cell_f)
513     return apply_env (macro, CDR (r1), r0);
514   else if (TYPE (r1) == PAIR
515            && TYPE (CAR (r1)) == SYMBOL
516            && ((expanders = assq_ref_cache (cell_symbol_sc_expander_alist, r0)) != cell_undefined)
517            && ((macro = assq (CAR (r1), expanders)) != cell_f))
518     {
519       SCM sc_expand = assq_ref_cache (cell_symbol_expand_macro, r0);
520       if (sc_expand != cell_undefined && sc_expand != cell_f)
521         r1 = apply_env (sc_expand, cons (r1, cell_nil), r0);
522     }
523   return r1;
524 }
525
526 SCM
527 vm_begin_env ()
528 {
529   SCM r = cell_unspecified;
530   while (r1 != cell_nil) {
531     if (TYPE (r1) == PAIR && TYPE (CAR (r1)) == PAIR)
532       {
533         if (caar (r1) == cell_symbol_begin)
534           r1 = append2 (cdar (r1), cdr (r1));
535         else if (caar (r1) == cell_symbol_primitive_load)
536           {
537             SCM f = read_input_file_env (r0);
538             r1 = append2 (f, cdr (r1));
539           }
540       }
541     r = eval_env (car (r1), r0);
542     r1 = CDR (r1);
543   }
544   return r;
545 }
546
547 SCM
548 vm_if_env ()
549 {
550   SCM x = eval_env (car (r1), r0);
551   if (x != cell_f)
552     return eval_env (cadr (r1), r0);
553   if (cddr (r1) != cell_nil)
554     return eval_env (caddr (r1), r0);
555   return cell_unspecified;
556 }
557
558 SCM
559 vm_call_with_values_env ()
560 {
561   SCM v = apply_env (r1, cell_nil, r0);
562   if (TYPE (v) == VALUES)
563     v = CDR (v);
564   return apply_env (r2, v, r0);
565 }
566
567 SCM
568 call (SCM fn, SCM x)
569 {
570   if ((FUNCTION (fn).arity > 0 || FUNCTION (fn).arity == -1)
571       && x != cell_nil && TYPE (CAR (x)) == VALUES)
572     x = cons (CADAR (x), CDR (x));
573   if ((FUNCTION (fn).arity > 1 || FUNCTION (fn).arity == -1)
574       && x != cell_nil && TYPE (CDR (x)) == PAIR && TYPE (CADR (x)) == VALUES)
575     x = cons (CAR (x), cons (CDADAR (x), CDR (x)));
576   switch (FUNCTION (fn).arity)
577     {
578     case 0: return FUNCTION (fn).function0 ();
579     case 1: return FUNCTION (fn).function1 (car (x));
580     case 2: return FUNCTION (fn).function2 (car (x), cadr (x));
581     case 3: return FUNCTION (fn).function3 (car (x), cadr (x), caddr (x));
582     case -1: return FUNCTION (fn).functionn (x);
583     }
584   return cell_unspecified;
585 }
586
587 SCM
588 gc_frame (SCM stack)
589 {
590   SCM frame = car (stack);
591   r1 = car (frame);
592   r2 = cadr (frame);
593   r3 = caddr (frame);
594   r0 = cadddr (frame);
595   return frame;
596 }
597
598 SCM
599 gc_stack (SCM a)
600 {
601   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
602   stack = cons (frame, stack);
603   stack = gc (stack);
604   gc_frame (stack);
605   stack = cdr (stack);
606   return stack;
607 }
608
609 SCM
610 vm_call (function0_t f, SCM p1, SCM p2, SCM a)
611 {
612   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
613   stack = cons (frame, stack);
614   r1 = p1;
615   r2 = p2;
616   r0 = a;
617   if (g_free.value + GC_SAFETY > ARENA_SIZE)
618     gc_stack (stack);
619
620   SCM r = f ();
621   frame = gc_frame (stack);
622   stack = cdr (stack);
623   return r;
624 }
625
626 SCM
627 evlis_env (SCM m, SCM a)
628 {
629   return vm_call (vm_evlis_env, m, cell_undefined, a);
630 }
631
632 SCM
633 apply_env (SCM fn, SCM x, SCM a)
634 {
635   return vm_call (vm_apply_env, fn, x, a);
636 }
637
638 SCM
639 eval_env (SCM e, SCM a)
640 {
641   return vm_call (vm_eval_env, e, cell_undefined, a);
642 }
643
644 SCM
645 expand_macro_env (SCM e, SCM a)
646 {
647   return vm_call (vm_expand_macro_env, e, cell_undefined, a);
648 }
649
650 SCM
651 begin_env (SCM e, SCM a)
652 {
653   return vm_call (vm_begin_env, e, cell_undefined, a);
654 }
655
656 SCM
657 if_env (SCM e, SCM a)
658 {
659   return vm_call (vm_if_env, e, cell_undefined, a);
660 }
661
662 SCM
663 call_with_values_env (SCM producer, SCM consumer, SCM a)
664 {
665   return vm_call (vm_call_with_values_env, producer, consumer, a);
666 }
667
668 SCM
669 append2 (SCM x, SCM y)
670 {
671   if (x == cell_nil) return y;
672   assert (TYPE (x) == PAIR);
673   return cons (car (x), append2 (cdr (x), y));
674 }
675
676 SCM
677 append (SCM x) ///((arity . n))
678  {
679   if (x == cell_nil) return cell_nil;
680   return append2 (car (x), append (cdr (x)));
681  }
682
683 SCM
684 make_char (int x)
685 {
686   g_cells[tmp_num].value = CHAR;
687   g_cells[tmp_num2].value = x;
688   return make_cell (tmp_num, tmp_num2, tmp_num2);
689 }
690
691 SCM
692 make_function (SCM name, SCM id, SCM arity)
693 {
694   g_cells[tmp_num3].value = FUNCTION;
695   function *f = (function*)malloc (sizeof (function));
696   f->arity = VALUE (arity);
697   g_cells[tmp_num4].value = (long)f;
698   return make_cell (tmp_num3, name, tmp_num4);
699 }
700
701 SCM
702 make_macro (SCM name, SCM x)
703 {
704   g_cells[tmp_num].value = MACRO;
705   return make_cell (tmp_num, STRING (name), x);
706 }
707
708 SCM
709 make_number (int x)
710 {
711   g_cells[tmp_num].value = NUMBER;
712   g_cells[tmp_num2].value = x;
713   return make_cell (tmp_num, tmp_num2, tmp_num2);
714 }
715
716 SCM
717 make_ref (SCM x)
718 {
719   g_cells[tmp_num].value = REF;
720   return make_cell (tmp_num, x, x);
721 }
722
723 SCM
724 make_string (SCM x)
725 {
726   g_cells[tmp_num].value = STRING;
727   return make_cell (tmp_num, x, 0);
728 }
729
730 SCM
731 cstring_to_list (char const* s)
732 {
733   SCM p = cell_nil;
734   int i = strlen (s);
735   while (i--)
736     p = cons (make_char (s[i]), p);
737   return p;
738 }
739
740 SCM
741 null_p (SCM x)
742 {
743   return x == cell_nil ? cell_t : cell_f;
744 }
745
746 SCM
747 internal_make_symbol (SCM s)
748 {
749   g_cells[tmp_num].value = SYMBOL;
750   SCM x = make_cell (tmp_num, s, 0);
751   g_symbols = cons (x, g_symbols);
752   return x;
753 }
754
755 SCM
756 make_symbol (SCM s)
757 {
758   SCM x = internal_lookup_symbol (s);
759   return x ? x : internal_make_symbol (s);
760 }
761
762 SCM
763 make_vector (SCM n)
764 {
765   int k = VALUE (n);
766   g_cells[tmp_num].value = VECTOR;
767   SCM v = alloc (k);
768   SCM x = make_cell (tmp_num, k, v);
769   for (int i=0; i<k; i++) g_cells[v+i] = g_cells[vector_entry (cell_unspecified)];
770   return x;
771 }
772
773 SCM
774 values (SCM x) ///((arity . n))
775 {
776   SCM v = cons (0, x);
777   TYPE (v) = VALUES;
778   return v;
779 }
780
781 SCM
782 vector_length (SCM x)
783 {
784   assert (TYPE (x) == VECTOR);
785   return make_number (LENGTH (x));
786 }
787
788 SCM
789 vector_ref (SCM x, SCM i)
790 {
791   assert (TYPE (x) == VECTOR);
792   assert (VALUE (i) < LENGTH (x));
793   SCM e = VECTOR (x) + VALUE (i);
794   if (TYPE (e) == REF) e = g_cells[e].ref;
795   if (TYPE (e) == CHAR) e = make_char (VALUE (e));
796   if (TYPE (e) == NUMBER) e = make_number (VALUE (e));
797   return e;
798 }
799
800 SCM
801 vector_entry (SCM x) {
802   if (TYPE (x) == PAIR || TYPE (x) == SPECIAL || TYPE (x) == STRING || TYPE (x) == SYMBOL || TYPE (x) == VECTOR) x = make_ref (x);
803   return x;
804 }
805
806 SCM
807 vector_set_x (SCM x, SCM i, SCM e)
808 {
809   assert (TYPE (x) == VECTOR);
810   assert (VALUE (i) < LENGTH (x));
811   g_cells[VECTOR (x)+g_cells[i].value] = g_cells[vector_entry (e)];
812   return cell_unspecified;
813 }
814
815 SCM
816 list_to_vector (SCM x)
817 {
818   VALUE (tmp_num) = VALUE (length (x));
819   SCM v = make_vector (tmp_num);
820   SCM p = VECTOR (v);
821   while (x != cell_nil)
822     {
823       g_cells[p++] = g_cells[vector_entry (car (x))];
824       x = cdr (x);
825     }
826   return v;
827 }
828
829 FILE *g_stdin;
830 int
831 getchar ()
832 {
833   return getc (g_stdin);
834 }
835
836 int
837 ungetchar (int c)
838 {
839   return ungetc (c, g_stdin);
840 }
841
842 int
843 peekchar ()
844 {
845   int c = getchar ();
846   ungetchar (c);
847   return c;
848 }
849
850 SCM
851 peek_byte ()
852 {
853   return make_number (peekchar ());
854 }
855
856 SCM
857 read_byte ()
858 {
859   return make_number (getchar ());
860 }
861
862 SCM
863 unread_byte (SCM i)
864 {
865   return ungetchar (VALUE (i));
866 }
867
868 SCM
869 write_char (SCM x) ///((arity . n))
870 {
871   SCM c = car (x);
872   SCM p = cdr (x);
873   int fd = 1;
874   if (TYPE (p) == PAIR && TYPE (car (p)) == NUMBER) fd = VALUE (car (p));
875   FILE *f = fd == 1 ? stdout : stderr;
876   assert (TYPE (c) == NUMBER || TYPE (c) == CHAR);
877   fputc (VALUE (c), f);
878   return c;
879 }
880
881 SCM
882 symbol_to_list (SCM x)
883 {
884   assert (TYPE (x) == SYMBOL);
885   return STRING (x);
886 }
887
888 SCM
889 char_to_integer (SCM x)
890 {
891   assert (TYPE (x) == CHAR);
892   return make_number (VALUE (x));
893 }
894
895 SCM
896 integer_to_char (SCM x)
897 {
898   assert (TYPE (x) == NUMBER);
899   return make_char (VALUE (x));
900 }
901
902 void
903 make_tmps (scm* cells)
904 {
905   tmp = g_free.value++;
906   cells[tmp].type = CHAR;
907   tmp_num = g_free.value++;
908   cells[tmp_num].type = NUMBER;
909   tmp_num2 = g_free.value++;
910   cells[tmp_num2].type = NUMBER;
911   tmp_num3 = g_free.value++;
912   cells[tmp_num3].type = NUMBER;
913   tmp_num4 = g_free.value++;
914   cells[tmp_num4].type = NUMBER;
915 }
916
917 //\f Jam Collector
918 SCM g_symbol_max;
919 bool g_debug = false;
920
921 SCM
922 gc_up_arena ()
923 {
924   ARENA_SIZE *= 2;
925   void *p = realloc (g_cells-1, 2*ARENA_SIZE*sizeof(scm));
926   if (!p)
927     {
928       if (g_debug) fprintf (stderr, "cannot up arena: %s: arena=%d\n", strerror (errno), 2*ARENA_SIZE);
929       return cell_unspecified;
930     }
931   g_cells = (scm*)p;
932   g_cells++;
933   gc_init_news ();
934 }
935
936 SCM
937 gc ()
938 {
939   if (g_debug) fprintf (stderr, "***gc[%d]...", g_free.value);
940   g_free.value = 1;
941   if (g_cells < g_news && ARENA_SIZE < MAX_ARENA_SIZE) gc_up_arena ();
942   for (int i=g_free.value; i<g_symbol_max; i++)
943     gc_copy (i);
944   make_tmps (g_news);
945   g_symbols = gc_copy (g_symbols);
946   SCM new = gc_copy (stack);
947   if (g_debug) fprintf (stderr, "new=%d\n", new, stack);
948   stack = new;
949   return gc_loop (1);
950 }
951
952 SCM
953 gc_loop (SCM scan)
954 {
955   while (scan < g_free.value)
956     {
957       if (NTYPE (scan) == MACRO
958           || NTYPE (scan) == PAIR
959           || NTYPE (scan) == REF
960           || scan == 1 // null
961           || NTYPE (scan) == SPECIAL
962           || NTYPE (scan) == STRING
963           || NTYPE (scan) == SYMBOL)
964         {
965           SCM car = gc_copy (g_news[scan].car);
966           gc_relocate_car (scan, car);
967         }
968       if ((NTYPE (scan) == MACRO
969            || NTYPE (scan) == PAIR
970            || NTYPE (scan) == VALUES)
971           && g_news[scan].cdr) // allow for 0 terminated list of symbols
972         {
973           SCM cdr = gc_copy (g_news[scan].cdr);
974           gc_relocate_cdr (scan, cdr);
975         }
976       scan++;
977     }
978   return gc_flip ();
979 }
980
981 SCM
982 gc_copy (SCM old)
983 {
984   if (TYPE (old) == BROKEN_HEART) return g_cells[old].car;
985   SCM new = g_free.value++;
986   g_news[new] = g_cells[old];
987   if (NTYPE (new) == VECTOR)
988     {
989       g_news[new].vector = g_free.value;
990       for (int i=0; i<LENGTH (old); i++)
991         g_news[g_free.value++] = g_cells[VECTOR (old)+i];
992     }
993   g_cells[old].type = BROKEN_HEART;
994   g_cells[old].car = new;
995   return new;
996 }
997
998 SCM
999 gc_relocate_car (SCM new, SCM car)
1000 {
1001   g_news[new].car = car;
1002   return cell_unspecified;
1003 }
1004
1005 SCM
1006 gc_relocate_cdr (SCM new, SCM cdr)
1007 {
1008   g_news[new].cdr = cdr;
1009   return cell_unspecified;
1010 }
1011
1012 SCM
1013 gc_flip ()
1014 {
1015   scm *cells = g_cells;
1016   g_cells = g_news;
1017   g_news = cells;
1018   if (g_debug) fprintf (stderr, " => jam[%d]\n", g_free.value);
1019   return stack;
1020 }
1021
1022 SCM
1023 gc_show ()
1024 {
1025   fprintf (stderr, "cells: ");
1026   scm *t = g_cells;
1027   display_ (stderr, -1);
1028   fprintf (stderr, "\n");
1029   if (g_news)
1030     {
1031       fprintf (stderr, "news: ");
1032       g_cells = g_news;
1033       display_ (stderr, -1);
1034       fprintf (stderr, "\n");
1035     }
1036   g_cells = t;
1037   return cell_unspecified;
1038 }
1039
1040 //\f Environment setup
1041 SCM
1042 acons (SCM key, SCM value, SCM alist)
1043 {
1044   return cons (cons (key, value), alist);
1045 }
1046
1047 SCM
1048 add_environment (SCM a, char const *name, SCM x)
1049 {
1050   return acons (make_symbol (cstring_to_list (name)), x, a);
1051 }
1052
1053 SCM
1054 gc_init_cells ()
1055 {
1056   g_cells = (scm *)malloc (2*ARENA_SIZE*sizeof(scm));
1057   g_cells[0].type = VECTOR;
1058   g_cells[0].length = 1000;
1059   g_cells[0].vector = 0;
1060   g_cells++;
1061   g_cells[0].type = CHAR;
1062   g_cells[0].value = 'c';
1063   g_free.value = 1; // 0 is tricky
1064 }
1065
1066 SCM
1067 gc_init_news ()
1068 {
1069   g_news = g_cells-1 + ARENA_SIZE;
1070   g_news[0].type = VECTOR;
1071   g_news[0].length = 1000;
1072   g_news[0].vector = 0;
1073   g_news++;
1074   g_news[0].type = CHAR;
1075   g_news[0].value = 'n';
1076 }
1077
1078 SCM
1079 mes_symbols () ///((internal))
1080 {
1081   gc_init_cells ();
1082   gc_init_news ();
1083
1084 #include "mes.symbols.i"
1085
1086   g_symbol_max = g_free.value;
1087   make_tmps (g_cells);
1088
1089   g_symbols = 0;
1090   for (int i=1; i<g_symbol_max; i++)
1091     g_symbols = cons (i, g_symbols);
1092
1093   SCM a = cell_nil;
1094
1095 #if BOOT
1096   a = acons (cell_symbol_label, cell_t, a);
1097 #endif
1098   a = acons (cell_symbol_begin, cell_begin, a);
1099   a = add_environment (a, "sc-expand", cell_f);
1100   a = acons (cell_closure, a, a);
1101
1102   internal_lookup_symbol (cell_nil);
1103
1104   return a;
1105 }
1106
1107 SCM
1108 mes_builtins (SCM a)
1109 {
1110 #include "mes.i"
1111
1112 #include "define.i"
1113 #include "display.i"
1114 #include "lib.i"
1115 #include "math.i"
1116 #include "posix.i"
1117 #include "quasiquote.i"
1118 #include "reader.i"
1119 #include "string.i"
1120 #include "type.i"
1121
1122 #include "define.environment.i"
1123 #include "display.environment.i"
1124 #include "lib.environment.i"
1125 #include "math.environment.i"
1126 #include "mes.environment.i"
1127 #include "posix.environment.i"
1128   //#include "quasiquote.environment.i"
1129 #include "reader.environment.i"
1130 #include "string.environment.i"
1131 #include "type.environment.i"
1132
1133 #if QUASIQUOTE
1134   SCM cell_unquote = assq_ref_cache (cell_symbol_unquote, a);
1135   SCM cell_unquote_splicing = assq_ref_cache (cell_symbol_unquote_splicing, a);
1136   SCM the_unquoters = cons (cons (cell_symbol_unquote, cell_unquote),
1137                             cons (cons (cell_symbol_unquote_splicing, cell_unquote_splicing),
1138                                   cell_nil));
1139   a = acons (cell_symbol_the_unquoters, the_unquoters, a);
1140 #endif
1141
1142   a = add_environment (a, "*dot*", cell_dot);
1143   a = add_environment (a, "*foo-bar-baz*", cell_nil); // FIXME: some off-by one?
1144
1145   return a;
1146 }
1147
1148 SCM
1149 mes_stack (SCM a) ///((internal))
1150 {
1151   r0 = a;
1152   r1 = make_char (0);
1153   r2 = make_char (0);
1154   r3 = make_char (0);
1155   stack = cons (cell_nil, cell_nil);
1156   return r0;
1157 }
1158
1159 SCM
1160 mes_environment () ///((internal))
1161 {
1162   SCM a = mes_symbols ();
1163   return mes_stack (a);
1164 }
1165
1166 SCM
1167 make_lambda (SCM args, SCM body)
1168 {
1169   return cons (cell_symbol_lambda, cons (args, body));
1170 }
1171
1172 SCM
1173 make_closure (SCM args, SCM body, SCM a)
1174 {
1175   return cons (cell_closure, cons (cons (cell_circular, a), cons (args, body)));
1176 }
1177
1178 SCM
1179 lookup_macro (SCM x, SCM a)
1180 {
1181   if (TYPE (x) != SYMBOL) return cell_f;
1182   SCM m = assq_ref_cache (x, a);
1183   if (macro_p (m) == cell_t) return MACRO (m);
1184   return cell_f;
1185 }
1186
1187 SCM
1188 read_input_file_env_ (SCM e, SCM a)
1189 {
1190   if (e == cell_nil) return e;
1191   return cons (e, read_input_file_env_ (read_env (a), a));
1192 }
1193
1194 SCM
1195 read_input_file_env (SCM a)
1196 {
1197   r0 = a;
1198 #if READER
1199   return read_input_file_env_ (read_env (r0), r0);
1200 #endif
1201   return apply_env (cell_symbol_read_input_file, cell_nil, r0);
1202 }
1203
1204 SCM
1205 load_env (SCM a) ///((internal))
1206 {
1207   r0 =a;
1208 #if !READER
1209   g_stdin = fopen ("module/mes/read-0.mes", "r");
1210   g_stdin = g_stdin ? g_stdin : fopen (PREFIX "module/mes/read-0.mes", "r");
1211 #endif
1212   if (!g_function) r0 = mes_builtins (r0);
1213   r3 = read_input_file_env (r0);
1214   g_stdin = stdin;
1215   return r3;
1216 }
1217
1218 SCM
1219 bload_env (SCM a) ///((internal))
1220 {
1221   g_stdin = fopen ("module/mes/read-0.mo", "r");
1222   g_stdin = g_stdin ? g_stdin : fopen (PREFIX "module/mes/read-0.mo", "r");
1223   char *p = (char*)g_cells;
1224   assert (getchar () == 'M');
1225   assert (getchar () == 'E');
1226   assert (getchar () == 'S');
1227   stack = getchar () << 8;
1228   stack += getchar ();
1229   int c = getchar ();
1230   while (c != EOF)
1231     {
1232       *p++ = c;
1233       c = getchar ();
1234     }
1235   g_free.value = (p-(char*)g_cells) / sizeof (scm);
1236   gc_frame (stack);
1237   g_symbols = r1;
1238   g_stdin = stdin;
1239
1240   r0 = mes_builtins (r0);
1241   return r3;
1242 }
1243
1244 int
1245 dump ()
1246 {
1247   r1 = g_symbols;
1248   SCM frame = cons (r1, cons (r2, cons (r3, cons (r0, cell_nil))));
1249   stack = cons (frame, stack);
1250   stack = gc (stack);
1251   gc_frame (stack);
1252   char *p = (char*)g_cells;
1253   fputc ('M', stdout);
1254   fputc ('E', stdout);
1255   fputc ('S', stdout);
1256   fputc (stack >> 8, stdout);
1257   fputc (stack % 256, stdout);
1258   for (int i=0; i<g_free.value * sizeof(scm); i++)
1259     fputc (*p++, stdout);
1260   return 0;
1261 }
1262
1263 #include "type.c"
1264 #include "define.c"
1265 #include "display.c"
1266 #include "lib.c"
1267 #include "math.c"
1268 #include "posix.c"
1269 #include "quasiquote.c"
1270 #include "reader.c"
1271 #include "string.c"
1272
1273 int
1274 main (int argc, char *argv[])
1275 {
1276   g_debug = getenv ("MES_DEBUG");
1277   if (getenv ("MES_ARENA")) ARENA_SIZE = atoi (getenv ("MES_ARENA"));
1278   if (argc > 1 && !strcmp (argv[1], "--help")) return puts ("Usage: mes < FILE\n");
1279   if (argc > 1 && !strcmp (argv[1], "--version")) return puts ("Mes 0.3\n");
1280   g_stdin = stdin;
1281   r0 = mes_environment ();
1282   SCM program = (argc > 1 && !strcmp (argv[1], "--load"))
1283     ? bload_env (r0) : load_env (r0);
1284   if (argc > 1 && !strcmp (argv[1], "--dump")) return dump ();
1285   display_ (stderr, begin_env (program, r0));
1286   fputs ("", stderr);
1287   gc (stack);
1288   if (g_debug) fprintf (stderr, "\nstats: [%d]\n", g_free.value);
1289   return 0;
1290 }