Лексический анализ теперь несколько удлиняется в основном из-за необходимости распознавания дополнительных операций:
yylex() /* hoc5 */
{
...
switch (с) {
case '>': return follow('=', GE, GT);
case '<': return follow('=', LE, LT);
case '=': return follow('=', EQ, '=');
case '!': return follow('=', NE, NOT);
case '|': return follow('|', OR, '|');
case '&': return follow('&', AND, '&');
case '\n': lineno++; return '\n';
default: return c;
}
}
Функция
follow
"смотрит" на один символ вперед и возвращает символ назад во входной поток с помощью
ungetc
, если он оказался не тем, который требовался:
follow(expect, ifyes, ifno) /* look ahead for >=, etc. */
{
int с = getchar();
if (c == expect)
return ifyes;
ungetc(c, stdin);
return ifno;
}
В файле
hoc.h
стало больше описаний функций, например всех отношений, но в общем его структура такая же, как и в
hoc4
. Ниже приведено несколько последних строк грамматики:
$ cat hoc.h
...
typedef int (*Inst)(); /* machine instruction */
#define STOP (Inst)0
extern Inst prog[], *progp, *code();
extern eval(), add(), sub(), mul(), div(), negate(), power();
extern assign(), bltin(), varpush(), constpush(), print();
extern prexpr();
extern gt(), lt(), eq(), ge(), le(), ne(), and(), or(), not();
extern ifcode(), whilecode();
$
Большая часть файла
code.c
также не изменилась, хотя, очевидно, здесь появилось много новых процедур для обработки операций отношений. Типичным примером может служить функция
le
("less than equal to" меньше или равно).
le() {
Datum d1, d2;
d2 = pop();
d1 = pop();
d1.val = (double)(d1.val <= d2.val);
push(d1);
}
He совсем тривиальными являются функции
whilecode
и
ifcode
. Чтобы понять их, необходимо уяснить, что функция
execute
последовательно обрабатывает команды до тех пор, пока не будет найдена команда
STOP
, после чего происходит возврат из
execute
. Процесс разбора построен таким образом, что команда
STOP
завершает каждую последовательность команд, которую нужно обработать за одно обращение к
execute
. Тело цикла
while
, а также условие и фрагменты оператора
if
после
then
и
else
обрабатываются с помощью рекурсивных обращений к
execute
, возврат из которых по завершении обработки осуществляется в функцию
execute
на один уровень вложенности выше. Управление этими рекурсивными обращениями обеспечивается в
whilecode
и
ifcode
. Последние и предназначены для обработки соответствующих операторов.
whilecode() {
Datum d;
Inst *savepc = pc; /* loop body */
execute(savepc+2); /* condition */
d = pop();
while (d.val) {
execute(*((Inst **)(savepc))); /* body */
execute(savepc+2);
d = pop();
}
pc = *((Inst **)(savepc+1)); /* next statement */
}
Как уже отмечалось ранее, после операции
whilecode
размещается указатель на тело цикла, затем указатель на следующий оператор, а за ним команды условия. Когда вызывается
whilecode
, значение указателя
pc
уже увеличено, так что он содержит указатель на тело цикла. Таким образом,
pc+1
настроен на следующий оператор, а
pc+2
на команды условия.
Функция
ifcode
аналогична предыдущей: при входе в нее
pc
ссылается на фрагмент посте
then
,
pc+1
на фрагмент посте
else
,
pc+2
на следующий оператор, а
pc+3
на условие.
ifcode()
{
Datum d;
Inst *savepc = pc; /* then part */
execute(savepc+3); /* condition */
d = pop();
if (d.val)
execute(*((Inst **)(savepc)));
else if (*((Inst **)(savepc+1))) /* else part? */
execute(*((Inst **)(savepc+1)));
pc = *((Inst**)(savepc+2)); /* next stmt */
}
Программа в файле
init.c
также немного увеличится за счет введения в нее таблицы ключевых слов, хранимых в таблице имен вместе с остальной информацией: