скачать рефераты
  RSS    

Меню

Быстрый поиск

скачать рефераты

скачать рефератыРеферат: Проектирование трансляторов

     Тип-команды может быть,  например,  вызовом стандартного

обозначения операции,  тогда параметрами могут быть имя знака

операции, адреса опреандов и адрес результата. Например,

                      STANDOP II+,A,B,C

     Здесь II+ обозначает сложение двух целых чисел,  а A, B,

C cлужат во время прогона адресами двух операндов и результа-

та. Для того чтобы в промежуточном коде можно было воспользо-

ваться адресами во время прогона, распределение памяти к это-

му времени должно быть уже закончено. При распределении памя-

ти необходимо знать,  какой обьем памяти занимает целое,  ве-

щественное и другие значения на той машине, для которой выда-

ется обьектный код.  Это означает,  что промежуточный код  не

является в  строгом  смысле  интерфецсом между не зависящей и

зависящей от машины частями компилятора.  Тем не  менее  если

речь идет  о  переводе  фронтальной  части компилятора ( т.е.

части, транслирующей исходный код в промежуточный )  с  одной

машины на другую,  то единственное,  что здесь может потребо-

ваться, - это изменение нескольких констант.

     Промежуточный код пишется на относительно низком уровне.

Он аналогичен коду, использованному для реализации Алгола 68.

Обычно выдвигается  условие,  чтобы промежуточный код отражал

структуру реализуемого языка.

     Промежуточный код  напоминает  префиксную  нотацию в том

смысле, что знак операции всегда предшествует  своим  операн-

дам. Но он имеет менее общий характер,  так как сами операнды

не могут быть префиксными выражениями. При получении промежу-

точного кода для хранения адресов операндов до тех пор,  пока

не будет напечатан знак операции, используется стек. Посколь-

ку знак  операции  можно  установит ( во многих языках ) лишь

после того,  как станут известны его  опреанды,  стек  служит

также для  хранения каждого знака операции на то время,  пока

не определены оба операнда.

     Адрес на  время прогона обычно соотносится со стеком,  и

каждый такой адрес можно представить тройкой вида

            ( тип-адреса, номер блока, смещение ).

     Тип-адреса может быть прямым или косвенным ( т.е. адрес

может содержать  значение  или указатель на значение ) и ссы-

латься на рабочий стек или  стек  идентификаторов.  Он  может

быть также  литералом  или константой.  Номер блока позволяет

найти номер уровня блока в таблице блоков,  что  обеспечивает

доступ к конкретной рамке стека через диспдей. В сдучае лите-

рала или константы номер блока не  используется.  Смещение  (

для адреса  стека  )  показывает смещение значения конкретной

рамки по отношению к началу стека идентификаторов или рабоче-

го стека.  Если тип-адрес представляет собой литерал, то сме-

щение выражается самим значением,  а если тип-адреса -  конс-

танта, то смещение нужно найти в таблице констант по заданно-

му им адресу.  В том случае, когда в каждой рамке стека рабо-

чий стек помещается сразу же над стеком идентификаторов, сме-

щения адресов рабочего стека по отношению к началу рамки мож-

но рассчитывать,  как  только  станет  известным размер стека

идентификаторов для конкретной рамки ( т.е. во время прохода,

следующего за проходом,  при котором происходит распределение

памяти ).

     Адреса во время прогона для идентификаторов определяются

в процессе распределения памяти и хранятся в таблице символов

вместе с информацией о типе и т.п.

     Кроме рассмотренных,  существуют и другие команды проме-

жуточного кода ( ICI по Бранкару ):

                         SETLABEL L1

для установки метки и

                   ASSIGN type, add1, add2

для присваивания.  Тип необходим как параметр,  чтобы опреде-

лить размер значения, переписываемого из add1 в add2. В Алго-

ле 68 может потребоваться просмотр типа ( вида ) при трансля-

ции этой команды в фактический код машины,  если значения бу-

дут содержать динамические части,  поэтому во время генерации

машинного кода нужна таблица видов.

             Структуры данных для генерации кода

     Как упоминалось выше,  для хранения адресов операндов на

то время,  пока их нельзя будет выдать как параметры ICI, не-

обходим стек значений. В этом стеке, который Бранкар называет

нижним стеком,  можно хранить также и другую информацию. Нап-

ример, значение может быть связано со своими

     а) адресом времени прогона;

     б) типом;

     в) областью действия,

помимо той информации,  которая имеет значение для диагности-

ки. Это - статическая информация,  так как ( по крайней мере,

для большинства языков ) ее можно получить во время  компиля-

ции. Так,  при  компиляции может быть известно если не факти-

ческое значение, то во всяком случае адрес целого числа.

     При трансляции  А  +  В первыми помещаются в нижний стек

статические свойства А.  Любой элемент  нижнего  стека  можно

представить в виде структуры, имеющей поле для каждой из сво-

их статических характеристик. В случае идентификаторов стати-

ческие характеристики находятся из таблицы символов.  Затем в

стек знаков операции помещается знак операции +,  и в  нижний

стек добавляются статические характеристики В.  Знак операции

берется из стека знаков операций,  а его два  операнда  -  из

нижнего стека.  Типыоперандов  используются для идентификации

знака операции,  после чего генерируется код.  И  наконец,  в

нижний стек помещаются статические характеристики результата.

     Этот процесс можно распространить и на более сложные вы-

ражения, например  нп те,  которые генерируются грамматикой с

правилами

     EXP -> TERM |

            EXP + TERM |

            EXP - TERM

     TERM -> FACT |

             TERM * FACT |

             TERM / FACT

     FACT -> constant |

             identifier |

             (EXP)

     После чтения идентификатора или константы,  знака опера-

ции и второго операнда необходимо выполнить  следующие  дейс-

твия:

     А1. Послечтения идентификатора или константы ( т.е. лис-

та синтаксического   дерева   )   поместить   в  нижний  стек

соответствующие статические характеристики.

     А2. После  чтения  оператора поместить символ операции в

стек знаков операций.

     А3. После  чтения  правого операнда ( который может быть

выражением ) извлечь из стеков знак операции и его  два  опе-

ранда, генерировать соответствующий код,  так как знак опера-

ции идентифицирован,  и поместить в стек статические характе-

ристики результата.  Тип  результата  становится известным во

время идентификации знака операции,  например  сложение  двух

целых чисел всегда дает целое число.

     При включении в грамматику этих действий она примет сле-

дующий вид:

     EXP -> TERM

            EXP+<A2>TERM<A3>

            EXP-<A2>TERM<A3>

     TERM -> FACT

             TERM*<A2>FACT<A3>

             TERM/<A2>FACT<A3>

     FACT -> constant<A1>

             identifier<A1>

             (EXP)

     Нижний стек частично используется для передачи  информа-

ции о  типе вверх по синтаксическому дереву.  Рассмотрим син-

таксическое дерево, соответствующее выражению:

                              +

                              ^

                             / \

                            /   \

                           /     \

                        * /       \ *

                         /\       /\

                        /  \     /  \

                       /    \   /    \

                      a     b   x     y

                        a * b + x * y

     Если значения a и b имеют тип целого,  а х и у - тип ве-

щественного значения,     компилятор     может     заключить,

воспользовавшись информацией нижнего стека, что "+" в вершине

дерева представляет сложение целого и вещественного значений.

Мы можем переписать выражение, расставив действия А1, А2 и А3

в том  порядке,  в  каком они будут вызываться при трансляции

этого выражения:

       а<A1>*<A2>b<A1><A3>+<A2>x<A1>*<A2>y<A1><A3><A3>

     Действие А3 соответствует применению знака  операции. Из

изложенного выше вытекает,  что каждый вызов А3 соответствует

тому месту,  где появился бы знак операции в постфиксной фор-

ме. Стек знаков опреаций,  по существу, служит для формирова-

ния постфиксной нотации.  Поэтому последовательность действий

при трансляции данного выражения должна быть следующей:

     А1. Поместить статические  характеристики   а   в нижний

стек.

     А2. Поместить знак "*" в стек знаков операций.

     А1. Поместить статические  характеристики   b   в нижний

стек.

     А3. Извлечь статические характеристики  a  и  b  из ниж-

него стека и знак "*" из стека знаков  операций, генерировать

код для умножения двух целых чисел, поместить статические ха-

рактеристики результата в нижний стек; тип результата - целый.

     А2. Поместить знак "+" в стек знаков операций.

     А1. Поместить статические  характеристики   х   в нижний

стек.

     А2. Поместить знак "*" в стек знаков операций.

     А1. Поместить статические  характеристики   у   в нижний

стек.

     А3. Извлечь статические характеристики  х  и  у  из ниж-

него стека и знак "*" из стека знаков  операций, генерировать

код для умножения двух целых чисел, поместить статические ха-

рактеристики результата в нижний стек;  тип результата -  ве-

щественный.

     А3. Извлечь два верхних элемента из нижнего стека и знак

"+" из  стека знаков операций,  генерировать код для сложения

целого и вещественного значений, поместить статические харак-

теристики результата в нижний стек;  тип результата - вещест-

венный.

     Действия А1,  А2,  А3 и вышеприведенную грамматику легко

расширить, что позволит использовать

     а) большее число уровней приоритета для знаков операций;

     б) унарные знаки операций.

     Другие случаи употребления нижнего стека рассматриваются

в следующем разделе.

     Нижний стек  обеспечивает  передачу  информации вверх по

синтаксическому дереву.  Для передачи же информации  вниз  по

дереву применяется  так  называемый верхний стек.  Значение в

него помещается всякий раз,  когда во  время  генерации  кода

происходит вход  в  такую  конструкцию,  как присваивание или

описание идентификатора.  При выходе из этой конструкции зна-

чение из стека удаляется. Следовательно, генератор кода может

заключить, например, что  компилируемое  выражение  находится

справа от знака присваивания; эта информация способствует оп-

тимизации.

     Еще одной структурой данных,  которая требуется во время

генерации кода, является таблица блоков.

╔══════════╦═══════════╦═══════════════════╦═════════════════╗

║   Блок   ║  Уровень  ║   Размер стека    ║ Размер рабочего ║

║          ║   блока   ║  идентификаторов  ║                 ║

╠══════════╬═══════════╬═══════════════════╬═════════════════╣

║    1     ║     1     ║        14         ║       16        ║

║    2     ║     2     ║        12         ║       11        ║

║    3     ║     2     ║        21         ║       13        ║

║    4     ║     3     ║         4         ║        9        ║

║    5     ║     2     ║         6         ║       12        ║

╚══════════╩═══════════╩═══════════════════╩═════════════════╝

     В этой  таблице есть запись для каждого блока программы,

и эту запись можно рассматривать как структуру,  имеющуюю по-

ля, которые соответствуют номеру уровня блока, размеру стати-

ческого стека идентификаторов,  размеру статического рабочего

стека и т.д.  Такую таблицу можно заполнять во время прохода,

генерирующего код,  и с ее помощью в следующем проходе вычис-

лять смещения  адресов  рабочего стека по отношению к текущей

рамке стека.

     Таким образом, во время генерации кода используются сле-

дующие основные структуры данных:  нижний стек, верхний стек,

стек знаков операций,  таблица блоков и,  кроме того, таблица

видов и таблица символов из предыдущих проходов.

                        Генерация команд

     По существу,  на этом этапе происходит перевод  внутреннего

представления  исходной  программы  на  автокод  или на машинный

язык.

     Возможны три формы об'ектного кода: абсолютные команды, по-

мещенные в фиксированные ячейки; программа на автокоде; програма

на  языке  машины,  предтавленная  образами карт и записанная во

вторичную память.

     Рассмотрим выражение (A + B) + (X + Y)

     Очевидный способ его вычисления в терминах машинного  языка

таков:

     1. загрузить А в сумматор;

     2. прибавить B к сумматору;

     3. записать результат A+B во временную рабочую  ячейку;

     4.  загрузить X в сумматор; 5. прибавить Y к сумматору;

     6. прибавить временный результат A+B к X+Y в сумматоре.

     Каждому из  трех  сложений предшествует своя последователь-

ность команд загрузки и записи.

     Чтобы построить код генератор хранит некоторую информацию о

том,  что будет происходить в период исполнения генерируемого им

кода.

     При разработке генератора кода  первый  шаг  заключается  в

том,  что чтобы определить, как будет организована память машины

в перид исполнения скомпилированной прграммы. Предлагаемое расп-

ределение памяти показано на рисунке

     ----------------------

     ! Программа          !

     ----------------------

     ! Константы          !

     ----------------------

     ! Подпрограммный     !

     ! стек               !

     ----------------------

     ! Промежуточные      !

     ! результаты         !

     ----------------------

     ! Хранимые результаты!

     ----------------------

     ! Переменные         !

     ----------------------

     Область ПРОГРАММА  содержит  команды  об'ектной  программы.

ПОДПРОГРАММНЫЙ СТЕК используется для хранения  адресов  возврата

подпрограмм. Область ХРАНИМЫЕ РЕЗУЛЬТАТЫ используется для хране-

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23


Новости

Быстрый поиск

Группа вКонтакте: новости

Пока нет

Новости в Twitter и Facebook

  скачать рефераты              скачать рефераты

Новости

скачать рефераты

© 2010.