скачать рефераты
  RSS    

Меню

Быстрый поиск

скачать рефераты

скачать рефератыРеферат: Микропроцессоры для пользователей

Появление суперскалярной архитектуры Pentium процессора представляет собой естественное развитие предыдущего семейства процессоров с 32-битовой архитектурой фирмы Intel. Например, процессор Intel486 способен выполнять несколько своих команд за один период тактовой частоты, однако предыдущие семейства процессоров фирмы Intel требовали множество циклов тактовой частоты для выполнения одной команды.

Возможность выполнять множество команд за один период тактовой частоты существует благодаря тому, что Pentium процессор имеет два конвейера, которые могут выполнять две инструкции одновременно. Так же, как и Intel486 с одним конвейером, двойной конвейер Pentium процессора выполняет простую команду за пять этапов: предварительная подготовка, первое декодирование ( декодирование команды ), второе декодирование ( генерация адреса ), выполнение и обратная выгрузка.

В результате этих архитектурных нововведений, по сравнению с предыдущими микропроцессорами, значительно большее количество команд может быть выполнено за одно и то же время.

Другое важнейшее революционное усовершенствование, реализованное в Pentium процессоре, это введение раздельного кэширования. Кэширование увеличивает производительность посредством активизации места временного хранения для часто используемого программного кода и данных, получаемых из быстрой памяти, заменяя по возможности обращение ко внешней системной памяти для некоторых команд. Процессор Intel486, например, содержит один 8-KB блок встроенной кэш-памяти, используемой одновременно для кэширования программного кода и данных.

Проектировщики фирмы Intel обошли это ограничение использованием дополнительного контура, выполненного на 3.1 миллионах транзисторов Pentium процессора ( для сравнения, Intel486 содержит 1.2 миллиона транзисторов ) создающих раздельное внутреннее кэширование программного кода и данных. Это улучшает производительность посредством исключения конфликтов на шине и делает двойное кэширование доступным чаще, чем это было возможно ранее. Например, во время фазы предварительной подготовки, используется код команды, полученный из кэша команд. В случае наличия одного блока кэш-памяти, возможен конфликт между процессом предварительной подготовки команды и доступом к данным. Выполнение раздельного кэширования для команд и данных исключает такие конфликты, давая возможность обеим командам выполняться одновременно. Кэш-память программного кода и данных Pentium процессора содержит по 8 KB информации каждая, и каждая организована как набор двухканального ассоциативного кэша - предназначенная для записи только предварительно просмотренного специфицированного 32-байтного сегмента, причем быстрее, чем внешний кэш. Все эти особенности расширения производительности потребовали использования 64-битовой внутренней шины данных, которая обеспечивает возможность двойного кэширования и суперскалярной конвейерной обработки одновременно с загрузкой следующих данных. Кэш данных имеет два интерфейса, по одному для каждого из конвейеров, что позволяет ему обеспечивать данными две отдельные инструкции в течение одного машинного цикла. После того, как данные достаются из кэша, они записываются в главную память в режиме обратной записи. Такая техника кэширования дает лучшую производительность, чем простое кэширование с непосредственной записью, при котором процессор записывает данные одновременно в кэш и основную память. Тем не менее, Pentium процессор способен динамически конфигурироваться для поддержки кэширования с непосредственной записью.

Таким образом, кэширование данных использует два различных великолепных решения: кэш с обратной записью и алгоритм, названный MESI ( модификация, исключение, распределение, освобождение) протокол. Кэш с обратной записью позволяет записывать в кэш без обращения к основной памяти в отличие от используемого до этого непосредственного простого кэширования. Эти решения увеличивают производительность посредством использования преобразованной шины и предупредительного исключения самого узкого места в системе. В свою очередь MESI-протокол позволяет данным в кэш-памяти и внешней памяти совпадать - великолепное решение в усовершенствованных мультипроцессорных системах, где различные процессоры могут использовать для работы одни и те же данные.

Блок предсказания правильного адреса перехода - это следующее великолепное решение для вычислений, увеличивающее производительность посредством полного заполнения конвейеров командами, основанное на предварительном определении правильного набора команд, которые должны быть выполнены.

Pentium процессор позволяет выполнять математические вычисления на более высоком уровне благодаря использованию усовершенствованного встроенного блока вычислений с плавающей запятой, который включает восьмитактовый конвейер и аппаратно реализованные основные математические функции. Четырехтактовые конвейерные команды вычислений с плавающей запятой дополняют четырехтактовую целочисленную конвейеризацию. Большая часть команд вычислений с плавающей запятой могут выполняться в одном целочисленном конвейере, после чего подаются в конвейер вычислений с плавающей запятой. Обычные функции вычислений с плавающей запятой, такие как сложение, умножение и деление, реализованы аппаратно с целью ускорения вычислений.

В результате этих инноваций, Pentium процессор выполняет команды вычислений с плавающей запятой в пять раз быстрее, чем 33-МГц Intel486 DX, оптимизируя их для высокоскоростных численных вычислений, являющихся неотъемлемой частью таких усовершенствованных видеоприложений, как CAD и 3D-графика.

Pentium процессор снаружи представляет собой 32-битовое устройство. Внешняя шина данных к памяти является 64-битовой, удваивая количество данных, передаваемых в течение одного шинного цикла. Pentium процессор поддерживает несколько типов шинных циклов, включая пакетный режим, в течение которого происходит порция данных из 256 бит в кэш данных и в течение одного шинного цикла.

Шина данных является главной магистралью, которая передает информацию между процессором и подсистемой памяти. Благодаря этой 64-битовой шине данных, Pentium процессор существенно повышает скорость передачи по сравнению с процессором Intel486 DX - 528 MB/сек для 66 МГц, по сравнению со 160 MB/сек для 50 МГц процессора Intel486 DX. Эта расширеная шина данных способствует высокоскоростным вычислениям благодаря поддержке одновременной подпитки командами и данными процессорного блока суперскалярных вычислений, благодаря чему достигается еще большая общая производительность Pentium процессора по сравнению с процессором Intel486 DX.

Давая возможность разработчикам проектировать системы с управлением энергопотреблением, защитой и другими свойствами, Pentium процессор поддерживаем режим управления системой (SMM), подобный режиму архитектуры Intel SL.

Вместе со всем, что сделано нового для 32-битовой микропроцессорной архитектуры фирмы Intel, Pentium процессор сконструирован для легкой наращиваемости с использованием архитектуры наращивания фирмы Intel. Эти нововведения защищают инвестиции пользователей посредством наращивания производительности, которая помогает поддерживать уровень продуктивности систем, основанных на архитектуре процессоров фирмы Intel, больше, чем продолжительность жизни отдельных компонентов. Технология наращивания делает возможным использовать преимущества большинства процессоров усовершенствованной технологи в уже существующих системах с помощью простой инсталяции средства однокристального наращивания производительности. Например, первое средство наращивания - это OverDrive процессор, разработанный для процессоров Intel486 SX и Intel486 DX, использующий технологию простого удвоения тактовой частоты, использованную при разработке микропроцессоров Intel486 DX2.

Первые модели процессора Pentium работали на частоте 60 и 66 МГц и общались со своей внешней кэш-памятью второго уровня по 64-битовой шине данных, работающей на полной скорости процессорного ядра. Hо если скорость процессора Pentium растет, то системному разработчику все труднее и дороже обходится его согласование с материнской платой. Поэтому быстрые процессоры Pentium используют делитель частоты для синхронизации внешней шины с помощью меньшей частоты. Hапример, у 100 МГц процессора Pentium внешняя шина работает на 66 МГц, а у 90 МГц - на 60 МГц. Процессор Pentium использует одну и ту же шину для доступа к основной памяти и к периферийным подсистемам, таким как схемы PCI.

3.10. Процессор Pentium Pro.

3.10.1. Общее описание процессора.

Pentium Pro это высокотехнологичный процессор шестого поколения для высокоуровневых десктопов, рабочих станций и мультипроцессорных серверов. Массовое производство процессора Pentium Pro, содержащего на кристалле столько транзисторов, сколько никогда не было на серийных процессорах, сразу в нескольких вариантах стартует с 1 ноября, т.е. с самого момента объявления. Беспрецедентный случай в истории компании, да и электронной промышленности.

Hапомним некоторые его особенности. Агрессивная суперконвейерная схема, поддерживающая исполнение команд в произвольном порядке, условное исполнение далеко наперед (на 30 команд) и трехпоточная суперскалярная микроархитектура. Все эти методы могут поразить воображение, но ни один из них не является чем-то оригинальным: новые чипы NexGen и Cyrix также используют подобные схемы. Однако, Intel обладает ключевым превосходством. В процессоры Pentium Pro встроена вторичная кэш-память, соединенная с ЦПУ отдельной шиной. Эта кэш, выполненная в виде отдельного кристалла статического ОЗУ емкостью 256К или 512К, смонтированного на втором посадочном месте необычного двухместного корпуса процессора Pentium Pro, значительно упростила разработчикам проектирование и конструирование вычислительных систем на его основе.

Реальная производительность процессора оказалась намного выше 200 единиц, которые назывались в качестве запланированного стартового ориентира при февральском технологическом анонсировании P6.

Pentium Pro это значительный шаг вперед. И хотя в процессоре Pentium впервые была реализована суперскалярная форма архитектуры х86, но это была ограниченная реализация: в нем интегрирована пара целочисленных конвейеров, которые могут обрабатывать две простые команды параллельно, но в порядке следования команд в программе и без т.н. условного исполнения (наперед). Hапротив, новый процессор это трехпоточная суперскалярная машина, которая способна одновременно отслеживать прохождение пяти команд. Для согласования с такой высокой пропускной способностью потребовалось резко улучшить схему кэширования, расширить файл регистров, повысить глубину упреждающей выборки и условного исполнения команд, усовершенствовать алгоритм предсказания адресов перехода и реализовать истинную машину данных, обрабатывающую команды не по порядку, а сразу по мере готовности данных для них. Ясно, что эта схема нечто большее, чем Pentium, что и подчеркивает, по мнению Intel, суффикс Pro в имени процессора.

3.10.2. Два кристалла в одном корпусе.

Самая поразительная черта Pentium Pro - тесно связанная с процессором кэш-память второго уровня (L2), кристалл которой смонтирован на той же подложке, что и ЦПУ. Именно так, Pentium Pro это два чипа в одном корпусе. Hа одном чипе размещено собственно ядро процессора, включающее два 8-Килобайтовых блока кэш-памяти первого уровня; другой чип это 256-Кб СОЗУ, функционирующее как четырехканальная порядково-ассоциативная кэш второго уровня.

Два этих кристалла объединены в общем 387-контактном корпусе, но связаны линиями, не выходящими на внешние контакты. Hекоторые компании называют такой чип корпуса МСМ (multichip module), однако Intel использует для него термин dual-cavity PGA (pin-grid array). Разница слишком неосязаема и лежит, вполне вероятно, в области маркетинга, а не технологии, так как использование МСМ заработало себе репутацию дорогостоящей технологии. Hо сравнивая цены на процессоры Pentium и Pentium Pro, можно утверждать, что новая терминология исправит положение дел, так как P6 претендует на статус массового процессора. Впервые в истории промышленности многокристалльный модуль станет крупносерийным изделием.

Степень интеграции нового процессора также поражает: он содержит 5.5 млн. транзисторов, да еще 15.5 млн. входит в состав кристалла кэш-памяти. Для сравнения, последняя версия процессора Pentium состоит из 3.3 млн. транзисторов. Естественно, в это число не включена кэш L2, поскольку Pentium требует установки внешнего комплекта микросхем статического ОЗУ для реализации вторичной кэш-памяти.

Элементарный расчет поможет понять 6почему на 256К памяти требуется такое огромное число транзисторов. Это статическое ОЗУ, которое в отличие от динамического, имеющего всего один транзистор на бит хранения и периодически регенирируемого, использует для хранения бита ячейку из шести транзисторов:

256 х 1024 х 8 бит х 6 тр-ров = 12.5 млн. транзисторов. С учетом буферов и обвязки накопителя как раз и выйдет 15.5 миллионов.

Площадь процессорного кристалла равна 306 кв.мм. (для сравнения, у первого процессора Pentium кристалл имел площадь 295 кв.мм). Кристалл статической памяти, как всякая всякая регулярная структура, упакован намного плотнее - 202 кв.мм. Только Pentium Pro 150 MHz изготавливается по 0.6-микронной технологии. Все остальные версии нового процессора изготавливаются по 0.35-микронной BiCMOS-технологии с четырехслойной металлизацией.

Почему компания Intel пошла на двухкристалльный корпус, объединив ядро ЦПУ с вторичным кэшем? Во-первых комбинированный корпус значительно упростил изготовителям ПК разработку высокопроизводительных систем на процессоре Pentium Pro.

Одна из главных проблем при проектировании компьютера на быстром процессоре связана с точным согласованием с процессором вторичного кэша по его размеру и конфигурации. Встроенная в Р6 вторичная кэш уже тонко настроена под ЦПУ и позволяет разработчикам систем быстро интегрировать готовый процессор на материнскую плату.

Во-вторых, вторичная кэш тесно связана с ядром ЦПУ с помощью выделенной шины шириной 64 бита, работающей на одинаковой с ним частоте. Если ядро синхронизируется частотой 150 МГц, то кэш должна работать на частоте 150 МГц.

Поскольку в процессоре Pentium Pro есть выделенная шина для вторичного кэша, это решает сразу две проблемы: обеспечивается синхронная работа двух устройств на полной скорости и отсутствие конкуренции за шину с прочими операциями ввода-вывода. ОТдельная шина L2, "задняя" шина полностью отделена от наружной, "передней" шины ввода-вывода, вот почему в P6 вторичная кэш не мешает своими циклами операциям с ОЗУ и периферией. Передняя 64-битовая шина может работать с частотой, равной половине, трети или четверти скорости ядра Pentium Pro. "Задняя" шина продолжает работать независимо, на полной скорости.

Такая реализация представляет серьезный шаг вперед по сравнению с организацией шины процессора pentium и других процессоров х86. Только NexGen приближенно напоминает такую схему. Хотя в процессоре Nx586 нет кэша L2, зато встроен ее контроллер и полноскоростная шина для связи с внешней кэш-памятью. Подобно Р6, процессор Nx586 общается с основной памятью и периферийными подсистемами поверх отдельной шины ввода-вывода, работающей на деленной частоте.

В экзотическом процессором Alpha 21164 компания Digital пошла еще дальше, интегрировав прямо на кристалле в дополнение к первичной кэш-памяти еще и 96 Кбайт вторичной. За счет вздувания площади кристалла достигнута беспрецедентная производительность кэширования. Транзисторный бюджет Альфы составляет 9.3 миллиона транзисторов, большая часть которого образована массивом памяти.

Есть одна незадача: необычный дизайн Pentium Pro, пожалуй, затруднит экспертам задачку вычисления соотношения цены и производительности. Интегрированная в процессор кэш вроде как скрыта с глаз. Penyium Pro сможет показаться более дорогим, чем его конкуренты, но для создания компьютера на других процессорах потребуется внешний набор микросхем памяти и кэш-контроллер. Эффективный дизайн кэш-структуры означает, что другим процессорам, претендующим на сопоставимую производительность, потребуется кэш-памяти больше, чем 256 Кбайт.

Уникальный корпус предоставляет свободу созданию новых вариантов процессора. В будущем возможно как повышение объема кэш-памяти, так и ее отделение ее от процессора в соответствии с традиционным подходом. Если последний вариант появится, он окажется несовместим по внешним выводам с двухкристалльным базовым корпусом, так как ему необходимо добавить 72 дополнительных вывода (64-для "задней" шины и 8 для контроля ошибок). Hо он будет почти таким же быстрым, если будет широко доступна статическая память с пакетным режимом. По мнению инженеров Intel, подключение внешних микросхем памяти к "передней" шине Pentium Pro с целью реализации кэш-памяти третьего уровня, вряд ли оправдано. Отправной точкой для такой убежденности служат результаты натурного моделирования прототипа системы, которая вследствии высокой эффективности интерфейса кэш L2-процессор, практически до теоретического предела загружает вычислительные ресурсы ядра. Процессор Alpha 21164, напротив, спроектирован с учетом необходимости кэш L3.

Страницы: 1, 2, 3, 4, 5, 6, 7, 8


Новости

Быстрый поиск

Группа вКонтакте: новости

Пока нет

Новости в Twitter и Facebook

  скачать рефераты              скачать рефераты

Новости

скачать рефераты

© 2010.