скачать рефераты
  RSS    

Меню

Быстрый поиск

скачать рефераты


Блок предсказания  правильного адреса перехода - это следующее великолепное решение для вычислений,  увеличивающее производительность  посредством  полного заполнения конвейеров командами, основанное на предварительном определении правильного набора  команд,  которые  должны быть выполнены.  Pentium процессор - это первый и единственный PC-совместимый процессор, использующий блок предсказания, который до этого традиционно был связан с вычислительными платформами больших ЭВМ.

            Для лучшего понимания этой концепции, рассмотрим типичное программное приложение.  После выполнения каждого программного цикла, программа  выполняет соответствующую проверку для определения, необходимо ли возвратиться в начало цикла или выйти и продолжить выполнение  следующего шага.  Эти два решения,  или пути, называют предсказанием адреса перехода.  Блок предсказания правильного  адреса  перехода  прогнозирует,  какая  ветвь программы будет затребована,  основываясь  на  допущении,  что предыдущая ветвь,  которая была пройдена, будет использоваться снова. Pentium процессор выполняет предсказание правильного адреса перехода, используя специальный буфер предсказания перехода (BTB).  В отличие от  альтернативной  архитектуры,  это программно-шаблонное нововведение  дает  возможность для перекомпилирования программного кода, увеличивая при этом скорость и производительность  существующего  прикладного  программного обеспечения. Если команда управляет ветвлением программы,  буфер BTB запоминает команду и адрес,  на который необходимо перейти, и предсказывает,  какая ветвь команд в следующий момент будет использоваться. Когда буфер содержит правильное предсказание, переход выполняется без задержки.

Высокопроизводительный блок вычислений с плавающей запятой.

┌─────────────────────────────────────┬──────────────────────┐

│         ┌────────┐      ┌────────┐  │                      │

│       ┌─┤        ├──────┤        │  │  блок конвеерных     │

│       │ └───┬────┘      └────┬───┘  │    вычислений с      │

│       │     │  ┌─────────────┘      │  плавающей запятой   │

│       │ ┌───┴──┴─┐      ┌────────┐  │                      │

│ ┌───┐ │ │        ├──────┤░░░░░░░░│  │                      │

│ ┤   ├─┤ └─┬────┬─┘      │░░░░░░░░│  │                      │

│ └───┘ │ ┌─┴─┐┌─┴─┐      │░░░░░░░░│  │                      │

│       │ │   ││   │   ┌──┤░░░░░░░░│  │                      │

│       │ └─┬─┘└─┬─┘   │  │░░░░░░░░│  │                      │

│       │ ┌─┴────┴─┐   │  ├────────┤  │                      │

│       │ │        │   │  │░░░░░░░░│  │     Умножитель       │

│       │ └─┬────┬─┘   │  ├────────┤  │                      │

│       │   ├────┼─────┘  │░░░░░░░░│  │      сумматор        │

│       │ ┌─┴────┴─┐      ├────────┤  │                      │

│       └─┤        │      │░░░░░░░░│  │      делитель        │

│         └────────┘      └────────┘  │                      │

└─────────────────────────────────────┴──────────────────────┘

 


Нарастающая волна   32-разрядных  программных  приложений включает много интенсивно вычисляющих,  графически  ориентиро-программ, которые занимают много процессорных ресурсов на  выполнение операций с плавающей запятой,  обеспечивающих математические вычисления.  Поскольку  требования   к   персональным компьютерам со стороны программного обеспечения по вычислениям с плавающей запятой постоянно  возрастают,  удовлетворить  эти потребности могут  усовершенствования в микропроцессорной технологии. Процессор Intel486 DX, например, был первым микропроцессором, интегрированным  на  одной подложке с математическим сопроцессором. Предыдущие семейства процессоров  фирмы  INTEL, при необходимости  использования  вычислений с плавающей запятой, использовали внешний математический сопроцессор.

            Pentium процессор позволяет выполнять математические вычисления на более высоком уровне благодаря использованию усовершенствованного встроенного блока вычислений с плавающей запятой, который включает восьмитактовый конвейер и аппаратно реализованные основные математические функции.  Четырехтактовые конвейерные команды вычислений с  плавающей  запятой  дополняют четырехтактовую целочисленную конвейеризацию. Большая часть команд вычислений с плавающей запятой могут выполняться в  одном целочисленном конвейере, после чего подаются в конвейер вычислений с плавающей запятой.  Обычные функции вычислений с плавающей запятой, такие как сложение, умножение и деление, реализованы аппаратно с целью ускорения вычислений.

            В результате этих инноваций,  Pentium процессор выполняет команды вычислений с плавающей запятой в пять раз быстрее, чем 33-МГц    Intel486 DX,  оптимизируя  их  для  высокоскоростных численных вычислений,  являющихся  неотъемлемой  частью  таких усовершенствованных видеоприложений, как CAD и 3D-графика.

            Pentium процессор на тактовой частоте 66 МГц работает как "числодробилка" с  рейтингом 64.5 по тесту SPECint92,  практически не уступая RISC-процессору Alpha компании Digital,  но с тактовой частотой вдвое более высокой.

            Общая производительность Pentium процессора превосходит в 6 раз  25  МГц  Intel486 SX и в 2.6 раз - 66 МГц Intel486 DX2. Индекс по рейтингу iCOMP для 66 МГц Pentium процессора,  который выполняет  112  миллионов  операций в секунду,  составляет 567. Индекс  по  iCOMP  (Intel  COmparative   Microprocessor Performance)  выполняет относительное сравнение производительности 32-битовых процессоров фирмы INTEL.

Расширенная 64-битовая шина данных.

┌─────────────────────────────────────┬──────────────────────┐

│         ┌────────┐      ┌────────┐  │                      │

│       ┌─┤        ├──────┤        │  │                      │

│       │ └───┬────┘      └────┬───┘  │                      │

│       │     │  ┌─────────────┘      │                      │

│       │ ┌───┴──┴─┐      ┌────────┐  │                      │

│ ┌───┐ │ │        ├──────┤        │  │                      │

│ ┤░░░├─┤ └─┬────┬─┘      │        │  │                      │

│ └───┘ │ ┌─┴─┐┌─┴─┐      │        │  │                      │

│       │ │   ││   │   ┌──┤        │  │                      │

│       │ └─┬─┘└─┬─┘   │  │        │  │                      │

│       │ ┌─┴────┴─┐   │  ├────────┤  │                      │

│       │ │        │   │  │        │  │                      │

│       │ └─┬────┬─┘   │  ├────────┤  │                      │

│       │   ├────┼─────┘  │        │  │                      │

│       │ ┌─┴────┴─┐      ├────────┤  │                      │

│       └─┤        │      │        │  │                      │

│         └────────┘      └────────┘  │                      │

└─────────────────────────────────────┴──────────────────────┘

 


Pentium процессор снаружи представляет собой 32-битовое устройство. Внешняя шина данных к памяти является  64-битовой, удваивая количество данных, передаваемых в течение одного шинного цикла.  Pentium процессор поддерживает несколько типов шинных циклов, включая пакетный режим, в течение которого происходит порция данных из 256 бит в кэш данных и в течение одного шинного цикла.

Шина данных является главной магистралью, которая передает информацию между процессором и подсистемой памяти. Благодаря этой 64-битовой шине данных,  Pentium процессор существенно повышает скорость передачи по сравнению с процессором Intel486 DX - 528 MB/сек для 66 МГц,  по сравнению со 160 MB/сек для 50МГц процессора  Intel486  DX.  Эта  расширенная   шина   данных способствует высокоскоростным  вычислениям благодаря поддержке одновременной подпитки командами и данными процессорного блока суперскалярных  вычислений,  благодаря  чему  достигается  еще большая общая производительность Pentium процессора по сравнению с процессором Intel486 DX.

     В общем,  имея более широкую шину  данных,  Pentium  процессор обеспечивает    конвейеризацию    шинных   циклов,   что способствует увеличению пропускной способности шины. Конвейеризация шинных  циклов  позволяет второму циклу стартовать раньше завершения выполнения первого цикла. Это дает подсистеме памяти больше  времени  для  декодирования  адреса,  что позволяет использовать более медленные и менее дорогостоящие  компоненты памяти, уменьшая в результате общую стоимость системы. Ускорение процессов чтения и записи,  параллелилизм адреса и данных, а также декодирование в течение одного цикла - все вместе позволяет улучшить пропускную способность и повышает  возможности системы.


Мультипроцессорность.

┌────────────────────────────────────────────────────────────┐

│      Внутреннее определение ошибок и тестирование          │

│          с помощью функциональной избыточности             │

├───────────────────────────┬────┬───────────────────────────┤

│         Master            │    │         Checker           │

│        ┌────────┐   ┌────┐│    │        ┌────────┐   ┌────┐│

│      ┌─┤        ├───┤    ││    │      ┌─┤        ├───┤    ││

│      │ └───┬────┘   └──┬─┘│    │      │ └───┬────┘   └──┬─┘│

│      │     │  ┌────────┘  │    │      │     │  ┌────────┘  │

│      │ ┌───┴──┴─┐   ┌────┐│    │      │ ┌───┴──┴─┐   ┌────┐│

│┌───┐ │ │        ├───┤    ││    │┌───┐ │ │        ├───┤    ││

│┤   ├─┤ └─┬────┬─┘   │    ││ ─┬─│┤   ├─┤ └─┬────┬─┘   │    ││

│└───┘ │ ┌─┴─┐┌─┴─┐   │    ││  │ │└───┘ │ ┌─┴─┐┌─┴─┐   │    ││

│      │ │   ││   │ ┌─┤    ││  │ │      │ │   ││   │ ┌─┤    ││

│      │ └─┬─┘└─┬─┘ │ │    ││  │ │      │ └─┬─┘└─┬─┘ │ │    ││

│      │ ┌─┴────┴─┐ │ ├────┤│  │ │      │ ┌─┴────┴─┐ │ ├────┤│

│      │ │        │ │ │    ││  │ │      │ │        │ │ │    ││

│      │ └─┬────┬─┘ │ ├────┤│  │ │      │ └─┬────┬─┘ │ ├────┤│

│      │   ├────┼───┘ │    ││  │ │      │   ├────┼───┘ │    ││

│      │ ┌─┴────┴─┐   ├────┤│  │ │      │ ┌─┴────┴─┐   ├────┤│

│      └─┤        │   │    ││  │ │      └─┤        │   │    ││

│        └────────┘   └────┘│  │ │        └────────┘   └────┘│

├─────────────┬─────────────┘  │ └──────┬──────┬─────────────┤

│             │                │  Check │      │             │

│             ├────────────────┼────────┘      │             │

│          Outputs          Inputs          IERR#            │

└────────────────────────────────────────────────────────────┘

 


Pentium процессор - это идеал для нарастающей волны мультипроцессорных систем, а также высочайший уровень производительности и вычислительной мощности в области современных вычислительных средств.  Мультипроцессорные приложения,  которые соединяют два  или более Pentium процессоров - хорошо обслуживаются посредством усовершенствованной архитектуры кристаллов, раздельным встроенным кэшированием программного кода и данных, а также наборами микросхем для управления внешней  кэш-памятью и утонченными средствами контроля целостности данных.

Как обсуждалось  ранее,  Pentium  процессор  поддерживает упорядоченный кэш с его MESI протоколом.  Когда один процессор получает доступ  к  данным,  которые  кэшируются в другом процессоре, он имеет возможность приема правильных данных. И если данные модифицировались,  все процессоры получают  возможность доступа  к  приему  данных  в модифицированном виде.  Новейший Pentium процессор фирмы INTEL также определяет,  какие команды распознаются  системой  в  соответствии с используемым способом программирования.  Это строго определенно подсказывает,  каким образом программному обеспечению,  разработанному для однопроцессорной системы,  корректно работать в многопроцессорном окружении.

     Средства разделения памяти на страницы.

            Pentium процессор предлагает опции поддержки любой из традиционных размеров страниц памяти - 4 KB или более широкие, 4 MB страницы.  Эта  опция  позволяет  производить  вычисление

частоты свопинга  страниц в комплексных графических приложениях, буферах фреймов,  а также ядер  операционных  систем,  где увеличенный размер  страницы  сейчас  позволяет  пользователям перепланировать шире первоначально громоздкие объекты.  Увеличение страниц  дает  результат в виде повышения производительности, причем все это  отражается  на  прикладном  программном обеспечении.

     Определение ошибок и функциональная избыточность.

            Хорошая защита   данных   и  обеспечение  их  целостности посредством внутренних средств становится крайне важным в приложениях, критичным к потерям данных благодаря распространению современного окружения клиент-серверов.  Pentium процессор содержит два усовершенствования, традиционно присущих проектированию класса больших ЭВМ -  внутреннее  определение  ошибок  и контроль за счет функциональной избыточности ( FCR ) - это помогает обеспечить  целостность  данных  развивающихся  сегодня систем, базирующихся на настольных компьютерах.

            Внутреннее определение ошибок  дополняет  битом  четности внутренний код  и кэширование данных,  сдвиговую ассоциативную таблицу страниц, микрокод, а также целевой буфер перехода, помогая определять ошибки таким образом,  что это остается незаметным и для пользователя,  и для системы. В то же время контроль с помощью функциональной избыточности  оптимизирован  для приложений,  критических  к  потерям данных,  где Pentium процессор может работать в конфигурации  основной/контролирующий. Если  между  двумя  процессорами  обнаруживаются  разногласия, система извещается об ошибке.  В результате происходит обнаружение более чем 99% ошибок.

            Кроме того, на подложке процессора расположено устройство встроенного тестирования.  Самотестирование  охватывает  более 70% узлов Pentium процессора,  не  требует  выполнения  сброса кристалла и представляет собой процедуру,  обычно используемую при диагностике систем. Другими встроенными решениями является реализация  стандарта  IEEE  1149.1,  позволяющая  тестировать внешние соединения процессора и отладочный режим,  дающий  возможность  программному  обеспечению  просматривать  регистры и состояние процессора.

     Управление производительностью.

            Управление производительностью - особенность Pentium процессора, что  позволяет  разработчикам  систем  и   прикладных расширений оптимизировать   свои   аппаратные   и  программные средства посредством определения потенциально узкого места для программного кода. А разработчики могут наблюдать и считать такты для внутренних событий процессора,  таких,  как производительность чтения и записи данных, кэширование совпадений и выпадений,  прерываний и использования шины.  Это позволяет им измерять эффективность,  которую имеет код в  двойной  архитектуре Pentium  процессора  и  в  своих  продуктах и выполнять тонкую настройку своих приложений или систем для достижения оптимальной  производительности.  Выгода  для конечных пользователей  - это более высокие достоинства и высшая  производительность,  и все  это благодаря хорошему взаимодействию с Pentium процессором,  пользовательской  системой  и   прикладным   программным обеспечением.

Давая возможность разработчикам проектировать  системы  с правлением энергопотреблением,  защитой и другими свойствами, Pentium процессор  поддерживаем  режим   управления   системой (SMM), подобный режиму архитектуры Intel SL.

     Наращиваемость.

Вместе со всем, что сделано нового для 32-битовой микропроцессорной  архитектуры  фирмы   INTEL,   Pentium   процессор сконструирован  для легкой наращиваемости с использованием архитектуры наращивания фирмы INTEL.  Эти нововведения  защищают инвестиции пользователей  посредством  наращивания  производительности, которая помогает  поддерживать  уровень  продуктивности систем,  основанных  на  архитектуре  процессоров  фирмы INTEL, больше, чем продолжительность жизни отдельных компонентов. Технология наращивания делает возможным использовать преимущества большинства процессоров усовершенствованной технологи в  уже  существующих  системах с помощью простой инсталляции средства однокристального наращивания производительности. Например, первое  средство наращивания - это Overdrive процессор, разработанный для  процессоров  Intel486  SX  и  Intel486  DX, использующий технологию  простого  удвоения  тактовой частоты, использованную при разработке микропроцессоров Intel486 DX2.

Посредством наращивания  одного  из  этих  дополнительных процессоров в сокет,  расположенный возле центрального микропроцессора на большинстве материнских платах Intel486,  пользователи могут увеличить общую производительность системы более чем на 70% практически для всех программных приложений.

Технология наращивания с  помощью  Overdrive  процессоров возможна и  для  систем,  основанных на семействе Pentium процессора, посредством простой установки в  будущем  процессора, выполненного по  усовершенствованной  технологии.  В свою очередь,  технология Pentium процессора является основой дополнительного процессора,  разрабатываемого для систем,  базируемых на Intel486 DX2.

            На сегодня Pentium процессор дает  возможность  получения наибольшей производительности  при самой умеренной цене,  полностью поддерживая совместимость с предыдущими  микропроцессорами семейства X86.

Литература:

     1. The Intel Pentium Processor. A Technical Overview.

     2. Intel Solutions.


Страницы: 1, 2, 3


Новости

Быстрый поиск

Группа вКонтакте: новости

Пока нет

Новости в Twitter и Facebook

  скачать рефераты              скачать рефераты

Новости

скачать рефераты

Обратная связь

Поиск
Обратная связь
Реклама и размещение статей на сайте
© 2010.