скачать рефераты
  RSS    

Меню

Быстрый поиск

скачать рефераты

скачать рефератыРеферат: Процессор AMD. История развития

·  Модернизируемый кэш L2. У К7 кэш L2 будет размещен, по примеру PII, в картридже, а не интегрирован в кристалл, как у К6-3. Результатом этого является возможность "модернизации" кэша. Первоначально его частота будет составлять 1/3 частоты процессора. В дальнейшем планируется выпуск версий с кэшем L2, работающим на частоте процессора, и, возможно, на половинной частоте. То же и с размером. К7 может нести кэш L2 размером от 512К в "нижних" моделях до 8МВ в серверных моделях "high-end" (впечатляюще, Xeon на сегодня имеет до 2МВ, но цена...).

AMD Duron 650

В то время, когда популярность Socket 7 платформ находилась на самом пике, и оба крупнейших микропроцессорных производителя и Intel, и AMD делали процессоры под этот разъем, мы привыкли к тому что AMD предлагала менее производительные, но и более дешевые решения. Однако, год назад это положение коренным образом изменилось. Анонсировав Athlon, который архитектурно превосходит Intel Pentium III, AMD удалось на какое-то время захватить лидерство в производительности процессоров. И хотя Intel впоследствии удалось усовершенствовать ядро своих процессоров, в которое был добавлен встроенный кеш второго уровня, AMD прочно обосновалась на рынке скоростных CPU, где и по сей день продолжает укреплять свои позиции.

В настоящий момент AMD применяет против Intel два средства. Первое - агрессивная ценовая политика, в результате которой процессоры Athlon оказались намного дешевле своих соперников, Intel Pentium III, работающих на аналогичной частоте. И второе - благодаря своей архитектуре AMD удается повышать частоту своих процессоров несколько легче, чем Intel. В результате, на настоящий момент, например, AMD уже серийно продает свои гигагерцовые CPU.

Однако, есть у AMD и проблемы. Самая большая головная боль с Athlon - это кеш второго уровня, выполненный в виде микросхем SRAM, которые до недавнего времени располагались на процессорной плате и производились сторонними производителями. Младшие модели Athlon имели L2-кеш, работающий на половинной частоте ядра процессора, однако по мере роста частот производители SRAM не поспевали за AMD и не могли обеспечить поставки микросхем кеша, работающих на 1/2 частоты процессора. В результате, начиная с частоты 750 МГц Athlon стал снабжаться кеш-памятью, работающей на 2/5 частоты процессора, а начиная с частоты 900 МГц - и вовсе работающей на 1/3 частоты. Таким образом, получилась парадоксальная ситуация, когда самый быстрый L2-кеш оказался у 700-мегагерцового Athlon. AMD же, естественно, такая ситуация устроить не могла, так как медленная кеш-память второго уровня начала сдерживать рост производительности процессоров.

Поэтому, решение наконец-то переместить L2-кеш AMD Athlon с внешней процессорной платы внутрь ядра выглядит вполне логично. Тем более, что оба завода AMD и в Остине и в Дрездене успешно освоили технологию 0.18 мкм, что позволило при переходе со старой 0.25 мкм технологии уменьшить площадь ядра Athlon на 82 кв.мм.

В результате, линейка AMD Athlon получила продолжение в лице процессоров на ядре Thunderbird, имеющих кеш первого уровня размером 128Кбайт и 256-килобайтный интегрированный в ядро кеш второго уровня, работающий на полной частоте CPU. Это семейство новых AMD Athlon с частотой 750 МГц и выше было анонсировано более двух недель назад.

Однако, этим AMD не ограничилась. Еще год назад при представлении Athlon компания заявила о намерении производства различных модификаций своего CPU, рассчитанных на различные сектора рынка. И вот, наконец, теперь она начала осуществлять свои планы, представив и семейство процессоров AMD Duron ориентированное на low-end сектор и являющееся прямым конкурентом Intel Celeron.

Итак, посмотрим, что же представляют из себя процессоры Duron с точки зрения их основных характеристик:

  • Чип, производимый по технологии 0.18 мкм с использованием медных соединений
  • Ядро Spitfire, основанное на архитектуре Athlon. Содержит 25 млн. транзисторов и имеет площадь 100 кв.мм
  • Работает в специальных материнских платах с 462-контактным процессорным разъемом Socket A
  • Использует высокопроизводительную 100 МГц DDR системную шину EV6
  • Кеш первого уровня 128 Кбайт - по 64 Кбайта на код и на данные
  • Интегрированный кеш второго уровня 64 Кбайта. Работает на полной частоте ядра
  • Напряжение питания - 1.5В
  • Набор SIMD-инструкций 3DNow!
  • Выпускаются версии с частотами 600, 650, 700 МГц

Итак, с точки зрения архитектуры, Duron ничем не отличается от обычного Athlon, кроме встроенного в ядро 64-Кбайтного кеша второго уровня. Если же сравнить Duron с новыми Athlon на ядре Thunderbird, то различия между ними будут заключаться в размере интегрированного L2 кеша (у Thunderbird он 256 Кбайт против 64 Кбайт у Duron) и в частотах (Thunderbird выпускаются с частотами начиная с 750МГц, а Duron - с частотами до 700 МГц). В остальном же, архитектурно и старые и новые Athlon и Duron ничем не отличаются. При этом, все же необходимо иметь в виду, что все же новые процессоры Duron и Thunderbird имеют обновленное и технологически усовершенствованное ядро, выпускаемое по технологии 0.18 мкм. В результате, например, даже получается, что ядро Duron с встроенным L2-кешем по площади даже меньше, чем ядро K75 (0.18 мкм Athlon).

И отдельно хочется коснуться нового форм-фактора и процессорного разъема, который теперь использует AMD для своих CPU. Поскольку микросхем SRAM, используемых для внешнего L2-кеша у новых процессоров Duron и Thunderbird теперь нет, AMD вслед за Intel вновь обратила внимание на процессорный разъем типа socket. Это не только более выгодно из экономических соображений (нет необходимости в процессорной плате, картридже и т.п.), но и более рационально с точки зрения организации лучшего охлаждения. В качестве такого разъема AMD решила использовать 462-контактный Socket A, который по своим размерам, да и по внешнему виду похож как на Socket 7, так и на Socket 370. Поэтому, с Socket A процессорами AMD можно использовать старые Socket 7 и Socket 370 кулеры. Единственное, не следует при этом забывать, что тепловыделение Duron несколько превосходит количество тепла, отдаваемое Celeron, поэтому они нуждаются в несколько лучшем охлаждении. Например, Duron 650 выделяет тепла примерно столько же, сколько и Intel Pentium III 733.

У AMD Duron с системной шиной все в порядке. Поскольку этот процессор, как и остальные из семейства Athlon использует 100-мегагерцовую DDR шину EV6, пропускная способность этого звена оказывается 1,6 Гбайт/с. Кеш первого уровня Duron со времен выпуска первых Athlon не претерпел никаких изменений - его размер составляет 128 Кбайт. Кеш первого уровня Duron делится на две части - для кеширования данных и для кеширования инструкций.

Что же касается кеша второго уровня, то тут нас ждет небольшой сюрприз. Нетрудно заметить, что у Duron он в два раза меньше чем L1 кеш. Зачам он тогда нужен? Ответ на этот вопрос кроется в алгоритме работы L2 кеша Duron и, кстати, Thunderbird. Кеш второго уровня этих процессоров является эксклюзивным, что означает, что данные, хранящиеся в L1 кеше в нем не дублируются. Такой метод работы L2 кеша реализован пока только в новых процессорах AMD, все же интеловские процессоры имеют обычный inclusive L2 кеш, данные из L1 кеша в котором дублируются. Поэтому общий объем эффективной кеш-памяти у AMD Duron составляет 128+64=192 Кбайта, в то время как у Celeron он всего 128 Кбайт (32 Кбайта L2 кеша занято копией данных, имеющихся в L1 кеше).

Чтобы проиллюстрировать все вышесказанное приведу графики, показывающие скорость записи в память блоков данных различного размера для процессоров AMD Duron 650:

Процессор AMD Duron удался. Это можно сказать определенно. Его производительность находится на достаточно высоком уровне, чтобы не только обогнать конкурирующий Intel Celeron, но и вообще не оставить ему никаких шансов в штатном режиме. Производительность AMD Duron 650 всего на несколько процентов меньше скорости AMD Athlon 650 и примерно соответствует производительности Intel Pentium III 600EB. Таким образом, выход Duron, если Intel не предпримет никаких действий для улучшения производительности своего low-end процессора, означает смерть Celeron.

AMD Athlon

Если подойти к архитектуре AMD Athlon поверхностно, то основные его параметры можно обрисовать следующим образом:

  • Чип, производимый по технологии 0.25 мкм
  • Ядро нового поколения с кодовым именем Argon, содержащее 22 млн. транзисторов
  • Работает в специальных материнских платах с процессорным разъемом Slot A
  • Использует высокопроизводительную системную шину Alpha EV6, лицензированную у DEC
  • Кеш первого уровня 128 Кбайт - по 64 Кбайта на код и на данные
  • Кеш второго уровня 512 Кбайт. Расположен вне процессорного ядра, но в процессорном картридже. Работает на половинной частоте ядра
  • Напряжение питания - 1.6В
  • Набор SIMD-инструкций 3DNow!, расширенный дополнительными командами. Всего 45 команд
  • Выпускаются версии с частотами 500, 550, 600 и 650 МГц. Версия с частотой 700 МГц появится в ближайшее время

Однако таким простым процессор AMD Athlon кажется только лишь на первый взгляд. На самом же деле за этими несколькими строками скрываются многочисленные архитектурные инновации, которые мы рассмотрим позднее. Однако и простые характеристики AMD Athlon впечатляют. Например, как нетрудно заметить, Athlon превосходит Intel не только по максимальной тактовой частоте (у Intel Pentium III она 600 МГц, да и к тому же при этом он работает на повышенном до 2.05В напряжении ядра), но и по размеру кеша первого уровня, который у Intel Pentium III всего 32 Кбайта.


Перейдем же к более подробному рассмотрению архитектуры AMD Athlon.

Системная шина

Прежде чем углубляться в сам процессор, посмотрим, чем же отличается системная шина EV6, примененная AMD, от привычной интеловской GTL+. Внешнее сходство бывает обманчиво. Хотя процессорный разъем Slot A на системных платах для процессора AMD Athlon выглядит также как и Slot 1, перевернутый на 180 градусов, шинные протоколы и назначения контактов у Intel Pentium III и AMD Athlon совершенно различны. Более того, различно даже число задействованных сигналов - Athlon использует примерно половину из 242 контактов, в то время как Pentium III всего четверть. Внешняя похожесть вызвана тем, что AMD просто хотела облегчить жизнь производителям системных плат, которым не придется покупать особенные разъемы для установки на Slot A системные платы. Только и всего.

На самом же деле, хоть EV6 и работает на частоте 100 МГц, передача данных по ней, в отличие от GTL+ ведется на обоих фронтах сигнала, потому фактическая частота передачи данных составляет 200 МГц. Если учесть тот факт, что ширина шины EV6 - 72 бита, 8 из которых используется под ECC (контрольную сумму), то получаем скорость передачи данных 64бита х 200 МГц = 1,6 Гбайт/с. Напомню, что пропускная способность GTL+, работающей на 100 МГц в два раза меньше - 800 Мбайт/с. Повышение частоты GTL+ до 133 МГц дает увеличение пропускной способности при этом только до 1,06 Гбайт/с. Казалось бы, как в случае с GTL+, так и с EV6 получаются внушительные значения пропускной способности. Однако, только современная PC100 память может отожрать от нее до 800 Мбайт/с, а AGP, работающий в режиме 2x - до 528 Мбайт/с. Не говоря уже о PCI и всякой другой мелочевке. Получается, что GTL+ уже сейчас может не справляться с передаваемыми объемами данных. У EV6 же в этом случае все в порядке, потому эта шина более перспективна.

При этом, как частота GTL+ может быть увеличена со 100 до 133 МГц, планируется, что и частота EV6 также впоследствии достигнет значения 133 (266), а затем и 200 (400) МГц. Однако планы эти могут и не осуществиться - реализовать работу на материнской плате EV6, требующую большего количества контактных дорожек, несколько сложнее, особенно на больших частотах. Хотя если у AMD все получится, пропускная способность системной шины может достичь 2.1 и 3.2 Гбайта/с соответственно, что позволит беспрепятственно применять в Athlon-системах, например, высокопроизводительную 266-мегагерцовую DDR SDRAM.

Кеш

Прежде чем переходить непосредственно к функционированию AMD Athlon, хочется затронуть тему L1 и L2 кешей.

Что касается кеша L1 в AMD Athlon, то его размер 128 Кбайт превосходит размер L1 кеша в Intel Pentium III аж в 4 раза, не только подкрепляя высокую производительность Athlon, но и обеспечивая его эффективную работу на высоких частотах. В частности, одна из проблем используемой Intel архитектуры Katmai, которая, похоже, уже не позволяет наращивать быстродействие простым увеличением тактовой частоты, как раз заключается в малом объеме L1 кеша, который начинает захлебываться при частотах, приближающихся к гигагерцу. AMD Athlon лишен этого недостатка.

Что же касается кеша L2, то и тут AMD оказалось на высоте. Во-первых, интегрированный в ядро tag для L2-кеша поддерживает его размеры от 512 Кбайт до 16 Мбайт. Pentium III, как известно, имеет внешнюю Tag-RAM, подерживающую только 512-килобайтный кеш второго уровня. К тому же, Athlon может использовать различные делители для скорости L2-кеша: 1:1, 1:2, 2:3 и 1:3. Такое разнообразие делителей позволяет AMD не зависеть от поставщиков SRAM определенной скорости, особенно при выпуске более быстрых моделей.

Благодаря возможности варьировать размеры и скорости кеша второго уровня AMD собирается выпускать четыре семейства процессоров Athlon, ориентированных на разные рынки.

Архитектура. Общие положения

Вот мы и подошли к рассказу о том, как же, собственно, работает Athlon. Как и процессоры от Intel с ядром, унаследованным от Pentium Pro, процессоры Athlon имеют внутреннюю RISC-архитектуру. Это означает, что все CISC-команды, обрабатываемые процессором, сначала раскладываются на простые RISC-операции, а потом только начинают обрабатываться в вычислительных устройствах CPU. Казалось бы, зачем усложнять себе жизнь? Оказывается, есть зачем. Сравнительно простые RISC-инструкции могут выполняться процессором по несколько штук одновременно и намного облегчают предсказание переходов, тем самым позволяя наращивать производительность за счет большего параллелизма. Говоря более просто, тот производитель, который сделает более "параллельный" процессор, имеет шанс добиться превосходства в производительности гораздо меньшими усилиями. AMD при проектировании Athlon, по-видимому, руководствовалась и этим принципом.

Однако перед тем, как начать работу над параллельными потоками инструкций, процессор должен их откуда-то получить. Для этого в AMD Athlon, как впрочем и в Intel Pentium III, применяется дешифратор команд (декодер), который преобразует поступающий на вход процессора код. Дешифратор в AMD Athlon может раскладывать на RISC-составляющие до трех входящих CISC-команд одновременно. Современные интеловские процессоры могут также обрабатывать до трех команд, однако если для Athlon совершенно все равно, какие команды он расщепляет, Pentium III хочет, чтобы две из трех инструкций были простыми и только одна - сложной. Это приводит к тому, что если Athlon за каждый процессорный такт может переварить три инструкции независимо ни от чего, то у Pentium III отдельные части дешифратора могут простаивать из-за неоптимизированного кода.

Перед тем, как попасть в соответствующий вычислительный блок, поступающий поток RISC-команд задерживается в небольшом буфере (Instruction Control Unit), который, что уже неудивительно, у AMD Athlon расчитан на 72 инструкции против 20 у Pentium III. Увеличивая этот буфер, AMD попыталась добиться того, чтобы дешифратор команд не простаивал из-за переполнения Instruction Control Unit.

Еще один момент, заслуживающий внимания - вчетверо большая, чем у Pentium III, таблица предсказания переходов размером 2048 ячеек, в которой сохраняются предыдущие результаты выполнения логических операций. На основании этих данных процессор прогнозирует их результаты при их повторном выполнении. Благодаря этой технике AMD Athlon правильно предсказывает результаты ветвлений где-то в 95% случаев, что очень даже неплохо, если учесть, что аналогичная характеристика у Intel Pentium III всего 90%.

Страницы: 1, 2, 3


Новости

Быстрый поиск

Группа вКонтакте: новости

Пока нет

Новости в Twitter и Facebook

  скачать рефераты              скачать рефераты

Новости

скачать рефераты

© 2010.