скачать рефераты
  RSS    

Меню

Быстрый поиск

скачать рефераты

скачать рефератыДоклад: Intel Pentium 4

Кеш данных первого уровня 8 Кбайт. Trace Cache для декодированных инструкций рассчитан на 12000 микроопераций

Интегрированный Advanced Transfer Cache второго уровня размером 256 Кбайт. Работает на полной частоте ядра и имеет 256-битную шину

Напряжение питания - 1.7В

Набор SIMD-инструкций SSE2

Выпускаются версии с частотами 1.4 и 1.5 ГГц. Позднее ожидается версия с частотой 1.3 ГГц.

Процессор Intel Pentium 4 будет выпускаться в FC-PGA упаковке, однако само ядро будет закрыто heat spreader – специальной металлической крышкой, защищающей его от повреждения. Устанавливаться Pentium 4 будет в гнездо Socket 423, имеющее 423 контакта и отличающееся по размеру от обычных Socket 370 и Socket A.

Из-за большого ядра, тепловыделение новых кристаллов будет достаточно высоким. В частности, Pentium 4 1.4 ГГц, работающий на напряжении 1.7 В и потребляющий примерно 32 A, будет рассеивать порядка 52 Вт тепла (1.5 ГГц Pentium 4 рассеивает 55 Вт тепла). Поэтому, кулеры для Pentium 4 должны иметь достаточно большие размеры и площадь поверхности.

Стоимость процессора при поставках партиями 1000 шт. составляет, соответственно, $819 и $644 для моделей с тактовыми частотами 1.5 ГГц и 1.4 ГГц. Pentium 4 1.3 ГГц, который появится 29 января 2001 года, будет стоить $409. Intel планирует достаточно агрессивно снижать цены на Pentium 4, с тем, чтобы этот процессор мог применяться в настольных компьютерах среднего уровня:

20 ноября 10 декабря 29 января
Pentium 4 1.5 Гц 819 819 644
Pentium 4 1.4 Гц 644 574 440
Pentium 4 1.3 Гц - - 409

3.  Чипсет и системная шина

Поскольку Pentium 4 имеет совершенно новую архитектуру, то ему потребовался и новый чипсет. Так как Intel нацеливает свой новый процессор на приложения, работающий с потоками данных, то основной задачей такого чипсета должно являться обеспечение высоких пропускных способностей основных шин: шины памяти и системной шины, соединяющей процессор с северным мостом чипсета.

В первую очередь необходимо сказать о том, что Pentium 4 использует совершенно новую Quad Pumped процессорную шину, работающую с частотой 400 МГц. Пропускная способность такой шины в три раза больше, чем пропускная способность шины процессора Pentium III, и составляет 3.2 Гбайт/с. Благодаря такой высокой пропускной способности, минимизируются простои быстрого процессора Pentium 4 в ожидании следующей порции данных. Физически, реализуется новая системная шина путем умножения в контроллерах процессорной шины чипсета и процессора тактовой частоты, которая для Pentium 4 составляет 100 МГц, на 4. То есть, на частоте 400 МГц работает только участок между процессором и чипсетом.Наряду с такой высокопроизводительной шиной, чтобы система была сбалансирована, подсистема памяти для Pentium 4 должна обеспечивать не меньшую, чем 3.2 Гбайт/с, пропускную способность. Поэтому, при создании набора системной логики для нового процессора Intel принял решение адаптировать чипсет i840, который поддерживает два канала Direct RDRAM. Как известно, пропускная способность PC800 RDRAM составляет 1.6 Гбайт/с, то есть, при использовании двух каналов Rambus, пропускная способность памяти оказывается как раз на уровне 3.2 Гбайт/с.
О недостатках RDRAM сказано уже достаточно много, главный из них – это высокая цена этой памяти, однако с технологической точки зрения двухканальная RDRAM смотрится в системах с Pentium 4 вполне оправдано. К сожалению, DDR SDRAM с близкой пропускной способностью будет выпущена только к концу следующего года. Однако, RDRAM хороша только в задачах потоковой обработки данных. В случае же решения задач, требующих непоследовательный доступ к данным, латентность RDRAM оказывается слишком высокой и вполне может быть оправдано применение не только DDR SDRAM, но и даже обычной SDRAM памяти. Однако, чипсетов с поддержкой SDRAM пока нет, и в лучшем случае они появятся только к середине следующего года.

В качестве южного моста в этом наборе логики используется уже знакомая нам по чипсету i815E микросхема ICH2, а в качестве северного моста – новый MCH Intel 82850, в числе ключевых особенностей которого следует отметить поддержку двух каналов Rambus, каждый из которых может функционировать с парой модулей RIMM, поддержку 400-мегагерцовой системной шины и AGP 4x.

3.1  Материнские платы

Ввиду дороговизны самого чипсета i850, который стоит $75, а также ввиду того, что платы под Pentium 4 должны иметь шестислойную PCB, производить их достаточно сложно и дорого. Поэтому, только ограниченное число производителей системных плат высказало желание ввязаться в производство плат под Socket 423. В ближайшее время платы под Pentium 4 будут выпускаться только восемью производителями. Спецификации некоторых таких плат уже известны:

Плата Чипсет Форм-фактор RIMM AGP PCI CNR Примечания
Aopen AX4T i850 ATX 4 AGP Pro 5 1
ASUS P4T i850 ATX 4 AGP Pro 5 0 Возможности для разгона CPU
Gigabyte GA-8TX i850 ATX 4 AGP Pro 5 1 Интегрированный Creative CT5880
Intel D850GB i850 ATX 4 AGP Pro 5 1
MSI MS-6339 i850 ATX 4 1 5 1

Как можно видеть из таблицы, все платы под Pentium 4 похожи друг на друга: все имеют по четыре слота для RIMM и по пять слотов PCI. Большинство плат будет оборудоваться слотом AGP Pro, позволяющим использовать профессиональные графические карты с повышенным энергопотреблением.

3.2  ATX 2.03

Помимо новых системных плат и новых кулеров, как это парадоксально не звучит, новый процессор будет требовать и новый корпус, совместимый со спецификацией ATX 2.03. И вызвано это двумя причинами.
Во-первых, ввиду того что кулеры для Pentium 4 имеют большие радиаторы, масса которых может достигать 450 г, крепить к процессорному сокету их больше нельзя. Теперь для удерживания кулера будет использоваться специальный ретеншн-механизм, крепящийся при помощи четырех болтов непосредственно к корпусу. Соответственно, корпус должен иметь дополнительные крепежные отверстия.

                  

Дополнительный плюс, который дает использование ретеншн-механизма для кулера, это уменьшение электромагнитного влияния процессора, работающего на сверхвысоких частотах, на другие компоненты системной платы.
Вторым новым требованием спецификации ATX 2.03 является наличие у блока питания дополнительного четырехжильного кабеля питания, подключаемого к системной плате, с                                                                      способ крепления                                     напряжениями 12 и 5 В.

Дополнительное питание необходимо для процессора Pentium 4, отличающегося чрезмерно большим энергопотреблением.

4.  Тестирование Pentium 4

Для тестирования было собрано три системы со следующими конфигурациями:

Pentium 4 Pentium III Athlon
Процессор Intel Pentium 4 1.4 Гц Intel Pentium III 1ГГц AMD Athlon 1.2 ГГц
Системная плата Intel D850GB (i850) ASUS CUSL2 (i815) ABIT KT7 (VIA T133)
Память 256 Мбайт PC800 RDRAM 256 Мбайт PC133 SDRAM
Видеокарта ASUS V7700 32MB (NVIDIA GeForce2 GTS)
Жесткий диск IBM DTLA 307015

Производительность Pentium 4 сравнивалась с самыми быстрыми на сегодня процессорами других семейств: Intel Pentium III 1 ГГц и AMD Athlon 1.2 ГГц.

   Тестирование проводилось под управлением операционной системы Microsoft Windows2000 SP1 с установленным DirectX 8.

4.1  Результаты тестов

   Поскольку процессор Pentium 4 имеет совершенно новую архитектуру,

анализ производительности этого процессора будет состоять из двух частей. В первой для измерения быстродействия мы воспользуемся синтетическими тестами, а во второй протестируем процессоры, принимающие участие в тестировании, реальными приложениями.

CPUmark 99

Этот тест показывает производительность целочисленной части процессора и скорость работы с данными. Казалось бы, поскольку ALU Pentium 4 работает на удвоенной частоте процессора, то по результатам этого теста впереди должен быть Pentium 4. Однако этого не происходит. Разгадка медлительности Pentium 4 в данном тесте кроется в недостаточно большом L1 кэше, в который не помещаются все необходимые для его работы данные. Athlon же, с областью данных в L1-кеше размером 64 Кбайта, а это в 8 раз больше, чем кеш данных Pentium 4, значительно превосходит всех своих соперников.

FPU WinMark

Этот бенчмарк показывает "чистую" скорость работы арифметического сопроцессора благодаря тому что все данные, необходимые для его работы умещаются в L1 кэше процессора. Результаты еще раз подтверждают, что блок FPU у Athlon очень хороший. Кроме того, ясно видно, что из-за возросшей латентности FPU в Pentium 4, его показатели в этом тесте выглядят даже хуже, чем у Pentium III.

3DMark2000 CPUmarks

Этот бенчмарк, входящий в состав 3DMark2000 демонстрирует теоретическую скорость работы процессора по обработке типовых игровых 3D-сцен при активном использовании наборов SIMD-команд SSE и 3DNow!. К сожалению, тестов, позволяющих оценить выигрыш, получаемый от использования новых SSE2 инструкций Pentium 4 пока нет, поэтому сегодня мы довольствуемся только использованием базового набора инструкций SSE. Тем не менее, даже в этом случае Pentium 4 оказывается на высоте, обходя ближайшего конкурента, процессор AMD Athlon 1.2 ГГц на 12%. Таким образом, логично ожидать, что в играх, особенно поддерживающих SSE, Pentium 4 будет показывать достойные результаты.

Так как процессор Pentium 4 работает на совершенно отличной платформе, использующей двухканальную RDRAM, посмотрим на то, какую скорость операций с памятью может обеспечить эта система в сравнении с соответствующими результатами, полученными на остальной паре платформ:

Memory Speed - Read

Memory Speed - Write

По графикам совершенно очевидно, что действительно скорость работы L1 и L2 кэшей в Pentium 4 по сравнению с Pentium III возросла. Однако, AMD Athlon обладает гораздо большим по размеру L1 кэшем, что в ряде случаев обуславливает его превосходство. Естественно, также на графике ясно видно, что пропускная способность двухканальной RDRAM гораздо выше, чем используемой в системах на Athlon и Pentium III PC133 SDRAM. Также, результаты этого теста позволяют оценить, что L2 кеш процессора Athlon действительно работает медленнее чем L2 кеш даже Pentium III, из-за более узкой шины. И достаточно любопытным является тот факт, что влияние L1-кеша совершенно не сказывается в системе с Pentium 4 при записи в память.

Перейдем теперь к тестам в реальных приложениях.

Content Creation Winstone 2000

       

Этот тест основывается на измерении скорости системы в нескольких приложениях для создания контента. Как можно видеть, производительность системы с Pentium 4 тут однозначно выше, чем скорость системы на Pentium III 1 ГГц и приближается к производительности системы с Athlon 1.2 ГГц. Получается, AMD была права не став выпускать процессоры с более высокой, чем 1.2 ГГц частотой. Athlon 1.2 ГГц может конкурировать с Pentium 4 вполне успешно.

Sysmark 2000

Еще один тест, использующий для измерения производительности офисные приложения. Однако, тут упор делается на приложения более широкого профиля, чем в предыдущем тесте, в результате чего показатели Athlon здесь выше. Однако, архитектуры Pentium III, Athlon и Pentium 4 отличаются слишком сильно, поэтому, соотношения производительностей этих процессоров может изменяться от приложения к приложению. Поэтому, посмотрим на скорости испытуемых процессоров в конкретных приложениях.

Sysmark 2000

Нетрудно заметить, что тут однозначного лидера выделить тяжело. Однако, в семи из двенадцати приложений лидирует AMD Athlon 1.2 ГГц, в то время как Pentium 4 показывает большую скорость только в трех задачах: системе распознавания речи Dragon Naturally Speaking Preferred 4.0, графическом редакторе Adobe Photoshop 5.5 и в утилите для кодирования видеопотока Microsoft Windows Media Encoder 4.0. Таким образом, вся полезность Pentium 4 раскрывается действительно только в задачах потоковой обработки данных. И то, часть заслуги за высокую производительность этого процессора лежит на подсистеме памяти с гораздо более высокой пропускной способностью, чем у конкурирующих платформ.

3D Studio MAX R3 (чем меньше – тем лучше)

Для оценки производительностей систем в этом 3D-пакете, мы засекли время рендеринга сцены Anisotropic Wheel, входящей в дистрибутив. Соответственно, меньшее время соответствует лучшему результату. Удивительно, но тут производительность Pentium 4 1.4 ГГц в точности повторяет производительность Pentium III 1 ГГц. Это говорит о том, что FPU в Pentium 4 действительно работает медленнее, чем в Pentium III. Athlon 1.2 ГГц, обладая лучшим блоком FPU легко обошел обоих конкурентов, построив сцену на 40% быстрее.

WinZIP (чем меньше – тем лучше)

Тестирование в архиваторах позволяет увидеть целочисленную производительность процессоров при оперировании с небольшими объемами данных. В архиваторе WinZip лучшую скорость (на диаграмме меньшее значение соответствует лучшему результату) продемонстрировал Athlon 1.2 ГГц. По всей видимости, сказывается большой кеш первого уровня у этого процессора.

WinRar (чем меньше – тем лучше)

Как можно увидеть из диаграммы (на ней меньшее значение снова соответствует лучшему результату), Pentium 4 1.4 ГГц с ALU, работающим на частоте 2.8 ГГц здесь равных нет. Влияние объемного кеша первого уровня Athlon в WinRAR сводится на нет достаточно большим объемом словаря, используемого в этом архиваторе.
Перейдем теперь к результатам, которые показали испытуемые системы в игровых приложениях.

Quake3 Arena (demo001) - 640x480x16

В Quake3 Pentium 4 1.4 ГГц показывает себя с лучшей стороны, показывая на 30% более высокое быстродействие, чем Athlon 1.2 ГГц, не говоря уже о Pentium III. Это объясняется как тем, что ALU протестированного Pentium 4 работает на частоте 2.8 ГГц, так и тем, что Quake3 использует SSE инструкции, которые, как мы показали выше, исполняются на Pentium 4 очень быстро.

Quake3 Arena (demo001) - 1024x768x32

С одной стороны, число fps в высоких разрешениях в Quake3 зависит в основном от пропускной способности шин, связывающих различные компоненты системы, однако с другой – ограничивается скоростью заполнения используемой в системе видеокарты. Именно поэтому, тут разброс результатов не так велик, как в предыдущем случае. Однако, благодаря Quad Pumped bus Pentium 4 остается в лидерах. Однако, Athlon, с 200-мегагерцовой шиной EV6 дышит практически ему в затылок.

Unreal Tournament – 640x480x16

Тут лидирующую позицию удерживает Athlon, имеющий самый производительный среди всех участвующих в тесте процессоров блок FPU.

Unreal Tournament – 1024x768x32

Однако, при возрастании нагрузки на шины передачи данных в системе, которое влечет за собой увеличение разрешения, вперед выходит Pentium 4. Что ж, с 400-мегагерцовой шиной и памятью с пропускной способностью 3.2 Гбайт/с поспорить тяжело.

Expendable - 640x480x16

Expendable - игра, производящая во время своей работы интенсивные операции с небольшими объемами данных. Поэтому, система на Pentium 4 с RDRAM, имеющей большую латентность оказывается медленнее обоих своих конкурентов. Причем, отставание Pentium 4 1.4 ГГц от Athlon 1.2 ГГц оказывается немаленьким – более 30%.

Expendable - 1024x768x32

Результаты практически полностью повторяют предыдущий случай.
К сожалению, в настоящий момент мы не можем оценить потенциал новых Pentium 4 с точки зрения разгона. Дело в том, что имевшаяся в нашем распоряжении системная плата для Pentium 4 Intel D850GB не имела никаких функций для запуска процессора на частоте, отличающейся от штатной. Однако, по мере появления системных плат от сторонних производителей, мы протестируем Pentium 4 и на разгон.

Заключение

Итак, сделать однозначный вывод относительно процессора Pentium 4 нельзя. Безусловно, его архитектура имеет массу достоинств, основным из которых следует признать возможность легкого наращивания тактовых частот. Однако, производительность нового процессора в ряде приложений все же не так высока как хотелось бы: достаточно часто она оказывается меньше производительности старшего процессора семейства Athlon. Виной этому – сверхдлинный 20-стадийный конвейер и недостаточно большой кеш данных первого уровня. Поэтому, в ближайшее время Pentium 4 обогнать по быстродействию конкурента от AMD, Athlon, который также имеет пути для наращивания скорости посредством перехода на новое ядро Palomino и использования DDR SDRAM, не сможет.

 В то же время, у систем на Pentium 4 есть и более существенные недостатки, главный из которых – цена. Поскольку стоимость RDRAM, необходимой для Pentium 4, а также системных плат для него достаточно высока, Athlon-платформы обладают сегодня гораздо лучшим соотношением цена-производительность.
     Тем не менее, Pentium 4 все же имеет отдаленные перспективы. С переводом технологического процесса на 0.13 мкм и с выпуском чипсетов, поддерживающих более дешевые чем RDRAM типы памяти, Pentium 4 может стать массовым процессором. Пока же его удел – высокопроизводительные рабочие станции.

Список использованных источников:

1.          Компьютерный еженедельник “Компьютерра”, № 24 2000 г.

2.          Журнал “Страна игр”, №22 2000 г.

3.          Журнал “Мир ПК”, №12 2000 г.

4.          www.ixbt.ru

5.          www.computerra.ru

6.          www.zdnet.ru


Страницы: 1, 2


Новости

Быстрый поиск

Группа вКонтакте: новости

Пока нет

Новости в Twitter и Facebook

  скачать рефераты              скачать рефераты

Новости

скачать рефераты

Обратная связь

Поиск
Обратная связь
Реклама и размещение статей на сайте
© 2010.