Soсket 775 Intel Core 2 Extreme QX6700 2,66 ГГц Intel Core 2 Duo E6700 2.66 ГГц Intel Core 2 Duo X6800 2.93 ГГц Intel 560 3600 часть I Intel 660 2800 часть II Intel 560 3600 часть II Intel 660 2800 часть I Intel Pentium 4 EE gallatin 3466 часть II Intel Pentium 4 EE prescott 3733 часть II Intel Pentium 4 EE gallatin 3466 часть I Intel Pentium 4 EE prescott 3733 часть I Intel Pentium 4 EE 3,46 ГГц Intel Pentium 4 3,2 ГГц Intel Pentium 4 3.06 ГГц (сравнение в 3D приложениях) Intel Pentium 4 3.06 ГГц (сравнение в играх) Intel Pentium 4 3.06 ГГц (сравнение в AutoCAD 2002)
AMD
Soсket 462 AMD Athlon XP 3200+ 2,2 ГГц AMD Athlon XP 3000+ 2,16 ГГц AMD Athlon XP 2800+ (сравнение в 3D приложениях) AMD Athlon XP 2800+ (сравнение в играх) AMD Athlon XP 2800+ (сравнение в AutoCAD 2002)
Apple Apple PowerMac G5 Два 2GHz Apple PowerMac G5 1.6GHz Apple PowerMac G5 1.8GHz
Таблица 1. Краткое сравнение кристаллов современных высокопроизводительных процессоров Intel для настольных ПК
Процессор
Intel Pentium 4 Prescott2M
Intel Pentium 4 Extreme Edition (Prescott2M)
Intel Pentium 4 Prescott
Intel Pentium 4 Northwood
Intel Pentium 4 Extreme Edition (Gallatin)
Частоты ядра, ГГц
2,8-3,6*
3,73*
2,8 – 3,8
1,6 – 3,4
3,2 – 3,47
Частоты системной шины, МГц
800, 533
800, 533, 400
1067, 800
Технология производства
90 нм, напряженный кремний
130 нм
Площадь ядра, кв. мм
Число транзисторов
169 млн.
169 млн.
125 млн.
55 млн.
178 млн.
Длина целочисленного конвейера
Объем кэш-памяти данных первого уровня
16 кбайт
16 кбайт
16 кбайт
8 кбайт
8 кбайт
Латентность кэш-памяти первого уровня **
Ассоциативность кэш-памяти первого уровня
Объем кэш-памяти инструкций
12 тыс. микроопераций
Объем кэш-памяти второго уровня
2048 кбайт
2048 кбайт
1024 кбайт
512 кбайт
512 кбайт
Латентность кэш-памяти второго уровня **
~31
~31
~29 тактов
~18 тактов
~18 тактов
Ассоциативность кэш-памяти второго уровня
Кэш-память третьего уровня
нет
2048 кбайт
Латентность кэш-памяти третьего уровня **
-
-
-
-
~43 тактов
Расширение набора инструкций
SSE3/SSE2/SSE, Intel EM64T, XD bit
SSE3/SSE2/SSE, Intel EM64T, XD bit
SSE3/SSE2/SSE
SSE2/SSE
SSE2/SSE
Технология Hyper-Threading
улучшенная
стандартная
Напряжение питания, В
1,25-1,4
1,25-1,4
1,25-1,4
1,55
1,55
Допустимая тепловая мощность, TDP, Вт
84 или 115
89-103
не более 82
не более 115
* - верхние частоты на текущий момент. В будущем возможен рост. ** - измеренная в программе CPU-Z.
Количество транзисторов у Prescott2M увеличилось по сравнения с Prescott на 44 миллиона. Учитывая, что подавляющее большинство из них ушло на дополнительный мегабайт (8192 Кбит) кэша L2, получим, что на ячейку добавленной памяти L2 приходится всего чуть более пяти (точнее – 5,24) транзисторов. Напомню, что стандартная SRAM-ячейка требует 6 транзисторов плюс расходы на мультиплексоры и буферы (Примерно один транзистор в расчете на одну ячейку памяти расходуется для «вспомогательных» нужд – магистральные буферы, мультиплексторы и пр. Это подтверждают и оценки из сравнения ядер Northwood и Gallatin). И поскольку в исходном ядре Prescott наблюдался некоторый избыток транзисторов (и обозреватели даже любили строить на этом разные спекуляции по поводу новых нереализованных возможностей), то очевидно, что часть из этих «излишков» в новом ядре просто убрали. Новый же Extreme Edition, построенный на том же самом ядре и имеющий лишь более быструю системную шину (1067 МГц против 800 МГц у Pentium 4 660 и ниже), заметно отличается от прежнего Extreme Edition, использовавшего 130-нанометровое ядро с чуть большим числом транзисторов и гораздо (почти вдвое) более здоровым кристаллом – 237 против 135 кв. мм. От Prescott же новое ядро по площади отличается не так значительно – на 20%.
Подложка диаметром 300 мм с кристаллами Prescott2M
Параметры кэш-памяти первого уровня в Prescott2M остались прежними, а для кэш-памяти L2 помимо увеличения объема (при сохранении прежней ассоциативности) слегка увеличили задержки (если верить измерениям программы CPU-Z и некоторых других – в районе 2-3 тактов частоты ядра, то есть примерно на 5-10%; более точную цифру я пока назвать не могу).
Таблица 2. Процессоры Intel Pentium 4, вышедшие 21 февраля 2005 года
Процессор
Частота ядра, ГГц
Шина FSB, МГц
Кэш-память второго и третьего уровней
Напряжение питания, В
Допустимая тепловая мощность, TDP, Вт
Предварительная оптовая цена, $
Pentium 4 Extreme Edition 3,73 ГГц
3,73
2 Мбайт L2
1,25-1,4
115 (04B PCG)
Pentium 4 660
3,60
2 Мбайт L2
1,25-1,4
115 (04B PCG)
Pentium 4 650
3,40
2 Мбайт L2
1,25-1,4
84 (04A PCG)
Pentium 4 640
3,20
2 Мбайт L2
1,25-1,4
84 (04A PCG)
Pentium 4 630
3,00
2 Мбайт L2
1,25-1,4
84 (04A PCG)
Все эти процессоры предназначены для появившегося летом 2004 года разъема LGA775 (для Socket 478 новые Pentium 4 выпускаться не будут, в отличие от Celeron D) и используют процессорный номер модели (все, кроме Extreme Edition) – от 630 до 660 в похожем порядке, что и Pentium 4 (Prescott, LGA) 560 и ниже, вышедшие пол года назад. По-видимому, в этой линейке также будет присутствовать модель и 620 с частотой 2,8 ГГц, но на момент написания статьи официальной информации по этому поводу еще не было. Ну а чуть позже, весной 2005 года, появится и 3,8-гигагерцовая модель Pentium 4 670 (по цене более 800 долларов). Кстати, цены на Prescott2M пока будут заметно выше, чем на Prescott аналогичной частоты. И сколько производительности (в добавление к новым технологиям EM64T, XD и EIST) мы получим за эти надбавки, мы посмотрим ниже.
Первоначально эти процессоры будут работать на чипсетах Intel 925XE/X и 915 (и других производителей), однако позднее Intel планирует выпустить для них и будущих многоядерных процессоров новые чипсеты серии 945 с поддержкой более быстрой памяти и прочими «вкусностями».
Интересно и то, как Intel, недавно круто поменявшая свою структуру и переориентировавшаяся на «платформенные» направления, позиционирует новые продукты. Массовые процессоры серии Pentium 4 6xx предназначаются корпорацией в первую очередь для бизнес-пользователей. Подоплека тут такова – именно категория корпоративных заказчиков в первую очередь сможет расходовать дополнительные средства на внедрение у себя новых технологий 64-битных вычислений (EM64T), повышения безопасности (XD bit) и экономии электроэнергии (и снижения шума ПК), которая (экономия) в масштабах среднего предприятия может составить сотни тысяч долларов.
Корпоративные платформы для настольных ПК компании малого бизнеса и IT-подразделения подразделяются Intel на три категории (см. слайд ниже):
1. Ведущая производительная платформа. 2. Массовая стабильная платформа для IT-подразделений. 3. Массовая рабочая платформа для компаний малого бизнеса.
Тесты подсистемы памяти
Экспресс-оценку скорости работы подсистемы процессор-память мы проведем при помощи теста Everest 1.51.
Очевидно, что эффективная скорость работы с памятью ядра Prescott2M немного возросла по сравнению с и без того хорошо оптимизированным для этого дела ядром Prescott – прибавка тут составляет почти 200 МГц или более 3%! Старые (нортвудовские) ядра Extreme Edition существенно проигрывают новым даже при использовании FSB 1067 МГц (!), но использование этой шины с ядром Prescott2M творит чудеса – скорость подсистемы памяти резко прыгает с 6 до 7,3 Гбайт/с, почти полностью реализуя, наконец, скоростной потенциал двухканальной DDR2-533.
По скорости записи в память ситуация для FSB-1067 заметно скромнее – она едва смогла опередить обычные Pentium 4 с FSB-800, причем, как ни странно, возросший кэш новых процессоров не добавляет, а наоборот – слегка убавляет скорость записи в память.
Наконец, по латентности подсистемы памяти мы наблюдаем несколько интересных моментов: задержки при работе с память явно меньше у старого нортвудовского ядра (впрочем, это может быть связано с влиянием дополнительного кэша L3, буферизующего обращения к системной памяти из вышестоящих кэшей), хотя положительного эффекта от увеличения кэш-памяти L2 у Prescott не наблюдается. Скорее даже наоборот – латентность у нового ядра чуть возросла, что может быть связано, например, с немного возросшей латентностью самого кэша второго уровня в Prescott2M. Интересно и то, что латентность Prescott2M с шиной FSB-1067 явно не лучше, чем у остальных Prescott, то есть для работы на более быстрой шине производитель специально увеличил тайминги шины (для повышения ее стабильности) и этим свел ее возможные преимущества по латентности к нулю.