Процессор Pentium II , как описано в п. 2.5.(«Процессор Pentium II»), изготовлен на основе ядра Klamath по технологии 0,35 мкм с частотой внешней шины 66 МГц. Затем на основе Klamath фирмой Intel было разработано ядро Deschutes для 0,25 мкм технологии и изготовлен Pentium II с частотой шины 100 МГц и Pentium II Xeon (Зеон), отличающиеся более высоким быстродействием и емкостью кэш-2, и дешевый Celeron (в начале без кэш-2 с частотой внешней шины 66 МГц). Позже на базе Deschutes было разработано ядро с интегрированным в тот же корпус быстрым кэш-2 Mendocino, на базе которого выпускались все Celeron «А» (с внутренним кэш-2 емкостью 128 Кб). Затем Intel разработала МП Dixon с емкостью 256 Кб встроенного кэш-2. Это Celeron с увеличенным кэш-2 вдвое. Но так как он работает как Pentium II, то имеет другое название. В начале 1999 г. на основе ядра Katmai изготовлены Pentium III и Pentium III Xeon (Tanner). В конце 1999 г. на базе ядра Coppermine по 0,18 мкм технологии изготовлен Pentium III и Pentium III Xeon (Cascades), имеющие как Mendocino быстрый интегрированный кэш-2. С 2001 г. Pentium III выпускается по 0,13 мкм (металлизация Cu) технологии на базе ядра Tualatin с частотой шины 1400 МГц и дешевый Celeron (1.2 и 1.3 ГГц).
Так, ядро Coppermine имеет кэш-2 емкостью 256 Кб, который работает синхронно с МП. Организация внутреннего кэш-2 изменена. Он представляет собой 8-канальный ассоциативный буфер с 256-разрядной шиной ядра. Обмен МП с кэш-2 требует новых протоколов, то есть обновленной BIOS. В процессоре Pentium III оптимизирована схема внутренней буферизации (4 буфера с обратной записью; 6 буферов заполнения; 8 входов очереди шины). Оптимизация привела к сокращению времени ожидания данных из кэш-2 и увеличению производительности МП на той же частоте на 10 – 20 %. Повышение тактовой частоты до 1000 МГц достигнуто за счет уменьшения технологических норм, добавления 6 слоя алюминиевой металлизации и улучшения внутренней разводки цепей МП. Согласующие резисторы и конденсаторы, которые ранее устанавливались на плате процессорного модуля для Slot 1, перенесены в кристалл СБИС. Напряжение питания ядра понижено до 1.1 – 1.65 В.
Таким образом, начиная с 1999 г. фирма Intel осуществляет серийный выпуск процессора Pentium III разных модификаций по 0.25 и 0.13 мкм технологии с внутренней частотой синхронизации от 450 до 1400 МГц. Pentium III в зависимости от модификации ядра изготавливается на кристалле, содержащем от 9.5 до 42 млн транзисторов. Он ориентирован на применение в настольных (Pentium III 450/500/533ЕВ/…/1400), портативных (Mobill Pentium III 400/500/600) ПК, а также для работы в серверах (Pentium III Xeon 600B/667B//1000B). С индексом ”В” процессоры используются в системных платах с частотой системной процессорной шины FSB 133 МГц. Процессоры Pentium III с индексом ”Е” имеют напряжение питания 1.6 В и изготовлены по 0.18 мкм технологии с внутренним кэш-2 емкостью 256 Кб, размещённым в кристалле процессора. В связи с этим Pentium III Е выпускается как в виде картриджа S.E.C.C.2 с разъёмом Slot 1, так и в виде одной СБИС в новом корпусе FCPGA с разъёмом Socket 370. С появлением Celeron, а затем Pentium III и Xeon осуществлялся переход спецификации процессорной шины и стандарта разъёма МП Slot 1 на Socket 370, а затем на Socket FCPGA. Для Xeon был разработан свой стандарт разъёма Slot 2.
Mobill Pentium III питается от источника с пониженным напряжением 1.35 В и тактового генератора с частотой 100 МГц. Он оснащен встроенным в МП кэш-2 емкостью 256 Кб и блоком SSE.
У Pentium III 0.25 мкм технологии кэш-2 емкостью 512 Кб размещается на процессорной плате. Обычный Pentium III поддерживает двухпроцессорную конфигурацию, а Хеоn до 4 МП. Хеоn может взаимодействовать с внешним тыльным кэш-2 емкостью до 2 Мб, работающим на частоте процессора, что позволяет намного увеличить его быстродействие вычислений по сравнению с обычным Pentium III .
Новый картридж процессора Pentium III, заключенный в корпус с односторонним расположением контактов SECC2, упрощает конструкцию системных плат, предназначенных для работы с этим процессором, облегчает массовое их производство, безопасность при использовании и обеспечивает единый форм-фактор процессоров будущего. SECC2 – некое промежуточное звено между стандартным SECC и его полным отсутствием. В нём радиатор, обдуваемый вентилятором, соприкасается не с железной пластиной, прижатой к ядру, а непосредственно с микросхемой, обеспечивая лучший отвод тепла от кристалла, помещенного в новый органический сплав на основе меди OLGA.
Pentium III имеет следующие особенности:
1.Обеспечивает одновременно технологии потоковых SIMD-расширений SSE для Internet, динамического исполнения команд и технологию MMX.
2.Имеет архитектуру независимой двойной шины DIB, что увеличивает пропускную способность и производительность его по сравнению с процессорами с единственной шиной данных.
3.Содержит функцию серийного номера процессора для расширения степени управляемости ЭВМ.
4.Имеет неблокируемую кэш-1 первого уровня емкостью 32 Kб (16 Кб/16 Кб) и унифицированную неблокируемую кэш-2 второго уровня емкостью 512 Кб, что обеспечивает ускоренный доступ к часто используемым данным.
5.Поддерживает кэширование памяти с объемом адресного пространства 4 Гб.
6.Позволяет создавать масштабируемые системы с двумя процессорами и физической памятью объемом до 64 Гб.
7.Поддерживает тестирование и мониторинг производительности.
8.Совместим по кодам с существующим программным обеспечением и процессорами предшествующих поколений на базе архитектуры Intel.
Потоковые SIMD-расширения SSE для Internet (MMX2) представляют собой 70 новых команд, сгруппированных в следующие категории:
1.Команды копирования данных movaps,…, movss. Команды этой группы выполняют операции параллельного копирования упакованных элементов данных (PS), а также скалярного (SS) копирования только младшего элемента операнда. Действия производятся над операндами, расположенными в XMM‑регистрах или в памяти.
2.Арифметические команды SIMD выполняют сложение (addps, addss), вычитание, умножение (mulps, mulss), деление (divps, divss) и другие операцииданных одинарной точности с плавающей точкой. Входной (второй) операнд этих команд может располагаться либо в SIMD‑регистре, либо в памяти. Выходной (первый) операнд должен находиться в SIMD-регистре. Арифметические команды поддерживают как параллельные, так и скалярные операции.
3.Команды сравнения cmpps, cmpss и другие попарно сравнивают все четыре соответствующих FP‑элемента двух операндов (для скалярного (SS) варианта команд – только младшие элементы), устанавливают соответствующие флаги в регистре EFLAGS и проверяют выполнение арифметического условия, специфичного для каждой команды. Если для сравниваемой пары условие выполняется, то в соответствующие 32 разряда выходного операнда записывается маска из всех единиц. В противном случае – маска из нулей. Получаемая в результате двоичная маска обычно используется при логических операциях с объектами.
4.Команды преобразования типов данных выполняют преобразования данных из 32-разрядного целочисленного представления со знаком в FP-представление и обратно. Эти команды производят преобразование упакованных и скалярных данных между 128‑битными SIMD регистрами с плавающей точкой и также с 64-битными целыми MMX регистрами или 32-битными целыми регистрами IA-32.
5.Логические команды andps, andnps, orps и xorps часто используются для вычисления абсолютной величины (модуля) чисел; изменения знакового разряда (инверсии знака); действий с маской из нулей и единиц.
6.Дополнительные целочисленные SIMD-команды, команды перестановки, управления состоянием, управления кэшированием.
В Pentium III введён еще один блок, подобный MMX, только оперирующий с вещественными числами. Основной тип данных SSE это 128-разрядное значение, содержащее 4 последовательно расположенных (“упакованных”) 32-разрядных числа одинарной точности с плавающей точкой SPFP, как показано на рис. 2.14.
ОТ
ОТ
ОТ
ОТ
Рис. 2.14. Упакованное простое число с плавающей точкой
Каждое 32-разрядное число с плавающей точкой (см. рис. 1.2.) имеет 1 знаковый бит, 8 битов порядка и 23 бита мантиссы, что соответствует стандарту IEEE-754 на формат представления чисел одинарной точности с плавающей запятой. SIMD-инструкции оперируют в новом модуле SSE со специальными 128-битными регистрами XMM0-XMM7 и улучшают работу с приложениями трехмерной графики, потокового аудио, видео и распознавания речи. Каждый из этих регистров хранит 4 вещественных числа одинарной точности (ОТ). Потоковое расширение SIMD архитектуры Intel поддерживает 2 типа операций над упакованными данными с плавающей точкой – параллельные и скалярные.
Параллельные операции (ОР), как правило, действуют одновременно на все четыре 32-разрядных элемента данных в каждом из 128-разрядных операндов, как показано на рис. 2.15. В именах команд, выполняющих параллельные операции, присутствует суффикс ps. Например, команда addps складывает 4 пары элементов данных и записывает полученные 4 суммы в соответствующие элементы первого операнда.
Скалярные операции действуют на младшие (занимающие разряды (31,0)) элементы данных двух операндов, как это показано на рис. 2.16. Остальные 3 элемента данных в выходном операнде не изменяются (исключение составляет команда скалярного копирования movss). В имени команд, выполняющих скалярные операции, присутствует суффикс ss (например, команда addss).
Рис. 2.15. Упакованные (параллельные) операции
Большинство команд двухадресные и оперируют с двумя операндами. Данные, содержащиеся в первом операнде, могут использоваться командой, а после ее выполнения, как правило, замещаются результатами. Данные второго операнда в команде после ее выполнения не изменяются. Для всех команд адрес операнда в памяти должен быть выровнен по 16-байтной границе, кроме невыровненных команд сохранения и загрузки.
Рис. 2.16. Скалярные операции
Таким образом, выполняя операцию над двумя регистрами, блок SSE фактически оперирует с четырьмя парами чисел. Благодаря этому процессор может выполнять до 4 одинаковых операций одновременно. Однако для выполнения четырех параллельных операций программист должен использовать специальные команды, а также позаботиться о помещении и извлечении данных из 128-битных регистров. Поэтому для использования всех вычислительных мощностей Pentium III необходима целенаправленная оптимизация.
Внедрение потоковых SIMD-расширений позволяет существенно увеличить скорость и качество работы в реальном времени приложений, использующих:
- трехмерную графику и 3D-моделирование, расчет освещенности с использованием вычислений с плавающей запятой;
- обработку сигналов и моделирование процессов с широким диапазоном изменения параметров (вычисления с плавающей запятой);
- генерацию трехмерных изображений в программах реального времени, не использующих целочисленный код;
- алгоритмы кодирования и декодирования видеосигнала, обрабатывающие данные блоками;
- численные алгоритмы фильтрации, работающие с потоками данных.
Использование потоковых SIMD-расширений позволяет получить более высокое разрешение и качество изображений на дисплее, более высокое качество звука, видео и возможности параллельного кодирования и декодирования в формате сжатия цифровых кодов на оптический диск MPEG2, а также снизить загрузки процессора при распознавании речи и увеличить точность и быстродействие вычислений.
Как указывалось выше, технология динамического исполнения команд в архитектуре Р6 обеспечивает предсказание ветвлений и прогнозирует исполнение программы по нескольким ветвям, позволяет осуществить анализ потока данных, оптимизацию и реорганизацию последовательности исполнения команд на основе используемых в них данных. Допускает спекулятивное исполнение команд на основе оптимизированной последовательности, которая увеличивает загрузку РОН и блоков процессора, что ведет к повышению общей производительности Pentium III. Кроме того, технология MMX обеспечивается в Pentium III набором 57 команд общего назначения для целочисленных операций, легко применимых к широкому спектру мультимедийных и коммуникационных приложений. Здесь также используются SIMD-инструкции, которые исполняются в восьми 64-разрядных регистрах MMX0-ММХ7.
Серийный номер процессора – это электронный номер, позволяющий идентифицировать конкретную систему в больших компьютерных сетях.
Тестирование и мониторинг производительности в Pentium III содержит следующие функции:
- встроенный механизм самотестирования BIST обеспечивает постоянный контроль зависаний и сбоев в микрокоде и больших логических матрицах, а также тестирование кэш команд и кэш данных, буферов TLB и сегментов памяти ROM;
- механизм стандартного порта доступа к тестированию и периферийному сканированию IEEE 1149.1 дает возможность осуществлять проверку каналов связи между процессором Pentium III и системой через стандартный интерфейс;
- встроенные счетные устройства следят за показателями производительности и ведут подсчет событий.
Таблица 2.4
Характеристики процессоров Р6
Тип МП
Celeron
Pentium
II
III
III Xeon
Число транзисторов (млн шт.)
19,0
8,8
9,5 -42
9,5-140
Год выпуска
IV.98
V.97
II.99
III.99
Тип разъема
Slot 1, S/370
Slot 1
Slot 1
Slot 2
Тактовая частота (МГц)
266-1300
233-450
450-1400
500-2200
Блоки SIMD
2 MMX
2 MMX
SSE, MMX
КЭШ-1(Кб)
16 х 2 (четырехвходовый)
КЭШ-2(Кб)
128 или 256
256 или 512
Число МП в ЭВМ
Частота шины (МГц)
66, 100
100, 133
Регистры SIMD
ММХ0-7(63,0)
ММХ0-7(63,0);
ХММ0-7(127,0)
Число слоев метал.
Скорость обмена по шине (Мб/с)
800; 1064
Встроенный в кристалл диод и датчик температуры, расположенный на системной плате, контролируют температуру кристалла и управляют температурным режимом процессора Pentium III. Характеристики процессоров Pentium III представлены в табл. 2.4.