русс | укр

Языки программирования

ПаскальСиАссемблерJavaMatlabPhpHtmlJavaScriptCSSC#DelphiТурбо Пролог

Компьютерные сетиСистемное программное обеспечениеИнформационные технологииПрограммирование

Все о программировании


Linux Unix Алгоритмические языки Аналоговые и гибридные вычислительные устройства Архитектура микроконтроллеров Введение в разработку распределенных информационных систем Введение в численные методы Дискретная математика Информационное обслуживание пользователей Информация и моделирование в управлении производством Компьютерная графика Математическое и компьютерное моделирование Моделирование Нейрокомпьютеры Проектирование программ диагностики компьютерных систем и сетей Проектирование системных программ Системы счисления Теория статистики Теория оптимизации Уроки AutoCAD 3D Уроки базы данных Access Уроки Orcad Цифровые автоматы Шпаргалки по компьютеру Шпаргалки по программированию Экспертные системы Элементы теории информации

Pentium 4 в некоторых программах / тестах отстает по скорости от аналогичного по частоте / рейтингу Athlon и даже Pentium 3.


Дата добавления: 2015-08-06; просмотров: 661; Нарушение авторских прав


В некоторой степени проблема в том, что у P4 очень длинный конвейер (здесь подразумевается так называемый целочисленный конвейер) выполнения инструкций. Чем длиннее конвейер, тем легче наращивать тактовую частоту, но тем меньше производительности получается на каждый полученный мегагерц. И наоборот. Чем на большее количество стадий рассчитан конвейер, тем меньше работы приходится на каждый отдельный такт и тем быстрее этот такт выполняется. Pentium 3 имеет конвейер длиной 12 стадий (можно так же сказать ступеней), Athlon (XP) - 10 стадий, Athlon 64 - 12. Pentium 4 пока является абсолютным чемпионом по длине конвейера (20 стадий), то есть имеет самое меньшее время выполнения такта, позволяющее достичь максимальной тактовой частоты, но и самые большие задержки для связанных друг с другом операций. Более важным становится предсказание того, выполнение какой инструкции понадобится, задолго до самого процесса ее выполнения. И, естественно, ошибка на этой стадии - выбор не той ветви, по которой пойдет процесс выполнения программы, будет весьма и весьма сказываться на производительности процессора. Конвеер в случае ошибки предсказания ветвления "сбрасывается на нуль" и выполнение идёт заново, т. е. в идеале из-за каждой ошибки предсказания Pentium 4 в некоторых программах / тестах отстает по скорости от аналогичного по частоте / рейтингу Athlon и даже Pentium 3.

В некоторой степени проблема в том, что у P4 очень длинный конвейер (здесь подразумевается так называемый целочисленный конвейер) выполнения инструкций. Чем длиннее конвейер, тем легче наращивать тактовую частоту, но тем меньше производительности получается на каждый полученный мегагерц. И наоборот. Чем на большее количество стадий рассчитан конвейер, тем меньше работы приходится на каждый отдельный такт и тем быстрее этот такт выполняется. Pentium 3 имеет конвейер длиной 12 стадий (можно так же сказать ступеней), Athlon (XP) - 10 стадий, Athlon 64 - 12. Pentium 4 пока является абсолютным чемпионом по длине конвейера (20 стадий), то есть имеет самое меньшее время выполнения такта, позволяющее достичь максимальной тактовой частоты, но и самые большие задержки для связанных друг с другом операций. Более важным становится предсказание того, выполнение какой инструкции понадобится, задолго до самого процесса ее выполнения. И, естественно, ошибка на этой стадии - выбор не той ветви, по которой пойдет процесс выполнения программы, будет весьма и весьма сказываться на производительности процессора. Конвеер в случае ошибки предсказания ветвления "сбрасывается на нуль" и выполнение идёт заново, т. е. в идеале из-за каждой ошибки предсказания



"теряется" до 20 драгоценных тактов. Думаю, что несложно подсчитать, чем это чревато при среднем количестве ошибок предсказания (5%) в случае с 2ГГц процессором. В целочисленных операция P4 работает хорошо, а вот в операциях с плавающей точкой у него ситуация похуже, там он значительно проигрывает AXP. Еще недавно было мало приложений поддерживающих набор инструкций SSE2, использованный в P4 и способный значительно увеличить скорость его работы (скорость работы FPU, хотя, условно говоря, SSE2 не помогает FPU, а фактически его заменяет). На самом деле все немного сложнее, но не имеет особого смысла вникать во все эти тонкости...

При обработке больших объемов данных, где львиную долю всего процесса занимает переписывание информации из одного места памяти в другое, P4 лидирует. В играх же, начать следующие вычисления, как правило, не удается, не закончив предыдущие (процессор частично простаивает, пока предыдущая инструкция не выйдет с конвейера). И вот тут голову поднимает AXP. Масла в огонь подливают и различные наборы инструкций: 3DNow!, 3DNow!Professional, SSE, SSE2, - где скорость работы зависит от того, под какой процессор оптимизировано приложение. Первые модели P4 на ядре Willamete действительно ощутимо проигрывали даже близким по частоте моделям Pentium 3, не говоря уж об Athlon'ах. Но у Northwood’ов это отставание почти никогда не проявляется.

 



<== предыдущая лекция | следующая лекция ==>
Многие процессоры фирмы AMD такие дешевые, вероятно у них есть недостатки, какие? | Насколько хороши процессоры VIA C3?


Карта сайта Карта сайта укр


Уроки php mysql Программирование

Онлайн система счисления Калькулятор онлайн обычный Инженерный калькулятор онлайн Замена русских букв на английские для вебмастеров Замена русских букв на английские

Аппаратное и программное обеспечение Графика и компьютерная сфера Интегрированная геоинформационная система Интернет Компьютер Комплектующие компьютера Лекции Методы и средства измерений неэлектрических величин Обслуживание компьютерных и периферийных устройств Операционные системы Параллельное программирование Проектирование электронных средств Периферийные устройства Полезные ресурсы для программистов Программы для программистов Статьи для программистов Cтруктура и организация данных


 


Не нашли то, что искали? Google вам в помощь!

 
 

© life-prog.ru При использовании материалов прямая ссылка на сайт обязательна.

Генерация страницы за: 0.207 сек.