Удлинение конвейеров дало AMD возможность несколько увеличить тактовую частоту, но в Hammer сделана ставка не только на увеличение тактовой частоты, но и на увеличение количества инструкций за такт.
Рис.4 Выполнение команд в K7
Один из способов увеличения количества выполняемых за один такт инструкций, как говорилось выше, заключается в увеличении количества исполнительных устройств. В архитектуре K7 имеется три арифметико-логических устройства (АЛУ - для операций с целыми числами), три устройства адресации (Address Generation Units, AGUs - для операций выгрузки из кэша и для записи в кэш), и три устройства для операций с плавающей точкой. Ничего не стоило бы оснастить Hammer вдвое большим количеством устройств, но, к сожалению, на производительности это существенно не отразилось бы. Даже обеспечить работой все исполнительные устройства Athlon довольно сложно, как сложно вообще обеспечить работой исполнительные устройства любого современного процессора, включая Pentium 4. Именно поэтому увеличение частоты FSB приводит к существенному улучшению производительности, ведь именно от нее зависит насколько вы сможете загрузить работой исполнительные устройства.
Intel решает эту проблему с помощью технологии Hyper-Threading. Благодаря ей многопроцессорная операционная система использует один процессор как два, и выдает одновременно два потока команд. Смысл технологии заключается в том, что в большинстве случаев исполнительные устройства процессора далеки от полной загруженности. От передачи на выполнение вдвое большего потока команд повышается загрузка исполнительных устройств. В результате новой технологии Intel ожидал прироста производительности на 10-20 процентов.
Как и Intel, AMD понималт, что с простым увеличением количества исполнительных устройств производительность не повысится. То есть теоретически, возможно, и получится, но на практике - не получится.
Рис. 5. Исполнительные устройства Hammer аналогичны Athlon
AMD решила эту проблему со свойственной ей оригинальностью. Было решено оставить такое же количество исполнительных устройств, что и в K7, а увеличить количество выполняемых за такт операций, за счет улучшения архитектуры К7.
Тремя основными улучшениями улучшения новой являетюся:
· встроенный контроллер памяти и северный мост
· доработано устройство предсказания ветвлений
· то, что AMD любит называть "большой загрузкой буфера быстрого преобразования адреса (translation lookaside buffer, TLB)"