AMD Athlon (Thunderbird) 800

Итак, взвесив все плюсы и минусы L2-кеша на ядре, AMD, пришла к выводу о необходимости переноса кеша на ядро. Тем более, что оба завода AMD, находящиеся в Дрездене и Остине вполне успешно освоили технологию 0.18 мкм, по которой, кстати, некоторое время уже выпускались старшие модели обычных AMD Athlon. Так появился новый старый AMD Athlon с кодовым именем Thunderbird, архитектурно отличающийся от старого Athlon наличием интегрированной кеш-памяти второго уровня размером 256 Кбайт вместо внешнего 512-килобайтного L2-кеша. Посмотрим на его спецификацию:

Чип, производимый по технологии 0.18 мкм с использованием алюминиевых или медных соединений
Ядро Thunderbird, основанное на архитектуре Athlon. Содержит 37 млн. транзисторов и имеет площадь 120 кв.мм
Работает в специальных материнских платах с 462-контактным процессорным разъемом Socket A (Slot A версии доступны в ограниченных количествах только OEM)
Использует высокопроизводительную 100 МГц DDR системную шину EV6
Кеш первого уровня 128 Кбайт - по 64 Кбайта на код и на данные
Интегрированный кеш второго уровня 256 Кбайт. Работает на полной частоте ядра
Напряжение питания при частоте до 850МГц - 1.7В, при больших частотах - 1.75В
Набор SIMD-инструкций 3DNow!
Выпускаются версии с частотами 750, 800, 850, 900, 950 и 1000 МГц

Итак, с точки зрения архитектуры, Thunderbird ничем не отличается от обычного Athlon, кроме встроенного в ядро 256-Кбайтного кеша второго уровня. Несмотря на сокращение размера кеша вдвое по сравнению с обычным Athlon, быстродействие от этого упасть не должно - ведь новый кеш работает гораздо быстрее старого - на полной частоте ядра процессора. Да и к тому же благодаря более близкому его расположению к ядру латентность кеша у Thunderbird на 45% меньше, чем аналогичная характеристика у кеша старого Athlon. В остальном же, архитектурно и старые и новые Athlon ничем не отличаются, поэтому подробности о строении ядра этих CPU можно почерпнуть из обзора AMD Athlon 600. При этом, все же необходимо иметь в виду, что все же Thunderbird имеют обновленное и технологически усовершенствованное ядро, выпускаемое по технологии 0.18 мкм. В результате, например, даже получается, что ядро Thunderbird со встроенным L2-кешем по площади ненамного больше, чем ядро K75 (0.18 мкм Athlon) и даже значительно меньше, чем старое ядро K7, выполненное по технологии 0.25 мкм.

Вторым и не менее важным отличием старых и новых Athlon является то, что поскольку необходимость в процессорной плате отпала, они используют новый процессорный разъем типа socket, а не slot - Socket A. Хотя, конечно, некоторое время Slot A Thunderbird на рынке присутствовать будут, основным форм-фактором для этих CPU следует считать 462-контактный Socket A.

AMD выпускает Thunderbird на двух заводах - в Остине и в Дрездене, по двум различным технологиям - с использованием алюминиевых соединений и медных соединений. Тем не менее, обе эти модификации, похоже, между собой ни чем не отличаются, кроме … цвета. Дрезденские Thunderbird имеют синий цвет кристалла, в то время как Остинские - зеленый.

Что же касается видимых отличий старых и новых Athlon производимых в Slot A варианте, то тут найти отличие будет не так просто, так как оба они имеют одинаковый внешний вид картриджа и что более забавно, одинаковую цену. Однако отличить их все-таки возможно как по маркировке (старые Athlon маркируются как AMD-K7XXX, в то время как новые имеют маркировку AMD-AXXXX) так и заглянув внутрь картриджа со стороны процессорного разъема - у новых Athlon отсутствуют микросхемы SRAM, расположенные по обе стороны от ядра, в то время как у старых Athlon они есть.

До сих пор мы восхищались новыми Thunderbird и их интегрированным L2-кешем. Теперь пришло время немного огорчить фанатов AMD. Тем более, что сделать это будет нетрудно, если сравнить кеш Thunderbird и Coppermine.

Единственным преимуществом L2-кеша Thunderbird с этой точки зрения может являться его эксклюзивность. То есть, алгоритм работы L2 кеша у Thunderbird таков, что данные, хранящиеся в L1-кеше, в L2-кеше не дублируются. Это значит, что суммарный объем эффективной кеш-памяти новых Athlon равен 128+256 = 384Кбайта. В случае же с Coppermine 32Кбайта L2-кеша всегда занято копией содержимого кеш-памяти первого уровня и эффективный объем кешей у этого CPU составляет всего 256Кбайт.

Что же касается недостатков, то просто напросто кеш Thunderbird медленнее чем кеш Coppermine. Причины этого кроются как в меньшей латентности кеша Intel Pentium III так и в том, что инженеры AMD поленились переделать шину соединяющую ядро и L2 кеш, после того как перенесли последний внутрь процессорного ядра. В результате, она так и осталась 64-битной, в то время как шина кеша Coppermine в четыре раза шире.

4,7. AMD Athlon XP 1800+ (1533 MHz)

Вот мы и дождались. Дождались процессора, который нам обещали довольно длительное время. А именно - десктопного варианта процессора AMD Athlon, построенного на новом ядре Palomino.

На самом деле, само ядро присутствовало на рынке уже достаточно давно, но политика компании AMD по выпуску процессоров на его основе выглядела несколько оригинальной. Привычной уже стала схема, при которой на новом ядре выпускается сначала высокоуровневый процессор, спустя какое-то время выходит его несколько урезанный тем или иным образом бюджетный вариант, а затем появляется мобильный. Все логично и понятно, сначала снимается максимально возможное количество сливок с high-end сегмента рынка, а затем новинка продвигается в массы.

В случае же с Palomino все произошло несколько иначе, если не сказать "с точностью до наоборот". AMD начала, что называется, с конца цепочки. Сначала увидел свет мобильный вариант Palomino - Athlon 4, затем AMD Athlon MP, рассчитанный на работу в двухпроцессорных системах. Ладно, пока что ситуация забавная, но не экстраординарная. А вот затем AMD делает очень оригинальный шаг - вопреки всем ожиданиям, на рынок выходит не десктопный Palomino, а AMD Duron, основанный на ядре Morgan. Т.е., low-end процессор! Причем выходит без особой помпы, тихо и незаметно. Изначально вообще было не ясно, а Palomino ли это? Как оказалось - таки да, Palomino, только называется Morgan и кэш у него поменьше.

И лишь после этого на сцене появляется настольный Palomino, переименованный к этому времени в Athlon XP (реверанс в сторону Microsoft?), получивший вместо привычной керамической одежки пластиковую (OPGA, Organic Pin Grid Array) и… реанимированный Pentium Rating.

Если упаковка нового процессора в пластиковый конструктив шаг вполне логичный и обоснованный (керамический корпус гораздо дороже), то возвращение PR, пусть и несколько изменившегося - достаточно спорное решение.

Документ первый: QuantiSpeed™ Architecture

Итак, что же представляет из себя "новая архитектура" процессоров Athlon XP?

Nine-issue, superscalar, fully pipelined micro-architecture

Основной упор в описании своего ядра AMD делает на то, что количество ступеней конвейера у него меньше, чем у Pentium 4 (что и обуславливает меньшую частоту работы ядра при одинаковом техпроцессе), но зато количество одновременно исполняемых (за один такт) инструкций - больше.

Superscalar, fully pipelined Floating Point Unit (FPU)

Еще один плюс своих процессоров, который AMD решила показать в описании QuantiSpeed Architecture - это их знаменитый FPU. Он действительно мощный - три независимых конвейера для исполнения стандартных FPU-инструкций всего семейства x86, плюс инструкции из фирменного набора AMD 3DNow!, плюс (начиная с ядра Palomino) полная поддержка всего набора Intel SSE (к сожалению, пока еще только "первого" SSE). Фактически, ни для кого не секрет, что это похоже действительно самый мощный x86 FPU - даже у Pentium 4 он слабее. Однако… опять "плюс на минус" - все это правда, но все это было еще даже в ядре K7 (за исключением поддержки SSE).

Hardware data prefetch

В Athlon XP используется механизм предварительной (опережающей) загрузки инструкций в L1 cache. Примечательно следующее: во-первых - именно инструкций т.е. только исполняемого кода, а не данных. Во-вторых - именно в кэш первого уровня т.е. - минуя L2. В принципе, учитывая размер L1 у Athlon XP (128 KB)

Exclusive and speculative Translation Look-aside Buffers (TLBs)

TLB имеют практически все "сложные" современные процессоры. Фактически, это еще один подвид кэша, только кэшируются в нем не сами команды и данные, а их адреса. В Thunderbird двухуровневый TLB имел емкость 24/32 (24 адреса инструкций и 32 данных) и 256/256. Основное нововведение Palomino - расширенный L1 TLB, который теперь может хранить 40 адресов данных. Кстати, заметим - если Hardware Prefetch оптимизирует загрузку команд, то при усовершенствовании TLB AMD большее внимание уделила именно данным. Кроме того, "эксклюзивность" кэша (фирменная "фича" AMD, когда кэш второго уровня не дублирует в себе содержимое кэша первого уровня) теперь распространяется и на TLB. В общем, нам трудно будет судить насколько велик вклад нового Translation Look-aside Buffer в общую производительность Athlon XP т.к. нет возможности вычленить именно его вклад, но плюс мы все же поставим - это нечто действительно новое.

4,8. Athlon XP 3200+

Athlon XP 3200+ получился значительно лучше своего предшественника. Хотя вроде бы не так уж и много изменилось: подняли до 2200 МГц частоту ядра (раньше было 2167, т. е. всего на 33 МГц ниже), да еще 33 МГц «накинули» на шину — теперь она работает на 400 МГц (200 МГц DDR). Итого: все тот же Barton (3000+), только увеличили частоту ядра и шины. Однако, как ни странно, похоже, мы наблюдаем то самое явление «перехода количества в качество», о котором так любили в тему и не в тему говорить большевики.

Вот он какой, красавец…

Маркировка — смотрите, не ошибитесь при покупке

Но что-то совершенно непонятное творится у AMD, и в особенности у ее «придворных» изготовителей чипсетов, с поддержкой новых частот шин. Мало того, что сама AMD в этом вопросе хранит гордое молчание почти до последнего момента, так еще и производители чипсетов добавляют и убирают новые частоты в/из спецификаций, как Бог на душу положит. То у нас nForce2 был первым чипсетом, поддерживающим не только 333 МГц, но и 400 МГц FSB, а то уже 400 МГц официально вроде бы поддерживают только новые nForce 400/nForce 400 Ultra (последний из которых фактически является просто новой ревизией северного моста nForce2)…

У нас на плате вроде бы уже nForce2 Ultra 400, но… даже маркировка старая

Впрочем, процессор плата определяет уже правильно

У VIA чипсет Apollo KT400 сначала, на момент анонса, поддерживает DDR400, потом — нет (JEDEC отклонил ее стандартизацию), потом все-таки поддерживает (все заявили поддержку, а мы чем хуже?), а теперь вот снова не поддерживает (ну надо же как-то объяснять, чем от него KT400A отличается!). Учитывая, что FSB 400 МГц он тоже не поддерживает, становится немного непонятно — откуда в его названии вообще взялась цифра «400»?! И что означает «600» в названии следующего чипсета этой компании? Очень не хотелось бы и в этой области сваливания в «3D-маразм» со всеми этими GeForce4 Ti 4800(SE) и Radeon 9100. Зачем SiS свой 746FX выпускала — вроде бы было понятно… но ровно до тех пор, пока не оказалось, что и он со всеми новыми частотами FSB/DDR не совместим, в связи с чем был срочно выпущен 748, отличающийся от него исключительно тем, что поддерживает эту самую пресловутую 400 МГц FSB. Возникает впечатление, что то ли AMD сама толком не знает, что она собирается завтра выпускать, то ли она не информирует об этом своих партнеров, то ли они все вместе старательно делают вид, что каждая новая частота на них нисходит, как откровение свыше. Партнеры, однако, исправно клепают «новые» чипсеты, как горячие пирожки, сшибая деньгу с энтузиастов, которых немало среди пользователей платформы Socket .