P3-P4: новий хід Intel

Дмитро Дереза, Мій Комп'ютер

2000 видався для Intel не зовсім вдалим. Direct RDRAM був сприйнятий індустрією без особливого ентузіазму, чіпсет i810 так і не став популярним, i820 зазнав повного фіаско, а VIA більш ніж вдало зіграла зі своїм Apollo Pro133/133A. Якщо AMD змогла не тільки створити високопродуктивний high-end процесор, але і в достатніх кількостях налагодити його випуск, то Intel досі має проблеми з насиченням ринку. Процесор нижнього рівня AMD Duron по всіх параметрах з легкістю поклав на лопатки Intel Celeron, і тільки висока ціна і брак материнських плат під Socket A ще не звів Celeron зі світу. Але Intel відрізняється бойовим характером і, здається, не збирається здаватися, поднапрягшісь, компанія приготувала на останній квартал року кілька новинок. Одним з таких вибухонебезпечних сюрпризів став новий процесор Pentium 4, відомий раніше як Intel Willamette. З кожним днем наближається його масовий випуск – вже в жовтні-листопаді цього року очікується поява Pentium 4 1.4 Ггц і 1.5 Ггц. Модель буде виробляється по 0.18 мкм-технології і працювати з новими материнськими платами на чіпсеті i850 Tehama. Ми зацікавили вас? Тоді придивимося детальніше до нової архітектури, названої розробниками NetBurst.

Технологія Hyper Pipelined

Довжина конвеєра Intel Pentium 4 збільшена до 20 етапів. Чи добре це? Для прикладу – сьогоднішній Pentium III має 12-етапний конвеєр, Athlon – 10-ти. Але при цьому не варто забувати один загальновідому істину – чим довше конвеєр, тим легше нарощувати тактову частоту, але, відповідно, тим менша продуктивність доводиться на кожен отриманий мегагерц :-(. Виходить палиця на два кінці.

Системна шина

При все зростаючою продуктивності процесорів і підсистеми пам'яті, збільшення швидкості вже досить літній системної шини GTL+ за останній рік всього лише на 33 МГц виглядає не дуже вражаюче. Тому не дивно, що з виходом Willamette Intel вводить нову системну шину, яка має значно підвищити пропускну здатність. Ця системна шина має 128-бітові лінії з 64-бітним доступом, наприклад, у процесорів попередніх поколінь були 32-бітові лінії. А її тактова частота – всього 100 МГц, тобто навіть нижче, ніж у сьогоднішньої 133 МГц GTL +, але за рахунок передачі 4 пакетів за такт, ефективна частота зростає до 400 МГц.
? Таким чином плюси нової шини очевидні: значно зросла пропускна здатність – 3.2 Гб / с (400 МГц, 64 біт) проти 1.064 Гб / с у сьогоднішньої GTL + (133 МГц, 32 біт) і проти 1.6 Гб / с у системній шини EV6 під Athlon (200 МГц, 64-біт).
? А ось мінуси вийшли замаскованими. 4 пакети даних за один такт – це, звичайно, здорово, але тільки в тому випадку, коли вдасться їх надати до моменту виконання чергового такту. Інакше пропускна здатність шини буде використовуватися далеко не повністю. Загалом, 3.2 Гб / с – це максимум, на що ми можемо розраховувати. До того ж, використання нової шини вимагає застосування нового чіпсета, що також плюсом назвати досить важко.

Цілочисельні операції, Rapid Execution Engine

Блоки арифметичної логіки ALU (Arithmetic Logic Units) працюють на подвоєною, у порівнянні з ядром процесора, тактовій частоті. Це дозволяє виконувати деякі інструкції за половину такту – швидкість цілочисельних операцій збільшується у два рази. А оскільки таких блоків у Pentium 4 два – в ідеалі за один такт роботи процесора виходить 4 операції з цілими числами!

Співпроцесор

Що стосується блоку для операцій з числами з плаваючою комою в Pentium 4, то вийшла картина, схоже, не влаштовує навіть саму Intel. Два таких модуля в операціях з плаваючою комою будуть забезпечувати для 1.4 Ггц-процесора Pentium 4 пікову продуктивність всього лише 1.4 GFLOPS :-(. Реальну обчислювальну роботу виконує тільки один модуль – операції типу FADD (додавання) і FMUL (множення), Другий же займається підсобної діяльністю – операції типу FSTORE (обмін між регістрами і пам'яттю). Не в приклад Pentium 4, FPU процесора Athlon містить три роздільних, повністю конвейерізірованних модуля, здатних приймати інструкції на кожному такті. При цьому один з них призначений тільки для інструкції FSTORE, інші два складаються з пристроїв FADD і FMUL. Завдяки цьому FPU може виконувати за кожен такт по дві інструкції – одну додавання і множення іншу, тобто 1 ГГц Athlon має пікову продуктивність 2 GFLOPS. Виходить, що в Athlon більш досконала архітектура співпроцесора, ніж у Pentium 4.

Кеш. Execution Trace Cache

У кеш-пам'яті першого рівня зберігаються декодовані команди – ~ 12 Кб мікрокоманд, завдяки чому в циклі виконання усуваються затримки, пов'язані з розкодуванням. Така технологія має підвищити швидкодія кеш-пам'яті команд і збільшити ефективність використання кеша. Крім того, процесор Pentium 4 містить кеш-пам'ять другого рівня типу Advanced Transfer Cache об'ємом 256 Кб, що забезпечує передачу даних зі швидкістю 48 Гбіт / с, збільшується пропорційно тактовій частоті ядра. В цілому дуже непогано, але нічого революційного.

Удосконалення динамічного виконання (Advanced Dynamic Execution)

Pentium 4 містить вдосконалений блок спекулятивних обчислень. Процесор може виконувати інструкції, порушуючи їх природну послідовність, що дозволить щільніше завантажити виконавчі модулі, ліквідуючи витрати застосування довгого конвеєра.
Також Pentium 4 містить поліпшені схеми передбачення розгалужень, що дозволяють йому значно підвищити точність процесу передбачення переходів з імовірністю правильного передбачення до 95% і знижують втрати часу, пов'язані з помилковим вибором послідовності обчислень. Все це допоможе впоратися з витратами застосування все того ж дуже довгого конвеєра.

SIMD-розширення

Як показала практика реалізації в Pentium III технології SSE, інструкції не викликали особливого ентузіазму у розробників ігор. Однак багато ділові додатки, графічні редактори вже оптимізовані під SSE і показують при цьому значно більшу продуктивність. Правильно зорієнтувавшись, Intel тверезо оцінює ситуацію і не робить головні ставки на SIMD-розширення. Тим не менш, якщо розробники ПЗ все ж підтримають нововведення Intel, нові потокові SIMD-розширення 2 (SSE2), Що доповнюють технології MMX(tm) і SSE 144-ма новими інструкціями (68 128-розрядних цілочисельних інструкцій і 76 128-розрядних інструкцій для обчислень з плаваючою точкою), з часом стануть ще однією козирною картою в колоді напівпровідникового гіганта.

Висновки

Intel вже демонструвала досвідчені зразки Pentium 4. А деяким незалежних джерел (зарубіжні комп'ютерні ЗМІ) навіть вдалося спробувати новинку в роботі. І якщо відкинути результати явно рекламних тестів, які активно використовують SSE2, то висновки вийдуть досить звичайними – революції не відбулося :-(. Незважаючи на впровадження всіх вищеперелічених інновацій, результати перших польових випробувань не виявили явної переваги Pentium 4 до Pentium III Coppermine або AMD Athlon – при рівних тактових частотах.
Але навряд чи варто засмучуватися з цього приводу. Тепер в арсеналі Intel є відмінно масштабована архітектура, що дозволяє швидко і легко нарощувати тактову частоту процесора, зберігаючи при цьому гарний приріст продуктивності системи в цілому. Тепер головному конкурентові в особі AMD Athlon буде дуже важко змагатися з Pentium 4 по рівню досягаються тактових частот. У шаленій гонці напівпровідникових гігантів за звання виробника найшвидшого процесора компанія Intel зробила величезний ривок вперед, залишивши позаду суперників – AMD і VIA. Ось тільки чи надовго?

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*