Багатопроцесорна обробка на кристалі

Алан Джок, Тижневик «Computerworld Росія»,

Визначення

– Це метод проектування центральних процесорів, що передбачає розміщення двох процесорів на єдиному шматку кремнію, що забезпечує підвищення продуктивності однопроцесорних та багатопроцесорних (У традиційному розумінні) серверів. Цей метод, відомий також як «багатопроцесорна система на кристалі», практично готовий до комерційної реалізації.

Вже скоро найбільш прогресивні користувачі потужних систем зможуть ще раз переконатися у правоті прислів'я про те, що одна голова добре, а дві – краще. Це станеться тоді, коли компанії Sun Microsystems, IBM, Compaq Computer, Hewlett-Packard і інші виробники почнуть поставляти сервери старшого класу, побудовані за технологією багатопроцесорної обробки на кристалі (CMP – chip multiprocessing). Це стане кроком вперед у порівнянні з сучасними системами, оснащеними блоками з декількома незалежними процесорними модулями. (У ряді цих компаній відсутня Intel, в якій більше покладаються на підтримку паралелізму на рівні команд – менш дорогу технологію підвищення швидкості та продуктивності.)

«В основі цього напряму лежить одна проста думка – чи не простіше замість того, щоб створювати все більш і більш складні процесори, поміщати їх по кілька в один модуль, – пояснив Лінлі Гвеннап, старший аналітик консультаційної компанії Linley Group, що спеціалізується на проблематиці мікропроцесорів. – Складність полягає лише в тому, що якщо операційна система не буде 'розуміти', що має справу з парою процесорів, великої переваги досягти не вдасться ». Гвеннап додав, що в майбутньому, безсумнівно, операційні системи стануть підтримувати багатопроцесорні кристали, правда, тоді труднощі перемістяться в сферу розробки додатків.

Результати перших випробувань показують, що два процесори на одному кристалі працюють вдвічі ефективніше двох незалежних процесорів. Монтуючи два процесори на одній підкладці, проектувальники отримують перевагу перед архітектурами, де дані передаються між двома незалежними процесорами за рахунок менших відстаней при передачі сигналу і більшої швидкості внутрішньої шини.

Настанню часу комерційних систем на базі CMP сприяло вдосконалення технологій виробництва мікропроцесорів, що веде до зменшення їх розмірів і дозволяє проектувальникам більш щільно розміщувати компоненти. Вивільнення простору на кремнієвій підкладці дозволяє розміщувати на ній додаткові процесори – спочатку тільки один, хоча надалі можна очікувати появи кристалів, на яких буде змонтовано до восьми процесорів.

Втім, просте об'єднання двох процесорів в одному шматку кремнію не обов'язково означає створення більш ефективного обчислювального пристрою. Головне тут – змусити таку машину з двома «двигунами» правильно розпоряджатися даними, і основна відмінність між процесорними архітектурами різних виробників буде полягати саме в реалізації обробки даних.

Ці несхожі архітектури

У новому кварталі компанія Sun Microsystems планує представити модуль MAJC-5200 c двома 500-мегагерцевого процесора, графічним процесором і блоком передачі даних. Швидкість передачі даних при пікових навантаженнях вводу / виводу буде досягати 4,8 Гбайт / с. Процесори працюють з спільно використовуваних чотирьохканальним кешем даних, що підтримує асоціативні безлічі, крім того, кожен процесор матиме власний двоканальний кеш команд, що підтримує асоціативні безлічі, ємністю 16 Кбайт.

Додатковою можливістю MAJC-5200 стане підтримка многопотоковой обробки – апаратне забезпечення зможе поділяти завдання на побайтовим «порції», в певному порядку надходять на кожен процесор для уникнення втрачених циклів. Втім, Марк Тремблі, старший проектувальник групи процесорних продуктів компанії Sun, звертає увагу на те, що далеко не всі програмні додатки оптимізовані для многопотоковой обробки. В якості компенсації в MAJC-5200 буде використовуватися Java Virtual Machine для спекулятивного виділення потоків в Java-програмах.

У IBM, навпаки, вважали за краще не реалізовувати підтримку многопотоковой обробки в своєму високошвидкісному, гигагерцевой процесорі Power4. Для забезпечення ефективної передачі даних кожен процесор Power4 буде «перекачувати» їх зі своєї 32-мегабайтної пам'яті в кеш-пам'ять другого і третього рівня для підтримки зв'язку між процесорами і буферизації інформації з системної пам'яті.

«Каменем спотикання для всіх систем при збільшенні тактової частоти являетcя фізична віддаленість пам'яті, – пояснив Джоел Тендлер, директор зі стратегії в області технології серверної групи IBM. – Цикл обробки при частоті 500 МГц становить 1 нс, при 1 Ггц – це 2 нс. Саме тому ми додаємо в ієрархію пам'яті додаткову кеш-пам'ять ».

Швидкість шини понад гігагерца

Спочатку системи Power4 будуть працювати з шиною, що підтримує частоту 500 МГц (це становить половину швидкості процесора), хоча вони розраховані на швидкості шини, що перевищують 1 ГГц, в розрахунку на зростання швидкодії процесорів. У IBM розраховують випустити CMP-процесор у другій половині року.

Якими б не були відмінності між двома компаніями, Sun і IBM єдині в тому, що підтримка багатопроцесорної обробки на кристалі – значний крок вперед у проектуванні процесорів. Йому передував прогрес в області процесорної технології, мікропроцесорної архітектури та компіляторів.

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*