NVIDIA GeForce4 Ti і GeForce4 MX: особливості архітектури та їх вплив на продуктивність, порівняння з основними конкурентами і розгін, Відеокарти, огляди

Підготовлено
за матеріалами сайтів Anandtech, HotHardware, Xbit Labs і Digit-life

Введення

Після виходу графічної карти ATI RADEON 8500 для NVIDIA настали не
кращі часи. Один з кращих її продуктів – GeForce3 Ti500 поступився лідируючі
позиції. Нещодавно компанія представила свою нову лінійку продуктів GeForce4,
оснащену новими технологічними рішеннями, високою частотою і новими драйверами,
пропонує відчути раніше небачені рівні реалістичності відображуваних сцен.
Поки компанія представила два чіпи, націлені на масовий і продуктивний
ринок – GeForce4 Ti і GeForce4 MX.

Специфікація NVIDIA GeForce4 Ti 4600

Графічний движок – NVIDIA ® GeForce4 Ti GPU @ 300MHz
 
Відео пам’ять – 128MB DDR @ 650MHz DDR
 
Стандарт шини – AGP 4X / 2X / 1X
 
Роз’єм – Подвійний VGA або DVI (з конвертером)
 
TV-out роз’єм (опціально) – S-VHS mini-DIN

NVIDIA Personal Cinema Ready (опція)

nView – Технологія, що забезпечує роботу в багато дисплейних конфігураціях

Accuview AA – Нова технологія згладжування, що забезпечує новий рівень якості
згладжування сцен з великою швидкістю у великих дозволах

Lightspeed Memory Architecture TM (LMA) II – 128 – bit DDR інтерфейс, що збільшує
ефективність пам’яті, “Quad Cache” – чотири незалежних модуля кеш
пам’яті (Pixel, Texture, Primitive і Vertex), Стиснення Z-буфера без втрат з коефіцієнтом
4:1, Підсистема видимості другого покоління

nfiniteFX II движок – Забезпечує складну геометрію і анімацію з подвійним вершинним
шейдером і швидким піксельним шейдером

Продуктивність – 4.8Gsamples/sec

Специфікація NVIDIA GeForce4 MX 460


Графічний движок – NVIDIA ® GeForce4 MX GPU @ 300MHz
 
Відео пам’ять – 64MB DDR @ 550MHz DDR
 
Стандарт шини – AGP 4X / 2X / 1X
 
Гніздо – один VGA і один DVI
 
TV-out роз’єм (опціально) – One S-VHS mini-DIN

NVIDIA Personal Cinema Ready (опція)

nView – Технологія, що забезпечує роботу в багато дисплейних конфігураціях

Accuview AA – Нова технологія згладжування, що забезпечує новий рівень якості
згладжування сцен з великою швидкістю у великих дозволах

Lightspeed Memory Architecture TM (LMA) II – 128 – bit DDR інтерфейс, що збільшує
ефективність пам’яті, “Quad Cache” – чотири незалежних модуля кеш
пам’яті (Pixel, Texture, Primitive і Vertex), Стиснення Z-буфера без втрат з коефіцієнтом
4:1, Підсистема видимості другого покоління

Інтегрований TV кодер з роздільною здатністю 1024×768

Інтегрований апаратний MPEG-2 декодер

Компенсація руху і IDCT – Дозволяє декодувати DVD з мінімальним використанням
CPU

Підтримка HDTV

Порівняння специфікацій сучасних графічних карт

Архітектурні особливості GeForce4 Ti 4600

Ядро GeForce4 Ti 4600, використовує кодове ім’я NV25. Як і NV20, це ядро ​​виконано
по 0.15мкм технології.

При розгляді карти ядра відразу звертаєш увагу на присутність двох модулів
вершинних шейдеров, замість одного, використовуваного в NV20. Присутність двох модулів
значно збільшує швидкість і якість рендеринга, що дозволить розробникам
формувати більш деталізовані, і відповідно більш реальні сцени в
великому дозволі. Модуль піксельного шейдера залишився незмінним. Ядро має
чотири піксельних конвеєра і здатне обробити дві текстури на піксель. Ці
три модулі об’єднані в новий движок nfiniteFX II.

Движок nfiniteFX II реалізований тільки в GeForce4 Titanium. Це друге покоління
движка піксельного і вершинного шейдера, сумісного з DirectX 8.1. Два вершинних
шейдера здатні обробити до 136 000 000 вершин в секунду. Це дозволить
розробникам, реалізувати більш деталізовані і складні сцени. Для підтвердження
цих слів, дозвольте продемонструвати три скріншота, що демонструють можливості
GeForce4. 

NV Wolfman

Tiger Woods 2002

Morrowind

Як Ви бачите, все три кадри показують чудову якість і деталізацію
відображуваних сцен, проте ми хочемо особливо звернути Вашу увагу на перший
кадр – “Mojo Wolf”. Тут Ви можете бачити, як підготовлені деякі
складні елементи сцени.

Lightspeed Memory Architecture II

Нова особливість ядра NV25 – Lightspeed Memory Architecture II. У NV25 використовується
перехресна архітектура пам’яті NVIDIA, заснована на чотирьох незалежних контролерах
пам’яті, кожен з власної 32-bit DDR шиною, що дозволяє розділити і збалансувати
запити до пам’яті.

Quad Cache. Ця особливість передбачає наявність чотирьох виділених модулів кеш
пам’яті для примітивів, вершин, текстур і пікселів. Такий поділ так само дозволяє
прискорити доступ до даних.

Модуль компресії Z-буфера без втрат. Дані z-буфера (дані, які вказують
на те, як «глибоко» розташований об’єкт від поверхні екрану) фактично дуже
легко стискаються. Використовуючи алгоритм стиснення без втрат, ми отримуємо повну ідентичність
декомпрессірованний і оригінальних даних, що можна порівняти з ZIP компресією.
NVIDIA здатна досягти коефіцієнта стискування 4:1. Враховуючи факт що z-буфер дуже
активно пише і читає дані, всякий раз, коли відображається новий піксель,
це дозволить значно розвантажити шину.

Z-clear.Ета особливість, використовується в чіпах GeForce3 і Radeon, і дозволяє
з дуже великою швидкістю обнулити всі дані z-буфера.

Підсистема видимості другого покоління. GeForce3 має особливість, відому
як Z-occlusion culling, яка дозволяє GPU переглядати значення z-буфера,
для визначення видимості кожного пікселя. Якщо поточний піксель «накритий» іншим
пікселем, то він не буде відображатися, що призведе до розвантаження шини пам’яті.
Це дозволяє вирішити проблему відому як «overdraw» і значно збільшити
продуктивність.

І остання особливість LMA II відома як «auto pre-charge». Пам’ятайте, що
на відміну від кешу, DRAM пам’ять полягає в ємностях і відповідно вимагає
постійного оновлення. Перевага цього типу пам’яті полягає в тому, що
для її виготовлення використовується значно менше число дорогих компонентів,
ніж при виробництві кеш пам’яті, недолік ж полягає в наявності великих
затримок при доступі до інформації. Однією з причин виникнення затримок є
необхідність підзарядки ємностей при спробі зчитати інформацію з нових блоків
пам’яті. Технологія «auto pre-charge» використовує спеціальну логіку в контролері
пам’яті, що дозволяє передбачити, до якої рядку і до якого колонку DRAM масиву
буде звернення в наступний момент, що дозволить зарядити їх перш, ніж вони
будуть затребувані, скорочуючи, таким чином, час очікування. Якщо передбачення
пройшло невдало, то процес піде за звичайною схемою. «Auto pre-charge» на додаток
до Quad Cache дуже допомагає звільнити GPU від витрати дорогоцінних циклів в idle
стані.

В цілому, алгоритми, використовувані в GeForce4 дозволяють збільшити продуктивність
в порівнянні з GeForce3, що працюють на тій же частоті (гіпотетично) приблизно
на 25%.

Архітектурні Особливості GeForce4 MX 460

На відміну від ядра GeForce4 Ti 4600, GeForce4 MX не має піксельного шейдера
сумісного з DirectX 8 і обмежено підтримує вершинні шейдери. Замість
цього, чіп підтримує технологію NVIDIA Shading Rasterizer (NSR) використовувану
в GeForce2. Незважаючи на це GeForce4 MX є дуже потужним для сьогоднішніх
ігор.

GeForce4 MX має тільки два незалежних 64-bit контролера пам’яті балансують
навантаження. Вибір такої конфігурації пов’язаний з можливим використанням цього ядра
у складі майбутньої версії чіпсета nForce, який використовує двох канальний 64-bit
DDR інтерфейс пам’яті.

В іншому GeForce4 MX ідентичний GeForce4 Ti 4600; він має той же движок
Accuview AA (див. нижче), підтримку nView (див. нижче), і так само поліпшену підсистему
видимості.

Крім цього, GeForce4 MX має подвійний інтегрований TMDS передавач для
подвійного DVI виходу з дозволом до 1280 x 1024 на монітор, що в комплексі
з можливостями nView робить плати, засновані на цьому чіпі, дуже привабливими,
особливо на ринку бюджетних систем. Враховуючи націленість цього чіпа на масовий
ринок дешевих систем, NVIDIA вирішила, що буде корисно оснастити його апаратним
декодером MPEG2 з компенсацією руху і IDCT (inverse discrete cosine sform),
який допоможе значно поліпшити перегляд DVD на системах, що використовують
слабкі процесори. Відсутність подібного декодера в GF4 Ti пояснюється використанням
його в дуже потужних системах, де центральний процесор самостійно впоратися
з декодуванням MPEG2.

На сьогоднішній день лінійка GeForce4 MX включає три карти: MX 460, MX 440
і MX 420. Всі три карти мають 128-bit шину пам’яті з 64MB фрейм буфером. Карти
460 і 440 використовують DDR SDRAM, а 420 використовує звичайну SDR SDRAM пам’ять.

Особливості та можливості nView

Однією з найочікуваніших особливостей GeForce4 є технологія nView, яка
є розширенням TwinView. Новий чіп NVIDIA з верхньої цінової групи нарешті
придбав повнофункціональну підтримку двомоніторних конфігурацій. Тепер,
ми можемо забути про ті дні, коли нам доводилося миритися з тим, що швидкі
і дорогі 3D чіпи від NVIDIA не підтримують цієї цікавої та важливої ​​технології,
а їх дешеві і менш продуктивні модифікації (GeForce2 MX/MX200/MX400)
можуть працювати з двома моніторами, але не можуть забезпечити достатній продуктивності.

Звичайно ж, для підтримки двомоніторних конфігурацій чималу роль зіграла
компанія ATI. Якби карта ATI RADEON 8500/7500 не мали підтримки двухмонітоних
конфігурацій, ми до цих пір продовжували б мріяти про альтернативний вирішенні
від NVIDIA.

Коли до графічної карти підключені два монітори (Точніше кажучи, два дисплеї,
тобто монітор, і LCD або TV), nView дозволяє працювати в режимах Clone, Zoom,
Horizontal Span і Vertical Span. Крім того, первинне і вторинне пристрій
можуть мінятися ролями.

Ви так само можете міняти властивості орієнтації дисплея:

Під час відтворення відео є ще одіе режим – Video Mirror.

Говорячи про nView, ми не можемо не згадати програмну підтримку особливостей
NVIDIA GeForce4, здійснених на апаратному рівні. У цій області nView Desktop
Manager є доказом високої функціональності і зручності при роботі
з двомоніторних конфігураціями.

З функціональної точки зору, nView не поступається технології HYDRAVISION від
ATI. Єдине зауваження стосується роботи з TV-виходом.

Відповідно до твердження NVIDIA, є модуль TV-виходу з підтримкою HDTV вбудований
в чіп GeForce4. Однак, наша тестова карта NVIDIA GeForce4 Ti4600 була обладнана
зовнішнім чипом CX 25871-13 від Conexant. Крім того, якість зображення на екрані
TV трохи відстає від того, що ми бачили на картах ATI. Ми вважаємо, що коли
почнеться масове виробництво карт на NVIDIA GeForce4, ця проблема буде вирішена.

Новий алгоритм згладжування Accuview AA

У GeForce 4 і GeForce 4MX, NVIDIA реалізувала новий більш ефективний алгоритм
згладжування – “Accuview AA”. До випуску GeForce 3, NVIDIA використовувала
т.зв. алгоритм super-sampling дозволяє видалити “нерівності” з зображення.
Працює цей алгоритм наступним чином. Super-sampling рендери поточний фрейм
в більш високому дозволі (Наприклад, 2X або 4X від рідної). У цьому дозволі,
колірні семпли збираються навколо кожного пікселя, після чого вони змішуються
разом, і фрейм масштабується назад до рідного дозволу. Оскільки оригінальний
фрейм рендерится безліч разів, super-sampling вимагає великої пропускної здатності
шини пам’яті. У той час як візуально, super-sampling AA дозволяє отримати
чудові зображення, по продуктивності цей метод згладжування доступний
не всім GPU при вирішенні вище 800×600. огляду на це, в NVIDIA GeForce 3 застосувала
інший метод згладжування відомий як multisampling.

Multisampling працює подібно super-sampling, але через особливості GPU, оригінальні
дані посилаються через конвеєр один раз, що дозволяє розвантажити шину. Наявні
дані використовуються для отримання колірних семплів від т.зв. “Віртуальних
пікселів “оточуючих оригінальний піксель. Після цього всі семпли змішуються
разом. Незважаючи на це, multisampling має кілька побічних ефектів. Зменшення
завантаження шини згубно позначається на якості зображення. При багаторазовому
використанні даних текстури зображення може розмиватися. Для вирішення цієї
проблеми використовуються різні оптимізують методи, такі як анізотропна
фільтрація або зміна положення “віртуальних пікселів” використовуваних
для колірних семплів.

Різні версії алгоритмів згладжування, включаючи multisampling, 2x, Quincunx,
4x і 4xS, разом з анізотропної фільтрацією тепер називаються одним словом –
Accuview.

Тут, Ви бачите включення нового алгоритму згладжування 4xS. Фактично алгоритм
4xS є комбінацією 2x multisampling’а і 1×2 supersampling’а. Суть цього
методу полягає у формуванні фінального пікселя як середнє число двох
подпікселей, розташованих один нижче іншого, кожен з яких отримано 2x multisampling’ом.

Методика 4xS дозволяє приховати “сходинки” на горизонтальних і злегка
нахилених лініях. Для оцінки ефективності цієї методики ми використовували кілька
ігрових програм. Перша, Serious Sam: The Second Encounter, де ми порівняли
якість отримане при застосуванні методики 2x, Quincunx, 4x і 4xS від NVIDIA,
а так само SMOOTHVISION 6x від ATI.

Немає згладжування

Accuview 2x

Accuview Quincunx


Accuview 4x


Accuview 4xS


Smoothvision 6x Quality

Другий приклад – Novalogic Comanche 4

2X AA

Quincunx AA

4X AA

4XS

 Eye Candy 1

Eye Candy 2

Eye Candy 3

У цьому порівнянні верхні чотири знімки дозволяють нам побачити той самий ефект,
який ми спостерігали в Serious Sam: The Second Encounter. Нижні три знімки
показують нову якість отримуваних сцен при застосуванні методу 4XS.

Тепер ми хотіли б торкнутися питання впливу нового методу згладжування на
продуктивність. Для цього були проведені випробування Serious Sam: The Second
Encounter в режимах Speed ​​і Quality. У порівнянні взяли участь три графічні
карти NVIDIA GeForce4 TI4600, GeForce3 TI500 і ATI RADEON 8500.

Режим Quality відрізняється від режиму Speed ​​підтримкою анізотропної фільтрації,
ВТО час як 4xS відрізняється від 4x – 2×1 supersampling’ом.

З цієї причини, а саме через 2×1 supersampling’а в методиці 4xS, подвоєння
продуктивності, необхідний для обчислення кольору здається дуже відчутною
при включенні анізотропної фільтрації. Крім того, чим вище рівень анізотропної
фільтрації, тим більше 4xS відстає від 4x. Для визначення різниці використовувалася
тестова сцена Lobby з 3DMark2001.

Тут ми чітко бачимо, що збільшення обчислювального навантаження, необхідної
анізотропної фільтрацією збільшує час необхідний на відображення пікселя
4x і вдвічі збільшує час для 4xS.

Якість 3D сцен

Оскільки ми заговорили про анізотропної фільтрації, давайте докладніше розглянемо
нові можливості і продуктивність при відображенні 3D сцен.

NVIDIA GeForce4, так само як GeForce3 підтримує 8 -, 16 – і 32-семпловую анізотропну
фільтрацію. Зверніть увагу, що якість фільтрації текстур однаково для
цих двох чіпів. Для ілюстрації цього подивіться на скріншоти нижче виконані
в режимі quality:

NVIDIA
GeForce4 Ti4600

NVIDIA
GeForce3 Ti500

ATI
RADEON 8500

Як Ви може бачити, якість анізотропної фільтрації NVIDIA GeForce4 Ti4600
і NVIDIA GeForce3 Ti 500 абсолютно ідентичні.

Тепер, давайте подивимося вплив включення анізотропної фільтрації на NVIDIA
GeForce4 Ti4600 в порівнянні з NVIDIA GeForce3 Ti500 і ATI RADEON 8500:

При включенні анізотропної фільтрації продуктивність NVIDIA GeForce4 Ti4600
знижується набагато більше, ніж у NVIDIA GeForce3 Ti500. Особливо це важливо з огляду на,
що GeForce3 Ti500 втрачає майже 50% продуктивності. Єдиним порятунком
для GeForce4 Ti4600 є робота на більшій частоті. У разі однакових
частот GeForce4 Ti4600 може навіть програти GeForce3 Ti500.

Зовнішні особливості нових графічних карт

Графічні плати, засновані на нових чіпах, мають ряд нових конструктивних
рішень і особливостей. Перше, що кидається в очі – новий кулер з логотипом
NVIDIA. Враховуючи факт, що чіп працює на 300MHz, він вимагає більш ефективних
методів охолодження, ніж ті, що використовувалися раніше. Оригінальна конструкція
кулера дозволяє не тільки ефективно охолоджувати сам GPU, а й навколишні його
чіпи пам’яті, які, до речі, працюють на частоті до 600MHz, і теж вимагають
гарного охолодження.

  

Що стосується пам’яті, але плата оснащується 128MB DDR SDRAM від Samsung з часом
доступу 2.8ns. Зверніть увагу, що чіпи пам’яті виконані в новому корпусі
BGA, який має дещо кращі електричні характеристики, враховуючи стабільну
роботу на дуже високих частотах.

Карти обладнуються VGA-, DVI-I і S-Video виходами. Сигнал для цифрових моніторів
формується чипом Sil164ct64 від Silicon Image.

TV-сигнал формується чипом Conexant CX25871-13.

Випробування

Тепер, коли ми докладно розглянули всі нові особливості архітектури GeForce4,
і навіть провели попередні випробування впливу нових архітектурних рішень
на продуктивність GeForce4, давайте перейдемо безпосередньо до випробувань
нових графічних карт. Тестова система працювала під управлінням Windows XP,
яка встановлювалася з нуля для кожної нової графічної карти.

Тестова система

Нові референсні драйвера Detonator 4 27.30

Інформація

Direct X

OpenGL

Accuview AA

nView

Прозорість

Quake 3 Arena

Спочатку ми проведемо загальне порівняння без включення AA.

 

Всі плати були протестовані при установці максимальних налаштувань геометрії
і текстур, з 32 bit кольором і трилинейной фільтрацією. Однак пам’ятайте, що “старий”
ігровий движок не використовує піксельні і вершинні шейдери. Тепер результат.
Незважаючи на шалену швидкість GeForce4 Ti 4600, нашу увагу привернули результати
GeForce4 MX 460. Навіть у вирішенні 1600х1200 ця карта показує більше 80
кадрів в секунду. При тому, що її ціна близько 150 $. Тепер Давайте активізуємо
згладжування …

 

При активізації згладжування карта GeForce4 MX 460 становить серйозну конкуренцію
Radeon 8500 і навіть GeForce3 Ti 500. Ці результати були отримані в дозволі
1280X1024.

Порівняння продуктивності DirectX 8

 

У цій серії випробувань не використовувалося згладжування, а тільки змінювалося дозвіл.
Це дозволяє нам більш реально оцінити відміну DirectX 8 продуктивності
від GeForce3 Ti 200.

 

Ці випробування проводилися в дозволі 1024X768 з 32 bit глибиною кольору, при
використанні режимів згладжування 2X і 4X. Тут ми бачимо безперечне лідерство
карти GeForce4 Ti 4600, випереджальну GeForce4 MX 460 на 25 – 35%. Крім того,
в цю серію ми включили результат для режиму 4XS, який показує приблизно
4% відставання.

Продуктивність OpenGL

Для цих тестів ми використовували гру Serious Sam – The Second Encounter. Під
час тестів були встановлені максимальна якість текстур і деталізації.

 

Перша серія тестів з відключеним згладжуванням. Тут Ви можете бачити, що
всі плати, за винятком GeForce4 Ti 4600 показують приблизно рівні результати.

Наступні тести проводилися в одному дозволі при установці різних режимів
згладжування.

 

Тести виконані у вирішенні 1024X768, з установкою максимальної деталізації
і 32 bit глибини кольору. GeForce4 MX показує результати порівнянні з
Radeon 8500, за винятком режиму 4X. GeForce4 Ti 4600 перевершує інші
карти приблизно на 34 – 50%.

Продуктивність DirectX 8

У цій серії випробувань ми використовували продукт Max Payne, який використовує
DirectX 8 для управління графічними середовищами та життєподібному характером.
В цілому Max Payne дозволяє максимально завантажити графічну карту, що пояснює
не високу швидкість.

 

Тут ми продовжуємо спостерігати перевагу GeForce4 Ti 4600, проте, воно не
настільки значно, як ми бачили в попередніх тестах.

Можливості розгону GeForce4 Ti 4600

Експерименти показали, що GeForce4 Ti 4600 можна розігнати, але не сильно.
Фактично вдалося досягти частоти ядра 325MHz і пам’яті 715MHz (DDR). На цих
частотах карта залишалася стабільною при виконанні 3DMark 2001.

GeForce4 Ti 4600 @  325/715

 

Висновок

В цілому все, що було сказано вище, дозволить Вам самостійно зробити все
необхідні висновки. Ми тільки спробуємо зіставити деякі факти. Враховуючи,
що негласно чіп GeForce4 був випущений як головний конкурент ATI RADEON 8500,
NVIDIA повинна була врахувати всі недоліки GeForce3 Ti500 та переваги ATI RADEON
8500.

ATI RADEON 8500 на відміну від NVIDIA GeForce3 підтримує двомоніторних конфігурації.
Тепер ця підтримка здійснена в GeForce4.

ATI RADEON 8500 має апаратну декомпресію MPEG2. Тепер GeForce4 також
оснащується апаратним декодером MPEG2.

ATI RADEON 8500 має більш ефективний модуль вертикальних шейдеров, ніж NVIDIA
GeForce3. GeForce4 тепер має два модулі.

ATI RADEON 8500 підтримує більше “розширений” піксельний шейдер,
ніж NVIDIA GeForce3: версія 1.4 проти версії 1.1. GeForce4 має підтримку
версії 1.3.

ATI RADEON 8500 хвалиться технологією HyperZ II, яка більш ефективна,
ніж Lightspeed Memory Architecture технологія, використовувана в GeForce3. GeForce4
тепер використовує технологію Lightspeed Memory Architecture II.

І, нарешті, ATI RADEON 8500 працює на більш високій частоті ядра і пам’яті,
ніж GeForce3 Ti500. Тепер GeForce4 Ti4600 використовує найвищу частоту,
як для ядра, так і для пам’яті.

Все це підтверджує, що основною причиною випуску GeForce4 стала RADEON 8500.
Але це неважливо, головне, що тепер ми отримали дійсно новий рівень
якості та продуктивності.

Ми дякуємо компанії «Ultra Computers» за допомогу, надану при
підготовці цієї статті. Сьогодні компанія пропонує широкий асортимент графічних
карт GeForce2, GeForce 3, RADEON 8500 і GeForce 4.

З питань консультацій звертайтесь за телефонами в Києві: (095)
729-5255, 729-5244

Схожі статті:


Сподобалася стаття? Ви можете залишити відгук або підписатися на RSS , щоб автоматично отримувати інформацію про нові статтях.

Коментарів поки що немає.

Ваш отзыв

Поділ на параграфи відбувається автоматично, адреса електронної пошти ніколи не буде опублікований, допустимий HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

*

*