Analýza odhaluje, proč grafické čipy Nvidia představují výkonné šelmy, které šetří energii - Výpočetní - 2019

Anonim

Nedávná zpráva Davida Kantera z Real World Technologies zkoumá, proč grafické čipy poskytované firmou Nvidia - a to ty, které jsou založeny na architektuře společnosti Maxwell a Pascal - mají lepší výsledky než jejich špičkové teoretické počty a proč jsou efektivnější než konkurenční grafické čipy. Stručně řečeno, výstup pixelů na grafických procesorech Nvidia je ukládán do vyrovnávací paměti tím, co se nazývá rasterizery s okamžitým režimem založené na dlaždicích, které jsou rychlé a energeticky účinné. Grafické čipy soutěžícího se spoléhají na pomalejší konvenční rasterizátory s okamžitým režimem na celou obrazovku.

Podle společnosti Kanter je rasterizace založená na dlaždicích již od devadesátých let minulého století, poprvé se objevila v architektuře PowerVR a byla přijata společností ARM a Qualcomm v GPU mobilních procesorů. Až do zavedení tohoto systému Nvidia do architektury Maxwell GM20x nebyla rasterizace založená na dlaždicích úspěšně implementována do stolních grafických čipů.

Rasterizace založená na dlaždicích v podstatě znamená, že každá trojúhelníková trojrozměrná scéna je rozdělena na dlaždice a každá dlaždice je rozložena (rastrována) na pixely na samotném grafickém čipu, aby byla "vytištěna" na dvourozměrné obrazovce. Naproti tomu rasterizátory s okamžitým režimem na plné obrazovce využívají více paměti a více energie tím, že rozdělí celou scénu na pixely v jednom průchodu (nebo skenování).

"Použitím dlaždicových oblastí a ukládáním do vyrovnávací paměti data rasterizátoru se snižuje šířka pásma paměti pro vykreslování, čímž se zlepšuje výkon a výkon, " vysvětluje Kanter. "V souladu s touto hypotézou naše testování ukazuje, že grafické procesory Nvidia mění velikost dlaždic, aby zajistily, že výstup pixelů z rasterizace zapadá do vyrovnávací paměti nebo vyrovnávací paměti s pevnou velikostí."

Kanter vysvětluje, že mobilní GPU z modelů Apple a jiných výrobců zařízení používají metodu nazvanou odkládané vykreslování založené na dlaždicích, kde práce na bázi geometrie a pixelů probíhá ve dvou samostatných průchodech. Scéna je rozdělena na dlaždice, trojúhelníky jsou zpracovávány pro každou dlaždici najednou a poté se pro každou dlaždici objeví stínování pixelů.

Nicméně Nvidia údajně využívá v desktopových GPU dlaždicovou "okamžitou" techniku, která rozděluje obrazovku na dlaždice a pak rastrová malé dávky trojúhelníků uvnitř dlaždice. Trojúhelníky jsou typicky ukládány do vyrovnávací paměti nebo ukládány do mezipaměti na čipu, říká, což zase zlepšuje výkon a šetří sílu.

V demonstraci pomocí nástroje nazvaného Triangles. HLSL, který běží na grafickém procesoru AMD Radeon HD 6670 a Windows 10, ukazuje, jak grafický čip AMD vykresluje dvanáct identických plochých objektů na obrazovce, pohybujících se zprava doleva a po řádku, dokud nejsou vykresleny po jednom z horní části displej dolů, přepisují se navzájem. Tuto techniku ​​odhalil přesunutím posuvníku, který nastavuje počet pixelů, které lze na obrazovce vykreslit. Představte si, že neviditelná tiskárna bude rychleji než lidské oko.

Po odhalení technologie AMD pro současné kreslení se demonstrace přesune do jiného systému pomocí stejného nástroje, Windows 10 a grafické karty Nvidia GeForce GTX 970. Zde si všimnete, že když je proces vykreslování pozastaven, vykreslené dvanáct objektů je vykresleno současně s dvěma dokončenými dlaždicami vlevo a pěti dalšími dlaždicemi, které se v různých státech objevují v šachovnicovém vzoru napravo. Celkově cesta rasterizace je ponechána vpravo a shora dolů.

To všechno řečeno, Nvidia plně rasterizuje jednu dlaždici obsahující část všech objektů, než se přesune na další dlaždici. AMD na druhé straně rastrová každý objekt tiskovým způsobem nejprve shora dolů, než se vrátí na začátek a vykreslí další objekt. Věci jsou ještě zajímavější, když je Nvidia GeForce GTX 970 nainstalována do zkušební postele a odhaluje ještě větší dlaždice s jiným vzorem.

Chcete-li se podívat na toto nejnovější vyšetřování, ujistěte se, že jste vložili video, které bylo vloženo výše, pro celou demonstraci v 19:45.