Valige leht

Proovisin järele: AMD GCN - Radeon HD 7970 ja HD 7950 tutvustus

Kätte on jõudnud aeg AMD GCN (Graphics Core Next) arhitektuuri ja selle kahe kõige võimsama esindaja, Radeon HD 7970 ja Radeon HD 7950, lõplikuks tutvustamiseks.

GCN-i artiklilogod

HD 7950-st avaldasime kohe austust kahele neist, nii et meil oli ka võimalus CrossFireX-i testida, samuti sooritasime mõlema kaardiga häälestatud mõõtmised. Loomulikult saatsime kahe uue kahuri vastu ka hulga sõitjaid, et näha, kui palju kaardid olid kiirenenud võrreldes eelmise põlvkonna GeForcesi ja Radeonidega. 


Enne osalejate ja testide läbimist vaatame lähemalt GCN-i arhitektuuri ja võtame üle HD 7970 ja HD 7950 funktsioonid.

 kõik kaardikaardid 2k

 Graafika tuum Järgmine

2007. aasta mais tutvustas AMD Radeon HD 2900 XT graafikakaarti, mis oli juba üles ehitatud ühtsele varjuri arhitektuurile. Nagu selgus, oli disainil mitmeid vigu, kuid Radeon HD 4000 seeria ajaks olid probleemid peaaegu täielikult kõrvaldatud, andes ettevõttele tugipunkti lauaarvutite graafikakaartide turul. Siinkohal oli näha, et nüüd on vaja radikaalseid muudatusi. Esimeseks sammuks peetakse HD 6900 “Cayman” seeriat. Siin on eelmised viiekäigulised superskalaarsed protsessorid (VLIW5) asendatud neljasuunaliste protsessoritega (VLIW5) ja Cayman oli esimene kiip, mis käsitles mitut sõltumatut käsuvoogu. Teine suur uuendus oli kahe „graafikamootori” kasutuselevõtt, mis kahekordistas kolmnurga seadistusvõime - suurendades tessellatsiooni võimsust - ja mõne elemendi (Rasterizer, Hierarchical Z, Tessellator) arvu. Temast sai täna meie järgmise taseme test. Tänu Graphics Core Next (GCN)-nimelisele arhitektuurile on seni kasutatud VLIW-käskudega töötavad varjutusmassiivid vananenud, asendatud nn arvutusühikutega (CU). GCN tegi oma debüüdi perekonnas Radeon HD 4 “Tahiti”.

19 m

Huvitav, kuid mitte üllatav, on Tahiti GPU-d tänu TSMC 28 nm ribalaiuse tootmistehnoloogiale saavutanud silmapaistva transistori tiheduse - need sisaldavad 365 miljardit transistorit 4,3 ruutmillimeetri kohta. Üks arvutusüksus sisaldab nelja SIMD-d ja ühte skalaarset üksust. AMD lipulaev Radeon HD 7970 “Tahiti XT” töötab 32 aktiivse CU-ga, eeldades, et kokku on 2048 varjutusprotsessorit (neli 16-suunalist SIMD-d, 64 ALU-d). Arvestades põlvkondade senist arengut, ei tundu see esmapilgul silmapaistev väärtus, kuid parema efektiivsuse ja kasutamise huvides tahaksime märkida, et sellest ei tasu kogemata kaugeleulatuvaid järeldusi teha üks tehniline näitaja. Teoreetiliselt suudab CU töötada sama palju kui üks Caymani SIMD-seade. Eelmiste põlvkondade peamine probleem on andmetest sõltuvus (järjestikused juhised sõltuvad andmetest), mis on põhjustanud kasutamise järsu kõikumise. Ka GCN-i arhitektuur on selles valdkonnas samm edasi, sest see kõrvaldab voo töötlemise kaudu varem kogetud sõltuvused. Kasu on ainult pealkirjades: ajakava koostamine, silumine, eeldatava jõudluse hindamine ja draiverite arendamine on muutunud ka radikaalselt lihtsamaks ja läbipaistvamaks. 

24

36 mCU ei sisalda mitte ainult nelja SIMD-seadet, vaid sellel on ka oma planeerija, 340 KB ajutist salvestusruumi ja tekstureerimisklaster. See tuleneb 4 × 64 KB vektorregistri, kohaliku andmejagamise, mis on samuti 64 KB, 4 KB skalaarregistri ja esimese taseme vahemälu, mille maht on 16 KB, summa. Ülaloleval pildil on näha veel üks kindlasti äramärkimist vääriv komponent ja selleks on nn "Branch & Message Unit", mis mängib rolli programmide tõhusamas juhtimises.
Senise teabe olemasolul vaatame uuesti üle Tahiti XT graafikaprotsessori põhiparameetrid: 32 CU (2048 varjuprotsessorit, 128 SIMD-d), 128 tekstuurimisseadet, 512 laadimis-salvestusüksust ja kokku 8,2 MB vahemälu. Nii et tüdruku seisukoht oli kohe teine, kuigi me alles hakkasime "lahti riietuma".

35 mEsiots

Eesosa osas näeme märkimisväärseid erinevusi võrreldes NVIDIA GF110 arhitektuuriga. Juhtimist ei tehta põhimõtteliselt CU-de tasandil. Selle ülesande täidavad käsuprotsessor ja asünkroonne arvutusmootor (ACE). Kiibile on antud kaks geomeetrilist mootorit, mis lisaks Geometry-Assemblerile mahutavad Vertex-Assembler ka üheksanda põlvkonna tessellaatorid. Suhtlust CU-dega hõlbustab ülemaailmne andmete jagamine (GDS), mille kaudu saavad need üksused ka omavahel andmeid jagada. Esiosa jaotis sisaldab kahte rasterdajat - näete allpool asuvat paigutust.

37

ROP-id ja mäluliides
AMD Tahiti sisaldab 8 ROP-klastrit - siinkohal leidsime vaste Caymani kiibiga. Iga selline "massiiv" sisaldab nelja ROP-üksust ja 16 Z-proovivõtjat. Oluline on mainida, et igale klastrile anti oma vahemälu. Toimunud on veel üks suurem muudatus: otsest ühendust mälukontrolleriga pole enam olemas. Selle käigu eesmärk on parandada paindlikkust ja kasutatavust, mida võime näha Pitcairni kontekstis ... ROP-id saavad kirjutada 768 KB L2 vahemällu, mida omakorda saavad lugeda mitu üksust. Mäluliides saab rõõmsa pildi. Kuue 64-bitise mälupuldi kogumaht on 384 bitti. Lisaksime sellele lihtsalt ühe sõna. Lõpuks ometi! Videomälu vaikimisi suurus on 3072 MB, kuid teoreetiliselt on võimalikud ka 1536 MB ja 6 GB.

Loodame, et meie lugejad ei võta seda halva nimega, kuid siinkohal väljendaksime oma isiklikku arvamust taustaprogrammi kohta. Tõeliselt hästi toiminud Bartsi ja tagasihoidlikke tulemusi näidanud Caymani kiibi suhe viitab sellele, et AMD kiipide „üldiseks probleemiks“ on ROP-i kitsas maht. Ka Tahiti osas pole siin mingeid edusamme tehtud, samas võiks kiibi muudest uudsetest siiski veidi liialdades lehti kirjutada. ROP-de roll on eriti silmatorkav mängude ajal, GPGPU ülesannete ja rakenduste ajal saavad nad teiseks viiuldajaks. Samuti on kindel, et selles sektsioonis kulub suur hulk transistore, mis muidugi kajastub ka kiibi suuruses.

 

AMD senised täiustused on suures osas mängijate vajadusi rahuldanud. Nüüd on toimunud vähemalt 90-kraadine pööre ja sellest on saanud tugev ristmik professionaalsete vajaduste rahuldamiseks, GPU laiemaks kasutamiseks. Muidugi pole see probleem, kuna räägime põhimõtteliselt väga karmist jõudlusest, mis kindlasti peab paar aastat vastu tänapäevaste mängude katsumustele. Kuulujuttude kohaselt ei kohelda ROP-sid Kepleri abil kitsalt mitte ainult AMD, vaid ka NVIDIA.

Mälusiini laiendamine oli kiiduväärt samm. Tegelikult oli disaineritel vähe valikut. Kellasid ei saa enam oluliselt suurendada, kuid kiip nälgib andmeid. Meie arvates võis ainuüksi see samm mängude ajal jõudlust suurendada kuni 15 protsenti.

44DirectX 11.1 ja PCI Express 3.0
PCI-Express 3.0 standard suurendab kiirust 16 GB / sekundilt 32 GB / sekundile, kahekordistades PCIe 2.0 andmeedastuskiirust. Emaplaatide tootjad "hammustasid seda teemat kohe", kuid hoolimata sellest, kui palju nad soovivad, ei paku lüliti praegu olulist eelist. PCIe 3.0 on turunduse seisukohast oluline relv, kohustuslik standard AMD ja NVIDIA jaoks ning kasutajatele veel üks “rahalõks”.
DirectX 11.1 saab vallutamist alustada järgmise Windowsi operatsioonisüsteemiga, mis sisaldab väikseid parandusi ja optimeerimisi. Ametliku materjali kohaselt võime uuelt API-lt oodata looduslikku stereo 3D-tuge ja tõhusamat rasterimist. Kahjuks pole võib-olla kõige huvitavam punkt, mis käsitleb seda, kuidas saaks paindlikkust ja graafikariistvara laialdast kasutatavust parandada, üksikasjalik.

31 m

Arhitektuur Graphics-Core-Next näeb laias laastus välja selline. Loomulikult ei täida kiip ainult mängijate vajadusi, vaid sellel on ruumi ka professionaalsetele ülesannetele. Tahiti teoreetiliste arvutuste tippjõudlus (topelt-täpsusega arvutuste korral) on 947 GFLOP, mis on neli korda kõrgem ühe täppis-ujukomaoperatsioonide korral. Lisaks on mäludel ECC tugi ja GPU on DirectCompute 11.1, OpenCL 1.2 C ++ AMP API-dega hästi kursis.27 Uued funktsioonid: Zero-Core
Üldiselt on Radeon HD 7900-tasemel tippkiskjad harjunud tarbima tabuteemana, kuid AMD inseneridel puudub leidlikkus. Idee on lihtne, kuid suurepärane, kuid mitte uus. Kui jätate arvuti pikaks ajaks, kuid mingil põhjusel ei soovi seda välja lülitada, võite monitori jätta ainult ooterežiimi. Tänu ZeroCore Power tehnoloogiale saab väljalülitatud ekraani korral kogu graafikakontrolleri pingest välja lülitada ja selles vormis pole vaja aktiivset jahutust. Eelised on veenvad: null müra, 3 vatti energiatarvet. See on paljude jaoks tähtsusetu tegur, kuid neljasuunaliste Crossfire-süsteemide protseduur sulgeb mitte-esmased videokaardid, vähendades märkimisväärselt teie elektriarvet - ehkki keegi, kes sellisele koostule mõtleb, teeb energiatõhususega tegelemiseks vähe.

21

20

Eyefinity 2.0
Uue versiooni üks huvitav omadus on see, et see võimaldab teil korraldada mitme ekraaniga konverentsivestlusi mitme ribaga heliga. Protseduuri ametlik nimi on Diskreetne digitaalne mitmepunktiline (DDM) heli. Radeon HD 7970 saab korraga ühendada kolme kuvariga, mis suudab vastu võtta kaheksakanalilist helivoogu. See ei pruugi konkreetselt kodukasutajatele huvi pakkuda, kuid see on hea näide sellest, kui paljudes piirkondades saab uut kahurit kasutada. Katalüsaatori ajam on ka arenev, hõlbustades näiteks salve paigutamist ja võimaldades koostada kohandatud eraldusvõime. Tasub mainida, et Full HD stereo 3D-sisu saab vaadata ka režiimis Eyefinity. 

29 m

UVD ja VCE
UVD 3.0 pakub juba DivX / Xvid, MPEG-4 2. osa MVC sisu riistvarakiirendust ja videokoodimootor (VCE) on praktiliselt Intel Quick Sync Video AMD ekvivalent. VCE on eraldiseisev riistvara ja on mõeldud ainult H.264-videote kodeerimise kiirendamiseks. Mootor on aeglasem kui graafikaprotsessori varjutav protsessor, kuid palju energiatõhusam. Kasutajatele on saadaval kaks režiimi. Alguses töötab ainult VCE, mis on iseenesest kiirem kui enamik protsessoreid. Sellisel juhul ei esine me aeglustumist, saame videokaardi või kesküksuse probleemideta laadida. Teine võimalus on hübriidrežiim. VCE ja GPU aritmeetika-loogika ühikud hüppavad koos ülesande juurde. Sellel "abielul" on ilmselgelt hea mõju kodeerimiskiirusele, kuid sel juhul ärge üllatage, kui teie lemmikmäng lülitub slaidiseansi režiimi.

32

Nüüd, kui oleme teooriast ja numbritest teadlikud, tutvume testis kolme GCN-i mudeliga!