ATI HD6000 Series

Zaczęty przez S6X, 28 Sierpień 2010, 16:57

S6X

#120
asynchronous dispatch: daje możliwość wykonywania różnych zadan na gpu jednocześnie. np. obliczenia związane z fizyką i renderowanie grafiki w grach będą wykonywane jednoczesnie a nie jak jest teraz że najpierw fizyka a potem obraz. Wydaje mi się że będzie można liczyć jednocześnie kilka projektów na gpu milka,dnetc itd, ale tą funkcje ma wspierać dx12 i przyszłe wersje opencl.

CytatFor example, if today a video game requires GPU to process both graphics and physics effects, then GPUs have to first compute physics and then process graphics. In case of Cayman it is possible to assign certain SIMD [single input multiple data] engines to certain tasks

CytatGPU Compute

These changes are not limited to the graphics side, GPU compute is once again massively enhanced. The biggest change is asynchronous dispatch, meaning you can execute multiple compute kernels simultaneously. While this may not seem like a big deal unless you are calculating physics or processing data, there are huge benefits that will be seen from this. Eventually.

The idea is simple enough, if you can run multiple things at once, you can essentially multitask and take advantage of unused units. The tools to take advantage of this are not fully there, DX11 doesn't expose them, but the hardware supports the ability for a programmer to carve off shaders and dedicate them to a task. DX12 should support this, as will custom APIs, but that doesn't do much right now. Theoretically, you could run a game with 'only' 1280 shaders dedicated to it, while the remaining 256 are transcoding a movie. It also has huge implications for virtualization, cloud computing, and remote gaming ala Onlive.

Each of the compute kernels runs it's own thread, and has it's own virtual memory, so each kernel is protected from it's cohorts and sloppy programming. Nvidia's architecture does not hard separate kernels, so you can run into a lot of interesting threading bugs on something that is already a mess to debug. Not fun.

Cayman also has dual bidirectional DMA engines, so two threads can push and pull independently from system memory without stepping on each other. This should pay huge dividends in the GPGPU arena. Shader read ops are also coalesced for increased efficiency, and they can fetch directly from local memory. If that isn't enough, flow control is also improved.

One last bit, in case you didn't catch it above, the DP FP rate has been improved from 1/5 of the SP FP rate to 1/4. The already seriously fast DP performance of Cypress just got 25% faster.

What do you do with all that compute power? Barts added Morphological Antialiasing (MOO), and Cypress adds a new mode, EQAA. The short story is that EQAA allows you to set color and coverage sampling separately, theoretically getting the benefits of a full MSAA sample with far less overhead. AMD claims the same memory footprint with better quality, or less memory with the same quality. We will leave the evaluation of this feature to Max's review of the cards themselves.

Pierwsze wyniki dla radka 6970 w milkiway:
CytatI am way stupid busy tonight but I did stop to install the 6970 in a board by itself with the new 12 drivers that came with and set everything to default for now.

273195614 205826898 17 Dec 2010 22:44:48 UTC 17 Dec 2010 23:36:48 UTC Completed and validated 69.07 4.66 0.03 213.76 MilkyWay@Home v0.23 (ati13ati)
273195036 205492265 17 Dec 2010 22:43:41 UTC 17 Dec 2010 23:34:34 UTC Completed and validated 69.09 4.55 0.03 213.76 MilkyWay@Home v0.23 (ati13ati)
273195035 205492262 17 Dec 2010 22:43:41 UTC 17 Dec 2010 23:35:41 UTC Completed and validated 69.07 4.53 0.03 213.76 MilkyWay@Home v0.23 (ati13ati)
273194486 205826236 17 Dec 2010 22:42:34 UTC 17 Dec 2010 23:32:20 UTC Completed and validated 102.21 6.94 0.04 320.63 MilkyWay@Home v0.23 (ati13ati)
273194477 205826227 17 Dec 2010 22:42:34 UTC 17 Dec 2010 23:33:27 UTC Completed and validated 102.10 7.17 0.04 320.63 MilkyWay@Home v0.23 (ati13ati)

Yeah I think I'll get 7 more,lol

Może ktoś podać wyniki na standardowych taktach np 5870

update:
Cytatconsidering not oc'd, not bad times. I usually run two concurrent so had no idea how the 5870 compared.

oc'd 5870 1 WU per

273609315 206137864 18 Dec 2010 12:57:49 UTC 18 Dec 2010 13:02:44 UTC Completed and validated 110.04 9.20 0.06 320.63 Anonymous platform
273609314 206137863 18 Dec 2010 12:57:49 UTC 18 Dec 2010 13:02:44 UTC Completed and validated 110.04 9.53 0.06 320.63 Anonymous platform
273609313 206137862 18 Dec 2010 12:57:49 UTC 18 Dec 2010 13:04:39 UTC Completed and validated 110.05 9.02 0.05 320.63 Anonymous platform
273609312 206137861 18 Dec 2010 12:57:49 UTC 18 Dec 2010 13:00:55 UTC Completed and validated 110.27 9.24 0.06 320.63 Anonymous platform
273609311 206137860 18 Dec 2010 12:57:49 UTC 18 Dec 2010 13:00:55 UTC Completed and validated 110.27 9.30 0.06 320.63 Anonymous platform
273609310 206137859 18 Dec 2010 12:57:49 UTC 18 Dec 2010 13:04:39 UTC Completed and validated 110.05 9.24 0.06 320.63 Anonymous platform

Czyli podkręcony 5870 (nie wiadomo na ile oc ) dłuższą próbkę liczy ok 110s a nie podkręcony 6970 ok 102s. Rewelacji chyba nie ma.

apohawk

To jakieś 3.5-4x szybciej niż moja 4850  XD Czekam na wersje vapor-x/toxic od sapphire'a.
No good deed goes unpunished.

AiDec

Cytat: S6X w 18 Grudzień 2010, 13:16
(...)daje możliwość wykonywania różnych zadan na gpu jednocześnie. np. obliczenia związane z fizyką i renderowanie grafiki w grach będą wykonywane jednoczesnie a nie jak jest teraz że najpierw fizyka a potem obraz(...)

Nie wiem dokladnie jak to wyglada od strony technicznej, ale juz lata temu wygladalo to tak jak opisane powyzej, na moich GTX280 (testowalem 1, 2 i 3 grafy na raz, w tym Triple SLi pod Xp). Nie bylo zadnych problemow z liczeniem GPUGrida czy SETI z jednoczesnym graniem w najbardziej wymagajace gry (Crysis), bez zauwazalnego spadku wydajnosci w grach. W tej kwestii bardzo sie zawiodlem na ATI, bo przy jednoczesnym przetwarzaniu (Milka, Collatz) i graniu, wiekszosc gier predzej czy pozniej sie wysypuje, a o plynnosci to nie mozna nawet pomazyc. Dlatego stop dla przetwarzania zawsze jak gram :(. Sadze ze niestety jeszcze dluga droga przed ATI w tym temacie.


Cytat: S6X w 18 Grudzień 2010, 13:16
Czyli podkręcony 5870 (nie wiadomo na ile oc ) dłuższą próbkę liczy ok 110s a nie podkręcony 6970 ok 102s. Rewelacji chyba nie ma.

Ano nie ma. Niestety zadnych rewelacji. W ramach przykladu 5970 (czyli wolniejsza opcja 5870) podkrecona core 725MHz@900MHz robi mi te WU w 82s. Sadze ze te 110s to byla niepodkrecona 5870 (850MHz).



Przy okazji dwa pytania:

- Czy sa juz jakies info nt. 6990?
- Poniewaz niedlugo szykuje mi sie zmiana graf, to szukam na chwile obecna czterech 6970WC (LCS) - jakby ktos slyszal to bede wdzieczny za informacje.



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

Troll81

powinny pasować te od 5870...



Cyfron

Cytat: AiDec w 20 Grudzień 2010, 09:11
[...] niedlugo szykuje mi sie zmiana graf[...]

A co robisz ze "starymi" grafikami?

AiDec

Cytat: Cyfron w 20 Grudzień 2010, 14:48
A co robisz ze "starymi" grafikami?

Czesc przejdzie do innych kompow, a czesc mozliwe ze odsprzedam.



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

Cyfron

to daj znać - a nóż widelec ktoś coś kupi, jak będzie tanio  %)

Szopler


lolek

http://pclab.pl/news44300.html

Szopler

Allegro - Przeróbka/Odblokowanie Radeon HD 6950 na HD 6970 !

:)
6950 ma dualbios więc kto ma, może spróbować samemu. Najwyżej przywróci bios.

No to szczęśliwi posiadacze - KU CHWALE BOINC! 8)

Troll81

6970 i tak wypada gorzej niż 5970....

apohawk

Trollu, 5970 to 2xGPU, porównuj sensownie. ;) Ja czekam na vapor-x, czekam i czekam i się doczekać nie mogę  ::)
Róznica cenowa między 6970 i 6950 to 200PLN. Chyba wolę dopłacić za tą gwarancję.
No good deed goes unpunished.

[B@P] MSW

Odpowiednikiem 5970 jest 6990 ?

apohawk

Ma być, bo jeszcze nie ma.
No good deed goes unpunished.

Krzysiak

No tak ale czy przy obecnym spadu cen HD5850 do poziomu 600-650zł nie stał się znowu opłacalnym zakupem
http://www.boincatpoland.org/smf/karty-graficzne/kupowac-kupowac-chyba-trafila-sie-okazja/

+ do tego wersja HD5850 GV-R585OC-1GD która pozwala na całkiem przyzwoite OC o czym pisałem w innym wątku
Cytat: Krzysiak_PL_GDA w 28 Grudzień 2010, 23:30
...
Domyślne zegary to GPU 765MHz i pamięć 1000MHz
Czas dla 30 próbek Milky odczytywany w Boinc Menadżer to 105s -106s
Bez ruszania napięcia pchnąłem zegary do GPU 900MHz pamięć 1200MHZ
Czasy Milky spadły do 90s -91s
Czyli przy 100 próbkach dla domyślnych ustawień po OC moja karta jest wstanie przeliczyć o 16 próbek więcej
Czyli wciągu doby to 138 próbek więcej
...


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

Troll81

Jak masz kase to kupuj :D

Tomasz R. Gwiazda

moze akcja dla SKB@P ? :)

albo liczydlowi niech kupuja dla siebie

Cyfron

dla SKB@P nie ma sensu na razie nic kupować, bo muszę dojść do ładu ze sprzętem, bo na dobrą sprawę działa tylko jeden z trzech komputerów...

Tomasz R. Gwiazda

troche slabo, moze trzeba wyj$% w cholere polowe rzeczy i kupic nowe zeby dzialalalo ok :)

Cyfron

http://www.pcformat.pl/Lepsze-wrogiem-dobrego,a,1535

Krzysiak

Witam
Testował ktoś HD6950 pod Boinc
jak wydajnościowo ma się do HD5850 ?


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

Troll81

6950 - 2253 GFlops - 200W
5850 - 2088 GFlops - 151W

lukaszja

Cytat: Troll81 w 23 Luty 2011, 22:18
6950 - 2253 GFlops - 200W
5850 - 2088 GFlops - 151W

Prawda. Tyle, że referent (z 2 GB pamięci) 6950 = praktycznie (bezpieczna podmiana biosu) 6970. Czy i o ile podnosi to wydajność - nie wiem.

mikerbest

Witam.
Przeczytałem coś takiego o kartach z nowej serii:
Ważnym faktem jest również to, że wszystkie jednostki są takie same, a nie jak miało to miejsce wcześniej: cztery podstawowe i jedna zaawansowana. Ta ostatnia miała na celu wykonywanie skomplikowanych obliczeń jak m.in. działania trygonometryczne czy pierwiastkowanie. Teraz rolę tą przejęły trzy z czterech jednostek wykonawczych procesora strumieniowego. Zmiana ta jest bardzo ważna i będzie zauważalna w osiągach kart nowej generacji.
Jak myślicie rzeczywiście to wpływa na wydajność.
Może posiadacze tych kart się wypowiedzą?
http://www.boincstats.com/signature/user_2545973.gif

drWarlock

No to mam pytanie do znawców:
to co w takim wypadku najlepiej kupować ?
5870? 69xx ?? chodzi mi o relację cena/wydajność

Krzysiak

Dobre pytanie
Ale w Boinc chyba wydajniejszy będzie HD5870

Szkoda że nie było takiego skoku wydajności między HD69xx i HD58xx  jak to miało miejsce między HD48xx a HD58xx

Przy HD69xx najbardziej to chyba tylko Teslacja i zużycie energii zostało poprawione  :)


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

Troll81