AQUA@Home na GPU

Zaczęty przez lukaszde, 05 Maj 2009, 11:15

lukaszde

Info dla osob zainteresowanych projektem.
Nowa wersja aplikacji oznaczona jako v2 obsluguje wyczekiwane przez wszystkich checkpoint.
Jako ciekawostka - od wersji 3 bedzie mozliwosc zaangazowania do liczenia GPU
Wiecej: http://aqua.dwavesys.com/forum_thread.php?id=80

Troll81

hm.... I tu zapowiadają CUDA. ATI zostaje straszliwie w tyle. Niedługo ilość projektów wspierana przez NVIDIĘ będzie roznąć liniowo.

KrzychuP

UWAGA!!!

CytatTesting of a CUDA-enabled version of AQUA's application has started
25-May-2009
The AQUA@home project needs enourmous computing resources, so we have been working on using NVidia GPUs to reduce the running time of our application. We are happy to announce that version 3.00 of AQUA's application, supporting NVidia CUDA cards under Microsoft Windows, is now available for testing. Linux and Mac versions will follow in the next few weeks. We hope to gradually increase the performance of this version.

lolek

niech testują, bo na razie wali błędami. Do tego nie można zaznaczyć żeby tylko CUDA pobierało

Tomasz R. Gwiazda

no wlasnie nie ma takiej opcji zeby zaznaczyc obliczenia probek GPU :)


lolek

mi przysłało dwie cudowne próbki i po 3 sec. błąd. :( NA razie daję sobie spokój

Troll81

eeee no panowie :D troszke życzliwszym okie patrzcie na projekt. To w końcu niedawno ruszyło a od razu myślą o wsparciu CUDA

Szopler

Coś nie tak macie z kompami, że wam się wykrzacza AQUA. Odkąd ją liczę nie zdarzyło mi się. Obecne próbki na x64 liczą się 70h! Więc to nie jest projekt dla niecierpliwych. Cierpliwość nagradza punktami ;).

aaa CUDA ;) nie doczytałem :P... CUDów nie dostałem to się nie wypowiem...

KrzychuP

CUDA'owne AQUA testing mode on

jedna się zwiesiła i została wy.....na zgodnie z zaleceniem admina, gdyż w międzyczasie pojawiły się już 3 kolejne wersje aplikacji :)

dwie kolejne WU w trakcie testowania
zobaczymy co tam rano pokażą  8)

KrzychuP

Drodzy koledzy.

Rozwój CUDA'ów w Aqua idzie pełną parą. Aplikacja w ciągu kilku dni przeszła przez kilkanaście wersji  ;D
Aktualnie wersja 3.18 dla windows i 3.19 dla Linuksa.

Ja doliczam jeszcze próbkę na 3.17, bo słabą kartę mam i długo się liczy.
Ile za próbkę dają trudno powiedzieć, wcześniejsze albo się wykrzaczyły, albo przerwałem, bo ledwo zaczęły się przeliczać, a już nowa wersja aplikacji wchodziła. :)
Dam znać jak skończę.

Z płynnością pracy jest ok. (nawet na mojej karcie), bardzo dobrze działają checkpointy.
Deadline też baaaardzo przyzwoity, bo prawie 1,5 miesiąca, więc nie ma obawy, że nie zdążę przeliczyć.
Jedyny minus, to użycie procka od 4% do 50% jednego rdzenia. Zobaczymy, czy opłaci się to punktowo.

satanetv

#10
Dostałem 3 sztuki do policzenia. Jedna policzyła sięw 2 sekundy :D:D:D i dostałem 0.5 punkta. Druga się liczy poprawnie na razie. Jak będą jakieś wyniki dam znać.

Edit
Po 30 min liczenia mam policzone 1,5%. Trochę dziwne bo radiator na grafice jest chłodny. Przy GPUGRID był bardzo ciepły.

Edit
Coś mi zwolniło. Mam przeliczone 1,83% a liczę już 2:32. W takim tempie będzie się liczyło ze 150 godzin. A karta to 9800GT

Troll81

no to pora dać szansę wodzie :D bo GPUGrid ma dla mnie za krótkie deadline :( komp strasznie tnie więc jak przy nim siedzę to wstrzymuję próbki. MOże aqua da radę zaprząc do roboty moje GPU :D Jakieś specjalne tricki do tego projektu konieczne??

satanetv

Deadline są naprawdę długie. Nic nie jest potrzebne. Trzeba tylko sobie ustawić w preferencjach żeby tylko korzystał z GPU a sam pobiera odpowiednią aplikację. Obecnie pod Windowsa ver 3.18

stn

Próbki sa 10x GPUGRID, wiec deadline jest podobny. Tak jakby tam dali 6 dni.

KrzychuP

Cytat: stn w 05 Czerwiec 2009, 14:20
Próbki sa 10x GPUGRID, wiec deadline jest podobny. Tak jakby tam dali 6 dni.
A przeliczyłeś jakąś WU z Aqua?
Bo mnie się zdaje, że nie wiesz o czym piszesz.
Na moim kompie wygląda to tak:
Projekt:      Długość próbki:      Deadline:
GPUGrid      8dni                     4dni
AQUA         6dni                     45dni

Więc nie ma porównania, Aqua daje przyzwoity deadline, nawet dla słabych kart.
GpuGrid dla słabszych jest nieosiągalny, a nie chcą go zwiększyć.

Cytat: satanetv w 05 Czerwiec 2009, 10:13
Dostałem 3 sztuki do policzenia. Jedna policzyła sięw 2 sekundy :D:D:D i dostałem 0.5 punkta. Druga się liczy poprawnie na razie. Jak będą jakieś wyniki dam znać.

Edit
Po 30 min liczenia mam policzone 1,5%. Trochę dziwne bo radiator na grafice jest chłodny. Przy GPUGRID był bardzo ciepły.

Edit
Coś mi zwolniło. Mam przeliczone 1,83% a liczę już 2:32. W takim tempie będzie się liczyło ze 150 godzin. A karta to 9800GT
Z tego, co wyczytałem na forum projektu, do 2% większość obliczeń idzie na CPU, dopiero potem wskakuje na GPU.

stn

W GPU deadline to 5 dni.
Z tego co patrzyłem to za próbkę jest 10x wiecej punktów, a niemozliwe ze aqua jakos swietnie punktuje. GPU daje mi z 2k dziennie jak wlacze kompa na 10h, seti punktuje prawie jak procek.

45/5=9
50000/5000=10

Z tego wynika, ze moze byc ciezko.

Szopler

#16
05.06.09 16:11:37   AQUA@home   Restarting task 01jun09-200-2M-64-ac2_40_4_0 using AQUA_CUDA version 318
05.06.09 16:11:39   AQUA@home   Task 01jun09-200-2M-64-ac2_40_4_0 exited with zero status but no 'finished' file
05.06.09 16:11:39   AQUA@home   If this happens repeatedly you may need to reset the project.

Reset nie pomaga.
Odłączenie w BAM, skasowanie plików i ponowne podłączenie też nic nie daje.

Ciekawostka!
Dostałem WU z rodzaju "mt" i liczy na 2.00 CPU :). MultiTask.

Pigu

a mi wu aqua liczy się już ponad 77h na cpu i ma 66% - czy to normalne zachowanie tej aplikacji? (żadnego gpu nie wgrywałem)

Szopler

Ten MultiTask to jakiś FAKE! Blokuje 2 jajka, ale liczy na jednym (50% CPU Utilization).

KrzychuP

Cytat: Pigu w 05 Czerwiec 2009, 16:36
a mi wu aqua liczy się już ponad 77h na cpu i ma 66% - czy to normalne zachowanie tej aplikacji? (żadnego gpu nie wgrywałem)
bo GPU nie trzeba wgrywać
jak wprowadzili jednostki dla GPU, to pojawiły się odpowiednie opcje w ustawieniach projektu - domyślnie zaznaczone, że chcesz otrzymywać WU dla GPU  :D
Ale te 77h to i tak coś za dużo jak na CUDA, mimo dużego (do 50% jajka) wykorzystania procka.
Btw. masz Pigu Radka, czy NV?
Bo jak Radka, to nic nie słyszałem o aplikacji dla nich w AQUA.

Cytat: Szopler w 05 Czerwiec 2009, 16:53
Ten MultiTask to jakiś FAKE! Blokuje 2 jajka, ale liczy na jednym (50% CPU Utilization).
hmmm, a na ilu procentach ukończonej próbki Ci wywaliło?
te 2 jajka blokuje od początku przeliczania, czy w którymś momencie się tak włączyło?
jakiej wersji BM używasz?
Zostawiłem kompa w pracy na weekend włączonego, żeby doliczył do końca choć jedną próbkę i obawiam się, że się może wykrzaczyć...  ::)

TJM

O tej wielowątkowej aplikacji było dziś głośno na liście mailingowej. BOINC niezbyt dobrze takie obsługuje i przez to pojawiają się akcje typu jedna aplikacja AQUA licząca na wszystkich rdzeniach + jeszcze liczba_rdzeni - 1 aplikacji z innych projektów.
Z kolei aplikacja CUDA to GPU+CPU, czyli prawdopodobnie im szybsza karta, tym więcej CPU będzie wykorzystywać.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

TRZECIAK

Ta wielowątkowość jest coś skopana. Ściągnąłem sobie 5 próbek na CPU bo na GPU jakoś ich niema i zaczęła się kicha. Liczyło się 7 próbek milki i 1 AQUA i jak każda następna próbka milki się kończyła to nie zaczynało następnej :/ Myślałem że może AQUA liczy sobie na kolejnych zwalnianych się rdzeniach, ale nie. Poprostu zarezerwowała sobie kolejne rdzenie nie licząc na nich :/. Jak dla mnie takie liczenie nie ma sensu więc żadnych próbek poza tymi na GPU (jeśli mi jakąś zassie) nie będę w tym projekcie liczył. Wszystko było by może jeszcze do zniesienia gdyby chociaż zaczęło liczyć 2,3 ... 5 kolejnych próbek AQUA ale niestety liczy się tylko 1 a 7 wątków leży odłogiem.


Szopler

Cytat: KrzychuP w 05 Czerwiec 2009, 16:59
Cytat: Szopler w 05 Czerwiec 2009, 16:53
Ten MultiTask to jakiś FAKE! Blokuje 2 jajka, ale liczy na jednym (50% CPU Utilization).
hmmm, a na ilu procentach ukończonej próbki Ci wywaliło?
te 2 jajka blokuje od początku przeliczania, czy w którymś momencie się tak włączyło?
jakiej wersji BM używasz?
Zostawiłem kompa w pracy na weekend włączonego, żeby doliczył do końca choć jedną próbkę i obawiam się, że się może wykrzaczyć...  ::)

Wywala ja wiem na 0.1% po kilkunastu sekundach góra po kilku minutach... oczywiście GPU
Manager najnowszy.

MT liczy blokując jajka... na razie po 3.38% i 1h20m stable...

PS.Jeśli chodzi o GPU, to patrzyłem jak to wygląda u innych i wiem, że te same próbki wywalają się też u innych.

Troll81

A mi nie chce próbek zasysać :( reset projektu i aktualizacje nie pomagają :(

Podaj Krzyśku config  z tego projektu bo może ja głupi jestem i coś namieszałem...

Szopler

Hmm ten WU MultiKulti ;) zaczął używać 2 jajek... Jak korzystam z kompa to jest 75 do 99% użycia procka.

KrzychuP

Mam tak poustawiane w preferencjach:

CytatResource share
If you participate in multiple BOINC projects, this is the proportion of your resources used by AQUA@home   --> 1000
Is it OK for AQUA@home and your team (if any) to email you?    --> yes
Should AQUA@home show your computers on its web site?   --> yes
Default computer location   --> ---
Maximum CPU % for graphics 0 ... 100   --> 3
Run only the selected applications   --> (all applications)
If no work for selected applications is available, accept work from other applications?   --> no
Use Graphics Processing Unit (GPU) if available   --> yes
Use Central Processing Unit (CPU)   --> no

p.s. jak się używa tej tabeli na forum, co to jest zaraz nad emotkami, bo dojść nie mogę?

@Szopler
U mnie liczy się jeszcze WU na aplikacji w wersji 3.17
Może w tej 3.18 jest coś skopane ???
Jak zacznie mi liczyć następną próbkę na 3.18, to coś będę mógł więcej powiedzieć (ale to dopiero w poniedziałek rano)
No i używam wersji 6.5.0 managera. Dla niektórych to może być wada, ale dla mnie jest zaletą, że przełącza pracę na GPU między projektami dopiero jak skończy całą próbkę. Mniejsze wtedy ryzyko wykrzaczenia. Póki co liczenie na GPU to nowość i pewnie jeszcze dużo czasu upłynie zanim admini projektów dojdą do wprawy w pisaniu aplikacji dla GPU, a w Berkeley napiszą wersję managera, który sprawnie i poprawnie będzie zarządzał pracą CPU i GPU.

Właśnie dopisałeś nowego posta.  :)
Może ta rezerwacja jest podczas tych początkowych 2% - aplikacja coś tam sobie wylicza (co - to byś musiał na forum Aqua'y poszperać - tyle kojarzę, że czytałem), a dopiero potem zaprzęga całość zarezerwowanych jajców

Troll81

#26
po odłączeniu i dołączeniu do projektu mam coś takiego

2009-06-05 20:18:45|AQUA@home|Resetting project
2009-06-05 20:18:55|AQUA@home|Sending scheduler request: Requested by user.  Requesting 0 seconds of work, reporting 0 completed tasks
2009-06-05 20:19:01|AQUA@home|Scheduler request completed: got 0 new tasks
2009-06-05 20:19:11|AQUA@home|Sending scheduler request: Requested by user.  Requesting 0 seconds of work, reporting 0 completed tasks
2009-06-05 20:19:17|AQUA@home|Scheduler request completed: got 0 new tasks
2009-06-05 20:23:36|AQUA@home|Resetting project
2009-06-05 20:23:55|AQUA@home|Resetting project
2009-06-05 20:23:55|AQUA@home|Detaching from project
2009-06-05 20:24:12||Fetching configuration file from http://aqua.dwavesys.com/get_project_config.php
2009-06-05 20:24:38|AQUA@home|Master file download succeeded
2009-06-05 20:24:43|AQUA@home|Sending scheduler request: Project initialization.  Requesting 1 seconds of work, reporting 0 completed tasks
2009-06-05 20:24:48|AQUA@home|Scheduler request completed: got 1 new tasks
2009-06-05 20:24:51|AQUA@home|Started download of aqua_2.20_windows_x86_64__mt.exe
2009-06-05 20:24:51|AQUA@home|Started download of vcomp90_64bit
2009-06-05 20:24:56|AQUA@home|Finished download of vcomp90_64bit
2009-06-05 20:24:56|AQUA@home|Started download of 27_160_4_Ising_ndg.txt_01jun09-160-2M-64-a_27_49
2009-06-05 20:24:58|AQUA@home|Finished download of 27_160_4_Ising_ndg.txt_01jun09-160-2M-64-a_27_49
2009-06-05 20:25:10|AQUA@home|Finished download of aqua_2.20_windows_x86_64__mt.exe


czy to jest próbka CUDA??? aqua_2.20_windows_x86_64__mt.exe ???

Próbkę wywaliłem :D i podownie zrobiłem detach i attach i teraz już zassało co trza :D
Cytat2009-06-05 20:54:03|AQUA@home|Finished download of aqua_3.19_windows_intelx86__cuda.exe

Tomasz R. Gwiazda

dajcie znac jak punkty i czas trwania obliczen

I na czym konkretnie liczycie

:)

satanetv

Widzę że pojawiła się nowa wersja na Windowsa. V 3.19. Ciekawe co jest poprawione

satanetv

Cytat: KrzychuP w 05 Czerwiec 2009, 14:45
Cytat: stn w 05 Czerwiec 2009, 14:20
Próbki sa 10x GPUGRID, wiec deadline jest podobny. Tak jakby tam dali 6 dni.
A przeliczyłeś jakąś WU z Aqua?
Bo mnie się zdaje, że nie wiesz o czym piszesz.
Na moim kompie wygląda to tak:
Projekt:      Długość próbki:      Deadline:
GPUGrid      8dni                     4dni
AQUA         6dni                     45dni

Więc nie ma porównania, Aqua daje przyzwoity deadline, nawet dla słabych kart.
GpuGrid dla słabszych jest nieosiągalny, a nie chcą go zwiększyć.

Cytat: satanetv w 05 Czerwiec 2009, 10:13
Dostałem 3 sztuki do policzenia. Jedna policzyła sięw 2 sekundy :D:D:D i dostałem 0.5 punkta. Druga się liczy poprawnie na razie. Jak będą jakieś wyniki dam znać.

Edit
Po 30 min liczenia mam policzone 1,5%. Trochę dziwne bo radiator na grafice jest chłodny. Przy GPUGRID był bardzo ciepły.

Edit
Coś mi zwolniło. Mam przeliczone 1,83% a liczę już 2:32. W takim tempie będzie się liczyło ze 150 godzin. A karta to 9800GT
Z tego, co wyczytałem na forum projektu, do 2% większość obliczeń idzie na CPU, dopiero potem wskakuje na GPU.

Obyś miał rację bo do 2% nie dociągnąłem. Poddałem się i odpaliłem ponownie GPUGRID-a. W poniedziałek zapuszczę do 5%. Jak nie przyśpieszy to raczej nie będę ryzykował 100 godzin liczenia i zaciskał kciuki czy się nie wysypie.

Pigu

widać liczę próbkę cuda 100% na cpu (mam radka) - czy to możliwe?

gigi2000

Sluchajcie, ja mialem tak ze zapuscilem projekt, pierwsze 2% to byla droga przez meke, managera mialem ustawionego tak ze jak jest akatywnosc to wylacza GPU, wiec jak chcialem zobaczyc jak smiga, to wracalo do checkpointa, a ze pierwsze 2% to masakra wiec co chwila wracalem do tego samego miejsca, potem przestawilem managera ze liczy caly czas na GPU, nawet wtedy gdy jest aktywnosc... na GPU gridzie poprostu wywalalo mi probki gdy cokolwiek robilem na kompie... no i jak przebrnelo przez te 2% (w sumie z powrotami do checkpointow zajelo mi to jakies 6h liczenia, sporo bylo w tym straty) zaczelo smigac tak gdzies 2% do 3% na godzine na 9800GTX...
Ale 50k pkt za probke warte jest poswiecen :)
Poki co probka liczy sie bez problemow, dam znac jak sie zakonczy.

satanetv

Czyli jak to w końcu jest z tymi obliczeniami? Pierwsze 2-3% liczy na CPU i dopiero przełącza się na GPU czy od początku liczy na GPU ? Bo jak od początku to chyba odpuszczę. Ale zapuszczę w poniedziałek na 5-6 godzin i zobaczę jak to idzie.

TJM

Na forum pisze, że aplikacja pracuje równolegle na CPU/GPU - stąd podczas pracy używa ciągle trochę procesora. Po prostu GPU nie jest wykorzystywane do całości obliczeń, ale jako dopalacz tam gdzie można.
Problem z checkpointami można pewnie rozwiązać zaznaczając opcję pozostawiania zadań w pamięci gdy są wstrzymane.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

gigi2000

Przeliczylem moja pierwsza probke aqua na GPU (9800GTX).
Aplikacja liczaca 3.18, calosc chodzila stabilnie.
Liczenie zajelo 46 godzin (tylko ze tutaj mialem troche straty na poczatku bo wracalem do checkpointa, wynikalo to z tego ze ustawiony mialem brak liczenia na GPU w momencie aktywnosci, balem sie ze probka bedzie sie wysypywac, okazalo sie ze przy liczeniu caly czas, rowniez podczas aktywnosci calosc jest stabilna i nie wykrzacza sie).
Ilosc punktow: 31.877
Daje to nam 692 pkt na godzine, czyli w tym konkretnym przypadku ok 2x lepiej niz GPUGrid! ( w GPUGridzie czas liczenia ok 15h, pkt: od 3-5k co daje w najlepszym przypadku 333pkt na godzizne).
Tak jak wspomnialem wczesniej, nie zniechecajcie sie poczatkiem probki, pierwsze 2-3% idzie bardzo wolno, potem rusza z kopyta swoja standardowa predkoscia, u mnie jakies 2,5% na godzine.

Tomasz R. Gwiazda

czy aby liczyc na GPU trzeba na stronie projektu zaznaczyc tak:

Use Graphics Processing Unit (GPU) if available   yes
Use Central Processing Unit (CPU) no

?
czy na obu YES ma byc ? :)

ksysju

Hi

Na dzień dobry  oba masz na YES i tak może zostać.

Co do punktacji to porównywanie do gpugrida jest nie najlepsze, bo ten procesora nie zajmuje, a aqua tak  i to kilka core na raz.
ksysju

gigi2000

W ustawieniach pole "Run only the selected applications" mam zaznaczone obie opcje czyli AQUA_CUDA oraz AQUA, natomiast "Use Graphics Processing Unit (GPU) if available" mam na YES a "Use Central Processing Unit (CPU)" na NO i liczy mi na GPU, a CPU zjada tylko troche na sterowanie grafiki a nie kilka rdzeni. Czy jak kto woli, dla precyzji, czesc na GPU czesc na CPU... Czyli podobnie jak w GPUGridzie, glowne obliczenia sa wykonywane na GPU a i tak zjada troche CPU na sterowanie... Zmierzam do tego ze obciazenie CPU wcale nie jest takie duze. Kilka rdzeni to on chyba bierze jak liczy aplikacja CPU a nie GPU (to chyba pierwszy z projektow gdzie jedna probka liczy sie na kilku rdzeniach CPU ?)
Ile zjadalo CPU na sterowanie grafika w GPU Gridzie? W AQUA zjada mi jakby pol jednego rdzenia (11% calego proca czterordzeniowca).
Co ciekawe kiedy mialem zaznaczone tylko AQUA_CUDA nie chcialo pobrac mi zadan, zaznaczenie obu aplikacjia czyli AQUA_CUDA i AQUA pomoglo i pobralo mi tylko zadania pod GPU.

Szopler

Zainstalowałem najnowsze stery i problem z AQUA CUDA minął jak ręką odjął! :)

satanetv

@gigi2000 Widzę, że masz więcej próbek zassanych. Następna próbka też Ci się tak liczy, że do 2-3% liczy się ok 6h a później przyśpiesza ?? Ciekawe ile taka próbka liczy się na 8500GT :D