Aktualności:

Nasz kanał IRC - Porozmawiaj z nami.

Menu główne

CUDA w SETI

Zaczęty przez [PBT] Horpah, 15 Lipiec 2008, 10:56

Machloj

u mnie jedna na 3-4 próbki liczy się kilkanaście sekund i się kończy (bez errora) - punktów za takowe nie dostaję - a tak to dostaje to co żądałem 14,7 pkt za 25 min próbkę (na gf8600m)

(nie łudź się Pigu - jak tylko pojawi się jakiś inny projekt na którym mój lapek będzie mógł również wykorzystać swoją grafę od razu wyrzucam wstrrrętnego seta  ;) )

filus777

u mnie jedną paczkę na GPU 9600gt liczy między 1m:30s a 2m:30s, tylko że mam problem z wysyłaniem wyników. Nie wiecie co się może dzieje? Łącze mam 1MB, a nie moge wysyłać czasem sie zatnie na kilku kilo wysłanych danych, a czasem niby wysyła 100 % ale po kilku minutach lączy sie ponownie i wysyła znów tą samą paczkę.

BTW nie wiecie może jaki projekt używa w tym momencie jeszcze CUDA?

Troll81

GPUGrid i zapowiedział się einstein

Machloj

Cytat: filus777 w 18 Grudzień 2008, 22:19
u mnie jedną paczkę na GPU 9600gt liczy między 1m:30s a 2m:30s, tylko że mam problem z wysyłaniem wyników. Nie wiecie co się może dzieje? Łącze mam 1MB, a nie moge wysyłać czasem sie zatnie na kilku kilo wysłanych danych, a czasem niby wysyła 100 % ale po kilku minutach lączy sie ponownie i wysyła znów tą samą paczkę.

BTW nie wiecie może jaki projekt używa w tym momencie jeszcze CUDA?

teraz sprawdziłem logi i miałem podobny problem od 19.30 do 23 teraz wszystko mi ładnie odsyła - pewnie jakiś problem z serwerem był...jak na razie gpu wykorzystuje tylko gpugrid - a przymierza się einstein i...WCG :)

filus777

Byłoby dobrze gdyby WCG wykorzystało CUDA, bo mnie jakoś osobiście nie kreci wspieranie szukania kosmitów ;).
BTW u mnie rano też wszystko wróciło do normy z odsyłaniem

KrzychuP

qrka. tylko czemu u mnie nie?  >:(

Troll81

potrzebny reset projektu??

KrzychuP

ale wtedy stracę 12 przeliczonych cuda'ownych próbek  :(

z takimi radami to nie do mnie Trollu

Troll81

wiesz... lepszy reset niż tracenie kolejnych jednostek. A spróbuj popingować tego serwera moze masz kłopoty na łączu??

KrzychuP

#49
z tego co piszą na forum Bety (na tyle ile zrozumiałem w engliszu) to mają jakiś problem z serwerami, i to tylko z tymi, które zbierają próbki z cudami  ???, normalna aplikacja i astropulse podobno uploadują się normalnie :-\
takich jak ja jest kilkanaście/kilkadziesiąt osób (przynajmniej tych co na forum próbują się coś dowiedzieć), a ile jeszcze niezgłaszających problemu

jednostek nie tracę, jak na razie, bo jak nie odsyła, tak też nie pobiera nowych cudów
pocieszam się, że deadline mają (te nieodesłane) 8-10-2008, więc może uda mi się je odesłać po urlopie  :arrr:

filus777

jak się okazuje nie tylko z serwerami które zbierają dane ale także z tymi które je udostępniają bo nie mogę nic pobrac od kilku godzin

KrzychuP

szkoda, że nie udało się im uporać z tym  :( , bom miał nadzieję zaciągnąć trochę WU na te 2 tyg. urlopu  ;)

TRZECIAK

Witam, bo to mój 1 post na forum.

Odnośnie CUDA to zrobiłem sobie wczoraj kilka wyliczeń.

Na kompie z Q6600 4 mb i 8600GT z Vistą 64 bit jest totalna porażka.

Projekt liczy astropulse zamiast na 4 to zwykle na 2-3 rdzeniach więc sporo pkt mniej dostaje jeśli chodzi o procka. Natomiast próbki SETI CUDA liczy bez większych problemów, ale jest coś skopane. Czas jaki jest podawany (np. 76 sek.) to bujda bo faktycznie daną próbkę na mojej karcie liczy 58-62 minut dodatkowo pkt jakie są za takie próbki zaliczane to lipa bo od 14,7 - 14,78 pkt.

Podsumowując:
Moja karta zarobiła by na 24 h ok 350-360 pkt i to plus  bo pkt nigdy za mało (choć spodziewałbym się wyniku o wiele razy wiekszego skoro ponoć GPU jest wydajniejsze od CPU) , ale istotnym minusem jest to że w tym czasie procek nie liczy średnio na 1-2 rdzeniach a to daje mi ok 1000-2000 pkt mniej.
Z powyższego wynika że póki nie dopracują menedżera który nie wiadomo czemu ne wykorzystuje 100% mocy obliczeniowej przesiadka na to cudo to porażka, a nawet jeśli będzie liczyło na 100% to przyrost dzięki GPU jest póki co tak mały że niewarto sobie tym głowy zawracać, bo prądu karta też potrafi sporo pociągnać.


Troll81

Witamy na forum :D To raczej nie wina managera tylko aplikacji projektu. Wiesz, CUDA jest jeszcze młode i wcale nie tak łatwo zmusić GPU do obliczeń niegraficznych.

Bartek

#54
Witam.

Podobnie jak poprzednika to również mój pierwszy post.

Doświadczenia mam również podobne do kolegi Trzeciaka. A zatem do rzeczy.

Policzyłem kilka próbek na seti.beta.
http://setiweb.ssl.berkeley.edu/beta/results.php?userid=10524
Czas prawdziwego procesora 190 do 230 sekund, czas pracy GPU 8600 GT około 1 godziny i 8 do 13 minut (procesor E6550 2 rdzenie 2,33 podkręcony na 2,80). Licząc zoptymalizowaną do SSE3 aplikacją uzyskuję podobne czasy, więc u mnie się zupełnie nie opłaca. Dodatkowo nieco przycina grafikę. 8600 to nie jest zbyt mocny procesor, na np 9800 teoretycznie powinno być 3 razy szybciej.
I jeszcze o optymalizacji: aplikacje liczące na GPU wymagają bezwzględnie optymalizacji, na razie szału raczej nie ma. Procesory x86 programujemy od wielu lat, GPU dopiero raczkujemy. Potencjał jednak jest duży. Polecam zajrzeć tu:
http://www.gpugrid.net/show_host_detail.php?hostid=13276

Pigu

gpugrid karmi za cuda opłacalniej niż dobrze kręcony proc - na 8600 już się opłaca (acz w zamian przycina nawet firefoxa), seti dopiero ruszył - bez obaw, będzie dobrze :attack:

btw: temat widzę pobudza forumowych czytaczy do pisania - doskonale :arrr:

Machloj

kurcze...aż nabrałem wiary w swojego laptopa...ja mam 8600M i czas przeliczenia próbki to ok. 25min...i do tego nie przycina mi się za bardzo...a może to chodzi o system? ja mam viśtę...

Pigu

jak zapłaciło za wu? ile jajec zabrało i czy w pełni (tzn - da się coś innego na nich odpalić?), ile można gpu-wu na raz? 1? a może by tak liczyć set na non_cpu_intensive? :ph34r:

TRZECIAK

#58
Cytat: Pigu w 19 Grudzień 2008, 22:45
jak zapłaciło za wu? ile jajec zabrało i czy w pełni (tzn - da się coś innego na nich odpalić?), ile można gpu-wu na raz? 1? a może by tak liczyć set na non_cpu_intensive? :ph34r:

Na 8600GT za ok 1h liczenia WU punktuje w tej chwili ok 14,7 pkt, więc póki co bardzo słabo. Po testach forumowiczów lunatics i własnych spodziewałem się czegoś więcej, ale bez dopracowania i optymalizacji to wygląda nędznie chyba że ktoś ma np GTX 280 :D.
Aplikacja jest dziwna, bo nie radzi sobie z przydziałem mocy obliczeniowej CPU.

Sam klient na VISTA 64bit sciąga próbki:

-astropulse które przelicza CPU. 
U mnie na Q6600 powinno przerabiać 4 na raz, a przerabia 1-3 na raz i na 16h testowania 4 próbki w jednym czasie przetwarzało tylko ok 30 minut.

-zwykłe próbki które przelicza GPU
Niestety tylko 1 w danym momencie, ale to chyba zależy czy karta ma 1 czy 2 procki.

Może w niedzielę pobawie się trochę na lapku z VISTĄ 32bit i kartą 9500M i postaram się zerknąć jak wygląda to na XP 32bit z grafą 8600GT.
Zobaczę może uda mi się wrzucić do klienta optymalkę astropulsa, a CUDA zostawię jak są.
Jesli się wyrobię to zdam relację z testów.


Pigu

atropulse nie liczę - czy idzie liczyć 3x (4x) normalna wu i 1x cuda? czy też aplikacja gpu lubi zabrać więcej niż 1 jajeczko

filus777

Tak naprawdę aplikacja cudy zabiera 0,07 rdzenia procesora i procesor graficzny. Ja mam tak że na 1 rdzeniu liczy się WCG a grafika i 1 rdzeń jest wykorzystywany przez SETI, niestety program jest tak napisany że prawie nie wykorzystuje tego rdzenia ale ten rdzeń jest blokowany pod tą operację. Więc na drugim rdzeniu nie mogę puścić drugiej próbki mimo że praktycznie jest on nie używany.

@Bartek
Mi też pokazuje krótki czas pracy procka mimo iż próbka liczy się znacznie dłużej.

Poza tym zaobserwowałem iż chyba dają większe paczki bo liczą się one coraz dłużej

BTW czy jest sens stosować jakieś optymalizacje skoro liczę na gpu, jesli tak to jaki mam wgrać dla Pentium D (obsługuje sse3

Pigu

http://calbe.dw70.de/seti.html

a co do uwolnienia rdzenia to daj <ncpus> 3 </ncpus> (masz rozumiem 2 rdzenie?) w cc_config.xml (acz z tym i obserwowanie wpływu na wydajność gpu-wu poczekałbym na stabilizację) dodatkowo oczywiście potrzebowałbyś duży przydział procentowy na seti lub liczyć tylko seti by nie doszło do mielenia 3 non_seti_wu na raz :P

jak kurcze tylko skończy się wyścig prime i uciułam to co należy dla projektu miesiąca zabiorę się za testy

btw: głosowaliście chłopaki już na seti jako projekt miesiąca styczeń? http://www.boincatpoland.org/smf/index.php/topic,2156.0.html

AiDec

Cytat: Pigu w 20 Grudzień 2008, 12:00
a co do uwolnienia rdzenia to daj <ncpus> 3 </ncpus> (masz rozumiem 2 rdzenie?) w cc_config.xml

Tez polecam to rozwiazanie.


Cytat: Pigu w 20 Grudzień 2008, 12:00
btw: głosowaliście chłopaki już na seti jako projekt miesiąca styczeń? http://www.boincatpoland.org/smf/index.php/topic,2156.0.html

Jaka agitacja :O   XD



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

filus777

Cytat: Pigu w 20 Grudzień 2008, 12:00


a co do uwolnienia rdzenia to daj <ncpus> 3 </ncpus> (masz rozumiem 2 rdzenie?) w cc_config.xml (acz z tym i obserwowanie wpływu na wydajność gpu-wu poczekałbym na stabilizację) dodatkowo oczywiście potrzebowałbyś duży przydział procentowy na seti lub liczyć tylko seti by nie doszło do mielenia 3 non_seti_wu na raz :P


sorki za głupie pytanie ale gdzie mogę znaleźć ten plik conf, bo go nie mam w żadnym z folderów bonica

Bober

Musisz go sobie stworzyć. instrukcja

3891mike

No dziś pierwsze próbki przeliczone na gpu GF 8800GS zostały odesłane do serwera przez mój komputer. Ogólnie liczy sporo szybciej ok 30 min na próbke z seti więc jest różnica. Jeszcze nie zostały mi przydzielone punkty za te próbki więc nie wiem jak to wyjdzie w przeliczeniu. W moim menadżerze pokazało że procesor na próbke poświęcił 41s~1m20s więc moge nie dostać tylu punktów za prace, ale poczekam i zobacze. Inna sprawa kożystania z mocy obliczeniowej karty graficznej to wyraźne spowolnienie pracy komputera na tyle że pisząc ten tekst musiałem czekać po każdym słowie zanim je wyświetli. Narazie innych spostrzeżeń brak ale jak coś znajde to obiecuje sie podzielić info.


TRZECIAK

Cytat: 3891mike w 20 Grudzień 2008, 20:43
...Inna sprawa kożystania z mocy obliczeniowej karty graficznej to wyraźne spowolnienie pracy komputera na tyle że pisząc ten tekst musiałem czekać po każdym słowie zanim je wyświetli. ...
Mi przy liczeniu SETI nic nie zwalniało. Teraz wrzuciłem sobie GRIDA na GPU i tnie straszliwie :/ zobaczymy czy sie opłaca, bo próbkę na GPU będzie liczyło ok 52h. Jedna dziwna sprawa że einsteina liczy mi już normalnie na 4 rdzeniach CPU + GRID na GPU choć GRID zabiera ok 10-20% mocy 1 rdzenia CPU.
Cytat: Pigu w 20 Grudzień 2008, 12:00
...a co do uwolnienia rdzenia to daj <ncpus> 3 </ncpus> (masz rozumiem 2 rdzenie?) w cc_config.xml (acz z tym i obserwowanie wpływu na wydajność gpu-wu poczekałbym na stabilizację) dodatkowo oczywiście potrzebowałbyś duży przydział procentowy na seti lub liczyć tylko seti by nie doszło do mielenia 3 non_seti_wu na raz :P...

Niestety na nowej aplikacji nie ma możliwości wybrania ilości rdzeni jakie mają być wykorzystane, a wprowadzone zostało:

" w systemach wieloprocesorowych, używaj nie więcej niż xxx,xx % ogólnej liczby procesorów "




Pigu

nic nie mówiłem o "preferencjach lokalnych" - chodziło o ręczną edycję plików - możesz sobie ustawić by liczył ile chcesz zadanek na raz

3891mike

Słabiutko 14,5 kredytu za jedną próbkę na GPU zważywszy na to że wcześniej na CPU dostawałem jakieś 61 kredytów i liczyłem przez jakieś 4 godziny to tutaj średnio sie opłaca tak bardzo obciązać karte graficzną co prawda i tak mam jedną z ekonomiczniejszych wersji bo nie przekracza 90W ale chciałbym mieć możliwość wyboru pomiędzy GPU/CPU a tutaj oni to narzucili z góry. Drugą stroną medalu jest to że przy tak wielkim skoku wydajności w liczeniu próbek być może wkrótce społeczność boinc osiągnie na tyle dużą moc obliczeniową że badania będą prowadzone na bieżąco, a o to tak naprawdę chodzi.


Bartek

Policzyłem kilka próbek na GPU tym razem już w prawdziwym Seti a nie beta.
http://setiathome.berkeley.edu/results.php?hostid=3957971

A zatem mamy dla GPU 8600GT
'mała próbka' czas liczenia ok 18,5 minuty, punkty 14,58 czyli ok 47,3 punkta na godzinę
'duża próbka' czas liczenia ok 69 minut, punkty 66,42, ok 57,7 na godzinę (zarządał 79 co dałoby ok 69 na godzinę)
Czyli punktacja podobna jak na CPU, czasy liczenia dla tego GPU też podobne.
Dla porównania próbka Astropulse liczona aplikacją zoptymalizowaną dała u mnie wynik ok 42,77/godzinę.
I jeszcze jedno: liczenie 'małej' próbki jest w zasadzie niezauważalne w czasie pracy komputera, liczenie 'dużej' powoduje niewielkie opóźnienia w pracy grafiki aż do na moje oko dwu-, trzy sekundowych zastojów przy pewnych etapach obliczeń (szczególnie na początku). Opłacalność do rozważenia dla każdego indywidualnie.
A może ktoś z kolegów forumowiczów ma mocniejszy GPU ? A może GTX 280 ? Podzielcie się wynikami doświadczeń, zobaczymy wtedy jak poszczególne GPU liczą a nie tylko rysują.

Pigu

oo - widzę kolega mocarny a do teamu się nie zapisał :(

czyli wedle obserwacji na ten moment g8600 karmi jak jedno jajko procka? hmm słabo - może się jeszcze poprawią

filus777

U mnie małą próbkę liczy 8 min do 8:30 (czas rzeczywisty liczony stoperem) daje to ok 14,51-14,77 pkt za próbkę liczone na GF9600GT. Jeszcze nie sprawdzałem jak długo liczy dłuższe próbki

Machloj

przesiadłem się na BM 6.5.0 - i czas liczenia wzrósł znacząco (8600M) - jedna próbka liczyła mi się ok. 6h ( http://setiathome.berkeley.edu/workunit.php?wuid=383571168 ) - ale za to liczę 3 zadania (2 CPU + 1 GPU [ok. 5% użycia CPU])

Bartek

@ Pigu
W konfiguracji domyślnej idzie tylko na jednym rdzeniu i to jeszcze mizernie go używając. Pewnie metodą edycji pliku konfiguracyjnego udałoby się coś poprawić. Komplikuje to jednak sprawę bo w zasadzie wymaga osobnej konfiguracji dla każdego projektu i komputera. Zabawa na razie nie dla mnie, bo liczę na wielu komputerach do których nie mam natychmiastowego dostępu (z serwerami nie ma problemu - tam w zasadzie nie ma gpu). Przy tej metodzie niestety potrzebna jest pełna i niezawodna automatyka.

Co do zapisu do teamu, jak już kiedyś wspomniałem, wolę pozostać wolnym strzelcem.

@ Filus777
Na 9600 daje to ok 102 na godzinę, czyli już warto.

Szym

Witam.
Boinc 6.4.5
Stery 180.48
Nie mogę porównać do czasu samego CPU bo od razu odpaliłem pod GPU, co o tym sądzicie?:
http://setiathome.berkeley.edu/workunit.php?wuid=383984683
Zabrał przy tym jedno jajko CPU, niestety.
Pozdrawiam

TRZECIAK

Cytat: Szym w 22 Grudzień 2008, 22:34
Witam.
Boinc 6.4.5
Stery 180.48
Nie mogę porównać do czasu samego CPU bo od razu odpaliłem pod GPU, co o tym sądzicie?:
http://setiathome.berkeley.edu/workunit.php?wuid=383984683
Zabrał przy tym jedno jajko CPU, niestety.
Pozdrawiam


Według mnie to ta próbka jest przeliczona nie na GPU, a po staremu na CPU (dlatego zabrało 1 jajko) i to z dosyć kiepskim czasem :/

Poza BOINC i sterami może nie zainstalowałeś CUDA ?


AiDec

#76
1. Zalecam przesiadke na 180.84 - nieoficjalne, ale lepsze stery (obecnie w wersji beta do pobrania ze strony Nvidii). Dostepne np. na Guru3d.
2. Zalecam przesiadke na 6.5.0
3. To ze zabiera jedno jajo to nie problem. Tak naprawde zabiera tylko czesc tego jajka. Pozostala czesc mozesz wciaz wykorzystac. Mozesz albo zapiac nastepna grafe ktora skorzysta z tego samego jajka (a tym samym je docisnie), albo zapiac FreeHAL`a, albo Almere korzystajac z non_cpu_intensive.

To tylko takie drobne porady.



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

wicher

Witam.
U mnie mala probke liczy okolo 6,00 minut 14,18 punktow
Duza okolo 25 minut 54 - 59 pkt

9800GT

Szopler

Cytat: AiDec w 23 Grudzień 2008, 10:10
1. Zalecam przesiadke na 180.84 - nieoficjalne, ale lepsze stery (obecnie w wersji beta do pobrania z e strony Nvidii). Dostepne np. na Guru3d.
2. Zalecam przesiadke na 6.5.0
3. To ze zabiera jedno jajo to nie problem. Tak naprawde zabiera tylko czesc tego jajka. Pozostala czesc mozesz wciaz wykorzystac. Mozesz albo zapiac nastepna grafe ktora skorzysta z tego samego jajka (a tym samym je docisnie), albo zapiac FreeHAL`a, albo Almere korzystajac z non_cpu_intensive.

Ściągnąłem 180.84 ale nie mogę ich zainstalować! Wyświetla mi okienko z informacją, że nie może znaleźć stosownego hardware. :(
Mam WinXP x64 i GF8600GT.

Obecnie ciągnie mi 0,04CPU + 1CUDA

Vitesse

#79
Cytat: Szopler w 28 Grudzień 2008, 19:22
Ściągnąłem 180.84 ale nie mogę ich zainstalować! Wyświetla mi okienko z informacją, że nie może znaleźć stosownego hardware. :(
Mam WinXP x64 i GF8600GT.

Spawdz na nieco starszych 180.60 (bo najnowszych 181.00 na WinXP x64 nie ma).

Cytat: wicher w 28 Grudzień 2008, 16:03
Witam.
U mnie mala probke liczy okolo 6,00 minut 14,18 punktow
Duza okolo 25 minut 54 - 59 pkt

9800GT

Wlasnie zastanawiam sie czy nie zrobic upgrade do 9800GT skoro mozna ja kupic juz ponizej 400 PLN (112 shaderow, seryjne zegary mozna pogonic na dzien dobry o 10%).