Aktualności:

W MEDIA znajdziesz grafiki, banery i avatary

Menu główne

Porównanie czasu obliczania BRP CUDA dla różnych konfiguracji

Zaczęty przez zoom_mctwist, 02 Grudzień 2012, 02:24

zoom_mctwist

Ciekawi mnie jak wygląda Wasz czas obliczania jednego WU: Binary Radio Pulsar Search (Arecibo) 1.32 na GPU, w zależności od konfiguracji komputera (CPU, GPU).
Jeżeli ktoś liczy kilka próbek równolegle (utilization factor: 0.5, 0.33 itp.) to jak przedstawia się wzrost wydajności w porównaniu do pojedynczego zadania.

Jako, że próbka próbce nierówna, najlepiej wyciągnąć średnią z kilku wyników przedstawionych na stronie E@H. Wynik do analizy to czas Run time (sec).

Wasze posty pozwolą opracować bazę danych najlepszych kart graficznych, procesorów i ustawień przeznaczonych do tego projektu.

// Podobny wątek znajduje się tutaj: http://einstein.phys.uwm.edu/forum_thread.php?id=9500#117815 z podsumowanymi wynikami: http://www.dskag.at/images/Research/EinsteinGPUperformancelist.pdf jednak nie uwzględnia on mocy CPU, który ma również wpływ na szybkość obliczeń.

stiven

BRP nie potrzebuje mocnego CPU. Możesz spokojnie bazować na tym co podali i wg nie są potrzebne dodatkowe testy. O ile nie wepchniesz jakiejś super karty pod atoma na przykłąd. Wąskim gardłem jest GPU zupełnie odwrotnie niż w POEM.

zoom_mctwist

Pewien wpływ jednak jest. Wg ich forum GTX460 liczy 2 próbki w 2900 sec. U mnie ta sama karta z mocno wykręconym CPU leci poniżej 2500 sec.

stiven

Bardziej stawiałbym na inne taktowanie GPU albo pamięci karty lub większej ilości próbek wziętych do uśredniania (jakieś rozrzuty są). Moja gt430 liczy 2 próbki jakieś 300-400s krócej niż podają.

Sebastian M. Bobrecki

Phenom II X4 940 (3,2GHz) + GTX270 (PCIe 2.0 x16) jedno zadanie na raz ~1870s/zadanie
Phenom II X4 965 (3,4GHz) + 2x GTX660Ti (PCIe 2.0 x8) ~2592s dwa zadania na jedno GPU -> ~1296s/zadanie, ~3365s trzy zadania na jedno GPU -> ~1122s/zadanie
Phenom II X6 1075T (3,495GHz) + GTX680 (PCIe 2.0 x16) ~2740s trzy zadania -> ~913s/zadanie, ~3410s cztery zadania -> ~852s/zadanie
Kocham pracę, mogę na nią patrzeć godzinami.

krzyszp

Q6600 i GT430, jedno zadanie naraz - 5,457.92s (Linux 64bit)
Athlon2x3, ATI 7750, jedno zadanie naraz - od 3,943.11s do... 50'000s... tragedia... (Windows 7-64)

ATI nie nadaje się moim zdaniem do Einsteina...
Jak uruchomić dwie próbki naraz dla tego kompa z GT430?

Fajne zegarki :)
Należę do drużyny BOINC@Poland
 Moja wizytówka

stiven

Bardzo prosto: GPU utilization factor of BRP apps na stronie projektu w Preferences for this project   Ustawienia Einstein@Home.
0.5 to 2 WU naraz, 0.33 to 3. Od razu Ci poradzę, że 3 nie ma sensu odpalać. 2 zapchają GPU pod korek robotą.

krzyszp

Cytat: stiven w 04 Grudzień 2012, 17:13
Bardzo prosto: GPU utilization factor of BRP apps na stronie projektu w Preferences for this project   Ustawienia Einstein@Home.
Ustawiłem to, ale nic się nie zmieniło - dalej liczy tylko jedną próbkę naraz...

Fajne zegarki :)
Należę do drużyny BOINC@Poland
 Moja wizytówka

stiven

Zaktualizuj projekt i jak tę doliczy to następne już pójdą zgodnie z Twoimi ustawieniami.

krzyszp

Cytat: stiven w 04 Grudzień 2012, 17:52
Zaktualizuj projekt i jak tę doliczy to następne już pójdą zgodnie z Twoimi ustawieniami.
Nie idą, te ustawienie zmieniłem 3 dni temu, aktualizowałem kilka razy..

Fajne zegarki :)
Należę do drużyny BOINC@Poland
 Moja wizytówka

stiven

Kiedyś tez tak nie mogłem się doczekać aż się okazało, że komputer ma lokalizację home a zmieniałem konfig dla default  :facepalm2:

Poprawiłem i pomyka.

krzyszp

Cytat: stiven w 04 Grudzień 2012, 18:07
Kiedyś tez tak nie mogłem się doczekać aż się okazało, że komputer ma lokalizację home a zmieniałem konfig dla default  :facepalm2:

Poprawiłem i pomyka.
To również sprawdziłem, mam lokalizację work i ustawienia "0.5" dla default i work...

Fajne zegarki :)
Należę do drużyny BOINC@Poland
 Moja wizytówka

stiven

No to nie wiem. U mnie działa. Proponuję zmontować aap_info. Tu: http://www.boincatpoland.org/smf/einsteinhome/wiele-wu-na-raz-na-gpu/ masz jakieś przykładowe myślę że sobie poradzisz.   

tito

Cytat: zoom_mctwist w 02 Grudzień 2012, 21:34
Pewien wpływ jednak jest. Wg ich forum GTX460 liczy 2 próbki w 2900 sec. U mnie ta sama karta z mocno wykręconym CPU leci poniżej 2500 sec.
Po długiej analizie co jest nie tak, zgadzam się z powyższym.
Mam AMD 7950 i za cholerę nie mogę jej wykarmić.
CPU to dosyć leciwy C2D @ 2600MHz + DDR2.
Jeśli zwolnię jedno jajko dla CPU (drugie coś sobie tam liczy) to obciążenie GPU wynosi ~63% a czas przeliczeń to ~ 2500 sek.
Jeśli przestanę liczyć na drugim jajku to obciążenie GPU wzrasta do ~75% a czas spada do 1700sek. Ciągle znacznie więcej niż u ludzi.
Być może wąskim gardłem jest pamięć, ale tego na odległość już nie przetestuję.