Generalized Fermat Prime - w końcu na AMD/ATI (OpenCL)

Zaczęty przez Krzysiak, 11 Wrzesień 2013, 19:04

Krzysiak

Tak jak w temacie
Właśnie przystąpiłem do testowania

HD7970 obciążenie GPU w 100%

Pozdrawiam


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

tito

Na 7950 też 100% obciążenia. Osobiście szacuję czas na ~ 7h. Jutro rano dam znać.
PS potrzebne double precision.

stiven

Ciekawe jak wypadną karty ati w porównaniu z cudami nv. Wrzućcie wyniki koniecznie wraz z czasami wingmanów i ich kartami.

Krzysiak

Na pewno zapodam ?

Czy długość wszystkich próbek jest zbliżona ?


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

stiven

Różne się trafiają. Ale patrząc choćby po:
http://www.primegrid.com/workunit.php?wuid=355340979
http://www.primegrid.com/workunit.php?wuid=355435786
nie są to jakieś wyjątkowe próbki atiGFN specjalnie dla ati lecz są liczone także na CPU i GPU Nvidia.

tito

Short task 21,097.59   1,327.13   pending   Genefer v2.08 (atiGFN)
Teraz mi mieli długaśnego. Po 5h mam prawie 7%.

Edit:
Patrząc na to http://www.primegrid.com/workunit.php?wuid=337164990  mam poważne wątplwości co do zasadności liczenia tegoż.

Krzysiak

Bo Ci się bardzo długa próbka trafiła  :p_arr:
max # of error/total/success tasks   60, 60, 5

Ja osobiście bym ją przeliczył do końca

Ja na razie jedną krótką przeliczyłem  ;D
max # of error/total/success tasks   15, 15, 5
482150812 355340979 250977 11 Sep 2013 | 16:14:46 UTC 12 Sep 2013 | 1:19:37 UTC Completed, waiting for validation 22,519.20 905.37 pending Genefer v2.08 (atiGFN)


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

tito

Przerwałem - wyjeżdżam i nie dałbym rady monitorować co się dzieje.

Krzysiak

I druga próbka przeliczona
481987140 355435786 11 Sep 2013 | 18:29:10 UTC 12 Sep 2013 | 6:56:46 UTC Completed, waiting for validation 19,205.76 910.25 pending Genefer v2.08 (atiGFN)


Win XP 32 bity + HD5850 niestety od razu wywala błąd  :bad:
482285112 355573657 12 Sep 2013 | 7:08:54 UTC 12 Sep 2013 | 7:09:48 UTC Error while computing 0.00 0.00 --- Genefer v2.08 (atiGFN)
482284082 355572361 12 Sep 2013 | 7:10:06 UTC 12 Sep 2013 | 7:12:01 UTC Error while computing 0.00 0.00 --- Genefer v2.08 (atiGFN)
482284080 355569000 12 Sep 2013 | 7:09:48 UTC 12 Sep 2013 | 7:10:06 UTC Error while computing 0.00 0.00 --- Genefer v2.08 (atiGFN)
482203714 355576660 12 Sep 2013 | 7:08:09 UTC 12 Sep 2013 | 7:08:54 UTC Error while computing 0.00 0.00 --- Genefer v2.08 (atiGFN)


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

stiven

Liczenie Genefer WR odradzam. Trwa to strasznie długo i potrzeba bardzo stabilnego sprzętu. W przypadku nvidii próbki są bardzo wrażliwe na różnorakie zakłócenia u mnie nawet oglądanie filmów. Od którejś wersji aplikacji i lub sterowników się poprawiło ale nadal szanse na utratę dużej ilości punktów zniechęcają.

Krzysiak

NVIDIA GeForce GTX 460 (1023MB) driver: 30623
463718029 312301 10 Jul 2013 | 17:10:10 UTC 11 Jul 2013 | 13:27:35 UTC Completed and validated 73,045.00 41.72 29,034.34 Genefer v2.05 (cudaGFN)

CAL AMD Radeon HD 7870/7950/7970 series (Tahiti) (3072MB) driver: 1.4.1741
482304571 250977 12 Sep 2013 | 9:00:35 UTC 13 Sep 2013 | 0:35:27 UTC Completed and validated 19,100.62 873.92 29,034.34 Genefer v2.08 (atiGFN)


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

mimeq

#11
7870 99% Load:

482397398 352157164 336131 12 Sep 2013 | 18:16:00 UTC 13 Sep 2013 | 10:03:44 UTC Completed and validated 56,843.17 1,772.08 29,255.04 Genefer v2.08 (atiGFN)

Intel(R) Xeon(R) CPU X5570 @ 2.93GHz:

476757296 408011 23 Aug 2013 | 22:02:27 UTC 30 Aug 2013 | 20:22:16 UTC Completed and validated 598,789.00 598,318.70 29,255.04 Genefer v2.04 (cpuGFN)

:P


Krzysiak

Prosił bym o podawanie swojego wyniku i konkuręta

Mój CAL AMD Radeon HD 7870/7950/7970 series (Tahiti) (3072MB) driver: 1.4.1741
482213268 250977 12 Sep 2013 | 14:19:26 UTC 13 Sep 2013 | 5:59:03 UTC Completed and validated 19,418.05 931.37 29,362.35 Genefer v2.08 (atiGFN)

i [2] NVIDIA GeForce GTX TITAN (4095MB) driver: 32641
482679512 285697 13 Sep 2013 | 19:16:40 UTC 16 Sep 2013 | 0:23:18 UTC Completed and validated 9,125.56 4,522.45 29,362.35 Genefer v2.07 (OCLcudaGFN)


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

Krzysiak

Właśnie odesłałem próbkę po 65h liczenia na HD7970 -o wartość punktowa 550 tyś

482470242 355451518 250977 13 Sep 2013 | 2:16:45 UTC 19 Sep 2013 | 9:00:30 UTC Completed, waiting for validation 244,124.75 4,924.89 pending Genefer (World Record) v2.08 (atiGFNWR)

No to czekam na sprawdzającego  :attack:


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

stiven

Ja rozpocząłem testy na gt 640 wersja cuda vs opencl. Bardzo jestem ciekawy co z tego wyjdzie.

Krzysiak

No i poszło

CAL AMD Radeon HD 7870/7950/7970 series (Tahiti) (3072MB) driver: 1.4.1741
482470242 250977 13 Sep 2013 | 2:16:45 UTC 19 Sep 2013 | 9:00:30 UTC Completed and validated 244,124.75 4,924.89 559,291.61 Genefer (World Record) v2.08 (atiGFNWR)

NVIDIA GeForce GTX 570 (1279MB) driver: 32049,
483431030 202799 17 Sep 2013 | 18:03:59 UTC 22 Sep 2013 | 18:09:50 UTC Completed and validated 427,939.11 258.86 559,291.61 Genefer (World Record) v2.06 (cudaGFNWR)


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

Dario666

A ile taką próbę liczy np. TITAN - dla porównania.

stiven

Mam ciekawe wyniki. Liczyłem na gt 640:
Pierwsza próbka CUDA:
483379615 356401179 376236 17 Sep 2013 | 21:57:33 UTC 22 Sep 2013 | 16:38:41 UTC Completed and validated 227,735.41 329.11 29,403.26 Genefer v2.05 (cudaGFN)
Druga na OCL:
483100807 352646760 376236 15 Sep 2013 | 20:59:58 UTC 19 Sep 2013 | 17:15:32 UTC Completed and validated 167,172.31 3,812.00 29,268.67 Genefer v2.09 (OCLcudaGFN)
Trudność próbki porównywalna patrząc na liczbę przyznanych punktów więc wychodzi na to, że w przypadku tej karty OCL liczy znacznie szybciej niż CUDA.

Wingmani przeliczali je odpowiednio:
1. 483379614 156728 17 Sep 2013 | 22:11:17 UTC 25 Sep 2013 | 22:11:36 UTC Completed and validated 543,115.02 540,366.30 29,403.26 Genefer v2.04 (SSE3cpuGFN) na Intel(R) Core(TM)2 Duo CPU E8400 @ 3.00GHz
2. 478037908 374601 27 Aug 2013 | 19:27:44 UTC 16 Sep 2013 | 22:17:16 UTC Completed and validated 1,612,717.97 1,428,234.00 29,268.67 Genefer v2.04 (cpuGFN) na Intel(R) Xeon(R) CPU W3550 @ 3.07GHz
Jak widać drugi miał pecha bo liczył na starej niezoptymalizowanej wersji aplikacji (bez SSE3).

Pomiary zapewne powtórzę ale zachęcam innych liczących na kartach geforce do przetestowania która z aplikacji liczy u nich szybciej.

pawg




stiven

Fakt. Ale to raptem godzina pracy CPU na 46 liczenia GPU.

4ys

A to kilka moich wyników

CAL AMD Radeon HD 7870/7950/7970 series (Tahiti) (2048MB) driver: 1.4.1741

489486316   359994436   5 Oct 2013 | 13:22:36 UTC   6 Oct 2013 | 14:32:31 UTC   Completed and validated   1,994.93   477.52   3,371.00   PPS (Sieve) v1.39 (atiPPSsieve)
489422563   360894036   5 Oct 2013 | 13:22:36 UTC   6 Oct 2013 | 17:11:03 UTC   Completed and validated   2,095.77   478.36   3,371.00   PPS (Sieve) v1.39 (atiPPSsieve)
489422562   360894034   5 Oct 2013 | 13:22:36 UTC   6 Oct 2013 | 5:10:41 UTC   Completed and validated   2,105.11   520.40   3,371.00   PPS (Sieve) v1.39 (atiPPSsieve)
489422560   360894030   5 Oct 2013 | 13:22:36 UTC   6 Oct 2013 | 3:51:26 UTC   Completed and validated   2,105.93   520.62   3,371.00   PPS (Sieve) v1.39 (atiPPSsieve)
489422518   360893967   5 Oct 2013 | 13:22:36 UTC   6 Oct 2013 | 14:32:31 UTC   Completed and validated   1,877.29   494.71   3,371.00   PPS (Sieve) v1.39 (atiPPSsieve)

485651367   354287117   25 Sep 2013 | 18:55:43 UTC   26 Sep 2013 | 10:18:29 UTC   Completed and validated   44,528.38   1,350.13   29,315.12   Genefer v2.10 (atiGFN)
485494273   357888357   26 Sep 2013 | 13:34:10 UTC   27 Sep 2013 | 11:14:41 UTC   Completed and validated   47,812.36   1,633.22   29,456.77   Genefer v2.10 (atiGFN)
485402229   357618495   24 Sep 2013 | 19:43:00 UTC   25 Sep 2013 | 15:28:38 UTC   Completed and validated   39,651.95   1,556.28   29,447.76   Genefer v2.10 (atiGFN)

485641562   356860878   27 Sep 2013 | 15:08:38 UTC   4 Oct 2013 | 11:06:47 UTC   Completed and validated   553,037.49   10,137.46   561,678.25   Genefer (World Record) v2.10 (atiGFNWR)

NVIDIA GeForce 9600 GSO (384MB) driver: 30623

489774639   361074540   7 Oct 2013 | 7:39:14 UTC   7 Oct 2013 | 13:37:55 UTC   Completed and validated   6,133.67   158.08   3,371.00   PPS (Sieve) v1.39 (cudaPPSsieve)
489774624   361074525   7 Oct 2013 | 7:39:14 UTC   7 Oct 2013 | 13:37:55 UTC   Completed and validated   6,156.68   186.89   3,371.00   PPS (Sieve) v1.39 (cudaPPSsieve)
489774623   361074524   7 Oct 2013 | 7:39:14 UTC   7 Oct 2013 | 13:37:55 UTC   Completed and validated   6,152.60   184.67   3,371.00   PPS (Sieve) v1.39 (cudaPPSsieve)
489657383   359818598   6 Oct 2013 | 10:57:37 UTC   7 Oct 2013 | 2:43:04 UTC   Completed and validated   6,207.86   244.36   3,371.00   PPS (Sieve) v1.39 (cudaPPSsieve)

Dario666

To ciekawe jaką dokładnie masz kartę, bo Krzysiak_PL_GDA liczy GNFWR w 244,124 sekundy, a nie 553,037.  ;D

d_worms

#22
U nie takie wyniki o dziwo GTX 680 jest szybszy niz GTX 780

GTX 680 liczy 8min 20sek a GTX 780 10min13sek Na sterownikach 327.23
a na sterownikach beta 331.40  GTX 680 liczy 11:23 a GTX 780 13:11


OK male sprostowanie
Na obu sterownikach casz przelicznia jest taki sam ruznica jest spowodowana tym ze w pierwszym przpadku CPU liczyl The Sky Net POGS a w drogim PrimeGrid TRP (LLR) 6.15
Mozna to za obserwowac na ponizszym Scr.Shot jak GPU byl slabo wykozystywany pogczas przeliczania przez CPU probek PrimeGrid TRP (LLR) 6.15

https://dl.dropboxusercontent.com/u/22209086/GPU.jpg

489875977   360662119   7 Oct 2013 | 12:42:05 UTC   8 Oct 2013 | 5:28:19 UTC   Completed and validated   592.13   235.02   3,371.00   PPS (Sieve) v1.39 (cudaPPSsieve)
489871541   361098591   7 Oct 2013 | 12:11:58 UTC   8 Oct 2013 | 4:58:36 UTC   Completed and validated   596.12   237.54   3,371.00   PPS (Sieve) v1.39 (cudaPPSsieve)
489868927   360599571   7 Oct 2013 | 12:01:56 UTC   8 Oct 2013 | 4:48:39 UTC   Completed and validated   594.07   234.53   3,371.00   PPS (Sieve) v1.39 (cudaPPSsieve)
489866356   360645915   7 Oct 2013 | 11:37:16 UTC   7 Oct 2013 | 21:02:44 UTC   Completed and validated   570.49   240.05   3,371.00   PPS (Sieve) v1.39 (cudaPPSsieve)
489866344   361092194   7 Oct 2013 | 11:37:16 UTC   7 Oct 2013 | 23:32:12 UTC   Completed and validated   545.55   213.75   3,371.00   PPS (Sieve) v1.39 (cudaPPSsieve)
489865862   361091293   7 Oct 2013 | 11:37:16 UTC   7 Oct 2013 | 18:41:30 UTC   Completed and validated   505.52   172.25   3,371.00   PPS (Sieve) v1.39 (cudaPPSsieve)
489871067   360889024   7 Oct 2013 | 12:02:47 UTC   8 Oct 2013 | 3:57:24 UTC   Completed and validated   647.93   198.67   3,371.00   PPS (Sieve) v1.39 (cudaPPSsieve)
489866358   361010286   7 Oct 2013 | 11:37:16 UTC   7 Oct 2013 | 19:45:12 UTC   Completed and validated   673.90   226.30   3,371.00   PPS (Sieve) v1.39 (cudaPPSsieve)
489866355   359528729   7 Oct 2013 | 11:37:16 UTC   7 Oct 2013 | 20:19:01 UTC   Completed and validated   677.59   230.14   3,371.00   PPS (Sieve) v1.39 (cudaPPSsieve)
489872358   360655572   7 Oct 2013 | 12:18:40 UTC   8 Oct 2013 | 4:19:26 UTC   Completed and validated   647.63   198.08   3,371.00   PPS (Sieve) v1.39 (cudaPPSsieve)
489869681   360724799   7 Oct 2013 | 11:54:41 UTC   8 Oct 2013 | 3:45:44 UTC   Completed and validated   528.00   194.95   3,371.00   PPS (Sieve) v1.39 (cudaPPSsieve)

GTX 680
479646378   348922860   3 Sep 2013 | 5:51:44 UTC   10 Sep 2013 | 5:30:59 UTC   Completed and validated   507,677.49   34,092.36   557,940.21   Genefer (World Record) v2.06 (cudaGFNWR)

481541319   355146253   10 Sep 2013 | 14:05:36 UTC   13 Sep 2013 | 19:14:36 UTC   Completed and validated   57,806.07   2,255.60   29,346.14   Genefer v2.07 (atiGFN)

stiven

#23
GTX 680 JEST szybszy niz GTX 780 w PPS Sieve. W Geneferze powinno być odwrotnie.
Tu: http://www.primegrid.com/gpu_list.php tabelka z wynikami z PG.
Przy okazji te próbki TRP LLR liczysz na wszystkich rdzeniach?
Część procesorów ma problemy z cachem i na forum PG rozkminili, że warto liczyć na 3/4 rdzeni. Doświadczenia kolegów z zespołu i moje również wskazują, że jedno jajko na WCG The Clean Energy Project - Phase 2 sprawdza się znakomicie. Tyle że podczas wyścigu rozsyłane próbki TRP LLR mają wysoki priorytet i ciężko to ogarnąć bez doglądania co jakiś czas.

d_worms


stiven

Jak rozumiem mielisz na  i7-3930K. Prosta rada - wyłącz HT. Przy liczeniu LLR daje więcej szkód niż pożytku. Dodatkowo bardziej przytyka GPU przy pełnym obciążeniu.

d_worms

Cytat: stiven w 08 Październik 2013, 13:32
Jak rozumiem mielisz na  i7-3930K. Prosta rada - wyłącz HT. Przy liczeniu LLR daje więcej szkód niż pożytku. Dodatkowo bardziej przytyka GPU przy pełnym obciążeniu.

HT wylaczony za pare dni  zobaczymy co z tego wyjdzie, juz widze ze na GTX680 PPS sieve 1.39 czas oplicznia spadl do srednio 7m40s przy POGS na CPU. A na CPU liczacym 4xLLR i 2xPOGS 9m15s
Dzieki stiv

4ys

Ja mam 7870xt ( nie kręcony) a Krzysiak_PL_GDA ma pewnie 7970

Krzysiak

Cytat: 4ys w 09 Październik 2013, 19:28
Ja mam 7870xt ( nie kręcony) a Krzysiak_PL_GDA ma pewnie 7970
Dokładnie tak jak to pisałem w pierwszym poście


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

4ys

Sorrki nie potrzebnie dodałem "pewnie"
I tak z ciekawości czy jest różnica miedzy pcie 2.0 a 3.0

stiven


Krzysiak

Pytanko
Czy na kratach R280 (kotlecie HD7970 - na tej karcie działa ) ktoś liczy ten projekt ?
bo na R290 nie mam pojęcia jak go uruchomić  :(


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

LQG

Na R9-280 i R8-280X apka Genefer v3.03 (atiGFN) mielała bez problemu. :)

Krzysiak

Tak myślałem
To teraz kurde jak odpalić na R290  :wth:


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

matszpk

próbowałem dzisiaj (wczoraj) liczyć genefer na mojej karcie Radeon HD7850. Na stocku ma: core=900MHz (o 40 MHz więcej niż standard), mem=1200 MHz.
Od jakiegoś czasu mam ustawienia core=1000MHz i mem=1290MHz. Inne projekty na tych ustawieniach działały bezproblemowo. Natomiast genefer wywalał błąd maxErr exceeded (nawet po kilku minutach  :fright:). Temperatura karty nie przekraczała 63 C. Czy to może być problem z podkręconą pamięcią karty? dawno temu robiłem testy memtestCL (nawet razem innymi programami OpenCL) razem obciązeniem procka (komp działał przez ok 2 godziny) i wszystko było OK. wtedy temp karty to było ok 65 C.
Aha mam stery 14.6beta1 (z maja) na linuksie.
czy genefer jest rzeczywiście taki wrażliwy (problem ze sprzętem) na pamiątki karty?
Obecnie liczę collatza (temp karty = 64C) i zobaczę jutro czy nie będzie błędów  :boing:.

PS: zapomniałbym. miałem obroty wiatraka ustawione na 41% gdy probowałem liczyć genefer.

matszpk

moze rzeczywiście mem=1290MHz to dla mojej karty za dużo gdy liczy genefer  ??? ? zmiejszyłem do mem=1270MHz i nie było błędów po kilkunastu minutach liczenia.

toms83

Ten projekt jest kosmicznie czuły na wszelkie zmiany. Swego czasu był wątek, gdzie fabrycznie podkręcony model ( nie pamiętam dokładnie jaki, ale chyba chodziło o 560Ti ) miał problem z przeliczeniem próbki. Trzeba było zmniejszać zegary, wtedy dopiero działało jak należy.

matszpk

No cóż  :dunno:. nawet to nie pomogło do końca. trzeba będzie liczyć na jeszcze niższych ustawiniach np.: mem=1260 lub dać sobie spokój. po 7 godzinach liczenia pojawił się błąd. daję sobie spokój zaczynam liczyć coś innego np.: collatz.

matszpk

Jedna WU genefer już policzona  :parrrty:. ale na mem=1255MHz, core=1000MHz. Jednak można. Jeszcze policzę jedną.

matszpk

czesc. odnośnie do genefer i podobnych aplikacji i stabilności:
główny problem to stabilność pamięci. niestety przekonałem się, że narzędzia takie jak memtestCL, gputest, a tym bardziej głupi furmark nie nadają się do testowania stabilności GPU  ???. byłem naiwny i zaufałem memtestCL i tym podobnym. jeśli chcecie rzeczywiście przetestować stabilność GPU weżcie genefer.
własnie sobie odpaliłem mój mały programik do automatów komórkowych :) i on tam gnębi pamięć GPU. na ustawieniach mem=1290 wywalił się po kilku minutach (tak jak genefer)...
na mem=1255 działa jakieś kilkanascie minut i nic. nietrudno napisać apkę, która będzie zarzynać GPU i jego pamięć.
moze opublikuje go na githubie  :) albo coś podobnego.
trochę mi głupio że przez cały czas liczyłem moowrapper na takich ustawieniach GPU :shame: (chociaż pewnie wszystkie WU są zwalidowane poprawnie).
myslałem, że katowanie GPU memtestCL'em, i mnożeniem macierzy przez dwie godzinki wystarczy... okazało się że nie.
do usłyszenia no i podkręcajcie pamięci GPU tylko troszkę albo wcale.