Prime na i5-4670K - wykorzystanie instrukcji AVX

Zaczęty przez Krzysiak, 30 Czerwiec 2013, 20:08

Krzysiak

Coś trzeba zmienić w tym projekcie żeby szybciej liczył na tym procku ?
Chodzi mi o instrukcje  AVX


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

stiven

Jak proc pozwala to obecnie już nic nie trzeba cudować. Po prostu liczy szybciej.

Krzysiak

Tak się pytam bo czasy przeliczeń próbek podobne do i7-950 a myślałem że skok wydajności będzie bardziej widoczny


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

Dario666


Krzysiak

Dobra jest szybciej  ;D ale najpierw musiałem wywalić projekt z menadżera a potem go dodać z powrotem  %)


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

PoznanskaPyra

Jak miałeś czasy jak i7 950 to potwornie wolno, xeony na 2.4GHz z HT tyle czasu potrzebują  %)
WIZYTÓWKA
Kompy:
AMD Ryzen 9-3900X + GTX980Ti
Intel i5 4570 + HD7970

Krzysiak

Jadnak odczułem moc nowej architektury !!! :fright:

Dla porównania

I7-950 oc 4,1GHz

456001680 337694852 250977 3 Jun 2013 | 6:20:39 UTC 8 Jun 2013 | 17:49:37 UTC Completed and validated 316,476.07 315,455.32 10,057.06 Prime Sierpinski Problem (LLR) v6.15


Dla porównania i5-4670k oc 4,2GHz
464040213 339802641 250977 10 Jul 2013 | 20:26:38 UTC 14 Jul 2013 | 21:03:57 UTC Completed and validated 165,469.52 160,469.62 10,092.42 Prime Sierpinski Problem (LLR) v6.15
464030594 339778668 250977 10 Jul 2013 | 21:42:53 UTC 14 Jul 2013 | 21:14:42 UTC Completed and validated 165,667.46 160,496.92 10,092.21 Prime Sierpinski Problem (LLR) v6.15


Teoretycznie o 91% szybciej przeliczona próbka  :fright:


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

Dario666


Troll81

a moze system zmieniłeś na 64bitowy??  %)

stiven

Dla LLR 64 bit ma to marginalne znaczenie. Co innego przy Sieve.

Krzysiak

Za parę dni jak znajdę czas będę przywracał do życia i7-950 oc 4,1GHz tylko że będzie tam XP 32 bity
więc będę mógł więcej porównań zapodać


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

Dario666

#11
Informacja o tym, że w podprojekcie Geneferze AVX wprowadzono dopiero 21 lipca 2013, no i problemy z tym związane - szczególnie pod Windows. Podobno AVX działa tu również pod nowe AMDki, ale lepiej uruchamiać wtedy 1 zadanie na 1 moduł.

http://www.primegrid.com/forum_thread.php?id=5179#67839


I porównanie:

Cytat500000^1048576+1 on i7-2600K@4500 1-core, GTX470@1512

genefercuda 3.1.0-0 (Windows 32-bit CUDA)
maxErr during b^N initialization = 0.0000 (8.120 seconds)
Estimated total run time for 500000^1048576+1 is 11:41:24

geneferavx 3.1.0-0 (Windows 64-bit AVX)
Initialization complete (2.590 seconds)
Estimated total run time for 500000^1048576+1 is 49:14:31

genefersse3 3.1.0-0 (Windows 64-bit SSE3)
Initialization complete (2.590 seconds)
Estimated total run time for 500000^1048576+1 is 69:45:17

genefx64 3.1.0-0 (Windows 64-bit SSE2)
Initialization complete (10.270 seconds)
Estimated total run time for 500000^1048576+1 is 93:57:44

genefer80 3.1.0-0 (Windows 32-bit x87-80)
Initialization complete (14.730 seconds)
Estimated total run time for 500000^1048576+1 is 263:51:19

Krzysiak

A więc tak dla:

Sierpinski/Riesel Base 5 Problem (LLR)

i7-950 oc 4,1 GHz WinXP 32
466339344 344671406 22 Jul 2013 | 9:11:36 UTC 22 Jul 2013 | 17:04:11 UTC Completed and validated 13,473.13 13,465.13 327.20 Sierpinski/Riesel Base 5 Problem (LLR) v6.15
466309124 344649113 22 Jul 2013 | 6:05:16 UTC 22 Jul 2013 | 16:32:33 UTC Completed and validated 12,680.02 12,671.63 327.03 Sierpinski/Riesel Base 5 Problem (LLR) v6.15
466152589 344538035 21 Jul 2013 | 15:36:40 UTC 22 Jul 2013 | 12:48:59 UTC Completed and validated 13,040.02 13,031.41 326.21 Sierpinski/Riesel Base 5 Problem (LLR) v6.15
466124804 344517402 21 Jul 2013 | 12:13:20 UTC 22 Jul 2013 | 9:11:49 UTC Completed and validated 13,616.59 13,594.28 325.98 Sierpinski/Riesel Base 5 Problem (LLR) v6.15


Dla i5-4670K  oc 4,2GHz Win7 64
465346873 343930879 17 Jul 2013 | 16:18:10 UTC 18 Jul 2013 | 22:22:07 UTC Completed and validated 4,121.92 3,822.57 321.46 Sierpinski/Riesel Base 5 Problem (LLR) v6.15
465309214 343903318 17 Jul 2013 | 11:38:34 UTC 18 Jul 2013 | 6:59:21 UTC Completed and validated 7,487.81 7,319.13 321.20 Sierpinski/Riesel Base 5 Problem (LLR) v6.15
465308474 343902508 17 Jul 2013 | 11:45:22 UTC 18 Jul 2013 | 9:20:39 UTC Completed and validated 6,227.91 6,219.00 321.19 Sierpinski/Riesel Base 5 Problem (LLR) v6.15
465305344 343900222 17 Jul 2013 | 11:38:34 UTC 17 Jul 2013 | 14:25:05 UTC Completed and validated 7,221.28 7,204.13 321.17 Sierpinski/Riesel Base 5 Problem (LLR) v6.15


Nie wiem skąd taki rozrzut  |-?


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

Karlik

Cytat: Krzysiak_PL_GDA w 23 Lipiec 2013, 14:45Nie wiem skąd taki rozrzut  |-?
Może HT albo trafiłeś akurat na prawdopodobną liczbę pierwszą. Wtedy SR5 robi drugi test pierwszeństwa (już deterministyczny) o ile wiem.

Krzysiak

Nie chodziło mi tylko o wyniki Dla i5-4670K  oc 4,2GHz Win7 64 że czasy nie są zbliżone


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

Dario666

Co jakis czas pojawiają się próbki, które kończą się szybciej, ale raczej trzeba by je pominąć w porównaniach.

stiven

Rozwiązanie jest nieco inne. Tak przynajmniej twierdzą na forum PG. Wyczytałem tam, że używając proca z AVX takie spowolnienia będą obserwowane gdy w użyciu są wszystkie rdzenie. Wynika to architektury procesora. Jak ustawisz max użycie 3 rdzeni to czasy zbliżą się do minimalnego obserwowanego wcześniej a odchylenia wyraźnie się zmniejszą.

Dario666

Też się zdziwiłem licząc "Seventeen and Bust", że mobilny i5-2430M CPU @ 2.40GHz (Turbo chyba 3 GHz) na 1 rdzeniu liczy go około 100 h, a i5-3470 CPU @ 3.20GHz na 4 rdzeniach liczy około 166 h.

stiven

Dobrym rozwiązaniem optymalizacyjnym jest zmuszenie managera do liczenia dodatkowo czegoś co nie wykorzystuje AVX. Np 3 jajka PG a na 4. WCG.

Dario666

#19
CytatWynika to architektury procesora

a dokładniej...

Według mnie to zależy głównie od dostępnego cache'u. Zrobiłem testy dla i5-3470 CPU @ 3.20GHz na "Seventeen and Bust" i oto wyniki:

4 core - 0,590%/h czyli 169 h/WU - całkowica wydajność proca 2,360%/h
3 core - 0,843%/h czyli 121 h/WU - całkowica wydajność proca 2,528%/h
2 core - 0,875%/h czyli 114 h/WU - całkowica wydajność proca 1,750%/h
1 core - 1,333%/h czyli 75 h/WU  - całkowica wydajność proca 1,333%/h

Więc widać, że najlepiej liczyć na 3 rdzeniach, a licząc na 1 rdzeniu przyspieszamy obliczenie WU o ponad 2 razy. Należy zauważyć również, że działa tutaj system Turbo core. Przy 1 rdzeniu ma chyba 3.1 GHz, więc bez niego 1 zadanie liczone by było 97 godzin, co daje i tak 1,75 wzrost szybkości obliczeń. Cache jest naważniejszy, szczególnie przy zadanich operujących na dużej liczbie danych.

Krzysiak

"Seventeen and Bust" na moim  5-4670K  oc 4,2GHz Win7 64 -4 próbki naraz (czasem 3 jak w coś grałem )

465637114 344022094 250977 19 Jul 2013 | 6:44:49 UTC 26 Jul 2013 | 5:13:26 UTC Completed, waiting for validation 295,710.85 288,590.96 pending Seventeen or Bust v6.15
465617129 344022091 250977 19 Jul 2013 | 6:36:33 UTC 25 Jul 2013 | 20:29:16 UTC Completed, waiting for validation 294,816.57 288,065.27 pending Seventeen or Bust v6.15


czyli około 85h dla próbki  ;D

Dla i7-950 oc 4,1 GHz czasy były około 200h


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

Dario666


Krzysiak

Jako że wszystkie próbki mają te same czasy  Sophie Germain (LLR)

i7-950 oc 4,1 GHz WinXP 32
470950782 348146570 9 Aug 2013 | 9:03:54 UTC 9 Aug 2013 | 12:37:45 UTC Completed and validated 1,601.45 1,598.64 39.91 Sophie Germain (LLR) v6.15
470949547 348145489 9 Aug 2013 | 9:03:55 UTC 9 Aug 2013 | 13:46:08 UTC Completed and validated 1,645.73 1,642.42 39.91 Sophie Germain (LLR) v6.15
470949546 348145488 9 Aug 2013 | 9:03:55 UTC 9 Aug 2013 | 13:29:12 UTC Completed and validated 1,562.50 1,559.70 39.91 Sophie Germain (LLR) v6.15
470949540 348145482 9 Aug 2013 | 9:03:54 UTC 9 Aug 2013 | 13:09:32 UTC Completed and validated 1,643.50 1,640.92 39.91 Sophie Germain (LLR) v6.15
470948807 348144873 9 Aug 2013 | 9:03:54 UTC 9 Aug 2013 | 13:37:15 UTC Completed and validated 1,572.66 1,569.75 39.91 Sophie Germain (LLR) v6.15
470948805 348144871 9 Aug 2013 | 9:03:54 UTC 9 Aug 2013 | 14:04:32 UTC Completed and validated 1,631.45 1,628.20 39.91 Sophie Germain (LLR) v6.15
470948797 348144863 9 Aug 2013 | 9:03:54 UTC 9 Aug 2013 | 12:52:26 UTC Completed and validated 1,562.58 1,559.55 39.91 Sophie Germain (LLR) v6.15


Dla i5-4670K  oc 4,2GHz Win7 64
470804295 348014581 8 Aug 2013 | 21:51:08 UTC 9 Aug 2013 | 16:03:45 UTC Completed and validated 736.68 692.99 39.91 Sophie Germain (LLR) v6.15
470804282 348014457 8 Aug 2013 | 21:49:44 UTC 9 Aug 2013 | 15:40:54 UTC Completed and validated 669.85 664.77 39.91 Sophie Germain (LLR) v6.15
470804025 347560904 8 Aug 2013 | 21:51:08 UTC 9 Aug 2013 | 15:42:09 UTC Completed and validated 669.84 665.31 39.91 Sophie Germain (LLR) v6.15
470804008 347560809 8 Aug 2013 | 21:51:09 UTC 9 Aug 2013 | 17:18:12 UTC Completed and validated 728.58 686.28 39.91 Sophie Germain (LLR) v6.15
470804005 347560479 8 Aug 2013 | 21:51:08 UTC 9 Aug 2013 | 16:06:12 UTC Completed and validated 708.48 673.25 39.91 Sophie Germain (LLR) v6.15
470803797 348015902 8 Aug 2013 | 21:51:08 UTC 9 Aug 2013 | 16:04:43 UTC Completed and validated 722.60 681.05 39.91 Sophie Germain (LLR) v6.15
470782492 347313311 8 Aug 2013 | 21:28:09 UTC 9 Aug 2013 | 15:30:59 UTC Completed and validated 667.74 661.80 39.91 Sophie Germain (LLR) v6.15
470751901 348016558 8 Aug 2013 | 21:51:09 UTC 9 Aug 2013 | 15:49:43 UTC Completed and validated 688.66 674.55 39.91 Sophie Germain (LLR) v6.15
470751898 348016555 8 Aug 2013 | 21:51:09 UTC 9 Aug 2013 | 16:28:50 UTC Completed and validated 720.56 688.65 39.91 Sophie Germain (LLR) v6.15


i5-4670K  teraz walka o stabilne 4,5GHz  :attack:


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

Dario666


Krzysiak

#24
Dobra walka nie równa strasznie chyba oporną sztukę trafiłem i więcej niż 4,3GHz nie chce pójść
[smg id=10222 type=full align=center caption="4 3GHz"]

471057584 348203935 250977 9 Aug 2013 | 14:44:39 UTC 10 Aug 2013 | 17:34:11 UTC Completed, waiting for validation 654.99 649.10 pending Sophie Germain (LLR) v6.15
471054279 348201545 250977 9 Aug 2013 | 14:33:24 UTC 10 Aug 2013 | 17:23:13 UTC Completed, waiting for validation 656.58 650.66 pending Sophie Germain (LLR) v6.15
471049039 348191954 250977 9 Aug 2013 | 13:57:01 UTC 10 Aug 2013 | 16:47:16 UTC Completed, waiting for validation 656.52 649.18 pending Sophie Germain (LLR) v6.15
471047815 348195771 250977 9 Aug 2013 | 13:49:07 UTC 10 Aug 2013 | 16:37:39 UTC Completed, waiting for validation 658.39 650.07 pending Sophie Germain (LLR) v6.15
471044881 348192404 250977 9 Aug 2013 | 13:45:54 UTC 10 Aug 2013 | 16:36:18 UTC Completed, waiting for validation 654.41 649.68 pending Sophie Germain (LLR) v6.15
471040960 348189495 250977 9 Aug 2013 | 13:36:41 UTC 10 Aug 2013 | 16:26:42 UTC Completed, waiting for validation 669.77 663.69 pending Sophie Germain (LLR) v6.15
471018872 348175964 250977 9 Aug 2013 | 12:52:17 UTC 10 Aug 2013 | 15:42:08 UTC Completed, waiting for validation 644.08 638.04 pending Sophie Germain (LLR) v6.15
471018821 348175220 250977 9 Aug 2013 | 11:57:35 UTC 10 Aug 2013 | 14:36:38 UTC Completed, waiting for validation 650.20 646.30 pending Sophie Germain (LLR) v6.15


Watomierz w pracy zostawiłem może jutro coś skombinuje 


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

Dario666

Według prawideł, jak się kręci procesor to powinno się wyłączać Turbo Boost, bo powoduje on niestabilność przy wyższych częstotliwościach.

PS: Coś słabo się kręcą te Intele, ja mam Phenom II x4 rewizja 3, który idzie stabilnie na chłodzeniu powietrznym przy 4,6 GHz, a przecież to procesor sprzed ponad 2 lat.

Krzysiak



>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

stiven

Cytat: Dario666 w 10 Sierpień 2013, 20:12
Według prawideł, jak się kręci procesor to powinno się wyłączać Turbo Boost, bo powoduje on niestabilność przy wyższych częstotliwościach.

PS: Coś słabo się kręcą te Intele, ja mam Phenom II x4 rewizja 3, który idzie stabilnie na chłodzeniu powietrznym przy 4,6 GHz, a przecież to procesor sprzed ponad 2 lat.
Porównaj jakich czasów potrzebuje ten phenom do przeliczenia pokazanych tu próbek SGS LLR - będziesz wiedział ile warte są te MHz. Nie mówiąc już o tym jak wygląda płyta główna po kilku miesiącach takiej "stabilnej" pracy. Sam niestety odesłałem jedną MOBO do krainy niskich napięć bo phenom okazał się dla niej zbyt wymagający (bez OC). Tuż przed końcem gwarancji zaczęła zmieniać kolor a jak już termin minął to wybiła jej godzina. Przy okazji sprawdzałeś ile prądu on żre po takim OC? Coś mi podpowiada, że prawie tyle co dwa i5-4670K :P

Krzysiak

#28
Dobra to inaczej
Które pod projekty wykorzystują AVX ?
Wiem że na pewno
Sophie Germain i Proth Prime Search (PPS & PPSE)
bo niemiłosiernie grzeją proca temperatura podskakuje do 85 stopni

teraz liczę The Riesel Problem i temperatura  dochodzi do 65 stopni to samo było podczas wyścigu
nawet grałem dzisiaj a w tle liczyły się 3 próbki co jest nierealne przy włączonym liczeniu z AVX 5 minut i restart
Złota myśl
Mam wrażenie że wszyscy kręcą procki i testują ale: Nie do końca

Ja swojego też mogę pchnąć na 4,5 GHz przy bardzo niskim napięciu i przeliczył mi 6 próbek Seventeen or Bust bez restartu
ale jak tylko zacząłem liczyć Sophie Germain to się cuda dziać zaczęły nawet na 4,2GHz przy 1,25V  dla 1,26V jest pewna stabilność - Ale nie do końca

- ludzie stabilnością się chwalą dla 4,6GHz przy 1,2V - ta pewnie niech zapuszczą prawdziwy test np Prime to pogadamy  :boing:

I teraz da się jakoś wyłączyć AVX żeby zobaczyć czy szybkość liczenia jest warta stabilności i dodatkowych 20 stopni ?

Dodatkowo tradycyjne małe porównanie dla The Riesel Problem (Sieve)

i7-950 oc 4,1 GHz WinXP 32

472971963 349579684 13 Aug 2013 | 15:17:40 UTC 14 Aug 2013 | 10:57:36 UTC Completed and validated 2,488.70 2,485.95 120.14 The Riesel Problem (Sieve) v1.12
472965097 349576055 13 Aug 2013 | 14:57:46 UTC 14 Aug 2013 | 10:42:13 UTC Completed and validated 2,376.41 2,373.14 120.14 The Riesel Problem (Sieve) v1.12
472964233 349575731 13 Aug 2013 | 14:57:46 UTC 14 Aug 2013 | 10:24:09 UTC Completed and validated 2,382.20 2,379.22 120.14 The Riesel Problem (Sieve) v1.12
472959895 349573956 13 Aug 2013 | 14:46:48 UTC 14 Aug 2013 | 10:16:11 UTC Completed and validated 2,334.28 2,330.64 120.14 The Riesel Problem (Sieve) v1.12
472954299 349570950 13 Aug 2013 | 14:34:54 UTC 14 Aug 2013 | 10:04:37 UTC Completed and validated 2,358.27 2,355.08 120.14 The Riesel Problem (Sieve) v1.12
472952549 349570019 13 Aug 2013 | 14:29:26 UTC 14 Aug 2013 | 10:02:33 UTC Completed and validated 2,313.31 2,310.61 120.14 The Riesel Problem (Sieve) v1.12


Dla i5-4670K  oc 4,2GHz Win7 64
473250811 349731422 14 Aug 2013 | 1:51:25 UTC 14 Aug 2013 | 18:16:48 UTC Completed and validated 1,119.51 1,105.13 120.14 The Riesel Problem (Sieve) v1.12
473247404 349729518 14 Aug 2013 | 1:43:45 UTC 14 Aug 2013 | 17:58:06 UTC Completed and validated 1,121.26 1,098.59 120.14 The Riesel Problem (Sieve) v1.12
473247334 349729483 14 Aug 2013 | 1:41:02 UTC 14 Aug 2013 | 17:58:06 UTC Completed and validated 1,123.40 1,099.04 120.14 The Riesel Problem (Sieve) v1.12
473243677 349727493 14 Aug 2013 | 1:33:26 UTC 14 Aug 2013 | 17:10:01 UTC Completed and validated 1,190.65 1,152.97 120.14 The Riesel Problem (Sieve) v1.12
473243325 349727318 14 Aug 2013 | 1:33:50 UTC 14 Aug 2013 | 17:39:24 UTC Completed and validated 1,143.25 1,113.39 120.14 The Riesel Problem (Sieve) v1.12
473239791 349725326 14 Aug 2013 | 1:25:50 UTC 14 Aug 2013 | 16:53:08 UTC Completed and validated 1,146.85 1,103.55 120.14 The Riesel Problem (Sieve) v1.12


Czyli też prawie 2x szybciej bez AVX a i chłodniej na CPU

Tak to wygląda na kopie działającym 20h żeby trochę wyścig nadrobić - w między czasie tłukłem czołgi w WOT  liczyły się 3 próbki słuchałem muzy z YouTube i siedziałem na FB (wszystko w tym samym czasie)
[smg id=10224 type=full align=center caption="1a"]


Jak wrócę zapuszczę Sophie Germain tak dla porównania 


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

stiven

AVX ma zastosowanie przy podprojektach LLR. Ostatnio udostępnili zdaje się ostatnią aplikację do podprojektu Genefer.
W sievie nie działa, przynajmniej na razie.

Nie wiem czy da się wyłączyć sprzętowo AVX ale z całą pewnością można użyć starszej wersji aplikacji i odpowiedniego konfiga. Nie wiem czy warto.

Odnośnie OC i testów to zgadzam się z Twoją opinią, że testy stabilności przeprowadzanie przez overclokerów mają się nijak do testów stabilności pod BOINCEM. Przy okazji z tego co kojarzę moje przygody z kręceniem to dla mnie wyznacznikiem jakości pracy był projekt rosetta. Wyjątkowo czuły na najdrobniejsze błędy. Nie wiem czy jest tak nadal bo był to rok 2007 czy 2008 i doszedłem wówczas do wniosku, że więcej korzyści widzę w pracy na fabrycznych ustawieniach. Obecnie wszystkie moje hosty mają OBNIŻONE napięcie na CPU przy zachowaniu taktowania.

Dario666

#30
Cytat: stiven w 11 Sierpień 2013, 01:01
Cytat: Dario666 w 10 Sierpień 2013, 20:12
Według prawideł, jak się kręci procesor to powinno się wyłączać Turbo Boost, bo powoduje on niestabilność przy wyższych częstotliwościach.

PS: Coś słabo się kręcą te Intele, ja mam Phenom II x4 rewizja 3, który idzie stabilnie na chłodzeniu powietrznym przy 4,6 GHz, a przecież to procesor sprzed ponad 2 lat.
Porównaj jakich czasów potrzebuje ten phenom do przeliczenia pokazanych tu próbek SGS LLR - będziesz wiedział ile warte są te MHz. Nie mówiąc już o tym jak wygląda płyta główna po kilku miesiącach takiej "stabilnej" pracy. Sam niestety odesłałem jedną MOBO do krainy niskich napięć bo phenom okazał się dla niej zbyt wymagający (bez OC). Tuż przed końcem gwarancji zaczęła zmieniać kolor a jak już termin minął to wybiła jej godzina. Przy okazji sprawdzałeś ile prądu on żre po takim OC? Coś mi podpowiada, że prawie tyle co dwa i5-4670K :P

Chodziło mi o sam zegar i to w znacznie starszym procesie produkcyjnym, a to ,że ma 2 razy dłuższe rejestry SIMD to już co innego.
Sprawdziłem pobór i wynosi około 300 W bez zewnętrzej grafiki :), więc się dużo nie pomyliłeś.

@Krzysiak: Co ty masz za cooler, że ten proc ci się tak poci. Ja mam przy tych 300W poboru temperaturę 62 stopnie. 85 stopni to już tragedia i możliwe, że ci procesor steppinguje i dlatego nie masz takiej wydajności. Z tego co pamiętam chyba nie można przekraczać 70-kilka stopni, bo system zabezpieczenia termicznego zaczyna WAITować rdzenie, by się wychłodziły. Nie dziwię się, że miałeś restarty systemu, bo pewnie rozgrzewałeś jeszcze inne elementy procesora jak "karta" graficzna i tego już było dla niego za wiele.

Nigdy nie można być na 100% pewnym, że proc podkręcony będzie stabilny. Wystarczy zadanie, które ostro korzysta np. z pamięci albo obciąża procesor na zmianę na 100% oraz 0% i sprzęt tego na dłuższą metę nie wytrzyma, więc wszystko się sypnie.

Krzysiak

 Dario666

1. punkt krytyczny przy prockach 4670k to 100 stopni po czym obniża się automatycznie wydajność
2. Problem z odprowadzaniem jest z powodowany tym że Intel zastosował BARDZO  :wth: cienkiej jakości pastę między krzemem a metalową czapką - ludzie nagminnie skalpują CPU wymieniają pastę zyskują nawet po 15 stopni
http://forums.anandtech.com/showpost.php?p=34053183&postcount=570
http://www.youtube.com/watch?v=Cd0zgaNnGA4

Sam się ostatnio zastanawiałem czy się nie pokusić na parę chwil dużej dawki adrenaliny

A co do samych funkij AVX po prostu ciekawi mnie ile się zyskuje ??


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

stiven

Jeszcze jedna sprawa.
Przy liczeniu TRP Sieve masz z automatu ok 1,7 raza szybciej na 64 bit systemie w stosunku do 32 bit.
Stąd różnice, które obserwujesz przy sieve. Przy LLR za przyspieszenie odpowiada AVX.

Krzysiak

Akurat też to doczytałem prze chwilą

No tak tylko zastanawia mnie dalej dlaczego CPU tak grzeje się przy Sophie Germain Prime Search (LLR)
a przy The Riesel Problem (LLR) jest o wiele chłodniej
Skąd aż taka różnica temperatur


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

mimeq

Cytat: Krzysiak_PL_GDA w 14 Sierpień 2013, 21:09
Dodatkowo tradycyjne małe porównanie dla The Riesel Problem (Sieve)

i7-950 oc 4,1 GHz WinXP 32

472971963 349579684 13 Aug 2013 | 15:17:40 UTC 14 Aug 2013 | 10:57:36 UTC Completed and validated 2,488.70 2,485.95 120.14 The Riesel Problem (Sieve) v1.12
472965097 349576055 13 Aug 2013 | 14:57:46 UTC 14 Aug 2013 | 10:42:13 UTC Completed and validated 2,376.41 2,373.14 120.14 The Riesel Problem (Sieve) v1.12
472964233 349575731 13 Aug 2013 | 14:57:46 UTC 14 Aug 2013 | 10:24:09 UTC Completed and validated 2,382.20 2,379.22 120.14 The Riesel Problem (Sieve) v1.12
472959895 349573956 13 Aug 2013 | 14:46:48 UTC 14 Aug 2013 | 10:16:11 UTC Completed and validated 2,334.28 2,330.64 120.14 The Riesel Problem (Sieve) v1.12
472954299 349570950 13 Aug 2013 | 14:34:54 UTC 14 Aug 2013 | 10:04:37 UTC Completed and validated 2,358.27 2,355.08 120.14 The Riesel Problem (Sieve) v1.12
472952549 349570019 13 Aug 2013 | 14:29:26 UTC 14 Aug 2013 | 10:02:33 UTC Completed and validated 2,313.31 2,310.61 120.14 The Riesel Problem (Sieve) v1.12


Dla i5-4670K  oc 4,2GHz Win7 64
473250811 349731422 14 Aug 2013 | 1:51:25 UTC 14 Aug 2013 | 18:16:48 UTC Completed and validated 1,119.51 1,105.13 120.14 The Riesel Problem (Sieve) v1.12
473247404 349729518 14 Aug 2013 | 1:43:45 UTC 14 Aug 2013 | 17:58:06 UTC Completed and validated 1,121.26 1,098.59 120.14 The Riesel Problem (Sieve) v1.12
473247334 349729483 14 Aug 2013 | 1:41:02 UTC 14 Aug 2013 | 17:58:06 UTC Completed and validated 1,123.40 1,099.04 120.14 The Riesel Problem (Sieve) v1.12
473243677 349727493 14 Aug 2013 | 1:33:26 UTC 14 Aug 2013 | 17:10:01 UTC Completed and validated 1,190.65 1,152.97 120.14 The Riesel Problem (Sieve) v1.12
473243325 349727318 14 Aug 2013 | 1:33:50 UTC 14 Aug 2013 | 17:39:24 UTC Completed and validated 1,143.25 1,113.39 120.14 The Riesel Problem (Sieve) v1.12
473239791 349725326 14 Aug 2013 | 1:25:50 UTC 14 Aug 2013 | 16:53:08 UTC Completed and validated 1,146.85 1,103.55 120.14 The Riesel Problem (Sieve) v1.12


Czyli też prawie 2x szybciej bez AVX a i chłodniej na CPU

Tak to wygląda na kopie działającym 20h żeby trochę wyścig nadrobić - w między czasie tłukłem czołgi w WOT  liczyły się 3 próbki słuchałem muzy z YouTube i siedziałem na FB (wszystko w tym samym czasie)


Musisz pamietac ze w tym przypadku roznica i to znaczna to system operacyjny. x64 ma przewage w tym przypadku nad x32 ~1,7x


stiven

TRP LLR i SGS LLR powinny grzać proca tak samo mocno. Przy TRP Sieve powinno być chłodniej ze względu na brak uzycia AVX.
Jeśli tak się nie dzieje to być może jakimś cudem TRP LLR liczysz na starszej wersji aplikacji. Upewnij się że masz najnowszą i wówczas powinna wykorzystywać AVX.

Dario666

Możliwe, że Sophie została tak zoptymalizowana, że prawie w tym procesorze trafia idealnie w zegar i procesor nie musi czekać tylko jedzie na maxa bez opóźnień. Ewentualnie wszystkie dane mieszczą jej się w cache'u i nie ma opóźnień w dostępie do nich.

Wiadomo, że LLR potrzebują dużo cache'u, a w twoim Intelu jest go niemało, więc możliwe, że Sophie tyle wystarza na większość danych. Trzeba by porównać inne komputery z procesorami serii i5-4.

Krzysiak

Jeszcze słów parę
Na początek wyniki dla Dla i5-4670K  oc 4,2GHz Win7 64

474347356 350366211 17 Aug 2013 | 6:33:45 UTC 17 Aug 2013 | 17:48:19 UTC Completed and validated 934.17 926.80 57.56 PPS (LLR) v6.22
474347344 350366199 17 Aug 2013 | 6:33:46 UTC 17 Aug 2013 | 17:49:11 UTC Completed and validated 943.46 939.77 57.56 PPS (LLR) v6.22
474345084 350364815 17 Aug 2013 | 6:33:45 UTC 17 Aug 2013 | 17:48:01 UTC Completed and validated 930.25 926.52 57.56 PPS (LLR) v6.22
474345052 350364783 17 Aug 2013 | 6:33:46 UTC 17 Aug 2013 | 17:48:45 UTC Completed and validated 937.43 933.93 57.56 PPS (LLR) v6.22
474216847 349400179 16 Aug 2013 | 14:24:35 UTC 17 Aug 2013 | 13:02:45 UTC Completed and validated 908.58 886.04 56.90 PPS (LLR) v6.22
474215879 348330842 16 Aug 2013 | 14:05:19 UTC 17 Aug 2013 | 9:04:17 UTC Completed and validated 934.92 910.39 56.31 PPS (LLR) v6.22
474211075 349399443 16 Aug 2013 | 14:25:45 UTC 17 Aug 2013 | 17:48:32 UTC Completed and validated 922.23 918.81 56.89 PPS (LLR) v6.22


A teraz jeszcze małe spostrzeżenia
komp chodził stabilnie 23 h
TYLKO
Musiałem przestrzegać pewnej zasady
Jak grałem do boinc wyłączony
Jak korzystałem z neta, filmy, youtube, gimp, radio to 50% mocy
Jak liczenie to nic innego oprócz radia z neta

A jak się zapomniałem i na 100% mocy w boinc włączyłem grę od razu przywitał mnie restart - dojechałem napięciem do 1,325V i dalej sobie odpuściłem

Więc albo mam tak kiepską sztukę albo dla AVX jest tak wymagający

Ma ktoś na forum 4670k lub 4770k i bawił się w OC
Bo na komputerowych forach trochę ludzie nie mogą zrozumieć o co z Boinc chodzi


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

mimeq

RK ma:

GenuineIntel
Intel(R) Core(TM) i7-4770K CPU @ 3.50GHz [Family 6 Model 60 Stepping 3]
(8 processors)


Ale czy bawil sie w OC nie mam pojecia ....


Dario666

A próbowałeś wykorzystać odpowiedznie tagi w w sekcji <options> cc_config.xml?

Cytat<exclusive_app> BOINC will suspend computing whenever the executable is running (e.g., a game). Multiple applications can be specified.
Warning: Do check your system for other applications with the same name. Since there will be no path used, any application with this name will suspend BOINC, not just the one you want (like a game).
<exclusive_gpu_app>
BOINC will suspend computing done on the GPU only whenever the specified executable is running. Multiple applications can be specified. One line per application.
Warning: Do check your system for other applications with the same name. Since there will be no path used, any application with this name will suspend BOINC, not just the one you want (like a game).