(https://i.imgur.com/yjPDlpw.jpeg)
Zapraszamy na następne wydarzenie "International Cat Day Challenge" które odbędzie się 8-13 sierpień 2024 na CPU.
Info na forum PG (https://www.primegrid.com/forum_thread.php?id=10605#173511)
Pierwotne wyszukiwanie główne (PRS)
n#±1 (n# jest iloczynem wszystkich liczb pierwszych mniejszych lub równych n)
International Cat Day Challenge
Obsługiwane platformy:
Windows: 32-bitowy, 64-bitowy
Linux: 64-bitowy
Wielowątkowość jest obsługiwana i jest zalecana.
Używa szybkich zadań dowodowych, więc nie są potrzebne żadne zadania podwójnej kontroli. Każdy jest ,,pierwszy"!
Termin: 4 dni (do 30 dni)
Ostatni średni czas procesora: 0:18:27
Wyniki:
Drużynowe (https://www.primegrid.com/challenge/2024_5/top_teams.html)
Użytkowników (https://www.primegrid.com/challenge/2024_5/top_users.html)
Aktualizacja wyników: 2024-09-13 - 22:41
Drużyn:
Team--punkty--liczba oddanych zadań
1 TeAm AnandTech 143 709 410.94 20 016
2 Antarctic Crunchers 119 431 333.20 14 997
3 Czech National Team 50 878 682.49 8 896
4 SETI.Germany 42 627 481.60 8 783
5 AMD Users 37 192 426.03 5 595
6 Aggie The Pew 29 340 306.53 4 310
7 Ukraine 24 002 006.19 3 797
8 [H]ard|OCP 16 945 247.35 2 277
9 The Knights Who Say Ni! 16 883 454.24 2 235
10 Planet 3DNow! 16 438 206.86 2 281
11 Romania 15 372 942.00 2 032
12 BOINC@MIXI 13 495 944.54 2 252
13 BOINC@Poland 12 672 784.98 1 710
14 BOINC@AUSTRALIA 10 239 302.15 1 560
28 The Scottish Boinc Team 2 774 575.54 321
Użytkowników:
user--punkty--liczba oddanych zadań
1. SzaMoT--5 892 517.50--732
2. SKB@P VPS--3 258 208.84--447
3. EDU Enthusiasts of Digital Universe--2 159 842.70--309
4. chr80--692 230.71--104
5. necavi--344 220.39--39
6. stiven--173 267.55--15
7. Karol91--70 055.73--8
8. pszyklejony--55 017.65--16
9. vaclav_m---27 423.91--40
(https://i.imgur.com/yjPDlpw.jpeg)
🍻🏆👍
EDIT
Nowe logo PG niedostępne?
Cytat: SzaMoT_👍😉 w 21 Lipiec 2024, 23:40(https://s9481.chomikuj.pl/ChomikImage.aspx?e=Yl2n0UtYszEZ3Rqb77MKE9PS2Op2koeUCAoiUMnJ3Pi1PJW0htvRL8_ohpsDJUwGZUWsTCwvuAlXYEeot77_bU7e2GMnYya-jpNvgeaUAFQ&pv=2)
🍻🏆👍
EDIT
Nowe logo PG niedostępne?
Już mam swoje. :D
Zapisujcie się na listę chętnych i przeprowadzajcie testy na komputerach.
Ostatnio było czternastu uczestników i około trzech udzielało się w wątku.
Na 1 rdzeniu zadanie
1778093938 1128263371 21 Jul 2024 | 13:54:59 UTC 21 Jul 2024 | 20:07:42 UTC Completed and validated (1st) [Proof task] 15,632.43 15,535.67 3,560.06 Primorial (PRST) v1.00 (mt)
1778043061 1128268517 21 Jul 2024 | 13:55:11 UTC 21 Jul 2024 | 20:08:00 UTC Completed and validated (1st) [Proof task] 15,638.14 15,544.51 3,566.15 Primorial (PRST) v1.00 (mt)
1778038621 1128264683 21 Jul 2024 | 13:55:11 UTC 21 Jul 2024 | 20:11:17 UTC Completed and validated (1st) [Proof task] 15,775.29 15,668.79 3,564.75 Primorial (PRST) v1.00 (mt)
1778036947 1128263117 21 Jul 2024 | 12:36:10 UTC 21 Jul 2024 | 18:44:43 UTC Completed and validated (1st) [Proof task] 15,560.92 15,459.38 3,557.19 Primorial (PRST) v1.00 (mt)
Dla 8 rdzeni zadanie
1778034790 1128261236 21 Jul 2024 | 8:40:16 UTC 21 Jul 2024 | 12:36:10 UTC Completed and validated (1st) [Proof task] 10,590.78 56,992.87 3,537.20 Primorial (PRST) v1.00 (mt)
EDIT:
"Zbyt duża ilość core na zadanie, rdzenie czekają na synchronizację "nic nie robiąc""
To jest stwierdzone prosto od administracji.
Inni używają przy CPU z mniejszą ilością pamięci podręcznej, wszystkich rdzeni z HT,
Czasy dla 16 wątków (8 rdzeni fizycznych) ~4000 sekund.
Zachęcają by nie przesadzać z ilością core na zadanie, każdy może sobie samemu obadać temat,
także pytanie kogoś ile rdzeni na zadanie mając na uwadze różnice w architekturach, trzeba samemu
Zostało 6 dni. Jeżeli będziesz brał udział pomrugaj oczami. :D
(https://media.tenor.com/IorawDaZf5sAAAAM/goofy-cat.gif)
Troche pomoge, narazie wyglada ze najlepiej robi taski po 2 taski po 8c. (2x Gold 6154)
// ale jeszcze musze przetestowac pod linuxem dobrze.
I nawet sie nie przegrzewa, a turbo clocki sa w dobrych miejscach.
(https://i.imgur.com/RofIuY7.png)
Aplikacja wygląda na bardzo słabo zoptymalizowaną. Mi przy kagańcu 80W 7950 boostował do 4,6, gdzie przy Asteroidach jest ~ 3,7
Cytat: tito w 02 Sierpień 2024, 14:30Aplikacja wygląda na bardzo słabo zoptymalizowaną. Mi przy kagańcu 80W 7950 boostował do 4,6, gdzie przy Asteroidach jest ~ 3,7
Zobacz czasy u innych na 7950, dla przykładu:
https://www.primegrid.com/show_host_detail.php?hostid=1170777
(2 threads) + aplikacja do wiązania rdzeni
Zadania urosły teraz obecnie ~7,7K kredyt
Jeśli chodzi o PRS, przy liczeniu na 1 rdzeniu zadanie wychodzi najlepiej ze wszystkich aplikacji (czas - kredyt, nie ma jeszcze premii),
nie są na tyle duże bym musiał na EPYC użyć więcej rdzeni na zadanie ale to się tyczy raczej serwerowych stacji.
Troche szybciej mi to idzie, i moze troche wiecej na 4 taski po 4 cory (jak zrobilem po 2 cory po 8 taskow zabieraly jakies 40% dluzej)
https://www.primegrid.com/show_host_detail.php?hostid=1164442
Od poczatku 8/2/2024 *14h zrobilem 86,385 pktow ten 7950X zrobil 121,228pktow
*(nie uwzglednialem pending)
Interesujace to chyba MAX czasu na task
u mnie 20.2k sek vs 7950x 19.9k sek
Po ile taskow robisz na raz na tym 7950x?
ps. Nie podoba mi sie jak boinc przydziela prace dla prockow, moze to dziala ok jak masz 1den procek - ale jest gozej jak masz wiecej... Czesto widze nie rowny load - a jak zaczne pinnowac cory dla dockera to sa inne problemy bo zle wykrywa ile ma cpu dostepne. Czesto widze cross-numa taski (gdzie byl przydzielony na corach u obydwowch prockach na raz.)
Cytatps. Nie podoba mi sie jak boinc przydziela prace dla prockow, moze to dziala ok jak masz 1den procek - ale jest gozej jak masz wiecej... Czesto widze nie rowny load - a jak zaczne pinnowac cory dla dockera to sa inne problemy bo zle wykrywa ile ma cpu dostepne. Czesto widze cross-numa taski (gdzie byl przydzielony na corach u obydwowch prockach na raz.)
Aplikacja do "wiązania" rdzeni - Process Lasso, AffinityWatcher, ~ +25% lepsze czasy
Cytat: SzaMoT_🪄 w 03 Sierpień 2024, 00:52Aplikacja do "wiązania" rdzeni - Process Lasso, AffinityWatcher, ~ +25% lepsze czasy
Tak, process lasso jest znakomity pod windowsem. Tutaj w dockreze linux.
A jak obsługiwać process lasso?
Tj, liczę 20+ WU aplikacji Asteroids. I co? jakieś opcje w lasso, czy samo uruchomienie powinno pomóc?
Cytat: tito w 06 Sierpień 2024, 13:40A jak obsługiwać process lasso?
Tj, liczę 20+ WU aplikacji Asteroids. I co? jakieś opcje w lasso, czy samo uruchomienie powinno pomóc?
Może ktoś tutaj podpowie co i jak, ja nie używam na co dzień, nie mam sprzętu, wiem że używają i chwalą.
Może jak nie tu, to wbij na Discord od projektów, tam będzie kilku co używają na co dzień, pokażą dokładnie co i jak.
Na forach też możesz pytać ale niektórzy bardziej preferują Discord, na forum rzadko zaglądają.
EDIT:
Mogę tylko wspomnieć o tym, że są tacy którzy liczą np. na połowię rdzeni z AVX512 LLR, a na pozostałych FMA apki które nie wspierają avx512,
wszystko jest wskazywane w aplikacji process lasso, które na jakich rdzeniach, by nie zmieniały miejsca (cały czas na w tym samym miejscu bez przemieszczania ,skakania tak zwanego). Ale szczegółów nie podpowiem teraz czytałem o tym nie raz ale sam jak wyżej pisałem nie miałem możliwości technicznych.
Jest również dedykowana dla LLR, (AffinityWatcher) nie wiem czy to na linuxa czy na win.
Odnośnie 7950x słyszałem o problemach z limitem mocy i z avx512 który jest wtedy "dławiony" nie działa w pełni,
zalecali zegary na stałe, bez boost, sam widzisz ze czasy dla PPS mimo taktowania ponad 4G masz około (5,481.74 - 5,928.38)
Na 7950X3D na zegarach ~4,3 czasy dla PPS:
1781630080 1131253926 6 Aug 2024 | 14:01:31 UTC 6 Aug 2024 | 15:00:13 UTC Completed and validated (1st) [Proof task] 3,325.48 3,320.04 745.52 PPS (LLR) v9.03 (mt)
1781627006 1131251436 6 Aug 2024 | 13:30:00 UTC 6 Aug 2024 | 14:29:01 UTC Completed and validated (1st) [Proof task] 3,330.12 3,324.47 745.52 PPS (LLR) v9.03 (mt)
1781627000 1131251430 6 Aug 2024 | 13:29:48 UTC 6 Aug 2024 | 14:29:01 UTC Completed and validated (1st) [Proof task] 3,332.19 3,325.74 745.52 PPS (LLR) v9.03 (mt)
1781626913 1131251351 6 Aug 2024 | 13:53:18 UTC 6 Aug 2024 | 14:48:00 UTC Completed and validated (1st) [Proof task] 3,131.47 3,125.85 583.20 PPS (LLR) v9.03 (mt)
1781625090 1131249871 6 Aug 2024 | 13:25:49 UTC 6 Aug 2024 | 14:25:18 UTC Completed and validated (1st) [Proof task] 3,325.07 3,318.83 745.51 PPS (LLR) v9.03 (mt)
Też można w ten sposób ustawić by mniej W pobrało ale już pisałeś dlaczego tak robisz, tylko piszą właśnie o problemach związanych przy dławieniu limitem mocy przy avx512
Cytat: tito w 06 Sierpień 2024, 13:40A jak obsługiwać process lasso?
Tj, liczę 20+ WU aplikacji Asteroids. I co? jakieś opcje w lasso, czy samo uruchomienie powinno pomóc?
lasso - tj. menedżer zadań -> szczegóły -> PPM-> ustaw koligację ?
Wspominałem już do autora wątku o podpięcie tematu do kalendarza by był na wierzchu, na głównej stronie forum
w wydarzeniach
Time until International Cat Day challenge:
1:15,55:28
DaysHoursMinSec
Szukanie tematu po działach mało wygodne
Cytat: SzaMoT_🪄 w 06 Sierpień 2024, 17:10Odnośnie 7950x słyszałem o problemach z limitem mocy i z avx512 który jest wtedy "dławiony" nie działa w pełni,
zalecali zegary na stałe, bez boost, sam widzisz ze czasy dla PPS mimo taktowania ponad 4G masz około (5,481.74 - 5,928.38)
Na 7950X3D na zegarach ~4,3 czasy dla PPS:
To ciekawe - całkiem możliwe, że to dlatego moje testy były o kant tyłka potłuc. Może kiedyś się przyjrzę tematowi ponownie.
Cytat: tito w 06 Sierpień 2024, 18:34Cytat: SzaMoT_🪄 w 06 Sierpień 2024, 17:10Odnośnie 7950x słyszałem o problemach z limitem mocy i z avx512 który jest wtedy "dławiony" nie działa w pełni,
zalecali zegary na stałe, bez boost, sam widzisz ze czasy dla PPS mimo taktowania ponad 4G masz około (5,481.74 - 5,928.38)
Na 7950X3D na zegarach ~4,3 czasy dla PPS:
To ciekawe - całkiem możliwe, że to dlatego moje testy były o kant tyłka potłuc. Może kiedyś się przyjrzę tematowi ponownie.
AVX-512 jest dławiony, bo jest ustawiony negative offset, a chłodzenie CPU nie wyrabia. Przynajmniej w intelu u mnie tak jest.
Cytat: chr80♂°🛰� w 06 Sierpień 2024, 18:38Cytat: tito w 06 Sierpień 2024, 18:34Cytat: SzaMoT_🪄 w 06 Sierpień 2024, 17:10Odnośnie 7950x słyszałem o problemach z limitem mocy i z avx512 który jest wtedy "dławiony" nie działa w pełni,
zalecali zegary na stałe, bez boost, sam widzisz ze czasy dla PPS mimo taktowania ponad 4G masz około (5,481.74 - 5,928.38)
Na 7950X3D na zegarach ~4,3 czasy dla PPS:
To ciekawe - całkiem możliwe, że to dlatego moje testy były o kant tyłka potłuc. Może kiedyś się przyjrzę tematowi ponownie.
AVX-512 jest dławiony, bo jest ustawiony negative offset, a chłodzenie CPU nie wyrabia. Przynajmniej w intelu u mnie tak jest.
tito pisał, Ze temperatury ma ok ~60 stopni? ale przy takim taktowaniu do tego LLR avx512, coś nie tak,
takie temperatury to dla Hz 2,2 - 2,4 takie są taktowania dla EPYC, ta sama generacja co 7950x tylko inny model,
12 matryc po 8 core pod jedną "czapką"
Cytattito pisał, Ze temperatury ma ok ~60 stopni? ale przy takim taktowaniu do tego LLR avx512, coś nie tak,
takie temperatury to dla Hz 2,2 - 2,4 takie są taktowania dla EPYC, ta sama generacja co 7950x tylko inny model,
12 matryc po 8 core pod jedną "czapką
Tu nie chodzi o temperatury - źle się wyraziłem.
U mnie na płycie EVGA 151-SX-E299-KR, X299 Dark, z procesorem Intel Core i9-7980XE.
Gdy robię OC lub UV. Rozwija się lista i pojawiają się dwie dodatkowe linijki/opcje:
AVX2 Negative Offset oraz
AVX3 Negative Offset
opisane są jako "AVX2/3 Negative Offset applied by Pcode OC mailbox read(0x1A)Write(0x18)"
Standardowo jest ustawione na wartość "3"
I gdy używany jest blok procesora odpowiedzialny za AVX taktowanie przy wartości "3" spada o 300 MHz, czyli 1 to 100 MHz. Gdy ustawimy zero to taktowanie nie spada.
Jeżeli ustawione jest prawidłowo napięcie, częstotliwość itd. komputer działa stabilnie.
U mnie ważne jest chłodzenie CPU jak i ustawienie obrotów wentylatorów na VRM.
Płyta killer, ale ma swoje ograniczenia.
A w AMD to może będzie nazywało się inaczej.
W AVX2/3 Negative Offset można ustawić wartość od zera w górę
Ponieważ zestawy instrukcji AVX i oprogramowanie, które ich używa, ładują żywe guano z procesora.
I wytwarzają ogromną ilość ciepła.
Więc musisz trochę zmniejszyć, albo nie będzie stabilny, będzie pobierał o wiele za duże napięcie i będzie jeszcze bardziej idiotycznie gorący niż, powiedzmy, 9900k.
Prowadzi to do dławienia termicznego. Gdy tylko rdzeń otrzyma inne instrukcje, powróci do normalnej częstotliwości OC.
Tyle z moich doświadczeń z AVX.
@SzaMoT_🪄
https://en.wikichip.org/wiki/intel/core_i9/i9-7980xe
Tutaj masz w "Frequencies" offset *ilosc aktywnych cores ktore maja FMA pipes aktywne.
Jesli jedna lub 2 sa aktywne to taktuje sie po 3.5GHz, i pozniej tak jak widzisz jesli wiecej niz 12 corow na avx-512 jest aktywnych to frequency spada ponizej 3GHz.
(https://i.imgur.com/EHpFDkC.png)
Personalnie bym sugerowal droga generacje (ale jeszcze jest droga) *o wiele mniej traci Hz przy wiekszym loadzie avx-512 i taktowanie pamieci idzie z 2666MHz do 2933MHz. (performance per core moze minimalnie lepszy.)
Skylake generacja ma 2 FMA AVX-512 units na core, Ryzen 7950x ma 2 FMA-256bit units na core ktore robia jeden AVX512.
(Lecz oczywiscie 7950x jest dalej szybszy, nie duzo ale dalej szybszy w avx-512)
offtopic
Jeszcze sie nie zaczal challange, a ja juz prawie wbilem 1mln w tym subprojekcie.
(https://i.imgur.com/fJMaG4f.png)
Luzem bez nagrzewania sie liczy avx-512.
@chr80♂°🛰�
Poproszę o dodanie do kalendarza, szukanie łatwiejsze jak wątek na jeden klik.
Tym samym osoby widzi to na głównej stronie forum przed wyzwaniem, w trakcie wyzwania.
Dziękuję
Cytat: SzaMoT_🪄 w 07 Sierpień 2024, 19:51@chr80♂°🛰�
Poproszę o dodanie do kalendarza, szukanie łatwiejsze jak wątek na jeden klik.
Tym samym osoby widzi to na głównej stronie forum przed wyzwaniem, w trakcie wyzwania.
Dziękuję
Zrobione. Proszę.
Każdy może dodać do kalendarza ty również.
Cytat: chr80♂°🛰� w 07 Sierpień 2024, 20:33Cytat: SzaMoT_🪄 w 07 Sierpień 2024, 19:51@chr80♂°🛰�
Poproszę o dodanie do kalendarza, szukanie łatwiejsze jak wątek na jeden klik.
Tym samym osoby widzi to na głównej stronie forum przed wyzwaniem, w trakcie wyzwania.
Dziękuję
Zrobione. Proszę.
Każdy może dodać do kalendarza ty również.
Zasada jest taka, że tylko autor danego wątku lub moderator/administrator
Innych nie swoich wątków bez uprawnień nie dodasz do kalendarza
Cytat: SzaMoT_🪄 w 07 Sierpień 2024, 20:56Cytat: chr80♂°🛰� w 07 Sierpień 2024, 20:33Cytat: SzaMoT_🪄 w 07 Sierpień 2024, 19:51@chr80♂°🛰�
Poproszę o dodanie do kalendarza, szukanie łatwiejsze jak wątek na jeden klik.
Tym samym osoby widzi to na głównej stronie forum przed wyzwaniem, w trakcie wyzwania.
Dziękuję
Zrobione. Proszę.
Każdy może dodać do kalendarza ty również.
Zasada jest taka, że tylko autor danego wątku lub moderator/administrator
Innych nie swoich wątków bez uprawnień nie dodasz do kalendarza
Ciekawe.
https://boincatpoland.org/smf/index.php?topic=11923.0 (https://boincatpoland.org/smf/index.php?topic=11923.0)
https://boincatpoland.org/smf/index.php?action=calendar (https://boincatpoland.org/smf/index.php?action=calendar)
Cytat: chr80♂°🛰� w 07 Sierpień 2024, 20:33Cytat: SzaMoT_🪄 w 07 Sierpień 2024, 19:51@chr80♂°🛰�
Poproszę o dodanie do kalendarza, szukanie łatwiejsze jak wątek na jeden klik.
Tym samym osoby widzi to na głównej stronie forum przed wyzwaniem, w trakcie wyzwania.
Dziękuję
Zrobione. Proszę.
Każdy może dodać do kalendarza ty również.
Nastąpiło małe nieporozumienie kiedyś nie można było dodać istniejącego wątku do kalendarza, tylko przy zakładaniu nowego,
teraz można w ostatnim poście jest klik dodaj do kalendarza tylko w ostatnim poscie
Cytat: SzaMoT_🪄 w 07 Sierpień 2024, 23:25Cytat: chr80♂°🛰� w 07 Sierpień 2024, 20:33Cytat: SzaMoT_🪄 w 07 Sierpień 2024, 19:51@chr80♂°🛰�
Poproszę o dodanie do kalendarza, szukanie łatwiejsze jak wątek na jeden klik.
Tym samym osoby widzi to na głównej stronie forum przed wyzwaniem, w trakcie wyzwania.
Dziękuję
Zrobione. Proszę.
Każdy może dodać do kalendarza ty również.
Nastąpiło małe nieporozumienie kiedyś nie można było dodać istniejącego wątku do kalendarza, tylko przy zakładaniu nowego,
teraz można w ostatnim poście jest klik dodaj do kalendarza tylko w ostatnim poscie
"Odnośnik do kalendarza" tak jest ta opcja w ostatnim poście wątku danego założyciela wątku, inni nie mają do nie swoich wątków tej możliwości, tylko autor może dać do kalendarza
Już ktoś oddał pierwsze zadanie z ustawieniem na t8 jego komputer ma na pokładzie AMD EPYC Genoa Engineering Samples. 🙄
https://www.primegrid.com/result.php?resultid=1782060454 (https://www.primegrid.com/result.php?resultid=1782060454)
Cytat: chr80♂°🛰� w 08 Sierpień 2024, 13:13Już ktoś oddał pierwsze zadanie z ustawieniem na t8 jego komputer ma na pokładzie AMD EPYC Genoa Engineering Samples. 🙄
https://www.primegrid.com/result.php?resultid=1782060454 (https://www.primegrid.com/result.php?resultid=1782060454)
Niektórzy zapomnieli, że teraz każdy dla LLR i nie tylko jest pierwszy,
8 rdzeni zmniejszy tylko przepustowość zadań na dobę, mniej policzy
Cytat"Odnośnik do kalendarza" tak jest ta opcja w ostatnim poście wątku danego założyciela wątku, inni nie mają do nie swoich wątków tej możliwości, tylko autor może dać do kalendarza
Było ciężko ale się udało. 😉
Jutro pozycja zespołu będzie lepiej wyglądać, szkoda, że teraz nie ma gonitwy na GPU ale w CPU
też chwilami jesteśmy mocni
Fajnie żeby każdy z nas miał jeden taki pod strzechą https://www.primegrid.com/show_host_detail.php?hostid=1315497 (https://www.primegrid.com/show_host_detail.php?hostid=1315497)
Kiedyś byliśmy w pierwszej dwudziestce i okolice drużyny Ukraine, Australia. A teraz mocno odskoczyli. Gdyby nie VPS to już w ogóle...
Dlatego cieszymy się z tego co mamy.
Teraz też jesteśmy z reguły w 1 >>> 20, zobacz klasyfikacje na ten rok na którym obecnie jestesmy.
2022 klasyfikacja drużyny 18 miejsce
2023 klasyfikacja drużyny 19 miejsce
2024 wstępna klasyfikacja ?
W tym obecnym wyzwaniu, ze wstępnych wyliczeń celował bym raczej do 1 >>> 10,
główny "motor" to SKB@P VPS
Cytat: SzaMoT_🪄 w 09 Sierpień 2024, 00:26W tym obecnym wyzwaniu, ze wstępnych wyliczeń celował bym raczej do 1 >>> 10,
główny "motor" to SKB@P VPS
Może jeszcze za szybko na werdykt, bo znajdujemy się w dolnej części tabeli ale jak doczłapiemy powyżej 20 pozycji to będzie sukces. Chyba że nastąpi znaczny wzrost wydajności i liczby ukończonych zadań w pozostałym czasie trwania konkursu.
Ty mi tu napisz proszę czy w Primorial Prime Search (PRS) HT lepiej mieć włączone czy nie?
Zadania od dłuższego czasu są w toku, ja mam po 1 rdzeniu na zadanie, SKB@P VPS na 16 rdzeniach EPYC też po 1 rdzeniu na zadanie,
plus do tego co teraz jest wynajęte tam jest ustawione po 2 rdzenie na zadanie
EDIT:
Dojdzie jeszcze 1 AMD Ryzen 9 7950X3D też będzie liczył po 1 rdzeniu na zadanie ale 14 rdzeni
Cytat: SzaMoT_🪄 w 09 Sierpień 2024, 00:52Zadania od dłuższego czasu są w toku, ja mam po 1 rdzeniu na zadanie, SKB@P VPS na 16 rdzeniach EPYC też po 1 rdzeniu na zadanie,
plus do tego co teraz jest wynajęte tam jest ustawione po 2 rdzenie na zadanie
EDIT:
Dojdzie jeszcze 1 AMD Ryzen 9 7950X3D też będzie liczył po 1 rdzeniu na zadanie ale 14 rdzeni
A co z Hyper-threading włączyć czy wyłączyć?
Dla swoich hostów?
Jak będziesz wiązał i przypisywał rdzenie dla aplikacji w celu nieprzemieszczania,
okolice ~50%, całości CPU, zależy co liczysz, jakie aplikacje.
Kwesta indywidualna są tacy co preferują i tacy którzy mają tylko pod systemem fizyczne rdzenie
Indywidualna - wspólna inicjatywa SKB@P VPS, GRG, pewnie nie lubi brać całą mocą na wyścig, ma inne priorytety, "maratończyk" cel 📣 🎯 🪄🤔 FIND >>> PRS >>> ?
https://statsgr.id/custom_user_graph.php?challenge_id=2024_5&user0=51995&user1=60754&user2=56804&user3=1285727&user4=1578229 (https://statsgr.id/custom_user_graph.php?challenge_id=2024_5&user0=51995&user1=60754&user2=56804&user3=1285727&user4=1578229)
Drużyny
https://statsgr.id/custom_team_graph.php?challenge_id=2024_5&team0=8398&team1=132&team2=46&team3=343&team4=25&team5=2&team6=408 (https://statsgr.id/custom_team_graph.php?challenge_id=2024_5&team0=8398&team1=132&team2=46&team3=343&team4=25&team5=2&team6=408)
Musimy się przybliżyć jak najbardziej do pomarańczowej lini wykresu,
pod koniec bufor będzie, na przekroczenie pomarańczowej link wykresu
Cytatznajdujemy się w dolnej części tabeli ale jak doczłapiemy powyżej 20 pozycji to będzie sukces. Chyba że nastąpi znaczny wzrost wydajności i liczby ukończonych zadań w pozostałym czasie trwania konkursu.
Wyraz "doczłapiemy" stał się nieaktualny i mało trafnie przewidywalny, wszystkie hosty mamy widoczne
Jeżeli utrzyma się taka dynamika wzrostu to wszystko możliwe. Ale inni też nie śpią.
Widze ze ladnie wszystko idzie w gore.
*nie zadlugo mialem pierwsze miejsce hehe
Dla wynajętych z Vast Gold 6138 CPU @ 2.00GHz, ustawienie 2 rdzenie na zadanie
Wygląda w miarę czasy ok, ale VPS po 1 zadaniu na rdzeń "biją na głowę"
AMD EPYC 9634 84-Core Processor ( 8 core ) Taktowanie stałe 2,225, 1 rdzeń na zadanie
1781599456 1131227770 8 Aug 2024 | 8:45:25 UTC 9 Aug 2024 | 0:31:23 UTC Completed and validated (1st) [Proof task] 42,058.46 41,513.70 10,987.08 Primorial (PRST) v1.00 (mt)
1781599240 1131227577 8 Aug 2024 | 8:33:32 UTC 9 Aug 2024 | 0:10:03 UTC Completed and validated (1st) [Proof task] 42,041.08 41,502.97 10,985.31 Primorial (PRST) v1.00 (mt)
1781595785 1131224585 8 Aug 2024 | 8:30:54 UTC 9 Aug 2024 | 0:06:39 UTC Completed and validated (1st) [Proof task] 42,071.86 41,520.17 10,979.78 Primorial (PRST) v1.00 (mt)
1781551973 1131187696 8 Aug 2024 | 8:31:38 UTC 9 Aug 2024 | 0:04:49 UTC Completed and validated (1st) [Proof task] 41,968.32 41,401.38 10,955.63 Primorial (PRST) v1.00 (mt)
1781351530 1131014751 5 Aug 2024 | 5:29:48 UTC 5 Aug 2024 | 8:53:40 UTC Completed and validated [Main task] 565.32 647.77 251.85 Primorial (PRST) v1.00 (mt)
Gold 6138 CPU @ 2.00GHz Taktowanie ~zmienne 2,6 GHz | 2 rdzenie na zadanie,
1782083569 1131139208 8 Aug 2024 | 14:35:18 UTC 9 Aug 2024 | 5:44:54 UTC Completed, waiting for validation (Proof task not available) 54,537.26 108,036.30 pending Primorial (PRST) v1.00 (mt)
1782083568 1131139207 8 Aug 2024 | 14:35:18 UTC 9 Aug 2024 | 5:40:48 UTC Completed, waiting for validation (Proof task not available) 54,290.24 107,569.80 pending Primorial (PRST) v1.00 (mt)
1781859341 1131446956 8 Aug 2024 | 14:35:18 UTC 9 Aug 2024 | 5:36:19 UTC Completed, waiting for validation (Proof task not available) 54,026.03 107,110.20 pending Primorial (PRST) v1.00 (mt)
1781836910 1131428279 8 Aug 2024 | 14:35:18 UTC 9 Aug 2024 | 5:31:10 UTC Completed, waiting for validation [Proof task] 53,720.20 106,484.50 pending Primorial (PRST) v1.00 (mt)
1781802560 1131399191 8 Aug 2024 | 14:35:18 UTC 9 Aug 2024 | 5:47:52 UTC Completed, waiting for validation (Proof task not available) 54,722.64 108,415.50 pending Primorial (PRST) v1.00 (mt)
ten gold 6138 jest w sumie taki sam jak moj gold 6154; ma tylko o wiele gorszy scaling avx-512 na taktowaniu.
https://en.wikichip.org/wiki/intel/xeon_gold/6138
1-4 cores aktywne avx-512 = 3.3GHz
5-8 cores aktywne avx-512 = 2.7GHz
9-12 cores aktywne avx-512 = 2.3GHz
13-16 cores aktywne avx512 = 2GHz
17-20 cores aktywne avx512 = 1.9GHz
sugerowal bym sprawdzic 4x1core or 2x2core taskow na cpu
Zapewne bedzie o wiele lepiej liczyl jak taktowanie bedzie przynajmniej 2.7GHz kontra 1.9-2.3GHz
(tutaj moj 2 taski na 4 cores na cpu)
1781984768 1130767031 8 Aug 2024 | 5:25:59 UTC 8 Aug 2024 | 9:31:44 UTC Completed and validated (1st) [Proof task] 14,713.98 56,850.79 7,965.03 Primorial (PRST) v1.00 (mt)
1781982719 1131545662 8 Aug 2024 | 3:37:33 UTC 8 Aug 2024 | 3:42:43 UTC Completed and validated [Main task] 294.14 1,094.04 335.15 Primorial (PRST) v1.00 (mt)
1781982441 1131550453 8 Aug 2024 | 3:42:43 UTC 8 Aug 2024 | 3:48:52 UTC Completed and validated [Main task] 355.16 1,279.30 335.14 Primorial (PRST) v1.00 (mt)
1781982404 1130763581 8 Aug 2024 | 5:40:41 UTC 8 Aug 2024 | 9:46:23 UTC Completed and validated (1st) [Proof task] 14,709.99 56,827.63 7,962.29 Primorial (PRST) v1.00 (mt)
1781982397 1130762944 8 Aug 2024 | 3:48:52 UTC 8 Aug 2024 | 9:21:54 UTC Completed and validated (1st) [Proof task] 19,962.43 69,510.18 7,962.00 Primorial (PRST) v1.00 (mt)
1781961455 1131130528 8 Aug 2024 | 1:24:40 UTC 8 Aug 2024 | 7:33:06 UTC Completed and validated (1st) [Proof task] 22,073.90 78,132.77 10,701.51 Primorial (PRST) v1.00 (mt)
CytatZapewne bedzie o wiele lepiej liczyl jak taktowanie bedzie przynajmniej 2.7GHz kontra 1.9-2.3GHz
Mają ustawiony ten sam profil co x 2 EPYC AMD EPYC 7542 32-Core, ale mogę przestawić na 4 rdzenie dla zadania.
EPYC ma więcej L3 inych dodatkowych profili nie chce ustawiać wszystko robię przez komendy Boinccmd,
by ograniczyć ~50 CPU dla fizycznych rdzeni
ustawienia działają globalnie
taktowania ma teraz ~2,7 GHz dla 2 rdzeni na zadanie tak pokazuje
watch -n 1 "cat /proc/cpuinfo | grep \"cpu MHz\""
watch -n 1 "cat /proc/cpuinfo | grep \"cpu MHz\""
nie wiem jak się przesuwa listę nie mieści się więcej na ekranie, by zobaczyć resztę
cpu MHz : 1000.013
cpu MHz : 1899.999
cpu MHz : 1899.999
cpu MHz : 1899.998
cpu MHz : 1899.907
cpu MHz : 1900.008
cpu MHz : 1900.000
cpu MHz : 2700.213 aktywny
cpu MHz : 1900.000
cpu MHz : 1900.000
cpu MHz : 1900.000
cpu MHz : 1898.761
cpu MHz : 1900.000
cpu MHz : 1900.000
cpu MHz : 2441.558 aktywny
cpu MHz : 1900.000
cpu MHz : 1900.014
cpu MHz : 1900.000
cpu MHz : 1900.852
cpu MHz : 1899.999
cpu MHz : 1899.198
cpu MHz : 1899.652
cpu MHz : 2300.000 aktywny
cpu MHz : 1899.797
cpu MHz : 1899.999
cpu MHz : 1000.210
cpu MHz : 1899.999
cpu MHz : 1898.894
cpu MHz : 1899.999
cpu MHz : 1900.000
cpu MHz : 1899.968
cpu MHz : 2299.141 aktywny
cpu MHz : 1900.000
cpu MHz : 1901.314
cpu MHz : 1900.000
cpu MHz : 1900.000
cpu MHz : 1900.001
cpu MHz : 1900.000
cpu MHz : 1899.999
cpu MHz : 1901.784
cpu MHz : 1001.182
cpu MHz : 1900.154
cpu MHz : 1899.742
cpu MHz : 1900.000
cpu MHz : 1900.000
cpu MHz : 1900.001
cpu MHz : 1899.136
cpu MHz : 2700.000 akywny
cpu MHz : 1901.100
Sześć osób z naszej drużyny uczestniczy w wyzwaniu.
Po ile rdzeni i ile zadań ustawić?
na:
1. 2x E5-2696 v2 - 24C/48T
2. i9-7980XE - 18C/36T
Z tego co znalazłem to zadanie potrzebuje około 15 MB z chache L3:
Aby oszacować, ile pamięci cache L3 procesora używa to zadanie, musimy wziąć pod uwagę następujące informacje z komunikatu stderr:
FFT length: ,,Using Montgomery reduction AVX FFT length 2x480K"
To oznacza, że długość transformacji Fouriera (FFT) wynosi 2x480K, czyli 960 tysięcy punktów.
Obliczanie zapotrzebowania na pamięć
Transformacja FFT o długości 960K operuje na liczbach zespolonych (każdy punkt FFT to zazwyczaj dwie liczby: rzeczywista i urojona). W zależności od implementacji, każda liczba zespolona może zajmować od 8 do 16 bajtów (w przypadku podwójnej precyzji). Przyjmując najczęściej używany scenariusz, czyli 16 bajtów na liczbę zespoloną:
Zapotrzebowanie na jeden punkt FFT: 16 bajtów
Liczba punktów FFT: 960K (czyli 960 * 1024 = 983040 punktów)
Całkowite zapotrzebowanie na pamięć:
983040×16 B=15,728,640 B (około 15 MB)
Cytat: chr80♂°🛰� w 09 Sierpień 2024, 15:27Po ile rdzeni i ile zadań ustawić?
Masz niestabilne, grzejące się hosty, znów będzie się restartował
EDIT
czepiam się bo napisałeś , jakiś czas temu, "przestałem przejmować się temperaturami mam dobrą płytę dark ...."
tak z pamięci zacytowałem, warto trzymać niskie temperatury.
Chyba za jakiś czas kupię sobie jakiegoś xeona do ~30 zł, płytę główna, dużo ram pod LHC, z ciekawości jak tam wygląda
zarządzanie energią pod systemem Win, Linux, do tego jakąś używane GPU, ale typu 1650 w miarę oszczędne,
albo gdzieś tanio co ma 16 giga VRAM może Tesla P?
Nie mam doświadczenia w kupowaniu z chin, cło naliczają? formalności z tym związane,
kupię raczej w PL
Zaraz po zakupie płyty głównej wymienię kondensatory wszystkie, zasilacz może też być używany ale z dobrym certyfikatem, wymienię kondensatory profilaktycznie, cała płytę umyje KT 15.
Cytat: SzaMoT_🪄 w 09 Sierpień 2024, 18:38Cytat: chr80♂°🛰� w 09 Sierpień 2024, 15:27Po ile rdzeni i ile zadań ustawić?
Masz niestabilne, grzejące się hosty, znów będzie się restartował
Czyli najlepiej je wyłączyć. Dzięki za radę.
Edycja w poprzednim poście
Cytat: chr80♂°🛰� w 09 Sierpień 2024, 15:27Sześć osób z naszej drużyny uczestniczy w wyzwaniu.
Po ile rdzeni i ile zadań ustawić?
na:
1. 2x E5-2696 v2 - 24C/48T
2. i9-7980XE - 18C/36T
Z tego co znalazłem to zadanie potrzebuje około 15 MB z chache L3:
Aby oszacować, ile pamięci cache L3 procesora używa to zadanie, musimy wziąć pod uwagę następujące informacje z komunikatu stderr:
FFT length: ,,Using Montgomery reduction AVX FFT length 2x480K"
To oznacza, że długość transformacji Fouriera (FFT) wynosi 2x480K, czyli 960 tysięcy punktów.
Obliczanie zapotrzebowania na pamięć
Transformacja FFT o długości 960K operuje na liczbach zespolonych (każdy punkt FFT to zazwyczaj dwie liczby: rzeczywista i urojona). W zależności od implementacji, każda liczba zespolona może zajmować od 8 do 16 bajtów (w przypadku podwójnej precyzji). Przyjmując najczęściej używany scenariusz, czyli 16 bajtów na liczbę zespoloną:
Zapotrzebowanie na jeden punkt FFT: 16 bajtów
Liczba punktów FFT: 960K (czyli 960 * 1024 = 983040 punktów)
Całkowite zapotrzebowanie na pamięć:
983040×16 B=15,728,640 B (około 15 MB)
A na Discord PG, piszą nie wiadomo jak przebiega i ile tak faktycznie jest potrzebe do tej aplikacji PRT.
Może tobie udało się poprawnie wyliczyć, ale pamiętaj o tym czasie na synchronizację rdzeni która tym bardziej przemieszczające się wątki rdzenie tym chyba trudniej o synchronizację.
Kompromis
Piszą też:
Istnieją dwie zmienne (odczyt-zapis) i dwie stałe (tylko do odczytu).
To jest prawdziwa FFT, więc rozmiar wynosi 8 * 480 kB dla każdej liczby.
4 * 8 * 480 = 15 MB.
Ale w zależności od przepustowości pamięci, 2 * 8 * 480 = 7,5 MB lub 3 * 8 * 480 = 11,25 MB może być wystarczające ze względu na dwie stałe.
Narzut dla MT PRS jest ogromny stąd mimo przekroczenia pamięci podręcznej CPU,
I tak warto liczyć na 1 rdzeniu fizycznym zadanie, jak GPU w mixe to luz do karmienia
Dla SKB@P VPS ustawiłem 1 rdzeń na zadanie dla tych z GPU a na EPYC to liczy cały czas po 1 zadaniu na rdzeń.
Taki bufor przyda się po koniec powinny w okolicach 1 doby na tych CPU z GPU
wyrobić się, ale to dla avx512 dla FMA będzie trochę ponad doba ~140 tys sekund.
teraz na 4-t jest gorzej niż na 2-t, porównamy na 1-t
Jest na siedmiu kamrat stiven oddał zadanie. 👍 😍
12 Romania 4 108 367.95 588
13 BOINC@Poland 3 180 176.30 471
14 BOINC@AUSTRALIA 3 122 187.25 517
15 SETI.USA 2 823 283.02 423
BOINC@AUSTRALIA - zaczyna deptać nam po piętach. 🤔
Jak na razie moje gorące hosty nie zaliczyły ani jednego restartu i oddały 29 zadań.
Ustawione 15 MB L3 cache do podziału na zadanie.
CytatBOINC@AUSTRALIA - zaczyna deptać nam po piętach. 🤔
Nie zgodzę się z tym, zatrzyna nam deptać po piętach, to my jako Drużyna zmiażdżyły 3 miesiące 📣🏆🪄?
Raz nie zawsze atak, nigdy nie było podium dla Drużyny nawet za czasów, wspólnej konsolidacji między drużynami
w PL, TERAZ mamy okazję kwestia 100/200 $ w połączeniu z GPU dla SKB@P VPS, który dla testu V100,
liczy All-Sky Gravitational Wave search on, Market na GPU 4 zadania na GPU, taki test jak wypadną V100 i czy
einsteinathome.org korzysta z FP64
Nasze w większości hosty liczą po 1 zadaniu na rdzeń w domach liczycie po parę
rdzeni na zadanie sugerując się FFT, ta apka jest nowa słabo współpracuje z MT,
synchronizacja między rdzeniami powoduje że niekiedy pozostałe przypisane rdzenie do zadania "czekają, nudzą się" KOMPROMIS.
Ustawiając 1 rdzeń na zadanie dla avx512 tak czy siak w 100k sekund zadanie się wykona a przeliczając na to np 4 rdzenie na zadanie ile będzie mielić? 20k? sekund?
raczej więcej 30k sekund to już jest strata.
Niech każdy sobie
protestuje przetestuje, jest na to czas, ponad 3 dni do końca
Już nam nie depczą - przeskoczyli nas.
Pytałem jak ustawić to napisałeś mi jakieś dywagacje. A teraz to już nie ważne.
Jeszcze zobaczymy się na mecie. 👋
CytatPytałem jak ustawić to napisałeś mi jakieś dywagacje. A teraz to już nie ważne.
Może jakiś mam uraz odnośnie tego co wspomniałeś o temperaturach, że przestałeś się tym przejmować.
A szukałeś optymalnego ustawienia dla 18 rdzeni intel a ciągle, był niestabilny przy liczeniu LLR.
EDIT
Do wyścigu powoli wkraczają CPU 9950x, ale na razie nie u nas w drużynie, pewnie pojawią się za jakiś czas w vast,
GPU 5090 już się nie mogę doczekać ale to na przyszły rok do np, zdobycia koszulki w 1 dzień, jak znalazł i to na konto
SKB@ P VPS :) Jedno jednodniowy "strzał" damy radę na spokojnie ale to są plany zagospodarowania $
Całe życie się czymś martwiłem zupełnie niepotrzebnie.
Komputer to takie samo narzędzie jak młotek.
To on jest dla mnie nie ja dla niego.
Komputer z 2x E5-2696 v2 pracował 365/24/7 i dalej żyje w tym GTX Titan X i Tesla K80. I bezpieczniki nie wytrzymały a w gniazdku było 53°C.
Reszta sprzętu też niewiele mniej miała przepracowane.
Każdy ma dobry zasilacz, wentylatory w obudowie miedziane radiatory i Bóg wie co jeszcze.
A Teslę to chciałem kupić T4.
Wystarczy wyłączyć tryb turbo w biosie i problem temperatur znika.
CytatKomputer to takie samo narzędzie jak młotek.
To on jest dla mnie nie ja dla niego.
"on jest dla Ciebie a Ty nie dla niego"
Oj 🧱
Powinniśmy zdobyć choć brązowy medal 🏅 na początek jak będzie np. Wyścig dla GPU to walka o najwyższym podium.
Chociaż raz
LoL
😂
EDIT
AUSTRALIAN nas chowa na wykresie by za jakiś czas mieć linie pionową, ale pewnie czytają nasze forum,
Pozdrowienia dla BOINC@AUSTRALIA 👍
https://statsgr.id/custom_team_graph.php?challenge_id=2024_5&team0=8398&team1=132&team2=46&team3=343&team4=25&team5=2&team6=408 (https://statsgr.id/custom_team_graph.php?challenge_id=2024_5&team0=8398&team1=132&team2=46&team3=343&team4=25&team5=2&team6=408)
https://www.primegrid.com/show_host_detail.php?hostid=1350817
Na ten weekend wlaczylem ten host, powinnien troche podbic statystki.
Niestety procek nie jest najlepszy na duzo aktywnych corow (tylko 150W) wiec zrobilem 4x4 na nim.
Ma podobne czasy jak moj Gold 6154. (tylko 0 jakiegokolwiek innego loadu - moje goldy 6154 jeszcze robia za kvm + media server)
Powinnien miec naprawde szybki avx512 a jakos tego nie widze. (Moze taktowanie za slabe nawet na 4x4)
Ogolem jestem naprawde rozczarowny tym avx512 powinnien byc naprawde szybszy od zwyklych prockow bez tego - ale jakos nie jest o tyle szybszy w tych specyficznych taskach. (Nie tak jak to kiedys bylo z sandy bridge i5-2500k i pierwsza odslona avx (gdzie 30m taski zmienily sie w 5minut).
(na ta chwile mam 14 pending po 8-10k punktow, ale widze podobna sytuacje u innych userow + - 5-20 taskow w pending)
// Mysle ze przygotuje 2xe5-2690v4 box, ktory aktualnie spoczywa -- mam nadzieje ze temp nie beda tragiczne jak tylko bedzie cpu szlo; Pelna para tylko rusze w zime jak bedzie zimno. A teraz rozgladam sie ze jakas karta graficzna ktora ma blower albo passive.
Cytat: EDU Enthusiast w 10 Sierpień 2024, 12:37https://www.primegrid.com/show_host_detail.php?hostid=1350817
Na ten weekend wlaczylem ten host, powinnien troche podbic statystki.
Niestety procek nie jest najlepszy na duzo aktywnych corow (tylko 150W) wiec zrobilem 4x4 na nim.
Ma podobne czasy jak moj Gold 6154. (tylko 0 jakiegokolwiek innego loadu - moje goldy 6154 jeszcze robia za kvm + media server)
Powinnien miec naprawde szybki avx512 a jakos tego nie widze. (Moze taktowanie za slabe nawet na 4x4)
Ogolem jestem naprawde rozczarowny tym avx512 powinnien byc naprawde szybszy od zwyklych prockow bez tego - ale jakos nie jest o tyle szybszy w tych specyficznych taskach. (Nie tak jak to kiedys bylo z sandy bridge i5-2500k i pierwsza odslona avx (gdzie 30m taski zmienily sie w 5minut).
(na ta chwile mam 14 pending po 8-10k punktow, ale widze podobna sytuacje u innych userow + - 5-20 taskow w pending)
// Mysle ze przygotuje 2xe5-2690v4 box, ktory aktualnie spoczywa -- mam nadzieje ze temp nie beda tragiczne jak tylko bedzie cpu szlo; Pelna para tylko rusze w zime jak bedzie zimno. A teraz rozgladam sie ze jakas karta graficzna ktora ma blower albo passive.
Może termalnie wyjdzie lepiej po jednym rdzeniu na zadanie i cztery-sześć zadań na procesor.
A może i nawet osiem to podaje Techpowerup.
CytatSpeed Select Technology - Performance Profiles:
5416S (0) - 16 Active Cores @ 2 GHz 150 W
5416S (1) - 12 Active Cores @ 1.9 GHz 135 W
5416S (2) - 8 Active Cores @ 2.5 GHz 135 W
sprawdze na nastepnej tuze zadan.
(to akurat sa power profiles, ja uzywam dell power profile nie jest na tej liscie ~ poweredge r760, lecz musze powiedziec ze dell bardzo ograniczyl power na nowych cpu, spodziewam sie ze duze failure rates - wiedzieli co sie swieci)
A może ustawić po dwa rdzenie na zadanie?
Juz konczy 4 corowe, teraz beda szly 2 corowe. (2 tury taskow, jako ze dodatkowo chodzily kilka godzin 2cx4 taski po zmianie. (spodziewam ze dam update za kilka godzin - czy oplaca sie czy nie.)
U mnie na i9-7980XE 18C/36T HT-wł, Turbo Boost-wył - idzie 8 zadań każde po jednym rdzeniu 6g:20min - trwa, a pozostało 21g:30 min.
CPU obsługuje następujące instrukcje AVX-512:
AVX-512 (AVX512 Foundation)
AVX-512 (AVX512BW)
AVX-512 (AVX512CD)
AVX-512 (AVX512DQ)
AVX-512 (AVX512VL)
Czyli jak Tomasz pisał nie ma co się sugerować ilością Cache L3.
Tu jest wytłumaczone jak to działa:
https://www.anandtech.com/show/11839/intel-core-i9-7980xe-and-core-i9-7960x-review/2 (https://www.anandtech.com/show/11839/intel-core-i9-7980xe-and-core-i9-7960x-review/2)
nie wiem ile jest warto juz porownywac czasy taskow (taski staja sie coraz dluzsze)
Z 15-20k sec na task na gold 6154 (bez zmian 4x4) zabiera juz 18-30k (4x4)
Te czasy szacunkowe nie zawsze są zgodne z prawdą. Zrestartuj BM.
Nie, to widac w taskach zaczynaja byc faktycznie dluzsze
(patrz "length"
20k
https://www.primegrid.com/result.php?resultid=1782428247
<core_client_version>8.0.2</core_client_version>
<![CDATA[
<stderr_txt>
PRST version 12.1.1450, GWnum library version 30.19, GMP library version 6.1.2
Using Montgomery reduction AVX-512 FFT length 2x480K, Pass1=768, Pass2=640, clm=4, 4 threads.
Fermat probabilistic test of 6132673#+1, a = 3, complexity = 8910900.
Gerbicz-Li check enabled, L2 = 410*337.
Saving 64 proof points.
Testing complete.
6132673#+1 compressed 64 points to 6 products, time: 14.3 s.
Done.
17:58:11 (7882): called boinc_finish(0)
</stderr_txt>
]]>
15k
https://www.primegrid.com/result.php?resultid=1781984768
<core_client_version>8.0.2</core_client_version>
<![CDATA[
<stderr_txt>
PRST version 12.1.1450, GWnum library version 30.19, GMP library version 6.1.2
Using Montgomery reduction AVX-512 FFT length 2x384K, Pass1=768, Pass2=512, clm=4, 4 threads.
Fermat probabilistic test of 5070421#+1, a = 3, complexity = 7375282.
Gerbicz-Li check enabled, L2 = 386*296.
Saving 64 proof points.
Testing complete.
5070421#+1 compressed 64 points to 6 products, time: 11.8 s.
Done.
04:31:16 (5800): called boinc_finish(0)
</stderr_txt>
]]>
btw. Juz 302k pending. (spodziewam sie ze proporcjonalnie tak samo jest u innych )
Jest nas dziewięciu.
Nagły przyrost punktów u Tomasza i przeskoczyliśmy Australijczyków.
1. SzaMoT-- 4 189 919.25--538
2. SKB@P VPS 1 778 701.03 309
3. EDU Enthusiasts of Digital Universe 1 337 223.72 206
4. chr80 369 046.43 59
5. necavi 229 751.29 29
6. stiven 126 564.83 11
7. Karol91 48 177.93 5
8. vaclav_m 2 805.69 8
9. pszyklejony 386.24 1
Postęp punktacji w Naszej Drużynie:
https://statsgr.id/custom_user_graph.php?challenge_id=2024_5&user0=51995&user1=1578229&user2=60754&user3=1285727&user4=377687&user5=95657&user6=410981&user7=84780&user8=43374 (https://statsgr.id/custom_user_graph.php?challenge_id=2024_5&user0=51995&user1=1578229&user2=60754&user3=1285727&user4=377687&user5=95657&user6=410981&user7=84780&user8=43374)
My na tle innych dziewięciu drużyn:
https://statsgr.id/custom_team_graph.php?challenge_id=2024_5&team0=16&team1=1710&team2=499&team3=65&team4=394&team5=2&team6=25&team7=189&team8=1596&team9=41 (https://statsgr.id/custom_team_graph.php?challenge_id=2024_5&team0=16&team1=1710&team2=499&team3=65&team4=394&team5=2&team6=25&team7=189&team8=1596&team9=41)
Z vast dla SKB@P VPS
AMD Ryzen 9 7950X 16-Core
14 rdzeni dla PRS po 1 rdzeniu na zadanie Hz podane poniżej
do tego AP27 x 2 4090 (limit 450W, a widziałem też limit na 500W ustawiony)
Every 1.0s: cat /proc/cpuinfo | grep "cpu MHz" dcc9207dcfc6: Mon Aug 12 03:23:13 2024
cpu MHz : 4500.000
cpu MHz : 3000.000
cpu MHz : 3000.000
cpu MHz : 5396.267 aktive
cpu MHz : 5395.967 aktive
cpu MHz : 5396.097 aktive
cpu MHz : 5396.196 aktive
cpu MHz : 5394.779 aktive
cpu MHz : 5096.441 aktive
cpu MHz : 5096.445 aktive
cpu MHz : 5104.537 aktive
cpu MHz : 5096.462 aktive
cpu MHz : 5096.426 aktive
cpu MHz : 5096.419 aktive
cpu MHz : 5096.388 aktive
cpu MHz : 3859.421
cpu MHz : 5228.447 aktive
cpu MHz : 5394.794 aktive
cpu MHz : 3000.000
cpu MHz : 4500.000
cpu MHz : 3000.000
cpu MHz : 3000.000
cpu MHz : 3000.000
cpu MHz : 4500.000
cpu MHz : 5096.709 aktive
cpu MHz : 3000.000
cpu MHz : 4500.000
cpu MHz : 3000.000
cpu MHz : 3000.000
cpu MHz : 3000.000
cpu MHz : 3000.000
cpu MHz : 4500.000
hehe, to chyba nie dogonie skb@p vps :)
Cytat: EDU Enthusiast w 12 Sierpień 2024, 06:32hehe, to chyba nie dogonie skb@p vps :)
RACZEJ NIE
ma bufor około 80 zadań które za godzinę, dwie będzie uwalniać
Widze, 1mln up, i drogi mln w pending. Bez szans.
Sapphire Rapids Host odpada dzis; (no new tasks) (spodziewam sie ze o polowe punktow mniej bede robil)
U mnie wskoczy jeszcze z około 20 zadań.
Na taski wydaje mi sie ze nie wiecej niz 10 taskow jeszcze zrobie do konca wysciu.
*podlaczylem 5900x na 1x6cores moze cos extra pociagnie, ale temp sa zle podchodzi do 85'C z limitem 100W tdp.
Czytałem ostatnio na Discord, ktoś pisał, że ma EPYC ~96 CORE GEN.4,
nie pamiętam dokładnie jaki model, ale pisał, że ma 3,5GHz na wszystkich rdzeniach i ~350 W, Kolejne generacje EPYC podobno jeszcze lepiej będą wypadać pod względem wydajności, poboru W, jak by miał default Hz pewnie jeszcze mniej W.
Porównując to z liczbę rdzeni konsumenckich 7950X wychodzi duża na plus W ale pewnie cena zakupu takiego CPU, płyta główna, ramy ile to może kosztować obecnie, premiera była jakiś czas temu nie jest to nowy temat.
Mam jeszcze jedną rozkmine dla tych VPS co mamy w konfiguracji 8 core, tam jest CPU który ma 84 core
https://www.primegrid.com/show_host_detail.php?hostid=1346255 (https://www.primegrid.com/show_host_detail.php?hostid=1346255)
Ile ma rdzeni matryca?
84 : 12 = 7 core?
Ma na pewno 12 matryc według tych danych
https://www.techpowerup.com/cpu-specs/epyc-9634.c2932
Pytam bo nie mogę znaleźć ile ma matryca core, ile ma L3 KAŻDA.
Ale i tak budowa takiego "potwora" dla siebie w domu tylko dla BOINC chyba mało sensowna skoro można to wynająć w rozsądnej cenie, nie inwestując w sprzęt, który z czasem traci na wartości i po kilku, nastu latach kończy w muzeum.
Ile przypada corow na chiplet?
Nie wiadmo, w poprzednich generacjach amd uzywal mix 6-8 corow na chiplet (nawet w ryzenach). Spodziewam sie ze tak samo to wyglada.
Bezpiecznie uzyc 6corow na task na chiplet; ale moze to nie jest tak duzy problem.
L3 jest chyba sharowany przez chiplet
(https://www.arrow.com/globalecs-media/wgzfhpw1/amd-zen-4.jpg)
(https://www.servethehome.com/wp-content/uploads/2022/11/AMD-EPYC-9004-Genoa-Zen-4-Cache-Hierarchy.jpg)
Teraz nowy EPYC 9634 kosztuje 4200€ , a używany 3500€. A nówka wersja QS 1660€.
Jedna kość 4800 MTs 64GB 250€, obsługuje do 6TB na gniazdo.
Jest kit startowy za 3000 €
https://www.ebay.com/itm/395564286735 (https://www.ebay.com/itm/395564286735)
Kupić może by i kupił ale to zasilić plus rachunek za prąd, schłodzić to dopiero jest wyzwanie.
Jeszcze żeby w pełni wykorzystać potencjał 8 do 16 GPU.
Jedna Tesla H100 80GB około 36 000€ - to już kosmos.
Dlatego opłaca się wynająć jak dla nas.
Na liczenie to bylaby tragedia - 300W cpu... zeby myslec o tym sugerowalbym wodne i chiller.
(cos w tym stylu https://www.youtube.com/watch?v=itQLBGQyTX8)
Jesli chodzi o compute to juz bardziej byloby warto i taniej miec konsumerskie gpu's z blockiem na wode podlaczone do takiego systemu.
Moze bys sie zamknal w 15k za 5x 4080ti/4090. (ten board wiecej nie pociagnie bez cudactwa jeszcze wiekszego)
Na dluzsza mete to wyszloby taniej niz wypozyczanie vps'ow. Lecz kto to bedzie budowal i pozniej sie z tym bawil... I po co to komu.
Jak sie poczeka kilka lat znowu bedzie "rewolucja" a systemy z tymi prockami spadna jeszcze bardziej.
W wypadku sprzetu, bardziej sie oplaca dogadac z kims kto ma serwery i placic mu za miejsce 2u - (i zakupic serwer) albo w jakis sposob dac mu oferte za jego idle - ilosc jego sprzetu by on mogl sobie policzyc ze mu sie wczesniej zwroci za sprzet. (taki serwer z cpu co ma 300W dalej by sie grzal mocno gdyby byl caly uzywany do liczenia - nawet jak masz datacenter, w mojej pracy ja walczylem ze wieloma systemami ktore mialy high-load i 250W cpus - poprostu wylaczaly sie albo downclockowaly sie do 1.4-1.9GHz z powodu temperatur gdzie nie mialy sensu.)
Co tez odsloni problemy z aplikacja boinca, ktora jest tragicznie outdated, na dzisiejsze wymogi i.e. temperatury, i wiele cpu poprawny task numa allocation scheduler.
Do czego nawiazuje, vpsy itp dalej beda sie przegrzewac, tylko ty nie bedziesz tego widzial.
Osobiscie nie mialbym problemu wynajac za darmo dla skb@p, 8c kvm'a do liczenia na moim systemie 2x gold 6154 (kontakt poprzez discord); gozej z gpu - raczje karty ktore by mi odpowiadaly sa aktualnie za drogie (blower) ~ szkoda byloby mi wydac ta kase.
przykald:
https://www.ebay.com/itm/296483771528
https://www.ebay.com/itm/204894513613
https://www.ebay.com/itm/225781000654
https://www.ebay.com/itm/395578392529
(na tym systemie mam naprawde dobre chlodzenie pod loadem goldy 6154 sa na 50-60'C.) (inlet 20'C) a fany sa na 40% ustawione
Mamy szansę na 12 pozycję.
Nie wiem, juz mi wciagu dnia 2x e5-2690v4 padl od temperatur (teraz niedawno zobaczylem ze sie przewrocil i nie wstal).
Raczej nie mamy szans na 12 pozycję, chyba, że ktoś ma dodatkowy bufor i czeka na odpowiednie moment do zrzutu?
Te CPU co mamy na VPS mają wodne chłodzenie, one są na bazowym Hz
CytatJedna Tesla H100 80GB około 36 000€ - to już kosmos.
V 100 już testowaliśmy dla GPUGrid tylko kolejnym razem trzeba zapodać jeszcze większy dysk dla 2 GPU około 128G,
H100 są też w vast tylko nie wiem czy warto i czy wydajnością zniweluje cenę w kwestii V100.
Każdy może sobie zobaczyć sam jakie są GPU w vast i dać ewentualnie znać które przetestować na koncie SKB@P VPS,
trzeba również wspomnieć o tym, że testy tego typu mają swoją określoną cenę, słabe klucze mogę podać jak co
Jeden H100 powinnien byc jak 3.5x V100's w fp64.
cena 4x V100 vs cena 1x H100
Ok to za jakiś czas przetestuje się, w vast jest sekundowe rozliczanie :)
Cytat: EDU Enthusiast w 13 Sierpień 2024, 03:09Osobiscie nie mialbym problemu wynajac za darmo dla skb@p, 8c kvm'a do liczenia na moim systemie 2x gold 6154 (kontakt poprzez discord); gozej z gpu - raczje karty ktore by mi odpowiadaly sa aktualnie za drogie (blower) ~ szkoda byloby mi wydac ta kase.
przykald:
https://www.ebay.com/itm/296483771528
https://www.ebay.com/itm/204894513613
https://www.ebay.com/itm/225781000654
https://www.ebay.com/itm/395578392529
(na tym systemie mam naprawde dobre chlodzenie pod loadem goldy 6154 sa na 50-60'C.) (inlet 20'C) a fany sa na 40% ustawione
Dla mnie w mieszkaniu GPU z chłodzeniem typu (blower) jest nie akceptowalne - ciśnienie akustyczne jak w profesjonalnej turbo suszarce do włosów. Wiem na podstawie
FirePro W8100 8GB i miałem z tym chłodzeniem GTX Titan X (Maxwell) ale W8100 pokonuje wszystkie w negatywnym sensie.
A nie lepiej jakaś NV Tesla.
Gratulacje dla wszystkich uczestników za osiągnięte wyniki! Analizując ostateczne wyniki w Primorial: International Cat Day Challenge, widzimy imponujące wyniki, szczególnie w pierwszej dziesiątce.
Nasz zespół, BOINC@Poland, uplasował się na 13. miejscu z wynikiem 12 672 784.98 punktów. To bardzo dobre miejsce, biorąc pod uwagę konkurencję i liczbę zespołów biorących udział w wyzwaniu.
13. miejsce oznacza, że BOINC@Poland znajduje się w górnej części rankingu, wyprzedzając wiele innych zespołów. To świadczy o dużej skuteczności w rozwiązywaniu zadań oraz dobrym zarządzaniu zasobami vide Tomasz nasz administrator B@P VPSa.
Zespół zakończył wyzwanie z liczbą 1 710 zadań, co pokazuje intensywność pracy w trakcie konkursu.
W dniach 22-29 września 2024 czeka nas następne wyzwanie siedmiodniowe Autumnal Equinox Challenge w podprojekcie GCW na CPU.
Również skupimy się w następnym wątku na zagadnieniach technicznych:
Jak przygotować sprzęt? Optymalizacja liczby rdzeni i zadań itd...
Oczekiwania i cele:
To wyzwanie będzie testować zarówno moc obliczeniową, jak i zdolność do efektywnego zarządzania zasobami. Mając na uwadze poprzednie wyniki, możecie dążyć do poprawy swojej pozycji w rankingu, zwłaszcza jeśli zoptymalizujecie ustawienia sprzętu zgodnie z wymaganiami projektu GCW.
Powodzenia w nadchodzącym wyzwaniu!
Wstępne klasyfikacje za rok 2024
Drużynowa 2024 (http://www.rechenaugust.de/boinc/2024_Challenge_Series_Current_Standings_Teams.html)
Klasyfikacja indywidualna 2024 (http://www.rechenaugust.de/boinc/2024_Challenge_Series_Current_Standings_Individuals.html)
Połączenia nie są szyfrowane do tych 2 linków
Cytat: chr80♂°🛰� w 13 Sierpień 2024, 22:35Dla mnie w mieszkaniu GPU z chłodzeniem typu (blower) jest nie akceptowalne - ciśnienie akustyczne jak w profesjonalnej turbo suszarce do włosów. Wiem na podstawie FirePro W8100 8GB i miałem z tym chłodzeniem GTX Titan X (Maxwell) ale W8100 pokonuje wszystkie w negatywnym sensie.
A nie lepiej jakaś NV Tesla.
Hehe, w moim przypadku to najlepsze chlodzenie, a o chalas sie nie martwie *kompy i tak siedza w swoim pomieszczeniu - w domu mam 0dB od serwerow.
Patrzalem na Volte/Tesle ale wydaje sie wastem miejsca.
https://www.ebay.com/itm/405121079815
(https://i.imgur.com/gRTDE4F.png)
(i musialbym dokupic passive gpu kit dla tego serwera, a za ta cene moglbym juz cos lepszego w fp32 kupic)
Ceny tesli ampere sa z kosmosu. Turing Tesla jest tragiczne 8.5TFlops fp32 najlepsza karta tej seri - praktycznie jest do niczego. Bardzo slaba.
https://www.techpowerup.com/gpu-specs/tesla-t10-16-gb.c4036
Tutaj link do kart ktore testowalem dla pracy (jest wykres na fp16-32-64:
https://docs.google.com/spreadsheets/d/1Dyz8ZPLFMZ0rHPfpzf0R5wlj6ALcipxHy2hYA7RmZYw/edit?usp=sharing