International Cat Day Challenge Primorial Prime Search (PRS) [CPU]

Zaczęty przez chr80♂°🛰�, 21 Lipiec 2024, 23:17

EDU Enthusiast

Widze ze ladnie wszystko idzie w gore.
*nie zadlugo mialem pierwsze miejsce hehe

SzaMoT_👀

#41
Dla wynajętych z Vast Gold 6138 CPU @ 2.00GHz, ustawienie 2 rdzenie na zadanie
Wygląda w miarę czasy ok, ale VPS po 1 zadaniu na rdzeń "biją na głowę"

AMD EPYC 9634 84-Core Processor ( 8 core ) Taktowanie stałe 2,225, 1 rdzeń na zadanie
1781599456 1131227770 8 Aug 2024 | 8:45:25 UTC 9 Aug 2024 | 0:31:23 UTC Completed and validated (1st) [Proof task] 42,058.46 41,513.70 10,987.08 Primorial (PRST) v1.00 (mt)
1781599240 1131227577 8 Aug 2024 | 8:33:32 UTC 9 Aug 2024 | 0:10:03 UTC Completed and validated (1st) [Proof task] 42,041.08 41,502.97 10,985.31 Primorial (PRST) v1.00 (mt)
1781595785 1131224585 8 Aug 2024 | 8:30:54 UTC 9 Aug 2024 | 0:06:39 UTC Completed and validated (1st) [Proof task] 42,071.86 41,520.17 10,979.78 Primorial (PRST) v1.00 (mt)
1781551973 1131187696 8 Aug 2024 | 8:31:38 UTC 9 Aug 2024 | 0:04:49 UTC Completed and validated (1st) [Proof task] 41,968.32 41,401.38 10,955.63 Primorial (PRST) v1.00 (mt)
1781351530 1131014751 5 Aug 2024 | 5:29:48 UTC 5 Aug 2024 | 8:53:40 UTC Completed and validated [Main task] 565.32 647.77 251.85 Primorial (PRST) v1.00 (mt)


Gold 6138 CPU @ 2.00GHz Taktowanie ~zmienne 2,6 GHz | 2 rdzenie na zadanie,
1782083569 1131139208 8 Aug 2024 | 14:35:18 UTC 9 Aug 2024 | 5:44:54 UTC Completed, waiting for validation (Proof task not available) 54,537.26 108,036.30 pending Primorial (PRST) v1.00 (mt)
1782083568 1131139207 8 Aug 2024 | 14:35:18 UTC 9 Aug 2024 | 5:40:48 UTC Completed, waiting for validation (Proof task not available) 54,290.24 107,569.80 pending Primorial (PRST) v1.00 (mt)
1781859341 1131446956 8 Aug 2024 | 14:35:18 UTC 9 Aug 2024 | 5:36:19 UTC Completed, waiting for validation (Proof task not available) 54,026.03 107,110.20 pending Primorial (PRST) v1.00 (mt)
1781836910 1131428279 8 Aug 2024 | 14:35:18 UTC 9 Aug 2024 | 5:31:10 UTC Completed, waiting for validation [Proof task] 53,720.20 106,484.50 pending Primorial (PRST) v1.00 (mt)
1781802560 1131399191 8 Aug 2024 | 14:35:18 UTC 9 Aug 2024 | 5:47:52 UTC Completed, waiting for validation (Proof task not available) 54,722.64 108,415.50 pending Primorial (PRST) v1.00 (mt)

>>> SKB@P VPS Składkowa inicjatywa dla wsparcia mocy obliczeniowej dla projektów <<<
>>> Obecnie liczone projekty - statystyki <<<

>>> Cel na ten rok - zdobyć kolejną gwiazdkę, poprawa kolorków


>>> Donate SKB@P VPS <<< >>> Badge by chr80♂°🛰� <<<
Rozpowszechnianie bez zgody autora surowo zabronione!, tylko osoby wspierające

EDU Enthusiast

ten gold 6138 jest w sumie taki sam jak moj gold 6154; ma tylko o wiele gorszy scaling avx-512 na taktowaniu.

https://en.wikichip.org/wiki/intel/xeon_gold/6138
1-4 cores aktywne avx-512 = 3.3GHz
5-8 cores aktywne avx-512 = 2.7GHz
9-12 cores aktywne avx-512 = 2.3GHz
13-16 cores aktywne avx512 = 2GHz
17-20 cores aktywne avx512 = 1.9GHz


sugerowal bym sprawdzic 4x1core or 2x2core  taskow na cpu
Zapewne bedzie o wiele lepiej liczyl jak taktowanie bedzie przynajmniej 2.7GHz kontra 1.9-2.3GHz


(tutaj moj 2 taski na 4 cores na cpu)
1781984768 1130767031 8 Aug 2024 | 5:25:59 UTC 8 Aug 2024 | 9:31:44 UTC Completed and validated (1st) [Proof task] 14,713.98 56,850.79 7,965.03 Primorial (PRST) v1.00 (mt)
1781982719 1131545662 8 Aug 2024 | 3:37:33 UTC 8 Aug 2024 | 3:42:43 UTC Completed and validated [Main task] 294.14 1,094.04 335.15 Primorial (PRST) v1.00 (mt)
1781982441 1131550453 8 Aug 2024 | 3:42:43 UTC 8 Aug 2024 | 3:48:52 UTC Completed and validated [Main task] 355.16 1,279.30 335.14 Primorial (PRST) v1.00 (mt)
1781982404 1130763581 8 Aug 2024 | 5:40:41 UTC 8 Aug 2024 | 9:46:23 UTC Completed and validated (1st) [Proof task] 14,709.99 56,827.63 7,962.29 Primorial (PRST) v1.00 (mt)
1781982397 1130762944 8 Aug 2024 | 3:48:52 UTC 8 Aug 2024 | 9:21:54 UTC Completed and validated (1st) [Proof task] 19,962.43 69,510.18 7,962.00 Primorial (PRST) v1.00 (mt)
1781961455 1131130528 8 Aug 2024 | 1:24:40 UTC 8 Aug 2024 | 7:33:06 UTC Completed and validated (1st) [Proof task] 22,073.90 78,132.77 10,701.51 Primorial (PRST) v1.00 (mt)

SzaMoT_👀

CytatZapewne bedzie o wiele lepiej liczyl jak taktowanie bedzie przynajmniej 2.7GHz kontra 1.9-2.3GHz

Mają ustawiony ten sam profil co x 2 EPYC AMD EPYC 7542 32-Core, ale mogę przestawić na 4 rdzenie dla zadania.
EPYC ma więcej L3 inych dodatkowych profili nie chce ustawiać wszystko robię przez komendy Boinccmd,
by ograniczyć ~50 CPU dla fizycznych rdzeni
ustawienia działają  globalnie
taktowania ma teraz ~2,7 GHz dla 2 rdzeni na zadanie tak pokazuje
watch -n 1 "cat /proc/cpuinfo | grep \"cpu MHz\""

>>> SKB@P VPS Składkowa inicjatywa dla wsparcia mocy obliczeniowej dla projektów <<<
>>> Obecnie liczone projekty - statystyki <<<

>>> Cel na ten rok - zdobyć kolejną gwiazdkę, poprawa kolorków


>>> Donate SKB@P VPS <<< >>> Badge by chr80♂°🛰� <<<
Rozpowszechnianie bez zgody autora surowo zabronione!, tylko osoby wspierające

SzaMoT_👀

watch -n 1 "cat /proc/cpuinfo | grep \"cpu MHz\""
nie wiem jak się przesuwa listę nie mieści się więcej na ekranie, by zobaczyć resztę 
cpu MHz         : 1000.013
cpu MHz         : 1899.999
cpu MHz         : 1899.999
cpu MHz         : 1899.998
cpu MHz         : 1899.907
cpu MHz         : 1900.008
cpu MHz         : 1900.000
cpu MHz         : 2700.213 aktywny
cpu MHz         : 1900.000
cpu MHz         : 1900.000
cpu MHz         : 1900.000
cpu MHz         : 1898.761
cpu MHz         : 1900.000
cpu MHz         : 1900.000
cpu MHz         : 2441.558 aktywny
cpu MHz         : 1900.000
cpu MHz         : 1900.014
cpu MHz         : 1900.000
cpu MHz         : 1900.852
cpu MHz         : 1899.999
cpu MHz         : 1899.198
cpu MHz         : 1899.652
cpu MHz         : 2300.000 aktywny
cpu MHz         : 1899.797
cpu MHz         : 1899.999
cpu MHz         : 1000.210
cpu MHz         : 1899.999
cpu MHz         : 1898.894
cpu MHz         : 1899.999
cpu MHz         : 1900.000
cpu MHz         : 1899.968
cpu MHz         : 2299.141 aktywny
cpu MHz         : 1900.000
cpu MHz         : 1901.314
cpu MHz         : 1900.000
cpu MHz         : 1900.000
cpu MHz         : 1900.001
cpu MHz         : 1900.000
cpu MHz         : 1899.999
cpu MHz         : 1901.784
cpu MHz         : 1001.182
cpu MHz         : 1900.154
cpu MHz         : 1899.742
cpu MHz         : 1900.000
cpu MHz         : 1900.000
cpu MHz         : 1900.001
cpu MHz         : 1899.136
cpu MHz         : 2700.000 akywny
cpu MHz         : 1901.100


>>> SKB@P VPS Składkowa inicjatywa dla wsparcia mocy obliczeniowej dla projektów <<<
>>> Obecnie liczone projekty - statystyki <<<

>>> Cel na ten rok - zdobyć kolejną gwiazdkę, poprawa kolorków


>>> Donate SKB@P VPS <<< >>> Badge by chr80♂°🛰� <<<
Rozpowszechnianie bez zgody autora surowo zabronione!, tylko osoby wspierające

chr80♂°🛰�

#45
Sześć osób z naszej drużyny uczestniczy w wyzwaniu.

Po ile rdzeni i ile zadań ustawić?
na:
1. 2x E5-2696 v2 - 24C/48T
2. i9-7980XE - 18C/36T

Z tego co znalazłem to zadanie potrzebuje około 15 MB z chache L3:
Aby oszacować, ile pamięci cache L3 procesora używa to zadanie, musimy wziąć pod uwagę następujące informacje z komunikatu stderr:

FFT length: ,,Using Montgomery reduction AVX FFT length 2x480K"

To oznacza, że długość transformacji Fouriera (FFT) wynosi 2x480K, czyli 960 tysięcy punktów.

Obliczanie zapotrzebowania na pamięć
Transformacja FFT o długości 960K operuje na liczbach zespolonych (każdy punkt FFT to zazwyczaj dwie liczby: rzeczywista i urojona). W zależności od implementacji, każda liczba zespolona może zajmować od 8 do 16 bajtów (w przypadku podwójnej precyzji). Przyjmując najczęściej używany scenariusz, czyli 16 bajtów na liczbę zespoloną:

Zapotrzebowanie na jeden punkt FFT: 16 bajtów
Liczba punktów FFT: 960K (czyli 960 * 1024 = 983040 punktów)
Całkowite zapotrzebowanie na pamięć:
983040×16 B=15,728,640 B (około 15 MB)

SzaMoT_👀

#46
Cytat: chr80♂°🛰� w 09 Sierpień 2024, 15:27Po ile rdzeni i ile zadań ustawić?
Masz niestabilne, grzejące się hosty, znów będzie się restartował 
 
EDIT
czepiam się bo napisałeś ,  jakiś czas temu, "przestałem przejmować się temperaturami mam dobrą płytę dark ...."
tak z pamięci zacytowałem, warto trzymać niskie temperatury.

Chyba za jakiś czas kupię sobie jakiegoś xeona do ~30 zł, płytę główna, dużo ram pod LHC, z ciekawości jak tam wygląda
zarządzanie energią pod systemem Win, Linux, do tego jakąś używane GPU, ale typu 1650 w miarę oszczędne,
albo gdzieś tanio co ma 16 giga VRAM może Tesla P?
Nie mam doświadczenia w kupowaniu z chin, cło naliczają? formalności z tym związane,
kupię raczej w PL

Zaraz po zakupie płyty głównej wymienię kondensatory wszystkie, zasilacz może też być używany ale z dobrym certyfikatem, wymienię kondensatory profilaktycznie, cała płytę umyje KT 15.



>>> SKB@P VPS Składkowa inicjatywa dla wsparcia mocy obliczeniowej dla projektów <<<
>>> Obecnie liczone projekty - statystyki <<<

>>> Cel na ten rok - zdobyć kolejną gwiazdkę, poprawa kolorków


>>> Donate SKB@P VPS <<< >>> Badge by chr80♂°🛰� <<<
Rozpowszechnianie bez zgody autora surowo zabronione!, tylko osoby wspierające

chr80♂°🛰�

Cytat: SzaMoT_🪄 w 09 Sierpień 2024, 18:38
Cytat: chr80♂°🛰� w 09 Sierpień 2024, 15:27Po ile rdzeni i ile zadań ustawić?
Masz niestabilne, grzejące się hosty, znów będzie się restartował 

Czyli najlepiej je wyłączyć. Dzięki za radę.

SzaMoT_👀


>>> SKB@P VPS Składkowa inicjatywa dla wsparcia mocy obliczeniowej dla projektów <<<
>>> Obecnie liczone projekty - statystyki <<<

>>> Cel na ten rok - zdobyć kolejną gwiazdkę, poprawa kolorków


>>> Donate SKB@P VPS <<< >>> Badge by chr80♂°🛰� <<<
Rozpowszechnianie bez zgody autora surowo zabronione!, tylko osoby wspierające

SzaMoT_👀

Cytat: chr80♂°🛰� w 09 Sierpień 2024, 15:27Sześć osób z naszej drużyny uczestniczy w wyzwaniu.

Po ile rdzeni i ile zadań ustawić?
na:
1. 2x E5-2696 v2 - 24C/48T
2. i9-7980XE - 18C/36T

Z tego co znalazłem to zadanie potrzebuje około 15 MB z chache L3:
Aby oszacować, ile pamięci cache L3 procesora używa to zadanie, musimy wziąć pod uwagę następujące informacje z komunikatu stderr:

FFT length: ,,Using Montgomery reduction AVX FFT length 2x480K"

To oznacza, że długość transformacji Fouriera (FFT) wynosi 2x480K, czyli 960 tysięcy punktów.

Obliczanie zapotrzebowania na pamięć
Transformacja FFT o długości 960K operuje na liczbach zespolonych (każdy punkt FFT to zazwyczaj dwie liczby: rzeczywista i urojona). W zależności od implementacji, każda liczba zespolona może zajmować od 8 do 16 bajtów (w przypadku podwójnej precyzji). Przyjmując najczęściej używany scenariusz, czyli 16 bajtów na liczbę zespoloną:

Zapotrzebowanie na jeden punkt FFT: 16 bajtów
Liczba punktów FFT: 960K (czyli 960 * 1024 = 983040 punktów)
Całkowite zapotrzebowanie na pamięć:
983040×16 B=15,728,640 B (około 15 MB)

A na Discord PG, piszą nie wiadomo jak przebiega i ile tak faktycznie jest potrzebe do tej aplikacji PRT.
Może tobie udało się poprawnie wyliczyć, ale pamiętaj o tym czasie na synchronizację rdzeni która tym bardziej przemieszczające się wątki rdzenie tym chyba trudniej o synchronizację.
Kompromis

>>> SKB@P VPS Składkowa inicjatywa dla wsparcia mocy obliczeniowej dla projektów <<<
>>> Obecnie liczone projekty - statystyki <<<

>>> Cel na ten rok - zdobyć kolejną gwiazdkę, poprawa kolorków


>>> Donate SKB@P VPS <<< >>> Badge by chr80♂°🛰� <<<
Rozpowszechnianie bez zgody autora surowo zabronione!, tylko osoby wspierające

chr80♂°🛰�

Piszą też:
Istnieją dwie zmienne (odczyt-zapis) i dwie stałe (tylko do odczytu).
To jest prawdziwa FFT, więc rozmiar wynosi 8 * 480 kB dla każdej liczby.
4 * 8 * 480 = 15 MB.
Ale w zależności od przepustowości pamięci, 2 * 8 * 480 = 7,5 MB lub 3 * 8 * 480 = 11,25 MB może być wystarczające ze względu na dwie stałe.

SzaMoT_👀

Narzut dla MT PRS jest ogromny stąd mimo przekroczenia pamięci podręcznej CPU,
I tak warto liczyć na 1 rdzeniu fizycznym zadanie, jak GPU w mixe to luz do karmienia

>>> SKB@P VPS Składkowa inicjatywa dla wsparcia mocy obliczeniowej dla projektów <<<
>>> Obecnie liczone projekty - statystyki <<<

>>> Cel na ten rok - zdobyć kolejną gwiazdkę, poprawa kolorków


>>> Donate SKB@P VPS <<< >>> Badge by chr80♂°🛰� <<<
Rozpowszechnianie bez zgody autora surowo zabronione!, tylko osoby wspierające

SzaMoT_👀

Dla SKB@P VPS ustawiłem 1 rdzeń na zadanie dla tych z GPU a na EPYC to liczy cały czas po 1 zadaniu na rdzeń.
Taki bufor przyda się po koniec powinny w okolicach 1 doby na tych CPU z GPU
wyrobić się, ale to dla avx512 dla FMA będzie trochę ponad doba ~140 tys sekund.
teraz na 4-t jest gorzej niż na 2-t, porównamy na 1-t

>>> SKB@P VPS Składkowa inicjatywa dla wsparcia mocy obliczeniowej dla projektów <<<
>>> Obecnie liczone projekty - statystyki <<<

>>> Cel na ten rok - zdobyć kolejną gwiazdkę, poprawa kolorków


>>> Donate SKB@P VPS <<< >>> Badge by chr80♂°🛰� <<<
Rozpowszechnianie bez zgody autora surowo zabronione!, tylko osoby wspierające

chr80♂°🛰�

#53
Jest na siedmiu kamrat stiven oddał zadanie. 👍 😍
12    Romania    4 108 367.95        588
13    BOINC@Poland    3 180 176.30        471
14    BOINC@AUSTRALIA    3 122 187.25        517
15    SETI.USA    2 823 283.02        423

BOINC@AUSTRALIA - zaczyna deptać nam po piętach. 🤔
Jak na razie moje gorące hosty nie zaliczyły ani jednego restartu i oddały 29 zadań.
Ustawione 15 MB L3 cache do podziału na zadanie.

SzaMoT_👀

#54
CytatBOINC@AUSTRALIA - zaczyna deptać nam po piętach. 🤔

Nie zgodzę się z tym, zatrzyna nam deptać po piętach,  to my jako Drużyna zmiażdżyły 3 miesiące 📣🏆🪄?
Raz nie zawsze atak, nigdy nie było podium dla Drużyny nawet za czasów, wspólnej konsolidacji między drużynami
w PL, TERAZ mamy okazję kwestia 100/200 $ w połączeniu z GPU dla SKB@P VPS, który dla testu V100,
liczy All-Sky Gravitational Wave search on, Market na GPU 4 zadania na GPU, taki test jak wypadną V100 i czy
einsteinathome.org korzysta z FP64

Nasze w większości hosty liczą po 1 zadaniu na rdzeń w domach liczycie po parę
rdzeni na zadanie sugerując się FFT, ta apka jest nowa słabo współpracuje z MT,
synchronizacja między rdzeniami powoduje że niekiedy pozostałe przypisane rdzenie do zadania "czekają, nudzą się" KOMPROMIS.
Ustawiając 1 rdzeń na zadanie dla avx512 tak czy siak w 100k sekund zadanie się wykona a przeliczając na to np 4 rdzenie na zadanie ile będzie mielić? 20k? sekund?
raczej więcej 30k sekund to już jest strata.
Niech każdy sobie protestuje przetestuje, jest na to czas, ponad 3 dni do końca

>>> SKB@P VPS Składkowa inicjatywa dla wsparcia mocy obliczeniowej dla projektów <<<
>>> Obecnie liczone projekty - statystyki <<<

>>> Cel na ten rok - zdobyć kolejną gwiazdkę, poprawa kolorków


>>> Donate SKB@P VPS <<< >>> Badge by chr80♂°🛰� <<<
Rozpowszechnianie bez zgody autora surowo zabronione!, tylko osoby wspierające

chr80♂°🛰�

Już nam nie depczą - przeskoczyli nas.
Pytałem jak ustawić to napisałeś mi jakieś dywagacje. A teraz to już nie ważne.
Jeszcze zobaczymy się na mecie. 👋

SzaMoT_👀

#56
CytatPytałem jak ustawić to napisałeś mi jakieś dywagacje. A teraz to już nie ważne.
Może jakiś mam uraz odnośnie tego co wspomniałeś o temperaturach, że przestałeś się tym przejmować.
A szukałeś optymalnego ustawienia dla 18 rdzeni intel a ciągle, był niestabilny przy liczeniu LLR.

EDIT
Do wyścigu powoli wkraczają CPU 9950x, ale na razie nie u nas w drużynie, pewnie pojawią się za jakiś czas w vast,
GPU 5090 już się nie mogę doczekać ale to na przyszły rok do np, zdobycia koszulki w 1 dzień, jak znalazł i to na konto
SKB@ P VPS :) Jedno jednodniowy  "strzał" damy radę na spokojnie ale to są plany zagospodarowania $

>>> SKB@P VPS Składkowa inicjatywa dla wsparcia mocy obliczeniowej dla projektów <<<
>>> Obecnie liczone projekty - statystyki <<<

>>> Cel na ten rok - zdobyć kolejną gwiazdkę, poprawa kolorków


>>> Donate SKB@P VPS <<< >>> Badge by chr80♂°🛰� <<<
Rozpowszechnianie bez zgody autora surowo zabronione!, tylko osoby wspierające

chr80♂°🛰�

Całe życie się czymś martwiłem zupełnie niepotrzebnie.
Komputer to takie samo narzędzie jak młotek.
To on jest dla mnie nie ja dla niego.
Komputer z 2x E5-2696 v2 pracował 365/24/7 i dalej żyje w tym GTX Titan X i Tesla K80. I bezpieczniki nie wytrzymały a w gniazdku było 53°C.
Reszta sprzętu też niewiele mniej miała przepracowane.
Każdy ma dobry zasilacz, wentylatory w obudowie miedziane radiatory i Bóg wie co jeszcze.
A Teslę to chciałem kupić T4.
Wystarczy wyłączyć tryb turbo w biosie i problem temperatur znika.

SzaMoT_👀

#58
CytatKomputer to takie samo narzędzie jak młotek.
To on jest dla mnie nie ja dla niego.

"on jest dla Ciebie a Ty nie dla niego"
Oj 🧱

Powinniśmy zdobyć choć brązowy medal 🏅 na początek jak będzie np. Wyścig dla GPU to walka o najwyższym podium.
Chociaż raz
LoL
😂

EDIT
AUSTRALIAN  nas chowa na wykresie by za jakiś czas mieć linie pionową, ale pewnie czytają nasze forum,
Pozdrowienia dla BOINC@AUSTRALIA 👍

https://statsgr.id/custom_team_graph.php?challenge_id=2024_5&team0=8398&team1=132&team2=46&team3=343&team4=25&team5=2&team6=408

>>> SKB@P VPS Składkowa inicjatywa dla wsparcia mocy obliczeniowej dla projektów <<<
>>> Obecnie liczone projekty - statystyki <<<

>>> Cel na ten rok - zdobyć kolejną gwiazdkę, poprawa kolorków


>>> Donate SKB@P VPS <<< >>> Badge by chr80♂°🛰� <<<
Rozpowszechnianie bez zgody autora surowo zabronione!, tylko osoby wspierające

EDU Enthusiast

#59
https://www.primegrid.com/show_host_detail.php?hostid=1350817
Na ten weekend wlaczylem ten host, powinnien troche podbic statystki.

Niestety procek nie jest najlepszy na duzo aktywnych corow (tylko 150W) wiec zrobilem 4x4 na nim.
Ma podobne czasy jak moj Gold 6154. (tylko 0 jakiegokolwiek innego loadu - moje goldy 6154 jeszcze robia za kvm + media server)

Powinnien miec naprawde szybki avx512 a jakos tego nie widze. (Moze taktowanie za slabe nawet na 4x4)
Ogolem jestem naprawde rozczarowny tym avx512 powinnien byc naprawde szybszy od zwyklych prockow bez tego - ale jakos nie jest o tyle szybszy w tych specyficznych taskach. (Nie tak jak to kiedys bylo z sandy bridge i5-2500k i pierwsza odslona avx (gdzie 30m taski zmienily sie w 5minut).


(na ta chwile mam 14 pending po 8-10k punktow, ale widze podobna sytuacje u innych userow + - 5-20 taskow w pending)


// Mysle ze przygotuje 2xe5-2690v4 box, ktory aktualnie spoczywa -- mam nadzieje ze temp nie beda tragiczne jak tylko bedzie cpu szlo; Pelna para tylko rusze w zime jak bedzie zimno. A teraz rozgladam sie ze jakas karta graficzna ktora ma blower albo passive.

chr80♂°🛰�

Cytat: EDU Enthusiast w 10 Sierpień 2024, 12:37https://www.primegrid.com/show_host_detail.php?hostid=1350817
Na ten weekend wlaczylem ten host, powinnien troche podbic statystki.

Niestety procek nie jest najlepszy na duzo aktywnych corow (tylko 150W) wiec zrobilem 4x4 na nim.
Ma podobne czasy jak moj Gold 6154. (tylko 0 jakiegokolwiek innego loadu - moje goldy 6154 jeszcze robia za kvm + media server)

Powinnien miec naprawde szybki avx512 a jakos tego nie widze. (Moze taktowanie za slabe nawet na 4x4)
Ogolem jestem naprawde rozczarowny tym avx512 powinnien byc naprawde szybszy od zwyklych prockow bez tego - ale jakos nie jest o tyle szybszy w tych specyficznych taskach. (Nie tak jak to kiedys bylo z sandy bridge i5-2500k i pierwsza odslona avx (gdzie 30m taski zmienily sie w 5minut).


(na ta chwile mam 14 pending po 8-10k punktow, ale widze podobna sytuacje u innych userow + - 5-20 taskow w pending)


// Mysle ze przygotuje 2xe5-2690v4 box, ktory aktualnie spoczywa -- mam nadzieje ze temp nie beda tragiczne jak tylko bedzie cpu szlo; Pelna para tylko rusze w zime jak bedzie zimno. A teraz rozgladam sie ze jakas karta graficzna ktora ma blower albo passive.
Może termalnie wyjdzie lepiej po jednym rdzeniu na zadanie i cztery-sześć zadań na procesor.

A może i nawet osiem to podaje Techpowerup.
CytatSpeed Select Technology - Performance Profiles:
5416S (0) - 16 Active Cores @ 2 GHz 150 W
5416S (1) - 12 Active Cores @ 1.9 GHz 135 W
5416S (2) - 8 Active Cores @ 2.5 GHz 135 W

EDU Enthusiast

sprawdze na nastepnej tuze zadan.

(to akurat sa power profiles, ja uzywam dell power profile nie jest na tej liscie ~ poweredge r760, lecz musze powiedziec ze dell bardzo ograniczyl power na nowych cpu, spodziewam sie ze duze failure rates - wiedzieli co sie swieci)

chr80♂°🛰�


EDU Enthusiast

Juz konczy 4 corowe, teraz beda szly 2 corowe. (2 tury taskow, jako ze dodatkowo chodzily kilka godzin 2cx4 taski po zmianie. (spodziewam ze dam update za kilka godzin - czy oplaca sie czy nie.)

chr80♂°🛰�

#64
U mnie na i9-7980XE 18C/36T HT-wł, Turbo Boost-wył - idzie 8 zadań każde po jednym rdzeniu 6g:20min - trwa, a pozostało 21g:30 min.
CPU obsługuje następujące instrukcje AVX-512:
AVX-512 (AVX512 Foundation)   
AVX-512 (AVX512BW)   
AVX-512 (AVX512CD)   
AVX-512 (AVX512DQ)   
AVX-512 (AVX512VL)
Czyli jak Tomasz pisał nie ma co się sugerować ilością Cache L3.
Tu jest wytłumaczone jak to działa:
https://www.anandtech.com/show/11839/intel-core-i9-7980xe-and-core-i9-7960x-review/2

EDU Enthusiast

nie wiem ile jest warto juz porownywac czasy taskow (taski staja sie coraz dluzsze)
Z 15-20k sec na task na gold 6154 (bez zmian 4x4) zabiera juz 18-30k (4x4)

chr80♂°🛰�

Te czasy szacunkowe nie zawsze są zgodne z prawdą. Zrestartuj BM.

EDU Enthusiast

#67
Nie, to widac w taskach zaczynaja byc faktycznie dluzsze
(patrz "length"


20k
https://www.primegrid.com/result.php?resultid=1782428247

<core_client_version>8.0.2</core_client_version>
<![CDATA[
<stderr_txt>
PRST version 12.1.1450, GWnum library version 30.19, GMP library version 6.1.2
Using Montgomery reduction AVX-512 FFT length 2x480K, Pass1=768, Pass2=640, clm=4, 4 threads.
Fermat probabilistic test of 6132673#+1, a = 3, complexity = 8910900.
Gerbicz-Li check enabled, L2 = 410*337.
Saving 64 proof points.
Testing complete.
6132673#+1 compressed 64 points to 6 products, time: 14.3 s.
Done.
17:58:11 (7882): called boinc_finish(0)

</stderr_txt>
]]>

15k
https://www.primegrid.com/result.php?resultid=1781984768

<core_client_version>8.0.2</core_client_version>
<![CDATA[
<stderr_txt>
PRST version 12.1.1450, GWnum library version 30.19, GMP library version 6.1.2
Using Montgomery reduction AVX-512 FFT length 2x384K, Pass1=768, Pass2=512, clm=4, 4 threads.
Fermat probabilistic test of 5070421#+1, a = 3, complexity = 7375282.
Gerbicz-Li check enabled, L2 = 386*296.
Saving 64 proof points.
Testing complete.
5070421#+1 compressed 64 points to 6 products, time: 11.8 s.
Done.
04:31:16 (5800): called boinc_finish(0)

</stderr_txt>
]]>


btw. Juz 302k pending. (spodziewam sie ze proporcjonalnie tak samo jest u innych )

chr80♂°🛰�

#68
Jest nas dziewięciu.
Nagły przyrost punktów u Tomasza i przeskoczyliśmy Australijczyków.

1. SzaMoT-- 4 189 919.25--538
2. SKB@P VPS    1 778 701.03        309
3. EDU Enthusiasts of Digital Universe 1 337 223.72        206
4. chr80 369 046.43        59
5. necavi 229 751.29        29 
6. stiven  126 564.83        11 
7. Karol91  48 177.93        5 
8. vaclav_m 2 805.69        8
9. pszyklejony 386.24        1

Postęp punktacji w Naszej Drużynie:
https://statsgr.id/custom_user_graph.php?challenge_id=2024_5&user0=51995&user1=1578229&user2=60754&user3=1285727&user4=377687&user5=95657&user6=410981&user7=84780&user8=43374

My na tle innych dziewięciu drużyn:
https://statsgr.id/custom_team_graph.php?challenge_id=2024_5&team0=16&team1=1710&team2=499&team3=65&team4=394&team5=2&team6=25&team7=189&team8=1596&team9=41

SzaMoT_👀

Z vast dla SKB@P VPS
AMD Ryzen 9 7950X 16-Core
14 rdzeni dla PRS po 1 rdzeniu na zadanie Hz podane poniżej
do tego AP27 x 2 4090 (limit 450W, a widziałem też limit na 500W ustawiony)

Every 1.0s: cat /proc/cpuinfo | grep "cpu MHz"                                                                                                                dcc9207dcfc6: Mon Aug 12 03:23:13 2024

cpu MHz        : 4500.000
cpu MHz        : 3000.000
cpu MHz        : 3000.000
cpu MHz        : 5396.267 aktive
cpu MHz        : 5395.967 aktive
cpu MHz        : 5396.097 aktive
cpu MHz        : 5396.196 aktive
cpu MHz        : 5394.779 aktive
cpu MHz        : 5096.441 aktive
cpu MHz        : 5096.445 aktive
cpu MHz        : 5104.537 aktive
cpu MHz        : 5096.462 aktive
cpu MHz        : 5096.426 aktive
cpu MHz        : 5096.419 aktive
cpu MHz        : 5096.388 aktive
cpu MHz        : 3859.421
cpu MHz        : 5228.447 aktive
cpu MHz        : 5394.794 aktive
cpu MHz        : 3000.000
cpu MHz        : 4500.000
cpu MHz        : 3000.000
cpu MHz        : 3000.000
cpu MHz        : 3000.000
cpu MHz        : 4500.000
cpu MHz        : 5096.709 aktive
cpu MHz        : 3000.000
cpu MHz        : 4500.000
cpu MHz        : 3000.000
cpu MHz        : 3000.000
cpu MHz        : 3000.000
cpu MHz        : 3000.000
cpu MHz        : 4500.000


>>> SKB@P VPS Składkowa inicjatywa dla wsparcia mocy obliczeniowej dla projektów <<<
>>> Obecnie liczone projekty - statystyki <<<

>>> Cel na ten rok - zdobyć kolejną gwiazdkę, poprawa kolorków


>>> Donate SKB@P VPS <<< >>> Badge by chr80♂°🛰� <<<
Rozpowszechnianie bez zgody autora surowo zabronione!, tylko osoby wspierające

EDU Enthusiast


SzaMoT_👀

Cytat: EDU Enthusiast w 12 Sierpień 2024, 06:32hehe, to chyba nie dogonie skb@p vps :)
RACZEJ NIE
ma bufor około 80 zadań które za godzinę, dwie będzie uwalniać

>>> SKB@P VPS Składkowa inicjatywa dla wsparcia mocy obliczeniowej dla projektów <<<
>>> Obecnie liczone projekty - statystyki <<<

>>> Cel na ten rok - zdobyć kolejną gwiazdkę, poprawa kolorków


>>> Donate SKB@P VPS <<< >>> Badge by chr80♂°🛰� <<<
Rozpowszechnianie bez zgody autora surowo zabronione!, tylko osoby wspierające

EDU Enthusiast

#72
Widze, 1mln up, i drogi mln w pending. Bez szans.


Sapphire Rapids Host odpada dzis; (no new tasks) (spodziewam sie ze o polowe punktow mniej bede robil)

chr80♂°🛰�


EDU Enthusiast

Na taski wydaje mi sie ze nie wiecej niz 10 taskow jeszcze zrobie do konca wysciu.
*podlaczylem 5900x na 1x6cores moze cos extra pociagnie, ale temp sa zle podchodzi do 85'C z limitem 100W tdp.

SzaMoT_👀

Czytałem ostatnio na Discord, ktoś pisał, że ma EPYC ~96 CORE GEN.4,
nie pamiętam dokładnie jaki model, ale pisał, że ma 3,5GHz na wszystkich rdzeniach i ~350 W, Kolejne generacje EPYC podobno jeszcze lepiej będą wypadać pod względem wydajności, poboru W, jak by miał default Hz pewnie jeszcze mniej W.
Porównując to z liczbę rdzeni konsumenckich 7950X wychodzi duża na plus W ale pewnie cena zakupu takiego CPU, płyta główna, ramy ile to może kosztować obecnie, premiera była jakiś czas temu nie jest to nowy temat.

Mam jeszcze jedną rozkmine dla tych VPS co mamy w konfiguracji 8 core, tam jest CPU który ma 84 core
https://www.primegrid.com/show_host_detail.php?hostid=1346255
Ile ma rdzeni matryca?
84 : 12 = 7 core?
Ma na pewno 12 matryc według tych danych
https://www.techpowerup.com/cpu-specs/epyc-9634.c2932
Pytam bo nie mogę znaleźć ile ma matryca core, ile ma L3 KAŻDA.

Ale i tak budowa takiego "potwora" dla siebie w domu tylko dla BOINC chyba mało sensowna skoro można to wynająć w rozsądnej cenie, nie inwestując w sprzęt, który z czasem traci na wartości i po kilku, nastu latach kończy w muzeum.

>>> SKB@P VPS Składkowa inicjatywa dla wsparcia mocy obliczeniowej dla projektów <<<
>>> Obecnie liczone projekty - statystyki <<<

>>> Cel na ten rok - zdobyć kolejną gwiazdkę, poprawa kolorków


>>> Donate SKB@P VPS <<< >>> Badge by chr80♂°🛰� <<<
Rozpowszechnianie bez zgody autora surowo zabronione!, tylko osoby wspierające

EDU Enthusiast

Ile przypada corow na chiplet?
Nie wiadmo, w poprzednich generacjach amd uzywal mix 6-8 corow na chiplet (nawet w ryzenach). Spodziewam sie ze tak samo to wyglada.

Bezpiecznie uzyc 6corow na task na chiplet; ale moze to nie jest tak duzy problem.
L3 jest chyba sharowany przez chiplet


chr80♂°🛰�

Teraz nowy EPYC 9634 kosztuje 4200€ , a używany 3500€. A nówka wersja QS 1660€.
Jedna kość 4800 MTs 64GB 250€, obsługuje do 6TB na gniazdo.

Jest kit startowy za 3000 €
https://www.ebay.com/itm/395564286735
Kupić może by i kupił ale to zasilić plus rachunek za prąd, schłodzić to dopiero jest wyzwanie.
Jeszcze żeby w pełni wykorzystać potencjał 8 do 16 GPU.
Jedna Tesla H100 80GB około 36 000€ - to już kosmos.
Dlatego opłaca się wynająć jak dla nas.

EDU Enthusiast

#78
Na liczenie to bylaby tragedia - 300W cpu... zeby myslec o tym sugerowalbym wodne i chiller.
(cos w tym stylu https://www.youtube.com/watch?v=itQLBGQyTX8)
Jesli chodzi o compute to juz bardziej byloby warto i taniej miec konsumerskie gpu's z blockiem na wode podlaczone do takiego systemu.

Moze bys sie zamknal w 15k za 5x 4080ti/4090. (ten board wiecej nie pociagnie bez cudactwa jeszcze wiekszego)


Na dluzsza mete to wyszloby taniej niz wypozyczanie vps'ow. Lecz kto to bedzie budowal i pozniej sie z tym bawil... I po co to komu.
Jak sie poczeka kilka lat znowu bedzie "rewolucja" a systemy z tymi prockami spadna jeszcze bardziej.


W wypadku sprzetu, bardziej sie oplaca dogadac z kims kto ma serwery i placic mu za miejsce 2u - (i zakupic serwer) albo w jakis sposob dac mu oferte za jego idle - ilosc jego sprzetu by on mogl sobie policzyc ze mu sie wczesniej zwroci za sprzet. (taki serwer z cpu co ma 300W dalej by sie grzal mocno gdyby byl caly uzywany do liczenia - nawet jak masz datacenter, w mojej pracy ja walczylem ze wieloma systemami ktore mialy high-load i 250W cpus - poprostu wylaczaly sie albo downclockowaly sie do 1.4-1.9GHz z powodu temperatur gdzie nie mialy sensu.)

Co tez odsloni problemy z aplikacja boinca, ktora jest tragicznie outdated, na dzisiejsze wymogi i.e. temperatury, i wiele cpu poprawny task numa allocation scheduler.

Do czego nawiazuje, vpsy itp dalej beda sie przegrzewac, tylko ty nie bedziesz tego widzial.

Osobiscie nie mialbym problemu wynajac za darmo dla skb@p, 8c kvm'a do liczenia na moim systemie 2x gold 6154 (kontakt poprzez discord);  gozej z gpu - raczje karty ktore by mi odpowiadaly sa aktualnie za drogie (blower) ~ szkoda byloby mi wydac ta kase.
przykald:
https://www.ebay.com/itm/296483771528
https://www.ebay.com/itm/204894513613
https://www.ebay.com/itm/225781000654
https://www.ebay.com/itm/395578392529

(na tym systemie mam naprawde dobre chlodzenie pod loadem goldy 6154 sa na 50-60'C.) (inlet 20'C) a fany sa na 40% ustawione

chr80♂°🛰�