Przeprowadzam testy na komputerach przed nadchodzącymi wyzwaniami.

Zaczęty przez chr80♂°🛰�, 04 Wrzesień 2021, 23:20

chr80♂°🛰�

Martin Gardner's Birthday Challenge GCW-LLR (CPU), będzie 21-28 Październik 2021
Euler's Constant Challenge AP27 (CPU i GPU), będzie 23-26 Listopad 2021
Geminids Shower Challenge GFN-21, GFN-22, DYFL (GPU), będzie 7-17 Grudzień 2021


chr80♂°🛰�

GCW-LLR  :bad: Na wszystkich komputerach nie pójdzie - zawiesza komputer przy 35-40 %.
Reszta aplikacji ok.

SzaMoT

Cytat: chris80uppers w 06 Wrzesień 2021, 01:40
GCW-LLR  :bad: Na wszystkich komputerach nie pójdzie - zawiesza komputer przy 35-40 %.
Reszta aplikacji ok.
A to spełniasz?
CytatTa aplikacja zużywa dużo pamięci. Wymaga około 1,5 GB przestrzeni wymiany/pamięci wirtualnej oraz 750 MB pamięci fizycznej.

chr80♂°🛰�

Cytat: Tomasz ♪ Kaczmarek w 06 Wrzesień 2021, 12:53
Cytat: chris80uppers w 06 Wrzesień 2021, 01:40
GCW-LLR  :bad: Na wszystkich komputerach nie pójdzie - zawiesza komputer przy 35-40 %.
Reszta aplikacji ok.
A to spełniasz?
CytatTa aplikacja zużywa dużo pamięci. Wymaga około 1,5 GB przestrzeni wymiany/pamięci wirtualnej oraz 750 MB pamięci fizycznej.
Trzy komputery po kolei 64, 128, 64 GB RAM - po 2-4 zadania na raz. Chyba, że błąd pamięci. A w dzienniku zdarzeń nic niepokojącego.

SzaMoT

A przestrzeń wymiany na dysku? 1,5 GB na zadanie potrzeba

stiven

Potwierdzam. Upewnij się, że masz odpowiednio dużo wirtualnej. Najlepiej ustawionej na sztywno a nie przydzielanej przez system.
Błędy widzę tylko na tym kompie:
http://www.primegrid.com/show_host_detail.php?hostid=1090559
na tym:
http://www.primegrid.com/show_host_detail.php?hostid=1014393
masz je jako "Aborted by user" a w szczegółach "EXIT_ABORTED_VIA_GUI" czyli wygląda jak przez naciśnięcie "Przerwij" w kliencie.
Aż z ciekawości sam przeliczę kilka próbek aby zobaczyć jak to u mnie działa. Dawno nie liczyłem GCW.

chr80♂°🛰�

Cytat: stiven w 07 Wrzesień 2021, 23:43
Potwierdzam. Upewnij się, że masz odpowiednio dużo wirtualnej. Najlepiej ustawionej na sztywno a nie przydzielanej przez system.
Błędy widzę tylko na tym kompie:
http://www.primegrid.com/show_host_detail.php?hostid=1090559
na tym:
http://www.primegrid.com/show_host_detail.php?hostid=1014393
masz je jako "Aborted by user" a w szczegółach "EXIT_ABORTED_VIA_GUI" czyli wygląda jak przez naciśnięcie "Przerwij" w kliencie.
Aż z ciekawości sam przeliczę kilka próbek aby zobaczyć jak to u mnie działa. Dawno nie liczyłem GCW.
To wszystko wyjaśnia. Wydawało mi się, że komputer który ma 64-128GB RAM nie potrzebuje pamięci wirtualnej. :o

Krzysiak

W teorii nie, ale jest dużo programów które nie potrafią bez niej żyć :)

Zrób sobie ramdisk i tam umieść pamięć wirtualną


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

stiven

Sprawdzam na linuxie. 6 zadań a wirtualki dałem 2GB. Liczy już 1d19h.

chr80♂°🛰�

Cytat: Krzysiak w 10 Wrzesień 2021, 22:17
W teorii nie, ale jest dużo programów które nie potrafią bez niej żyć :)

Zrób sobie ramdisk i tam umieść pamięć wirtualną
Już tak robiłem, ram dysk strasznie spowalnia działanie systemu-responsywność. Gdy nadarzy się okazja to zakupię dysk ssd do tego celu.
A na czas wyścigu jakoś przeboleję to i ustawię to na którymś z dysków hdd.
Ostatnio swap file w windows używałem w 2007 gdy dokupiłem 16GB to myślałem, że się od tego uwolnię, bo każdy komputer miał minimum 16GB RAMu.
Chociaż się wyjaśniło czym mogły być spowodowane nieoczekiwane błędy  :fright: na maszynach z windows'em. Bo do linuksów ciężko mi przekonać resztę domowników.

chr80♂°🛰�

Cytat: stiven w 11 Wrzesień 2021, 10:53
Sprawdzam na linuxie. 6 zadań a wirtualki dałem 2GB. Liczy już 1d19h.

A nie trzeba na każde zadanie 1.5 GB wirtualnej czyli w twoim przypadku 9GB?

Generalized Cullen/Woodall Prime Search LLR (GCW)
n·bn±1 for b=(13, 25, 29, 47, 49, 55, 69, 73, 101, 109, 121)

This app uses a lot of memory. It requires about 1.5 GB of swap space / virtual memory, and 750 MB of physical memory.

Krzysiak

Ja po przesiadce na szybki dysk SSD przestałem się bawić w ustawianie wirtualnej pamięci :)


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

chr80♂°🛰�

Cytat: Krzysiak w 11 Wrzesień 2021, 13:31
Ja po przesiadce na szybki dysk SSD przestałem się bawić w ustawianie wirtualnej pamięci :)
Ja się nigdy w to nie bawiłem tylko dokładałem maksymalną ilość pamięci i wyłączałem wirtualną.  XD

stiven

Cytat: chris80uppers w 11 Wrzesień 2021, 11:09
Cytat: stiven w 11 Wrzesień 2021, 10:53
Sprawdzam na linuxie. 6 zadań a wirtualki dałem 2GB. Liczy już 1d19h.

A nie trzeba na każde zadanie 1.5 GB wirtualnej czyli w twoim przypadku 9GB?
[/i]
O dziwo liczy dalej i nie robi problemów.

chr80♂°🛰�

#14
A więc tak na koniu zaczęły się restarty 1 do 2 razy dziennie - nieoczekiwana utrata zasilania przy zadaniach llrGCW:
2x Xeon E5 2696v2 24C(48T), 128GB DDR3@1866MHz (13-12-12-34), ASUS GTX TITAN X 12GB, NVIDIA Tesla K80, Seasonic PRIME 1300W Platinum.
1. Całkowity pobór mocy z gniazdka 970W więc zasilacz powinien dać radę.
2. Kiedyś jeden z przewodów na kablu EPS(zasilanie procesora) miał 32°C (na termo kamerze świecił na czerwono na tle reszty(16°C).
3. Temperatura pamięci RAM około 48°C radiatory pamięci nowe 4x32GB DDR3-1866 Samsung M386B4G70DM0-CMA4 RAM REG ECC Server.
4. System Win10 64bit. Pamięć wirtualna włączona - na innym dysku niż systemowy, katalog x:\ProgramData\BOINC\ - na jeszcze innym dysku SSD SATA.

Zmieniłem ustawienia z 18 na 9 rdzeni i po dwie aplikacje llrGCW max na raz.
Wykorzystanie procesorów jest na 50% czyli bez zmian tego ustawienia od czasów restartu. Oraz zmniejszyłem czas procesora na 60%.

Moje pytanie brzmi - Czy jest problem zasilania procesorów, czy komunikacji pomiędzy nimi czy jeszcze coś innego?
PS. Program monitorujący HWiNFO?

SzaMoT

Do monitorowania temperatury CPU,GPU możesz użyć TThrottle i zarządzania wszystkimi sprzętami BoincTasks
https://efmer.com/

Może tam coś ciekawego odkryjesz  :ahoy:


chr80♂°🛰�

Cytat: Tomasz ♪ Kaczmarek w 24 Październik 2021, 18:20
Do monitorowania temperatury CPU,GPU możesz użyć TThrottle i zarządzania wszystkimi sprzętami BoincTasks
https://efmer.com/

Może tam coś ciekawego odkryjesz  :ahoy:
:love2:
Dzięki za wskazówkę. Zbadam w wolnej chwili. :p_arr: