Start 2017-04-07 o godzinie 14 naszego czasu :)
Liczymy Prime Sierpinski Problem (LLR)
Warto liczyć. Bo to w końcu problem naszego rodaka Wacława Franciszka Sierpińskiego
https://pl.wikipedia.org/wiki/Wac%C5%82aw_Sierpi%C5%84ski
Próbki dość długie :boing: polecam liczyć na kilku rdzeniach poprzez modyfikację pliku app_config.xml
Przykład dla 2 próbki po 2 rdzenie
<app_config>
<app>
<name>llrPSP</name>
<fraction_done_exact/>
<max_concurrent>1</max_concurrent>
</app>
<app_version>
<app_name>llrPSP</app_name>
<cmdline>-t 2</cmdline>
<avg_ncpus>4</avg_ncpus>
<max_ncpus>4</max_ncpus>
</app_version>
</app_config>
Dzięki za sygnał. Co daje liczenie na dwóch rdzeniach? Chodzi mi o to, czy stosując proponowane przez ciebie usprawnienie, przemieli się więcej próbek w tym samym czasie. Jeżeli tak, to czy warto liczyć jedno zadanie na czterech rdzeniach?
Tu są zdania podzielone może zrobię test podczas wyścigu
1 vs 2 vs 4
Zapytałem, ponieważ dysponuję tylko jedną maszyną, zatem nie mam możliwości przeprowadzania eksperymentów. Dlatego będę mielił standardowo. Tj. bez zmiany ustawień, czyli jedna próbka na jeden rdzeń. Poczytałem o tym optymalizowaniu primegridowych aplikacji.
http://www.boincatpoland.org/smf/primegrid/primegrid-test-nowej-aplikacji-1-wu-na-wielu-watkach-jednoczesnie/
Po mojemu jest to wykonalne, gdy ktoś dobrze rozumie architekturę danego procesora. Za chudy w uszach na takie zabawy jestem. Do zobaczyska na starcie zawodów.
Wrrr... Czy ten temat nie powinien być w forumowych "Akcjach..." oraz info na głównej? :boing:
Nie pisuję informacji na głównej odnośnie wyścigów - może ktoś inny?
ZA 30 minut START :)
No to ruszylim. Pogońcie Kamraci maszyny do roboty. :whip:
Melduje sie. Wrzucam co mam ...
co robię nie tak?
app_config:
<app_config>
<app>
<name>llrPSP</name>
<fraction_done_exact/>
<max_concurrent>1</max_concurrent>
</app>
<app_version>
<app_name>llrPSP</app_name>
<cmdline>-t 1</cmdline>
<avg_ncpus>8</avg_ncpus>
<max_ncpus>8<max_ncpus>
</app_version>
</app_config>
a dalej zaczyna mi liczyć na pojedynczych rdzeniach...
resetuję projekt oczywiście
<cmdline>-t 1</cmdline>
tu masz ile rdzeni ma liczyc pojedyncze WU
no robiłem z "-t 8" i też leciało naraz ileś WU... Teraz zrobiłem tak od nowa, i co prawda leci jeden tylko WU, ale patrząc po temperaturze procka (ok. 40 stopni), i po tym, co pokazuje htop, to nawet jeśli jedzie na wielu rdzeniach, to niezbyt je obciąża... czy może mieć znaczenie to, że mam czterordzeniowy procek z ośmioma wątkami? a w tych ustawieniach chodzi o rdzenie fizyczne?
Nie opłaca się ustawiać więcej niż 4 rdzenie na próbkę
Różnica pomiędzy 4 a 8 będzie naprawdę minimalna
4ch narazie od nas zapunktowalo i 4 miejsce teamowo ;]
Cytat: sknd w 08 Kwiecień 2017, 08:32
no robiłem z "-t 8" i też leciało naraz ileś WU... Teraz zrobiłem tak od nowa, i co prawda leci jeden tylko WU, ale patrząc po temperaturze procka (ok. 40 stopni), i po tym, co pokazuje htop, to nawet jeśli jedzie na wielu rdzeniach, to niezbyt je obciąża... czy może mieć znaczenie to, że mam czterordzeniowy procek z ośmioma wątkami? a w tych ustawieniach chodzi o rdzenie fizyczne?
Zrób -t 4 ale
<avg_ncpus>1</avg_ncpus>
<max_ncpus>1<max_ncpus>
lub w boinc managerze daj używanie 12,5% CPU. Wg mnie to drugie działa lepiej.
I jedna uwaga koledzy. Po wprowadzeniu zmian wypada pobrać nowe próbki. Z moich doświadczeń wnika, że Boinc Manager chyba sobie jakoś próbki znakuje i zmiana "- t " działa dopiero dla nowych. Można to łatwo poznać jak się wejdzie w Stderr output przeliczonej próbki (na stronie projektu po kliknięciu w task). Informacja o ilości wątków na próbkę pojawia się tam nawet dwukrotnie:
CytatLLR command line: primegrid_cllr.exe -d -oDiskWriteTime=1 -oThreadsPerTest=3 ..\..\projects\www.primegrid.com\llrMEGA_282525631
Using all-complex AMD K10 FFT length 256K, Pass1=256, Pass2=1K, 3 threads, a = 3
08:35:56 (5144): called boinc_finish
Może to kwestia tego, że używam app_info.xml a nie app_config.xml
Cytat: stiven w 11 Kwiecień 2017, 11:48
Cytat: sknd w 08 Kwiecień 2017, 08:32
no robiłem z "-t 8" i też leciało naraz ileś WU... Teraz zrobiłem tak od nowa, i co prawda leci jeden tylko WU, ale patrząc po temperaturze procka (ok. 40 stopni), i po tym, co pokazuje htop, to nawet jeśli jedzie na wielu rdzeniach, to niezbyt je obciąża... czy może mieć znaczenie to, że mam czterordzeniowy procek z ośmioma wątkami? a w tych ustawieniach chodzi o rdzenie fizyczne?
Zrób -t 4 ale
<avg_ncpus>1</avg_ncpus>
<max_ncpus>1<max_ncpus>
lub w boinc managerze daj używanie 12,5% CPU. Wg mnie to drugie działa lepiej.
Trochę przekombinowane wg mnie. Wg mnie lepiej ustawić -t, <avg_ncpus> i <max_ncpus> na tą samą wartość czyli 4. Apki LLR lepiej sobie radzą bez HT, więc należy je wyłączyć w BIOSie albo ustawić w BOINC żeby używał 50% dostępnych CPU. No i zwykle nie ma potrzeby używania <max_concurrent> wspomnianego gdzieś wyżej, on służy do ustawiania ile kopii aplikacji może działać równocześnie.
Cytat: stiven w 11 Kwiecień 2017, 11:48
I jedna uwaga koledzy. Po wprowadzeniu zmian wypada pobrać nowe próbki. Z moich doświadczeń wnika, że Boinc Manager chyba sobie jakoś próbki znakuje i zmiana "- t " działa dopiero dla nowych. Można to łatwo poznać jak się wejdzie w Stderr output przeliczonej próbki (na stronie projektu po kliknięciu w task). Informacja o ilości wątków na próbkę pojawia się tam nawet dwukrotnie:
CytatLLR command line: primegrid_cllr.exe -d -oDiskWriteTime=1 -oThreadsPerTest=3 ..\..\projects\www.primegrid.com\llrMEGA_282525631
Using all-complex AMD K10 FFT length 256K, Pass1=256, Pass2=1K, 3 threads, a = 3
08:35:56 (5144): called boinc_finish
Może to kwestia tego, że używam app_info.xml a nie app_config.xml
Żeby zmienić wartości w znacznikach <avg_ncpus> i <max_ncpus> wystarczy tylko przeładować plik konfiguracyjny, BOINC od razu zacznie używać nowych wartości. Dla istniejących tasków ilość CPU będzie się wyświetlać po staremu, ale to tylko błąd wyświetlania, nie przejmujcie się tym.
Co do zmiany parametru -t w locie to też powinno się udać. Z tego co kojarzę to przekonfigurowywałem kiedyś zadania ATLAS bo miałem za mało pamięci. Żeby to zadziałało trzeba zatrzymać liczenie zadania. Trzeba też będzie wyłączyć opcję trzymania wstrzymanych zadań w pamięci, uruchomiony proces musi się zakończyć aby potem uruchomił się ponownie z nową wartością parametru.
Powróćmy na chwilę do sensowności całej zabawy. Tzn. problemu pt. czy na każdym kompie liczenie jednej próbki na dwóch, lub czterech rdzeniach, poskutkuje większą ilością przeliczonych zadań? Porównując to oczywiście z ustawieniami firmowymi, czyli jeden rdzeń, dla każdego zadania.
Dla zadań dłuższych niż SGS, PPS, PPSex jest zysk.
Trzeba tylko odpowiednio dobrać ilość wątków do rdzeni.
Ja szukając optimum dla i3-5005U (2 rdzenie, 4 wątki) znajduję je dla jednej próbki liczonej na 3 wątkach.
Dla phenoma X6 1055T skłaniam się ku dwóm próbkom po 3 wątki ale testuję też 3 próbki po 2 wątki.
Jedna próbka puszczona na 6 wątków jakby wolniej co jest spójne z dotychczasowymi obserwacjami innych osób.
Małe porównanie dla dwóch tych samych CPU w bieżącym wyścigu PSP LLR
Dla 1 CPU na zadanie
799578516 521980610 7 Apr 2017 | 12:00:46 UTC 11 Apr 2017 | 21:11:52 UTC Completed and validated 206,388.71 205,938.06 10,692.37 Prime Sierpinski Problem (LLR) v8.00
799578464 521980584 7 Apr 2017 | 12:00:46 UTC 12 Apr 2017 | 13:12:28 UTC Completed and validated 240,655.39 240,186.27 12,036.33 Prime Sierpinski Problem (LLR) v8.00
799578455 521980580 7 Apr 2017 | 12:00:46 UTC 11 Apr 2017 | 20:48:50 UTC Completed and validated 204,847.31 204,357.98 10,690.76 Prime Sierpinski Problem (LLR) v8.00
799578453 521980579 7 Apr 2017 | 12:00:46 UTC 12 Apr 2017 | 13:11:14 UTC Completed and validated 240,460.08 239,965.19 12,036.11 Prime Sierpinski Problem (LLR) v8.00
799578451 521980578 7 Apr 2017 | 12:00:46 UTC 11 Apr 2017 | 20:45:32 UTC Completed and validated 204,785.59 204,109.33 10,690.72 Prime Sierpinski Problem (LLR) v8.00
799578450 521980577 7 Apr 2017 | 12:00:46 UTC 11 Apr 2017 | 20:49:18 UTC Completed and validated 205,038.48 204,624.00 10,690.69 Prime Sierpinski Problem (LLR) v8.00
799578445 521980575 7 Apr 2017 | 12:00:47 UTC 11 Apr 2017 | 21:17:15 UTC Completed and validated 206,653.76 206,252.00 10,690.58 Prime Sierpinski Problem (LLR) v8.00
799578443 521980574 7 Apr 2017 | 12:00:47 UTC 11 Apr 2017 | 21:30:02 UTC Completed and validated 207,370.56 206,934.45 10,690.57 Prime Sierpinski Problem (LLR) v8.00
799427018 521928489 7 Apr 2017 | 12:00:47 UTC 12 Apr 2017 | 13:32:09 UTC Completed and validated 241,083.00 240,460.84 12,027.39 Prime Sierpinski Problem (LLR) v8.00
799309035 521888214 7 Apr 2017 | 12:00:47 UTC 12 Apr 2017 | 13:00:15 UTC Completed and validated 239,975.19 239,182.23 12,024.60 Prime Sierpinski Problem (LLR) v8.00
Dla 4 CPU na zadanie
801365449 522481434 10 Apr 2017 | 14:25:31 UTC 11 Apr 2017 | 15:34:05 UTC Completed and validated 90,514.00 169,701.53 14,852.19 Prime Sierpinski Problem (LLR) v8.00
800811171 522398435 10 Apr 2017 | 3:04:21 UTC 11 Apr 2017 | 7:22:55 UTC Completed and validated 101,914.00 173,049.38 14,818.47 Prime Sierpinski Problem (LLR) v8.00
800811169 522398434 10 Apr 2017 | 2:34:35 UTC 11 Apr 2017 | 15:02:25 UTC Completed and validated 131,270.00 303,524.36 14,818.29 Prime Sierpinski Problem (LLR) v8.00
800790145 521981000 9 Apr 2017 | 6:44:40 UTC 10 Apr 2017 | 10:53:44 UTC Completed and validated 101,344.00 112,609.92 10,712.17 Prime Sierpinski Problem (LLR) v8.00
800455261 522279508 9 Apr 2017 | 2:08:30 UTC 10 Apr 2017 | 21:58:34 UTC Completed and validated 157,804.00 263,324.89 14,751.83 Prime Sierpinski Problem (LLR) v8.00
800403860 522262623 9 Apr 2017 | 1:08:30 UTC 10 Apr 2017 | 8:31:58 UTC Completed and validated 113,008.00 153,694.20 14,745.38 Prime Sierpinski Problem (LLR) v8.00
800220073 522200306 8 Apr 2017 | 16:24:20 UTC 10 Apr 2017 | 15:10:19 UTC Completed and validated 168,359.00 251,637.59 13,600.07 Prime Sierpinski Problem (LLR) v8.00
799579738 521981219 7 Apr 2017 | 12:08:12 UTC 9 Apr 2017 | 23:15:17 UTC Completed and validated 164,931.36 164,931.36 10,723.64 Prime Sierpinski Problem (LLR) v8.00
799579640 521981170 7 Apr 2017 | 12:07:45 UTC 9 Apr 2017 | 13:58:40 UTC Completed and validated 179,455.00 219,655.84 12,070.78 Prime Sierpinski Problem (LLR) v8.00
799579624 521981161 7 Apr 2017 | 12:07:59 UTC 9 Apr 2017 | 21:13:52 UTC Completed and validated 205,553.00 224,323.27 12,070.53 Prime Sierpinski Problem (LLR) v8.00
799579584 521981141 7 Apr 2017 | 12:08:39 UTC 10 Apr 2017 | 2:29:15 UTC Completed and validated 197,214.67 197,214.67 10,719.77 Prime Sierpinski Problem (LLR) v8.00
799579580 521981139 7 Apr 2017 | 12:07:01 UTC 9 Apr 2017 | 2:49:55 UTC Completed and validated 139,374.00 174,063.97 12,068.77 Prime Sierpinski Problem (LLR) v8.00
799579578 521981138 7 Apr 2017 | 12:07:01 UTC 8 Apr 2017 | 17:30:22 UTC Completed and validated 105,801.00 114,432.11 10,719.72 Prime Sierpinski Problem (LLR) v8.00
799579576 521981137 7 Apr 2017 | 12:07:01 UTC 9 Apr 2017 | 1:55:28 UTC Completed and validated 111,781.92 111,781.92 10,719.71 Prime Sierpinski Problem (LLR) v8.00
799579574 521981136 7 Apr 2017 | 12:07:01 UTC 8 Apr 2017 | 16:16:15 UTC Completed and validated 101,354.00 202,803.56 12,068.68 Prime Sierpinski Problem (LLR) v8.00
799579572 521981135 7 Apr 2017 | 12:07:01 UTC 8 Apr 2017 | 11:57:24 UTC Completed and validated 85,823.00 180,439.34 10,719.56 Prime Sierpinski Problem (LLR) v8.00
799579570 521981134 7 Apr 2017 | 12:07:01 UTC 8 Apr 2017 | 11:34:20 UTC Completed and validated 84,439.00 180,872.66 10,719.52 Prime Sierpinski Problem (LLR) v8.00
799579568 521981133 7 Apr 2017 | 12:07:01 UTC 8 Apr 2017 | 14:33:48 UTC Completed and validated 95,207.00 210,394.34 12,068.48 Prime Sierpinski Problem (LLR) v8.00
799579562 521981130 7 Apr 2017 | 12:07:01 UTC 7 Apr 2017 | 21:28:49 UTC Completed and validated 33,708.00 125,306.83 10,719.42 Prime Sierpinski Problem (LLR) v8.00
799579445 521981071 7 Apr 2017 | 12:07:01 UTC 8 Apr 2017 | 10:10:59 UTC Completed and validated 79,438.00 134,765.36 12,064.19 Prime Sierpinski Problem (LLR) v8.00
Nie mam pojęcia czemu taki rozrzut czasowy