Nie znalazłem działu z Collatz Conjecture więc piszę tutaj.
Znalazłem stronę z poprawionymi plikami config. na forum ukboincteam ;D do konkretnych modeli GPU dane z 2016, ale może akurat komuś się przydadzą.
Mi przydało się do Titan X:
verbose=1
kernels_per_reduction=48
threads=9
lut_size=16
sieve_size=26
sleep=1
cache_sieve=1
reduce_cpu=1
Są to przykładowe konfiguracje pobrane z najlepszych hostów
http://www.ukboincteam.org.uk/newforum/viewtopic.php?t=6001
Tu użyłem google translatora:
Aby skrócić czas przetwarzania w projekcie Collatz Conjecture, znajdź plik collatz_sieve_1.21_windows_intelx86__opencl_amd_gpu.config (32-bitowy system operacyjny) lub collatz_sieve_1.21_windows_x86_64__opencl_amd_gpu.config (64-bitowy system operacyjny) w pliku C\S:\inbo katalog projektu com_collatz .
Początkowo będzie to pusty plik. Istnieją różne ustawienia, które można wprowadzić do tego pliku, aby sterować przetwarzaniem jednostek roboczych Collatz przy pustym pliku konfiguracyjnym, przetwarzanie jednostek roboczych zajmuje około dwa razy więcej czasu)
(nazwa) (wartości)
verbose 1/0
Jeśli włączone, więcej danych pojawia się na wyjściu - brak wpływu na chrupanie
kernels/reduction 1 - 64
Liczba ziaren zrobionych przed redukcją. Wyższe liczby przyspieszają przetwarzanie, zbyt wysoka powoduje awarię sterownika wideo. 8 - 48 pierwotnie zalecane, chociaż wyższe wartości działają dobrze z mocniejszymi kartami.
threads 6 - 11
Ilość używanych rejestrów GPU (2^6 = 64, 2^11 = 2048) Większe liczby pozwalają na równoległe działanie większej liczby wątków, konieczne jest użycie zbyt dużej i wolnej zewnętrznej pamięci RAM zamiast szybkich rejestrów GPU. AMD najlepiej przy 6-8, NVIDIA działa najlepiej przy 8-9. Większe wartości dla bardziej nowoczesnych kart.
lut_size 2 - 31
Rozmiar tablicy przeglądowej w potęgach 2, każdy wpis zajmuje 8 bajtów. (17 = 2^17 = 131 072 wpisy = 1 048 576 bajtów lub 1 GB) Większe, tym lepsze, >20 prawdopodobnie spowoduje awarię sterownika GPU. Skaluj, aby zmieścić się w pamięci podręcznej L1/L2 GPU. 4 GB pamięci podręcznej = 512 mln wpisów = 2^19 wpisów -> 19
sieve_size 25 - 32
Rozmiar używanego sita (2^25 do 2^32) oraz liczba elementów na jądro (26 = około 1 milion elementów na jądro , 27 = około 2 miliony pozycji na jądro). Im wyżej tym lepiej, zbyt wysoko zawiesza się sterownik GPU.
sleep >0
Liczba milisekund, przez które procesor przechodzi w stan uśpienia podczas oczekiwania na przetworzenie jądra. Większe wartości zapewniają mniejsze zużycie procesora i lepszą odpowiedź, ale spowalniają przetwarzanie jednostek roboczych.
cache_sieve 1/0
Buforuj lokalną tabelę sit między jednostkami roboczymi. Jeśli 0, jest tworzony ponownie dla każdej jednostki roboczej. Przechowywany na dysku, a nie na karcie, rozmiar pamięci GPU nieistotny.
reduce_cpu 1/0
Jeśli włączone, większe wykorzystanie procesora (dziwnie odwrotnie do tego, co sugeruje nazwa elementu), ale bardziej responsywny system graficzny.
Aby uzyskać maksymalną liczbę kredytów na jednostkę roboczą:
wątki powinny być skalowane do liczby rejestrów GPU obecnych na karcie.
lut_size powinien być skalowany, aby zmieścił się w pamięci podręcznej GPU poziomu 1/poziomu 2.
sleep powinno być ustawione na 1.
cache_sieve powinno być ustawione na 1.
Reduce_cpu powinno być ustawione na 0.
kernels/reduction i sieve_size z którymi warto poeksperymentować. (Uwaga: niewiele kart podaje liczbę obecnych rejestrów GPU, więc wątki są zwykle jednym z nich do eksperymentowania)
Znalazłem stronę z poprawionymi plikami config. na forum ukboincteam ;D do konkretnych modeli GPU dane z 2016, ale może akurat komuś się przydadzą.
Mi przydało się do Titan X:
verbose=1
kernels_per_reduction=48
threads=9
lut_size=16
sieve_size=26
sleep=1
cache_sieve=1
reduce_cpu=1
Są to przykładowe konfiguracje pobrane z najlepszych hostów
http://www.ukboincteam.org.uk/newforum/viewtopic.php?t=6001
Tu użyłem google translatora:
Aby skrócić czas przetwarzania w projekcie Collatz Conjecture, znajdź plik collatz_sieve_1.21_windows_intelx86__opencl_amd_gpu.config (32-bitowy system operacyjny) lub collatz_sieve_1.21_windows_x86_64__opencl_amd_gpu.config (64-bitowy system operacyjny) w pliku C\S:\inbo katalog projektu com_collatz .
Początkowo będzie to pusty plik. Istnieją różne ustawienia, które można wprowadzić do tego pliku, aby sterować przetwarzaniem jednostek roboczych Collatz przy pustym pliku konfiguracyjnym, przetwarzanie jednostek roboczych zajmuje około dwa razy więcej czasu)
(nazwa) (wartości)
verbose 1/0
Jeśli włączone, więcej danych pojawia się na wyjściu - brak wpływu na chrupanie
kernels/reduction 1 - 64
Liczba ziaren zrobionych przed redukcją. Wyższe liczby przyspieszają przetwarzanie, zbyt wysoka powoduje awarię sterownika wideo. 8 - 48 pierwotnie zalecane, chociaż wyższe wartości działają dobrze z mocniejszymi kartami.
threads 6 - 11
Ilość używanych rejestrów GPU (2^6 = 64, 2^11 = 2048) Większe liczby pozwalają na równoległe działanie większej liczby wątków, konieczne jest użycie zbyt dużej i wolnej zewnętrznej pamięci RAM zamiast szybkich rejestrów GPU. AMD najlepiej przy 6-8, NVIDIA działa najlepiej przy 8-9. Większe wartości dla bardziej nowoczesnych kart.
lut_size 2 - 31
Rozmiar tablicy przeglądowej w potęgach 2, każdy wpis zajmuje 8 bajtów. (17 = 2^17 = 131 072 wpisy = 1 048 576 bajtów lub 1 GB) Większe, tym lepsze, >20 prawdopodobnie spowoduje awarię sterownika GPU. Skaluj, aby zmieścić się w pamięci podręcznej L1/L2 GPU. 4 GB pamięci podręcznej = 512 mln wpisów = 2^19 wpisów -> 19
sieve_size 25 - 32
Rozmiar używanego sita (2^25 do 2^32) oraz liczba elementów na jądro (26 = około 1 milion elementów na jądro , 27 = około 2 miliony pozycji na jądro). Im wyżej tym lepiej, zbyt wysoko zawiesza się sterownik GPU.
sleep >0
Liczba milisekund, przez które procesor przechodzi w stan uśpienia podczas oczekiwania na przetworzenie jądra. Większe wartości zapewniają mniejsze zużycie procesora i lepszą odpowiedź, ale spowalniają przetwarzanie jednostek roboczych.
cache_sieve 1/0
Buforuj lokalną tabelę sit między jednostkami roboczymi. Jeśli 0, jest tworzony ponownie dla każdej jednostki roboczej. Przechowywany na dysku, a nie na karcie, rozmiar pamięci GPU nieistotny.
reduce_cpu 1/0
Jeśli włączone, większe wykorzystanie procesora (dziwnie odwrotnie do tego, co sugeruje nazwa elementu), ale bardziej responsywny system graficzny.
Aby uzyskać maksymalną liczbę kredytów na jednostkę roboczą:
wątki powinny być skalowane do liczby rejestrów GPU obecnych na karcie.
lut_size powinien być skalowany, aby zmieścił się w pamięci podręcznej GPU poziomu 1/poziomu 2.
sleep powinno być ustawione na 1.
cache_sieve powinno być ustawione na 1.
Reduce_cpu powinno być ustawione na 0.
kernels/reduction i sieve_size z którymi warto poeksperymentować. (Uwaga: niewiele kart podaje liczbę obecnych rejestrów GPU, więc wątki są zwykle jednym z nich do eksperymentowania)