[2016-11-18 - 2016-11-23] - The Wallis is Born Challenge

Zaczęty przez Ufol, 14 Listopad 2016, 14:05

Ufol

Start:
2016-11-18 18:00
Meta:
2016-11-23 18:00
Liczymy wyłącznie podprojekt Arithmetic Progression of Primes 27 (AP27) a więc aplikacja na gpu. Wymaga vramu 1,5 gb. Doradzam także aktualizację sterowników. Nie wiem czemu, lecz u mnie na starszych nie ruszyła, natomiast na nowych mieliła, aż miło. Terminarz podany według czasu uniwersalnego, tzn. opóźniony od polskiego zimowego o godzinę, zatem ruszamy osiemnastego listopada, czyli w najbliższy piątek, o dziewiętnastej. Wyścig projektowy, dlatego do punktacji wliczają się wyłącznie próbki pobrane po starcie i odesłane przed zakończeniem regat. Apeluję o udział, bo reprezentowanie Polski w Primegridzie zobowiązuje i dumą napawa.
:attack:

necavi

Apeluję o przypomnienie w piątek...  :ahoy:

Krzysiak



>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

necavi

CytatLiczymy wyłącznie podprojekt Arithmetic Progression of Primes 27 (AP27) a więc aplikacja na gpu.

Ta apka jest również na cpu. Nie wiem jak tam w punktach na cpu się przedstawia opłacalność/sens obliczeń.
Mam tylko 1 grafę, która da radę, ale mnie i cpu i gpu przemieliło pakiet kontrolny  :p_arr:

Ufol

Nie ma co się przejmować prognozami. Ostatnia moja próbka miała trwać
238:13:29
faktycznie się mieliła
18:36:07
a więc odwagi, do boju. Oczywiście można także liczyć na cpu. Moc obliczeniowa procesora jest mniejsza niż grafy, lecz każdy punkt ma znaczenie. Dlatego wszystkich zachęcam do uczestnictwa. Ruszamy dziś, po dziewiętnastej. Roześlijcie powiadomienia, gdzie tylko się da.
Niczym dawny herold wołam;
wici, wici, wici!

Peciak

Macie tutaj apke SESEfA do ATI https://dl.dropboxusercontent.com/u/1452459/pg/pg%20ap26%20malo%20cpu.zip
najlepiej liczyć dwie próbki na raz (przyśpieszenie jest całkiem spore)
cały watek znajduje się tutaj
http://www.boinc.pl/forum/ap-27-t1517.html
Błędy w liczeniu o których mowa w wątku dotyczą apki wycofanej tamta to miała dopiero kopa ale niestety 10% wyników było błędnych więc SESEF ja wycofał.
Apka z dużym użyciem proca tylko na naprawdę silne procesory i niczym nie obciążone.

,,Z szanowania wzajemnego wypływa moc wielka w chwilach trudnych."

Ufol

Ile vramu potrzeba, aby liczyć jednocześnie dwa zadania?

Ufol

Ogień! Kupą Mości Panowie. Właśnie wyścig się zaczął. Przełączać wszystkie moce na Primegrida; a żywo. Liczę klasycznie, za chudy w uszach jestem, aby bawić się w optymalki podczas regat. Skorzystam i poeksperymentuję po ich zakończeniu. Dzięki Peciaku za linka.

Krzysiak

Tak jak kolega przyspieszenie jest

Przed optymalizacją
748103793 500276128 12 Oct 2016 | 4:26:11 UTC 13 Oct 2016 | 3:17:59 UTC Completed and validated    4,669.08 57.69 4,043.00 AP27 Search v2.02 (opencl_ati_AP27)
748025345 500240834 11 Oct 2016 | 17:17:25 UTC 12 Oct 2016 | 7:36:46 UTC Completed and validated    4,833.74 194.95 4,043.00 AP27 Search v2.02 (opencl_ati_AP27)


Z optymalizacją
755120622 503502753 18 Nov 2016 | 23:44:16 UTC 19 Nov 2016 | 4:29:25 UTC Completed and validated    3,398.50 2,759.41 4,043.00 AP27 Search Anonymous platform (ATI GPU)
755119727 503502385 18 Nov 2016 | 22:45:57 UTC 19 Nov 2016 | 0:41:14 UTC Completed and validated    3,418.84 2,785.06 4,043.00 AP27 Search Anonymous platform (ATI GPU)



Co trzeba zmienić żeby zaczęło 2 próbki na GPU mielić ?

<?xml version="1.0" encoding="WINDOWS-1250"?>

-<app_info>


-<app>

<name>ap26</name>

<user_friendly_name>AP27 Search</user_friendly_name>

<non_cpu_intensive>0</non_cpu_intensive>

</app>


-<file_info>

<name>ap26ocl.exe</name>

<executable/>

</file_info>


-<app_version>

<app_name>ap26</app_name>

<version_num>201</version_num>

<platform>windows_intelx86</platform>

<plan_class>opencl_ati_AP27</plan_class>

<flops>46847048754.305817</flops>

<avg_ncpus>1.000000</avg_ncpus>

<max_ncpus>1.000000</max_ncpus>


-<coproc>

<type>ATI</type>

<count>1.000000</count>

</coproc>

<gpu_ram>1468006400.000000</gpu_ram>

<cmdline/>


-<file_ref>

<file_name>ap26ocl.exe</file_name>

<copy_file/>

<main_program/>

</file_ref>

</app_version>

</app_info>


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

necavi

Wyścig u nas nie cieszy się większym powodzeniem: aże 8 luda z teamu go podjęło co daje nam na dziś 15 miejsce.

Zachęcam do :attack:

Peciak

Cytat: Krzysiak_PL_GDA w 19 Listopad 2016, 08:50
Co trzeba zmienić żeby zaczęło 2 próbki na GPU mielić ?

najprawdopodniej podmieć app_info


<app_info>
<app>
    <name>ap26</name>
    <user_friendly_name>AP27 Search</user_friendly_name>
    <non_cpu_intensive>0</non_cpu_intensive>
</app>
<file_info>
    <name>ap26ocl.exe</name>
    <executable/>
</file_info>
<app_version>
    <app_name>ap26</app_name>
    <version_num>201</version_num>
    <platform>windows_intelx86</platform>
<plan_class>opencl_ati_AP27</plan_class>
<flops>46847048754.305817</flops>
    <avg_ncpus>1.000000</avg_ncpus>
    <max_ncpus>1.000000</max_ncpus>
<coproc>
        <type>ATI</type>
        <count>0.5</count>
    </coproc>
    <gpu_ram>1468006400.000000</gpu_ram>
    <cmdline></cmdline>
    <file_ref>
       <file_name>ap26ocl.exe</file_name>
<copy_file/>
       <main_program/>
    </file_ref>
</app_version>
</app_info>

i przeładować boinca
app_info ładuje się przy przeładowaniu boinc nie tak jak app_config

,,Z szanowania wzajemnego wypływa moc wielka w chwilach trudnych."

Ufol

Cytat: necavi w 20 Listopad 2016, 10:52
Wyścig u nas nie cieszy się większym powodzeniem: aże 8 luda z teamu go podjęło co daje nam na dziś 15 miejsce.

Zachęcam do :attack:
Faktycznie, mało nas do pieczenia chleba, lecz nie wiem, jak można zwiększyć ilość naszych liczydłowych. Pozostaje nadal gorąco apelować do nich, aby dołożyli choćby na chwilę trochę mocy do wspólnego pieca.

PoznanskaPyra

Na radeonach wykonywanie tych obliczeń jest mało skuteczne. Mój R9-290 potrzebuje 5k sekund gdy GTX980 potrzebuje tego czasu 2x mniej. Obciążenie karty równe jest 100% przez cały czas wykonywania obliczeń, więc uruchamianie dwóch zadań chyba mija się z celem w moim przypadku.
WIZYTÓWKA
Kompy:
AMD Ryzen 9-3900X + GTX980Ti
Intel i5 4570 + HD7970

Peciak

No tutaj to będę bronił SESEFA
1. Poznańska Pyra czy załączyłeś optymalkę, bo wydaje mi sie ze nie (patrząc na twoje wyniki), załącz a dopiero potem obserwuj jak pracuje GPU i wyciągaj wnioski
2. Wydajność mojej ATI 7970 po załączeniu optymalki SESEFA i liczeniu 2x WU na raz -----wzrosła ponad 2x.
Test robiłem w sierpniu więc od tego czasu mogły się zmienić sterowniki (co może rzutować na zachowanie GPU ale nie sadzę)

,,Z szanowania wzajemnego wypływa moc wielka w chwilach trudnych."

Krzysiak

Niestety puszczenie 2 próbek na FURY X też mija się z celem - a na koniec komp się powiesił  :(
Przy jednej próbce widoczny wzrost wydajności o czym pisałem wyżej.


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

Peciak


,,Z szanowania wzajemnego wypływa moc wielka w chwilach trudnych."

Krzysiak

Może nie sprecyzowałem 14 jajek dostępnych


>>Moja szczegółowa sygnatur<< %)                                      >> Spis moich odkrytych liczb pierwszych << :whistle:

Peciak

Chodzi o to, że apka z duża ilością CPU bardzo obciąża pojedyńcze rdzenie CPU i bardzo obciąża szynę danych z połączeniem pomiędzy procem a GPU. Dlatego proc musi być silny i nic innego nie liczyć. Zdecydowanie lepiej zachowuje się apka z mała ilością CPU. CPU jest wykorzystane krótko.
Dobrze też jest wypuścić liczenie Wu w odstępie a nie razem.
Warto też sprawdzić przed liczeniem czy nie wisi inne AP liczone (bo zabraknie ramu na karcie)

,,Z szanowania wzajemnego wypływa moc wielka w chwilach trudnych."

Ufol

Pytanie za przysłowiowe sto punktów do tych, u których optymalka działa prawidłowo. Ile vramu wam liczydła zeżarły. Skoro twórcy projektu podają 1,5 gb dla jednego procesu, to odpalenie dwóch, nawet niech ten drugi rusza minutę później. Bez trzech giga nie da rady, czy tak?

Peciak

Ilość wymaganego RAMU dla GPU sie nie zmienia
dodatkowo jest zadeklarowana w app_info
<gpu_ram>1468006400.000000</gpu_ram>
Ja na tej apce zrobiłem ponad 500k. Liczyłem 2x Wu. Żadnych zwiech.
Podałem linka do apki z małą ilością CPU bo była najbardziej sprawdzona.

,,Z szanowania wzajemnego wypływa moc wielka w chwilach trudnych."

Ufol

Jak prawidłowo odpalić tą optymalkę? Tzn. włączyć ją tak, aby faktycznie przyspieszyła liczenie i nie sypnęła błędami, lub nie zawiesiła kompa. Rozpakowujemy archiwum i oba pliki kopiujemy do folderu www.primegrid.com znajdującego się, w przypadku siódmej windy, tu:
C:\ProgramData\BOINC\projects
Co robić dalej? Przeczytałem podlinkowany wątek, lecz pomimo tego pozostałem ciemny, jak tabaka w rogu. Otworzyłem w notatniku plik app_info.xml, ale większości linii nie rozumiem, stąd moja prośba o więcej wskazówek.

tito

Wcześniej Peciak wstawił wyedytowany app_info.
Najlepiej podmienić całość - wtedy apka zacznie liczyć 2 WU jednocześnie.
A więc:
zamknąć BOINC,
wkleić oba pliki w katalog który podałeś,
podmienić zawartość app_info na to podane przez Peciaka,
uruchomić BOINC.

Dla łatwości podaję zawartość app_info
<app_info>
<app>
    <name>ap26</name>
    <user_friendly_name>AP27 Search</user_friendly_name>
    <non_cpu_intensive>0</non_cpu_intensive>
</app>
<file_info>
    <name>ap26ocl.exe</name>
    <executable/>
</file_info>
<app_version>
    <app_name>ap26</app_name>
    <version_num>201</version_num>
    <platform>windows_intelx86</platform>
   <plan_class>opencl_ati_AP27</plan_class>
   <flops>46847048754.305817</flops>
    <avg_ncpus>1.000000</avg_ncpus>
    <max_ncpus>1.000000</max_ncpus>
   <coproc>
        <type>ATI</type>
        <count>0.5</count>
    </coproc>
    <gpu_ram>1468006400.000000</gpu_ram>
    <cmdline></cmdline>
    <file_ref>
       <file_name>ap26ocl.exe</file_name>
   <copy_file/>
       <main_program/>
    </file_ref>
</app_version>
</app_info>

Ufol

Tak, jak się spodziewałem, to nie dla mnie. Odpalenie optymalki jedynie poskutkowało wysypaniem zadania i niczym więcej. Primegrid nic nie pobierał, gdy to ustrojstwo było odpalone. Zatem to zabawka do zastosowania w lepszych sprzętach.

Ufol

Zajęliśmy czternaste miejsce na 101 startujących ekip. Wielkie dzięki dla wszystkich liczydłowych, którzy wzięli udział w zakończonych wczoraj regatach. Oby w grudniowych było nas więcej.