[Propozycja] Zmiana zasad wykorzystania SUPERKOMPUTERA.

Zaczęty przez Ania, 14 Listopad 2012, 13:54

Troll81

dosyć OT na temat tego czym zajmuje się Ania i ile ma lat, wykształcenie itp. Zechce to się przedstawi szerzej w wizytówce.

http://www.boincatpoland.org/wiki/Biuletyn_Listopad_2012

Panowie pisarze do pióra  :whip: :whip: :whip: jeden news w newsletterze to mało :D

Bezprym


Doc

nie jestem pewien czy ta informacja powinna się w tym wątku pojawić, ale na swoim przykładzie zrobiłem próby na kilku projektach, co jest ile punktowane
:book:
szacunkowa ilość punktów na 12h pracy, karta zielonych o wydajności zmiennoprzecinkowej ok. 2100Gflopów
DistrRTgen 93k
GPUgrid 105-113k
POEM 4 wątki, 321k
PrimeGrid 147k

pokazuje to zależność pomiędzy punktowaniem tych projektów, nie konkretne cyfry - te mogą być bardzo różne na różnym sprzęcie
w każdym razie POEM górą - to jest projekt białkowy, wydaje mi się wart wsparcia ale nie wiem kto go dokładnie prowadzi, kto czerpie korzyść
następnie PrimeGrid - tu (dla mnie) sprawa wątpliwa, czyją wydolność kryptograficzną wspiera?
GPUgrid - projekt białkowy, zdecydowanie wart wsparcia, uniwerek w Barcelonie, wiadomo co, kto i po co
DistrRTgen - projekt podnoszący czyjąś siłę szyfrowania lub wręcz przeciwnie, łamiący, piszą, że szukający słabych hashy

macie jakieś inne info na temat tych projektów? może czegoś nie zrozumiałem w opisach?  :dunno:

Ania

Cytat: Doc w 18 Listopad 2012, 11:49
szacunkowa ilość punktów na 12h pracy, karta zielonych o wydajności zmiennoprzecinkowej ok. 2100Gflopów
DistrRTgen 93k
GPUgrid 105-113k
POEM 4 wątki, 321k
PrimeGrid 147k

W związku z takimi podejrzeniami (na podstawie danych Tito) powstał ten wątek.   Potwierdza to zasadność odpalenia POEM (choć są problemy z karmieniem, ale wtedy można liczyć drugi projekt z listy)

Dodatkowo z innego wątku  ...
Cytat: Szopler w 27 Listopad 2012, 16:14

SKB@P_11:
GPU: POEM (jeszcze ~200WU w zapasie). Za ostatnią dobę ponad 540k! Najlepszy wynik SKB@P w tym projekcie EVER

Osiągnęliśmy nowy poziom :)   Gratulacje Szopler !

Szopler

No to mamy bardzo (nie)ciekawą sytuację. PM-CPU nie karmi, PM-GPU nie karmi. Projekty zapasowe kiepsko się liczą...
I co ma liczyć SKB@P?!


Ania

Cytat: Szopler w 29 Listopad 2012, 10:33
No to mamy bardzo (nie)ciekawą sytuację. PM-CPU nie karmi, PM-GPU nie karmi. Projekty zapasowe kiepsko się liczą...
I co ma liczyć SKB@P?!

Dlatego dla każdego SKB@P trzeba zbudować listę projektów w których dobrze sobie daje radę z uwzględnieniem dodatkowych warunków.

np. POEM+Free+WU, PM GPU +PM CPU +WU +Free,DT+ WCG itp.
Jeśli pierwszy wariant (POEM+Free+WU) zawodzi to przechodzimy na drugi potem na trzeci.

Oczywiście zbudowanie takich list zajmie trochę czasu i trzeba je będzie aktualizować ... ale istniejemy już kilka lat i pewnie jeszcze kilka lat będzie to istniało. Tak więc w miarę możliwości warto takie listy zbudować wykorzystując najnowsze osiągniecia i wiedzę z poszczególnych projektów (optymalizacja listy pod konkretny sprzęt). Każdy z opiekunów szukałby rozwiązania dla swojego sprzętu.

philozoph

Cytat: Ania w 29 Listopad 2012, 10:43
Dlatego dla każdego SKB@P trzeba zbudować listę projektów w których dobrze sobie daje radę z uwzględnieniem dodatkowych warunków.

Z ust mi to wyjęłaś.

Troll81


Ania

Samo zbudowanie to nie problem. Mozna przepisać obecną. Wyzwaniem na dłuższy okres jest jej optymalizacja poprzez zmianę tych początkowych założeń.

Przykładowo w tej chwili na początku listy najcześciej jest DT. Jak wykazał Szopler w SKB@P11 warto wstawić na pierwsze miejsce POEM. Zyskujemy pkt i mamy większą dywersyfikację liczonych projektów przez SKB@P.
Dodatkowo w liście trzeba umieścić projekty które słabo karmią. Bardzo słabo. Są to projekty z grupy niszowych.
+ wyścigi (wszystkich nie damy rady obsłużyć )
Cały problem polega na to aby odpowiednio to połaczyć. Zapewne nie obędzie się bez zmian już zmienianych list.

Troll81

żeby zrobic liste trzeba by na kazdym z SKB@P policzyc każdy z ok 80 projektów. Trzeba by sprawdzić jak dany komp dany projekt liczy pod windows i pod linux. Z włączonym i wyłączonym HT......


kombinacji jest kilkaset. by wyniki były miarodajne trzebaby policzyć kazdyprojekt przez kilka dni.... wiesz ile to roboty?

Ania

Tak by było perfekcyjnie :)
Ale nie ma sensu tak robić. Słynna zasada głosi że robiąc 20% testów można uzyskac 80% skuteczności.
Dzięki wiedzy zespołu cześći testów (myślę, że większości) nie warto robić. 

Warto wykorzystać "ciekawostki" które obecnie już wiemy:
- POEM GPU
- WCG GPU
- kończące się projekty WCG, które niedługo znikną i pkt+time staną się "bezcenne"

Wszystkich nie pamiętam, ale wiele propozycji się zapewne pojawi. Cześć z nich warto będzie sprawdzić i ... jeśli się powiodą wdrożyć.

Troll81

nie wszędzie da się zastosowac zasadą 20/80 Aniu :D

stiven

I to chyba dopiero po wszystkim da się powiedzieć, które testy były tymi sensownymi.

Radegast

Witam koleżanki i kolegów.
Otrzymałem biuletyn, więc przybywam.

Według mnie koncepcja funkcjonowania PM jako przede wszystkim forum wyboru projektów dla SKB@P jest błędna.
Biorąc udział w głosowaniach na PM widzę, że przy głosowaniu uczestnicy - włączając w to mnie - kierują się głównie własnymi preferencjami dotyczącymi projektów co jest oczywiste i bardzo pożądane, ponieważ dzięki temu mamy różnorodność i względną równowagę w doborze zadań na każdy miesiąc. Sprzyja temu również dobrze według mnie funkcjonujący system zamrażarek i metoda głosowania. W tym przypadku myślę, że demokratyczne podejście spisuje się całkiem nieźle i przeciętnie nikt nie powinien być poszkodowany ani niezadowolony.
Inaczej sprawa się ma jeśli chodzi o SKB@P. Oczywiście jako maszyna nie może być niezadowolony ani poszkodowany, jednak jako maszyna licząca może być z pewnością nie wykorzystywany optymalnie. Trudno wymagać od SKB@P udziału w głosowaniu, a od wszystkich członków B@P wiedzy, jakie projekty najlepiej się na nim liczą.
W związku z powyższym proponuję wyłączyć SKB@P z udziału w PM i przypisać mu konkretne zadania długoterminowe zoptymalizowane do jego możliwości.

Jak tego dokonać?

Przebrnąłem jakoś przez 6 stron wątku i wybrałem według mnie dwie najciekawsze wypowiedzi:

Cytat: anomax w 14 Listopad 2012, 23:42
Przede wszystkim to uważam, że nie można oceniać wykorzystania CPU czy GPU na podstawie tego ile punktów daje projekt, ponieważ punkty są wartością trochę abstrakcyjną. Jeżeli mielibyśmy porównywać jak projekty wykorzystują podzespoły komputera to trzeba by było porównać ile FLOPS-ów jest w stanie przeliczyć dana karta czy procesor w danej jednostce czasu.

(...)

O ile sam nie liczę dla punktów, to uważam że jeśli chodzi o zespół to aby rywalizować z innymi musimy się po części nastawić się na punkty (niestety nie My ustalamy zasady gry). Ale trzeba pamiętać też, że nie punkty są najważniejsze lecz dobra zabawa i jak te nasze godziny liczenia wpłyną na przyszłość.

Uważam, że trzeba znaleźć takie rozwiązanie które pozwoli w jak największym stopniu spełnić te priorytety. Wiem, że to trudne zadanie, ale myślę że wspólnie uda się nam coś konkretnego wymyślić.

Zgadzam się z anomaxem z jedną poprawką: punkty są wartością całkowicie abstrakcyjną. Każdy projekt (a właściwie admin) przydziela punkty wedle własnego uznania. Punktacja nie powinna być kryterium wydajności, skuteczności czy przydatności pomiędzy różnymi projektami, a jedynie pokazywać może jak w obrębie jednego projektu radzą sobie różne platformy. Posługując się metaforą - to tak jakby porównywać liczenie ilości ziaren maku w jednym worku i ziemniaków w drugim.
Być może - i tu odwołuję się do wiedzy i umiejętności bardziej doświadczonych BOINCowców - możliwe jest i warto by było przeprowadzić taką analizę wydajności FLOPS komputerów SKB@P odnośnie każdego/wybranych projektów.
Oczywiście trzeba pamiętać, że admini projektów różnie optymalizują swoje aplikacje i niektóre bardziej wydajnie liczą zagadnienie naukowe, a inne gorzej ale na to już wpływu raczej nie mamy.

Z drugiej strony punkty stały się przedmiotem rywalizacji między uczestnikami i zespołami, bez wątpienia motywując do aktywnego partycypowania w platformie BOINC. Myślę, że dopóki będą funkcjonować takie fora jak nasze, na których wzajemnie się "pilnują" zwolennicy punktów i idei, równowaga będzie zachowana i nauka będzie prosperować.

W związku z pomysłem przypisania komputerów SKB@P konkretnym projektom można przyjąć w uproszczeniu trzy różne założenia wyboru projektów
   a) najlepiej punktujące
   b) najbardziej wydajne (FLOPS)
   c) najlepiej punktujące spośród najbardziej wydajnych (pts/FLOPS)

I tutaj przywołuję drugi najciekawszy post:

Cytat: Ania w 29 Listopad 2012, 10:43
Dlatego dla każdego SKB@P trzeba zbudować listę projektów w których dobrze sobie daje radę z uwzględnieniem dodatkowych warunków.

np. POEM+Free+WU, PM GPU +PM CPU +WU +Free,DT+ WCG itp.
Jeśli pierwszy wariant (POEM+Free+WU) zawodzi to przechodzimy na drugi potem na trzeci.

Oczywiście zbudowanie takich list zajmie trochę czasu i trzeba je będzie aktualizować ... ale istniejemy już kilka lat i pewnie jeszcze kilka lat będzie to istniało. Tak więc w miarę możliwości warto takie listy zbudować wykorzystując najnowsze osiągniecia i wiedzę z poszczególnych projektów (optymalizacja listy pod konkretny sprzęt). Każdy z opiekunów szukałby rozwiązania dla swojego sprzętu.

Reasumując, zasadniczo postawić należy dwa pytania:
1. czy chcemy zmiany zasad przydziału projektów dla SKB@P z systemu PM na system zoptymalizowany?
i jeśli odpowiedź na pytanie pierwsze będzie twierdząca:
2. według jakich kryteriów przydzielimy optymalne zadania dla poszczególnych maszyn SKB@P?
   a) punkty
   b) wydajność (FLOPS)
   c) punkty/FLOPS

Odnośnie zmian sprzętowych, wydaje mi się, że lepiej najpierw wprowadzić optymalizację zadań, a potem ewentualnie potraktować drobne zmiany hardware'u na zasadzie tuningu, czyli do-optymalizowania całego systemu.

sknd


Dario666

Cytat: Troll81 w 30 Listopad 2012, 13:26
żeby zrobic liste trzeba by na kazdym z SKB@P policzyc każdy z ok 80 projektów. Trzeba by sprawdzić jak dany komp dany projekt liczy pod windows i pod linux. Z włączonym i wyłączonym HT......
kombinacji jest kilkaset. by wyniki były miarodajne trzebaby policzyć kazdyprojekt przez kilka dni.... wiesz ile to roboty?

Jest jeszcze więcej, bo przecież np. w PrimeGrid jest kilkanaście podprojektów, więc liczba kombinacji wzrasta.

@Doc
Piszesz, że na PG jest tyle i tyle punktów, ale na jakim podprojekcie? Z moich obserwacji wynika, że najwięcej dają PPS (Sivie) i Genefer, tylko na tym ostatnim trudno określić  liczbę punktów w tak krótkim czasie (12h)