Tworzenie projektu... czyli powstanie i ewolucja Enigma@Home

Zaczęty przez TJM, 27 Lipiec 2007, 16:22

lukaszde

#440
Heh braklo probek do przeliczania  :o

Nieaktualne - juz sa  ;D

Troll81


TJM

Ciekawe kto by to przepisał, ja na pewno nie dałbym rady.
Poza tym progs wykonuje proste operacje stałoprzecinkowe i działania na tablicach, pewnie szybkość na GPU byłaby gorsza niż na procach średniej klasy.

EDIT: próbek nie ma prawa zabraknąć chyba że coś zdechnie na serwie. W kolejce czeka 4.5 miliona. Co najwyżej mogą być parominutowe braki jak ktoś wysysa szybciej niż serwer tworzy nowe.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

Troll81

jezusicku  :o to co ty liczysz??? plan zniszczenia i przejęcia świata?? :D

TJM

Serwer chwilowo off ze względu na pady zasilania spowodowane warunkami pogodowymi. Od wczoraj wieczora w okolicach Łodzi ciągle burze, późnym wieczorem już sie poprawiało ale w nocy nadszedł kolejny atak. W tym momencie w domu nie mam prądu ani netu :/

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

Pigu


TJM

A jak działa nowy wrapper ? Zwróciłeś uwagę czy informacje o postępach uaktualniają się poprawnie ?
Na linuksie zauważyłem już pewne małe zgrzyty (czasami na początku skacze na chwilę na 100% i potem działa normalnie, pod koniec potrafi wskoczyć na 90% i od razu potem na 100), ale to zostanie usunięte w nastepnej wersji.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

Pigu

jak to odpalić - wrzucić ten nowy plik do katalogu, nazwy nie modyfikowałem w app, bo się zgadzała i już powinno kulać?

TJM

Powinno, wystarczy zamienić plik wykonywalny wrappera.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

Pigu

działa - nie wiem jak, ale działa tzn wartość na pasku postępu jest pomiędzy 0 a 100, a z analizy czasu przeliczania i czasu pozostałego wskazanie zdaje się być poprawne

TJM

Jakiś dziwny bug jest gdzieś w skryptach projektu, giną niektóre pliki z katalogu /download przez co część zadań nie ma zamiaru się ściągać. Główkuję nad tym ale nie mam pojęcia skąd się bierze taki efekt, póki co lukajcie czasami czy wam nie wiszą jakieś download errory w transferach.

EDIT: wszystko wskazuje na to, że gdzieś w czasoprzestrzeni luty-sierpień zmieniła się troche logika zmian stanów zadań/rezultatów; stary assimilator zadania z download errorem oznaczał od razu jako uszkodzone (wiadomo, że brakujący na serwerze plik sam nie odrośnie), a nowa wersja serwera jakoś tego nie akceptuje i resetuje zadanie do stanu początkowego; w rezultacie każde zadanie z błędem ściągania jednego z plików siedziało mi w kolejce w nieskończoność i takich padaczek było w kolejce coraz więcej. Chyba to poprawiłem ale jeszcze muszę nad tym posiedzieć, bo przy okazji zauważyłem, że wreszcie rozszerzyli opisy wszystkich możliwych stanów dla zadań i rezultatów, więc może ulepszę jakoś swoje daemony.


W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

Bober

Zauważyłem u siebie dużo próbek z Client state  "compute error". Po krótkim przejrzeniu paru hostów okazało się, że zjawisko wystąpiło nie tylko u mnie, ale dotyczy tylko próbek sprzed paru dni. Wiadomo o co chodzi?

TJM

Nowy validator zaznaczył wszystkie stare zadania jako błędne, nie ma to żadnego efektu innego niż wizualny.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

TJM

Hm konieczność upgrejdnięcia serwera zbliża sie wielkimi krokami. Póki sprawnie działa automatyka, nowe zadania tworzone są płynnie i usuwane są stare z określonym wiekem od zakończenia jest ok. Ale wystarczy, że nastąpi przerwa w pobieraniu/odsyłaniu zadań z serwera M4 i potem trzeba nadgonić żeby uzupełnić zapasy lub pozbyć się tysięcy przeliczonych zadań - zaczyna  być kiepsko, nawet bardzo kiepsko. Każde dłużej trwające zadanie, nawet prosty db_purge który obecnie kasuje stare zadania zamula serwer. Głównym wąskim gardłem są dyski ale i dość niska jak na taki serwer ilość RAMu (2GB).
Jakoś na początku października zmienię cały sprzęt na inny (proc AMD nie był dobrym wyborem, raz że jest gorszy od podobnie taktowanego C2D, druga sprawa - jest jeszcze kompilator Intela i elementy serwera skompilowane nim dadzą pewnie jeszcze większą różnicę wydajności).
Cały proces upgrade na pewno potrwa co najmniej parę dni i w tym czasie można się będzie spodziewać różnych rzeczy - od najzwyklejszego niedziałania serwera, przez braki zadań, problemy w odsyłaniu i w najgorszym wypadku jakieś błędy %-)

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

Troll81


TJM

5x320GB, wszystkie chyba WD. Nie pracują w RAIDzie tylko pojedyńczo, podmontowane w różnych miejscach drzewa katalogów. W ten sposób obciążenie rozbija się na pojedyńcze dyski - logi na jeden, katalogi upload i download na drugi, baza danych na trzeci, backupy i archiwa na czwarty. Niestety w praktyce odciąża to tylko trochę jeden z dysków, bo 90% obciążenia generuje baza danych, tak więc jedynie pozostałe 10% rozkłada się między 3 dyski. Gdyby dało się poszczególne tabele rozdzielić np. między dwa dyski, to już byłby wielki sukces. Myślę że da się to jakoś zrobić (mało jest rzeczy niemożliwych na linuksie, możliwe, że wystarczy zwykły softlink na jednym dysku do pliku na drugim) ale wolę nie kombinować, póki na stałe nie wrócę do domu.


W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

Pigu


TJM

Odkryłem właśnie śmieszny błąd, a raczej niedopatrzenie, który w rezultacie powoduje nadmierny rozrost baz.
Zoptymalizowana aplikacja zawiera wrappera w wersji 5.19, który do stderr wypluwa informacje na temat postępów, ot taki trick który pomagał w trakcie dłubania we wrapperze. Do archiwum w założeniu miała wejść ta sama wersja, ale z wyłączonym debugiem. Jak to się stało, że wersja rozwojowa tam jest nie mam pojęcia, ale wynik jest taki, że do serwera uploadowany jest stderr o zawartości np. takiej:


<core_client_version>5.10.28</core_client_version>
<![CDATA[
<stderr_txt>
y 0.461538, frac_dokladny 0.071006, x3 88
debug: odleglosc 13, pozycja 6, frac_zgrubny 0.461538, frac_dokladny 0.071006, x3 88
debug: odleglosc 13, pozycja 6, frac_zgrubny 0.461538, frac_dokladny 0.071006, x3 88
debug: odleglosc 13, pozycja 6, frac_zgrubny 0.461538, frac_dokladny 0.071006, x3 88
debug: odleglosc 13, pozycja 6, frac_zgrubny 0.461538, frac_dokladny 0.071006, x3 88
debug: odleglosc 13, pozycja 6, frac_zgrubny 0.461538, frac_dokladny 0.071006, x3 88
debug: odleglosc 13, pozycja 6, frac_zgrubny 0.461538, frac_dokladny 0.071006, x3 88
debug: odleglosc 13, pozycja 6, frac_zgrubny 0.461538, frac_dokladny 0.071006, x3 88
debug: odleglosc 13, pozycja 6, frac_zgrubny 0.461538, frac_dokladny 0.071006, x3 88
debug: odleglosc 13, pozycja 6, frac_zgrubny 0.461538, frac_dokladny 0.071006, x3 88
debug: odleglosc 13, pozycja 6, frac_zgrubny 0.461538, frac_dokladny 0.071006, x3 88
debug: odleglosc 13, pozycja 6, frac_zgrubny 0.461538, frac_dokladny 0.071006, x3 88
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.005917, x3 66
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.005917, x3 66
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.005917, x3 66
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.005917, x3 66
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.005917, x3 66
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.005917, x3 66
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.005917, x3 66
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.005917, x3 66
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.005917, x3 66
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.005917, x3 66
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.005917, x3 66
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.005917, x3 66
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.005917, x3 66
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.005917, x3 66
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.005917, x3 66
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.005917, x3 66
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.005917, x3 66
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.014793, x3 69
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.014793, x3 69
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.014793, x3 69
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.014793, x3 69
debug: odleglosc 13, pozycja 7, frac_zgrubny 0.538462, frac_dokladny 0.014793, x3 69


i tak dalej, aż do kilkudziesięciu-kilkuset kB, zależnie od długości zadania i szybkości kompa. To wszystko przechowywane jest potem w bazie, a jak łatwo policzyć, jeśli zamiast pół kB (tyle średnio jest z normalnym wrapperem) jest np. 500kB, to jeden taki wpis w bazie zajmuje tyle, co 1000 normalnych :o

Wniosek stąd taki: użytkownicy Windowsa jadący na zoptymalizowanej aplikacji proszeni są o wywalenie z katalogu projektu obu wrapperów i pliku app_info oraz zastąpienie ich tymi z tego archiwum:

http://tjm.boo.pl/enigma/app/app_test_522.zip



W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

Pigu


Szopler


Bober

TJM czy mogę dodać Enigmę do ankiety na październikowy Projekt Miesiąca?

TJM

Jasne, 5 albo 6 października wracam na stałe do domu, przez te kilka dni nie powinno się raczej nic posypać. Gdzieś w okolicach 8-10 października będzie zmiana sprzętu w serwerze, ale myślę że jeśli nie będzie komplikacji downtime potrwa max parę godzin, a tyle da się przetrwać nawet z małym buforem zadań.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

PBT_marian_boss

Witam, chciałbym przyłączyć się do testowania ale nie za bardzo wiem jak to zrobić. Gdzie założyć konto itp. ? Proszę o jakieś wskazówki.

Mori

http://www.enigmaathome.net/

Edit: Eee, no bo Enigmie mówimy, nie?

stasieks

Cytat: Mori w 06 Wrzesień 2008, 12:22
http://www.enigmaathome.net/

Edit: Eee, no bo Enigmie mówimy, nie?

Heheheh ale żeś dowalił. Pytanie było o testowanie projektu.

Mori

No tak, ale testuje się chyba przez przeliczanie, nie? A linki do optymalek podawał TJM tam na forum :P

To gdzie się zgubiłem, co?

Bober

Popełniłem dziś straszny błąd - na hoście z którego pobierałem próbki dla beznetowca odpaliłem jakiegoś starego menedżera i bezmyślnie kliknąłem "opuść" Enigmie. W efekcie wszystkie próbki będące na beznetowcu dostały "client detached".

Na wszelki wypadek spytam: TJM czy są jakieś szanse na punkty za te próbki? Było ich ponad 100  :'(

PBT_marian_boss

No fajnie ale nadal nie wiem jak się podłączyć i jakiej aplikacji używać.

AiDec

Cytat: Bober w 08 Wrzesień 2008, 23:15
Popełniłem dziś straszny błąd - na hoście z którego pobierałem próbki dla beznetowca odpaliłem jakiegoś starego menedżera i bezmyślnie kliknąłem "opuść" Enigmie. W efekcie wszystkie próbki będące na beznetowcu dostały "client detached".

Na wszelki wypadek spytam: TJM czy są jakieś szanse na punkty za te próbki? Było ich ponad 100  :'(


To ja Ci cos zacytuje na otarcie lez ;D:


Cytat: Bober w 07 Wrzesień 2008, 19:48
AiDec nie denerwuj się. Stracone próbki to "sól boincowej ziemii'' - nie pierwszy to i nie ostatni raz. Boli ale w końcu się przyzwyczaisz  ;)


No dobra, tak naprawde to wcale nie jestem taki zlosliwy ;). Tylko mnie boli ze przez czyjes nieuctwo trace punkty, nie przez swoje zaniedbania :(.






Co do Enigmy. Mam pytanie proste: dlaczego Enigma tak slabo placi. Jaka jest przyczyna? Zadaje proste pytanie i oczekuje prostej odpowiedzi :).



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

kempler

Cytat: AiDec w 09 Wrzesień 2008, 09:26
Cytat: Bober w 08 Wrzesień 2008, 23:15
Popełniłem dziś straszny błąd - na hoście z którego pobierałem próbki dla beznetowca odpaliłem jakiegoś starego menedżera i bezmyślnie kliknąłem "opuść" Enigmie. W efekcie wszystkie próbki będące na beznetowcu dostały "client detached".

Na wszelki wypadek spytam: TJM czy są jakieś szanse na punkty za te próbki? Było ich ponad 100  :'(


To ja Ci cos zacytuje na otarcie lez ;D:


Cytat: Bober w 07 Wrzesień 2008, 19:48
AiDec nie denerwuj się. Stracone próbki to "sól boincowej ziemii'' - nie pierwszy to i nie ostatni raz. Boli ale w końcu się przyzwyczaisz  ;)

Hehehe  :P


Co do Enigmy. Mam pytanie proste: dlaczego Enigma tak slabo placi. Jaka jest przyczyna? Zadaje proste pytanie i oczekuje prostej odpowiedzi :).

Bo tak ?  :P

Kury Nas pogryzą, Raptory zeżrą....

AiDec

Cytat: kempler w 09 Wrzesień 2008, 09:36
Cytat: AiDec w 09 Wrzesień 2008, 09:26
Co do Enigmy. Mam pytanie proste: dlaczego Enigma tak slabo placi. Jaka jest przyczyna? Zadaje proste pytanie i oczekuje prostej odpowiedzi :).

Bo tak ?  :P

No dobra, nie az tak prostej :P



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

Bober

Przypuszczam, że TJM chciał być fair i nie zastosował overgrantingu tak jak niektóre projekty. Ogólnie rozsądne wydaje się, że powinien istnieć pewien parytet przyznawania punktów przez projekty. Chociaż nie wszystkie się stosują to jednak można go było mniej więcej określić i tak TJM ustalił punktację.

Inna sprawa, że nie uwzględnił, że AMDki słabiej liczą i dostają mniej niż żądają - można by więc nieco podnieść punktację.

@Marian_boss: nie do końca wiem co masz na myśli przez testowanie ale wszystkie pliki do optymalizacji są nadal  w temacie http://www.enigmaathome.net/forum_thread.php?id=17&nowrap=true#150

RAD-Poland

#472
nie wiem czy TJM zdoła coś zrobić, ale era beznetowców i kilku managerów na jednym kompie przemija

z tego co zauważyłem zależy to od wersji serwera boinc w projekcie, do niedawna liczyłem einsteina na kilku kompach teraz na jednym podobnie jest z enigmą, nowe wersje serverów boinc automatycznie łączą twoje managery, obecnie jak ściągnę wu do jednego managera, a następnie uruchomię drugiego to próbki z pierwszego dostają status "detach"  :(

w einsteinie taka sytuacja występuje od miesiąca, :(
w enigmie od prawie samego początku (TJM - stara się mieć aktualne wersje servera),
w yoyo taki problem u mnie na razie nie wystąpił więc liczę na kilku kompach,
idealny z mojego punku widzenia jest serwer SIMAP (nie zdarzyło mi się stracić ani jednej próbki) w nim tworzę kilka manager'ów (bo czasami mało wu dają), rozpoczynam  ściąganie wu, łączę managery "merage" i w jednym managerze mam np 300 wu i lecę do beznetowca  :D


   
WCG:
PG:         YOYO:

     

TJM

W sprawie próbek ze statusem client detached: teoretycznie jestem w stanie zresetować im status, ale dopiero w piątek bardzo późnym wieczorem lub w nocy z piątku na sobotę. W piątek rano wyjeżdżam z miejsca pracy do domu i dotrę dopiero wieczorem.
Do tego czasu część na pewno trafi do innych hostów, a że quorum = 1 serwer punktów nie przyzna dla dwóch wyników. Punkty dostanie host, który odeśle je pierwszy, przy czym niepotrzebne zadanie zostanie anulowane u drugiego użytkownika jeżeli nie było rozpoczęte.
Jeśli masz te próbki poprzeliczane na beznetowcu, ale nie odesłane, najlepiej byłoby wysłać do mnie te zadania (cały katalog z danymi) - mój assimilator jest w stanie wessać takie próbki i przydzielić za nie punkty, nawet jeśli są to 'duble' - w projekcie tak naprawdę nie ma czegoś takiego jak nadmiarowy rezultat a workunitów jest tylko 26k, przeliczane są w kółko za każdym razem z innymi, losowymi ustawieniami startowymi.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

TJM

Punktacja to rzecz względna - proc AMD może słabo punktować pod windows, ale z kolei Intel na linuksie może zgarniać nawet grubo ponad 200% claimed. E7200@3.5GHz z aplikacją skompilowaną kompilatorem Intela wciąga najkrótsze zadanie w jakieś 8 minut i dostaje za to ponad 8 punktów. Daje to ponad 60 punktów/h na jeden rdzeń.
Średnia z claimed credit jest praktycznie równa średniej z granted (niecały 1% rozrzutu) więc z punktacją nie jest aż tak źle. Nie wykluczam jednak, że moźe się lekko zmienić.

Nikt jeszcze nie wymyślił, jak poprawić windowsową aplikację. Zwykłe skompilowanie jej kompilatorem Intela dałoby wzrost prędkości rzędu 30-40% względem obecnych najszybszych. Różnica w prędkości między windows a linuksem to obecnie jakieś +60% na korzyść linuksa.  Dawno bym to zrobił, ale nie mam pojęcia jak - jeśli znacie kogoś kto mógłby pomóc, dajcie znać.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

Bober

Cytat: TJM w 10 Wrzesień 2008, 22:52
Jeśli masz te próbki poprzeliczane na beznetowcu, ale nie odesłane, najlepiej byłoby wysłać do mnie te zadania (cały katalog z danymi)
Niestety to był moment jak go podłączyłem i wszystkie prysły. No cóż, jak sam napisałem - nie pierwszy to i nie ostatni raz -  trudno ;)

Troll81


lukaszde

TJM czy mozemy liczyc na dodatkowe statystyki, na styl tych zamieszczonych w aps: http://www.apsathome.org/server_status.php

TJM

Jasne, część masz nawet w postaci wykresów w jednym z wątków na forum. Wkrótce wraz z nowym hardware (którego część już wczoraj została zainstalowana) pojawi się trochę dodatków: toplista userów i teamów za ostatnie 24h, 7 dni i miesiąc; śledzenie najlepszych rezultatów każdego użytkownika i parę innych bajerów.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

TJM

Serwer wyłączony na 30-40 minut, czyszczenie całości i upgrade procesora.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.