Błędne próbki w Einstein

Zaczęty przez [B@P] MSW, 12 Kwiecień 2010, 21:30

[B@P] MSW

Może mi ktoś pomóc? Jak tam u was z próbkami na Einsteina bo u mnie poprostu jak niewywali błąd to za odesłaną próbkę i tak niedostanę punktów bo wali validation error. Błędnych próbek jest pięć na jedną z validation error. Czyli w sumie moge liczyć ale na próżno. Mam Linuksa 64b core2duo niekręcone 1.8GHz, zmieniłem Boinc managera na nowszego i to samo, kiedyś wszystko dobrze liczyło a teraz od projektu miesiąca wszystko się  >:( .  Co może być grane?

G

Miałem to samo na Debianie -procek: 2x Xeon. Przyczyny nie znalazłem. Komp w wyścigu już nie pojedzie :no:- brak paliwa.  W tym samym czasie równoległe próbki, które były oddawane dla Prime Grid były 100/100 poprawne.  Postępujący spadek >:( wydajności Einsteina pod Linuxem obserwuję  już od kilku miesiecy. Pod Windą jest natomiast odwrotnie.
Za błędy winiłem u siebie mieszaną sieć (win+lin), lub stare jądro ale -jak już wspomniałem- PrimeGrid jakoś -ani jedno -ani drugie nie przeszkadza XD.

[B@P] MSW

No właśnie odkryłem źródełko punktów w primegrid i mogę spokojnie robić 1000 punktów dziennie i to nie non stop odpalonym kompie więc bedę zmuszony  XD tylko to liczyć, ale chciałem właśnie teraz podciągnąć inne projekty chociaż do 20k a tu taka lipa  :( Trochę czuję się dyskryminowany przez te projekty nie dość że benchmark wali mnie w wydajności to jeszcze uwalone projekty. Chyba społeczność musi zabrać się za BOINC  XD bo jak tego sami niepoprawimy to bida będzie.

apohawk

Liczę Einsteina zarówno na windowsie i linuksie w ramach projektu miesiąca i żadnych problemów nie ma.
Gentoo 64bit, kernel 2.6.31-r6, BM 6.10.36, athlon 64 x2 4800+, 4GB RAMu. Tak więc pamięci zadaniom nie zabraknie.
Zresetuj projekt, może coś w plikach Einsteina się pomieszało.
No good deed goes unpunished.

[B@P] MSW

Właśnie zrestartowałem projekt, zobaczę czy pomogło.

G

#5
Ja mam jeszcze kernela 2.6.18. To jadro nie obsługuje np współpracy procka z GPU. Jeżeli Einstein wprowadził głębsze zmiany w aplikacjach to bez wymiany kernela może być bida.

apohawk

Mój linux nie ma GPU... może dlatego działa  XD
No good deed goes unpunished.

[B@P] MSW

Ale ja mam 2.6.31.12 i chyba powinno działać, pozatym też narazie na GPU nieposiadam.

G

#8
kernel 2.6.31 działa z GPU i bez. Ale do obsługi GPU muszą być wgrane odpowiednie stery wraz z nowym Boinc'iem. Być może masz już to razem z dystrybucją. Używaną przez system nazwę sterownika można sprawdzić w katalogu  /etc -o ile dobrze pamiętam.


     

[B@P] MSW

Właśnie projekt zameldował mi że przyznano mi prawie 250 punktów za próbkę która liczyła się 44 tysiące sekund procesora. Czy to jest porównywalny wynik z waszymi.
Próbka to była Global Cośtam cośtam 16 godzin mieliła sie.  :parrrty:

Peciak

masz cierplwosc mnie szlak trafia jak probka mieli sie powyzej 3 godzin

,,Z szanowania wzajemnego wypływa moc wielka w chwilach trudnych."

apohawk

U mnie na quadzie te za 250 pkt liczą się ok. 8 godzin. Też wolę, gdy próbki liczą się krócej niż dłużej, ale niewiele można na to poradzić.
No good deed goes unpunished.

Tomasz R. Gwiazda

dla hardcorow (dla mnie np) sa probki z Aqua :) po 400h :D na C2D

[B@P] MSW

A rzesz dupa blada! Znowu wali compute errorami w global corelation.  >:( Było trochę spokoju i znowu powtórka z rozrywki. Chyba zakończe Einsteina z niemiłymi wspomnieniami. PS. mam jeszcze 2 próbki cały czas pending a 30 kwietnia mija czas dla innych odesłania próbek, wiem że mają mocne sprzęty bo wsparcie CUDA. Czy mozliwe że u nich się coś wykszaczyło a mnie te próbki poszły czy to ja zrypałem obliczenia i wyniki się niezgadzają ?
Pytanie do tomka a ta AQUA to ma checkpointy czy non stop?

Tomasz R. Gwiazda

wydaje mi sie ze miala :)
Nie wiem jak teraz z probkami jest bo jakis czas temu przestalem liczyc :)

Polecam Quantum i Docking jako dobra alternatywe.

[B@P] MSW

Zanalazłem takie coś mi wywala oto fragment
--------------------
sky:30/111, f1dot:3/4
2010-04-24 21:19:09.6964 (10948) [debug]: CG:8391, FG:8339439
sky:30/111, f1dot:4/4
2010-04-24 21:21:40.5081 (10948) [debug]: CG:8391, FG:8339439
c

APP DEBUG: Application caught signal 8.

FPU status word ffff88e1, flags:  ERR_SUMM STACK_FAULT PRECISION INVALID
Obtained 5 stack frames for this thread.
Use gdb command: 'info line *0xADDRESS' to print corresponding line numbers.
../../projects/einstein.phys.uwm.edu/einstein_S5GCE_1.04_i686-pc-linux-gnu__S5GCESSE2[0x805b632]
[0xffffe410]
../../projects/einstein.phys.uwm.edu/einstein_S5GCE_1.04_i686-pc-linux-gnu__S5GCESSE2[0x80528f3]
../../projects/einstein.phys.uwm.edu/einstein_S5GCE_1.04_i686-pc-linux-gnu__S5GCESSE2[0x805ca62]
/lib/libc.so.6(__libc_start_main+0xfe)[0xf7533ace]
Stack trace of LAL functions in worker thread:
UpdateSemiCohToplist at line 1879 of file /home/bema/einsteinathome/HierarchicalSearch/EinsteinAtHome/source/lalsuite/lalapps/src/pulsar/GCT/HierarchSearchGCT.c
At lowest level status code = 0, description: NO LAL ERROR REGISTERED
21:26:08 (10948): called boinc_finish

</stderr_txt>
]]>
-------------------------------------------------------
o co chodzi? Wydaje się że w obliczeniach jakiś błąd robi i się wywala

buninek

Borykałem się z identycznym problemem. Cały wątek znajduje się kilka tematów niżej -
"Uszkodzony procesor?"
Przyczyną błedów jest kernel skompilowany z
CONFIG_PREEMPT=y

Rozwiązanie. Zmienić kernel na inny, pozbawiony tej opcji lub przekompilować samodzielnie z wyłączeniem tego.

[B@P] MSW

zapoluje na nowego kernela  XD Mam nadzieję że pomoże.

buninek

Pomoże na 99.99%.

CONFIG_PREEMPT jest ustawiany często w kernelach tych bardziej desktopowych, poprawia responsensywność systemu.
http://www.linuxfordevices.com/c/a/Linux-For-Devices-Articles/Seven-realtime-Linux-approaches-Part-C/


[B@P] MSW

Rozejrzałem sie po systemie bo nawet nie byłem pewien jakie jajo mam teraz i wyszło że raczej z nowszych bo 2.6.31.12 poprzednio jak instalowałem ten system to domyślnie wpakowany był 2.6.31.5. Widać że podczas aktualizacji systemu kernel mi podmieniło  ;). Jako że korzystam z "debiloodpornej" dystrybucji opensuse to nie uśmiecha mi się kompilować nowego jajka samemu. Może wyczaje coś poprzez oneinstalklik  XD.
PS. 2.6.34 - może na to sobie poczekać ? Czy zmienić na inne np. xen, rt, vanila czymkolwiek to jest.

buninek

Pobrałem z serwera dwie paczki kerneli vanilla i desktop w wersji 2.6.31.5-0.1.1. W przypadku desktop faktycznie konfig jest ustawiony z CONFIG_PREEMPT.
Vanilla zaś nie.

Vanilla to "czysty" kernel bez jakichkolwiek modyfikacji (pobrany z kernel.org).  Każda dystrybucja bardzo często modyfikuje te vaniliowe kernele sporą ilością przeróżnych patchy.  Jedne bardziej drugie mniej.

Jeśli chesz liczyć einsteina to śmiało możesz zainstalować vaniliowy kernel.

[B@P] MSW

Rozwiązałem problem, teraz podzielę się z Wami spostrzerzeniami.  ;)
po pierwsze w systemie faktycznie jakimś cudem desktop mi się znalazł chociaż przysiągłbym że wersje default wgrywałem  XD
Po zmianie na default wszystko poszło bez problemów już nawet parę próbek przeliczyło i wszystko wporządku. Dzięki za dobre rady zwłaszcza dla buninka