Czyżby wysypała sie jednostka ?

Zaczęty przez michal_saper, 19 Marzec 2008, 17:47

michal_saper

Jest taka sprawa.
Pobrało się WU, model slab. Liczy się liczy, każdego dnia wysyła stróżki, i każdego dnia dostaje punkty. Wczoraj jednostka przeanalizowała się w 33%, timestep osiągnął 259248/259248 i BOINC rozpoczął masowe wysyłanie stróżek. Łącznie wysłał ich ok piętnastu. Po wysłaniu stróżek liczenie tej jednostki ruszyło dalej, ale już z nowym timestepem 1,2,3.../259248. Procenty w pasku postępu jednostki także szły sobie dalej (33,456%...) i gra muzyka.
Wstrzymałem tą jednostkę, podłączyłem się do POEM i pobrałem do przeliczenia kilka WU. BOINC fajnie sobie liczył projekt POEM, ukończone WU sobie wysłał - dostałem pkt.
Po przeliczeniu jednostek projektu POEM climata wznowiłem, jednak wyskoczył komunikat.

2008-03-19 15:34:09|climateprediction.net|Restarting task hadsm3fub_017x_005932694_0 using hadsm3 version 506

Liczenie próbki rozpoczęło się na nowo. Rzecz jasna wystartowało od 0.000% ALE nie wyzerowało czasu liczenia.
Na chwilę obecną wygląda to tak, że mam próbkę z postępem 0,870% a czas pracy wynosi lekko ponad 180 godzin. Pytanie, dlaczego wyzerowało mi jednostkę z 33 % do 0 % ? Oraz dlaczego nie widzę swoich stróżek (tych które BOINC wczoraj masowo wysyłał) na swoim koncie w CPDN ??

Moje stróżki
http://climateapps2.oucs.ox.ac.uk/cpdnboinc/trickle.php?resultid=7286965

Troll81

wygląda na prolem menadzera a nie próbki. Po prostu manadzer wyswietla ci 0% a próbka se leci dalej.

michal_saper

Cytat: Troll81 w 19 Marzec 2008, 18:52
wygląda na prolem menadzera a nie próbki. Po prostu manadzer wyswietla ci 0% a próbka se leci dalej.

Zapomniałem dodać iż próbka zaczęła liczyć się od samego początku tj. od roku 1810. Jeśli to możliwe to prosił bym o w miarę szybką odpowiedź czy liczyć to dalej (póki co próbka się liczy)
Miałem backup. Zainstalowałem parę chwil temu BOINC-a 5.10.30 - na tej też wersji klienta próbka została pobrana i spróbowałem uruchomić tą jednostkę na kliencie który ją pobrał, ale to nic nie dało wyzerowało jednostkę :-\
Przekopiowałem z powrotem pliki i liczy się póki co... Postęp na chwilę obecną wynosi 1,183% przy czasie 181 h :-\

P.S.
Problem z jednostką wystąpił na kliencie 5.10.45 którego od kilku dni testowałem.

Liczyć to dalej ? Usunąć i pobrać nową jednostkę ? Usunąć całęgo BOINC-a i dać se spokój z projektami ? :P

Tomislaw

Miałem kiedyś podobny problem. Z tego co pamiętam. To po kilku godzinach próbka wskoczyła na właściwy procent i dalej liczyła się normalnie. Jednakże jedna z dwóch jednocześnie liczonych próbek wywaliła się jakieś 20 lat przed końcem (długie WU po 180 lat) a druga doliczyła się do końca. Od tego czasu dałem sobie spokój z CPDNem



michal_saper

Rozumie że do końca doliczyła się ta próbka która wskoczyła po kilku godzinach na właściwy procent ? W takim razie zostawię ją, niech się liczy. Mam nadzieje że stanie sie tak jak w Twoim przypadku, i niebawem wskoczy na właściwy tor  :)

michal_saper

Nawiązując do swojego problemu powiem iż próbka nadal sie liczy, stróżki wysyła (choć nie widzę ich na swoim koncie) ale pkt mi nie przyznawają...
w menadżeże zadań są aktywne dwie aplikacje tj.

hadsm3_5.06_windows_intelx86.exe      Aplikacja zużywa 0% mocy procka
hadsm3_um_5.06_windows_intelx86.exe     Aplikacja zużywa 100% mocy procka

Tak jak już wcześniej pisałem, wcześniej wszystko ładnie się liczyło, ale o ile się nie mylę w użyciu była ta aplikacja która teraz, pomimo tego iż jest także uruchomiona nie jest używana. Sprawa mnie o tyle zaciekawiła, że wczesniej przybywało mi z każdym dniem MB jakie zajmuje mi na dysku BOINC. Każdego dnia wykonuje backup i każdego dnia miałem coraz wiecej MB do kopiowania. Od kilku dni jednak, (od momentu wyzerowania % postepu) MB na dysku nie przybywa, a próbka liczy sie dalej...
Na chwilę obecną przeliczyło mi 8,353% próbki.
W tym miejscu proszę kogoś kto przeliczył w całości jednostkę hadsm do końca o to by napisał jak ta jednostka liczyła się u niego. Czy to normalne ?

ksysju

Hi

Tak patrze, że od 18 III, nic ci climate nie zalicza. Nic Ci tam w logach nie krzyczy ?. W sumie z tego co wyczytałem to próbka liczy się od nowa, tak rozumiem komunikat: Restarting task.

A jeśli liczy jeszcze raz to samo na tym samym pc, to strużek nie przyjmie.
Co widać (czyli nie widać ;-) ) w wynikach.

Napisz jeszcze jak tam symulacja wygląda, może są jakieś anomalie i próbka ma problem.

Proponuje przerwać i pobrać nową próbkę.

W ramach eksperymentu możesz liczyć ją dalej, przy tych 33% albo się zrestartuje albo pójdzie dalej i zacznie zaliczać. -:)

Slab model na twoim sprzęcie to jakieś 300-400h,

--
ksysju
ksysju

michal_saper

#7
Na forum CPDN znalazłem taką oto informację...


"I have seen the same thing for both of my models too. Currently windows taskmanager has four CPDN processes listed:

hadsm3_um_5.06_windows_intelx86.exe (20-25%)
hadsm3_5.06_windows_intelx86.exe (20-25%)
hadcm3transum_5.44_windows_intelx86.exe (20-25%)
hadcm3_5.44_windows_intelx86.exe (20-25%)

My system is a Dual Core Intel @2.16Ghz with two CPDN models running."

Więc z tego co potrafię wywnioskować wynika iż to normalne.... Sam nie wiem już ja zrobić. Szkoda nieco ponad 200
h liczenia

DODANO:

oto link do wątku w którym znalazłem tą informację. Niestety nie znam angielskiego... :P

http://climateapps2.oucs.ox.ac.uk/cpdnboinc/forum_thread.php?id=6017

ksysju

Hi

Jeśli chodzi o:

hadsm3_5.06_windows_intelx86.exe      Aplikacja zużywa 0% mocy procka
hadsm3_um_5.06_windows_intelx86.exe     Aplikacja zużywa 100% mocy procka

To jest to  całkowicie normalne i tak ma być.

--
ksysju
ksysju

michal_saper

Mi bardziej zależy na wyniku liczenia, niżeli samych tylko za to punktach. I dla tego też postanowiłem liczyć dalej tą próbkę. Jeśli jednak dojdzie do tych 33% i nastąpi restart projektu, dam sobie spokój z tą próbką.