Aktualności:

W MEDIA znajdziesz grafiki, banery i avatary

Menu główne

FreeHAL@home

Zaczęty przez kempler, 08 Wrzesień 2008, 17:50

TJM

Wczoraj coś mi się nagle zmieniło i zwykły klient 6.6.x zaczął sam liczyć po kilka zadań na raz. Jednak już wcześniej, jak liczył tylko po jednym, coś się skwasiło i zaczęły wyskakiwać mi takie błędy:

Cytat
2009-02-16 09:49:23|FreeHAL@home|[error] Can't rename output file newFreeHAL_60657215218de-wikipedia-org.protaaoi-11462-3-7_0_0 to projects/boinc.freehal.org_projects_freehal_at_home/newFreeHAL_60657215218de-wikipedia-org.protaaoi-11462-3-7_0_0: Error 2
2009-02-16 09:49:30|FreeHAL@home|[error] Can't rename output file newFreeHAL_95209797408de-wikipedia-org.protaals-32032-4-17_1_0 to projects/boinc.freehal.org_projects_freehal_at_home/newFreeHAL_95209797408de-wikipedia-org.protaals-32032-4-17_1_0: Error 2
2009-02-16 09:49:35|FreeHAL@home|[error] Can't rename output file newFreeHAL_60657215218de-wikipedia-org.protaapy-11462-1-7_0_0 to projects/boinc.freehal.org_projects_freehal_at_home/newFreeHAL_60657215218de-wikipedia-org.protaapy-11462-1-7_0_0: Error 2

Na razie żadnym sposobem nie mogę tego naprawić :-(

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

lefler

wczoraj wszystkie przeliczone próbki utknęły w fazie wysyłania na serwer, restartowałem menagera i nic, ręcznie je ponaglałem też nic :)
o co tu chodzi?

KrzychuP

U mnie na obu kompach to samo.
Skrobnąłem przed chwilą co nieco na forum FreeHal'a. Czekamy na odpowiedź.

Pojawia się: HTTP error
02/17/09 08:13:26|FreeHAL@home|Started upload of newFreeHAL_24798527949de-wikipedia-org.protaarq-11443-6-17_0_0
02/17/09 08:13:30|FreeHAL@home|Temporarily failed upload of newFreeHAL_24798527949de-wikipedia-org.protaarq-11443-6-17_0_0: HTTP error
02/17/09 08:13:30|FreeHAL@home|Backing off 1 hr 43 min 37 sec on upload of newFreeHAL_24798527949de-wikipedia-org.protaarq-11443-6-17_0_0

tylko co to oznacza ???

AiDec

#363
Tyle co wiem, to ze od dwoch dni validator nie dziala - to moze byc przyczyna. Tez mam kilka tysiecy punkcikow do odeslania :).

Jakby ktos sie cos wiecej przez przypadek dowiedzial, to prosze o info tutaj.




Tak czy inaczej piate miejsce na swiecie odbite - gratki kamraci :). I przy naszym obecnym RAC`u (obecnym, a przeciez sie dopiero rozkrecamy ;) ), to czwarte miejsce zajmiemy lada moment, a i trzecie miejsce mamy zapewnione :). Czas pokaze czy stac nas na pierwsze (licze na to :) ).



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

Troll81

oooo AiDec zmienił avatara

KrzychuP

Robię ze swej strony co mogę

p.s. no rzeczywiście, bardzo ładny

TJM

Spotkaliście się może z takim błędem jak ten mój wyżej ? Próbowałem już wszystkiego chyba co mi na myśl wpadło, łącznie ze zmianą wersji managera i odłączaniem/podłączaniem się do projektu, cały czas ten sam błąd powraca jak bumerang, od paru dni ani jednego poprawnego zadania nie odesłałem.
A wasze błędy są spowodowane zmianą adresu upload/download serwera, mając próbki czekające do odesłania najlepiej wyedytować ten adres w plikach konfiguracyjnych klienta, żeby nic nie stracić.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

AiDec

Cytat: TJM w 17 Luty 2009, 14:34
Spotkaliście się może z takim błędem jak ten mój wyżej ? Próbowałem już wszystkiego chyba co mi na myśl wpadło, łącznie ze zmianą wersji managera i odłączaniem/podłączaniem się do projektu, cały czas ten sam błąd powraca jak bumerang, od paru dni ani jednego poprawnego zadania nie odesłałem.

1. Nie spotkalem sie z czyms w jakikolwiek sposob podobnym. Ale moglbym cos pomyslec, tylko najpierw daj znac na jakiej platformie to bylo - na Linuksie?


Cytat: TJM w 17 Luty 2009, 14:34
A wasze błędy są spowodowane zmianą adresu upload/download serwera, mając próbki czekające do odesłania najlepiej wyedytować ten adres w plikach konfiguracyjnych klienta, żeby nic nie stracić.


2. A samo sie nie zmieni? Serwery FreeHAL`a nie zaktualizuja danych?



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

TJM

Mój błąd dotknął wszystkie moje Windowsowe klienty, cinżko jest, odkąd to wystąpiło ani jednego poprawnego zadania jeszcze nie odesłałem.
A upload/download serwer chyba jest wpisany w parametry każdego zadania lub aplikacji (nie pamiętam, nie chce mi się teraz dokumentacji przeglądać), więc edycja plików jest chyba jedynym sposobem żeby go zmienić bez resetowania projektu.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

RAD-Poland

#369
wow właśnie sprawdziłem moje dodatkowe/równoległe klienty, wszystkie próbki przeliczone i błąd upload'u (360 próbek wisi - to ponad 2k pkt)  :ph34r:

Cytat: TJM w 17 Luty 2009, 14:34
A wasze błędy są spowodowane zmianą adresu upload/download serwera, mając próbki czekające do odesłania najlepiej wyedytować ten adres w plikach konfiguracyjnych klienta, żeby nic nie stracić.

w pliku client_state.xml znalazłem kilka różnych url

Cytat
<master_url>http://boinc.freehal.org/projects/freehal_at_home/</master_url>
...
<url>http://dl.freehal.org/projects/freehal_at_home/download//fh-101.zip</url>
...
<url>http://boinc.freehal.org:9898/projects/freehal_at_home/cgi-bin/file_upload_handler</url>

1. to główny url - działa
2. download działa ściąga nowe próbki
3. czy to ten trzeci adres url trzeba zmienić i na jaki ?

EDIT:
zmieniłem ten trzeci na (znaleziony w jednym z BM)
http://87.230.15.5/boinc/freehal_at_home/cgi-bin/file_upload_handler.cgi
ale nadal nic
:(

EDIT2:
ok
z tym nowym url'em idzie ale "jak krew  z ..."
za 3 4 próbą upload'u zazwyczaj się udaje

   
WCG:
PG:         YOYO:

     

AiDec

#370
No tak, ale sami sobie chyba zdajecie sprawe ile to roboty zmienic adresy na siedmiu kompach w trzydziestu klientach... :(. Sprawdzilem pierwszego rownoleglego klienta - w samym pierwszym kliencie ten link <url>http://boinc.freehal.org:9898/projects/freehal_at_home/cgi-bin/file_upload_handler</url> wystepuje czterdziesci razy! Czterdziesci linkow razy trzydziesci klientow... Naprawde nie da sie inaczej? :(



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

TJM

Przecież to max 5 minut roboty, nawet w notatniku masz funkcję zamień wszystko - otwierasz jedno okno w którym wklejasz stary i nowy link, potem kolejno XMLe i zamieniasz.
Alternatywą pewnie byłoby postawienie http proxy i rewrite starego URLa na nowy (całkowicie wykonalne), ale sądzę że samo przeczytanie instrukcji jak to zrobić więcej czasu zajmie niż ręczna zamiana nawet w 50 klientach %-)

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

AiDec

No wierze Ci na slowo.


Anyway, nawet bez zmiany URL, czasami udaje mi sie na roznych kompach odeslac WU. Caly czas klikam w `probuj ponownie` i raz na jakies 50 razy jakas jednostka sie uploadnie.



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

buninek

#373
Dokładnie, sama ręczna zmiana adresu w 14 klientach to raptem 90 s + restart 2 minuty.
Choć nie wiele to zmieniło jedynie komunikat w logach na

CytatError on file upload: There are too much uploads at the
moment. Please WAIT! Think at supermarket queues.

EDIT:
Coś tam jednak odsyła.

Uff! Odesłane.
Nie dziwi mnie, że w projekcie mającym status wczesnej alfy coś nie działa, dziwnym jest całkowity
brakiem informacji o zaistniałych problemach ze strony opiekuna projektu na stronie domowej czy forum.

KrzychuP

#374
U mnie na jednym kompie odsyła normalnie, chyba się już serwer odkorkował.
Drugi sprawdzę jutro rano.
I poszło jakoś bez ręcznego zmieniania url'a.  :)

EDIT:
Najpierw ładnie odesłał wczorajsze, a potem...

KA-SZA-NA  >:(

wisi mi już kilka WU i nie chce odesłać, w wiadomościach znów pojawia się:
02/19/09 12:00:59|FreeHAL@home|Message from server: 16 Feb 2009 | Attention! Please reset FreeHAL in the BOINC Manager. We have changed the upload URL. If you have done
02/19/09 12:00:59|FreeHAL@home|Message from server: 16 Feb 2009 | If you have done that already, ignore this message. It will disappear.
02/19/09 12:00:59|FreeHAL@home|Message from server: 16 Feb 2009 | Thank you // Tobias Schulz
02/19/09 12:00:59|FreeHAL@home|Message from server: 17 Feb 2009 | The problem is not fixed yet, but now the URL won't change again in such a short time. // Tobias Schulz
02/19/09 12:00:59|FreeHAL@home|Message from server: No work sent
02/19/09 12:00:59|FreeHAL@home|Message from server: (reached per-CPU limit of 5 tasks)

mimo, że url'e same się pozmieniały na te, które podawał RAD.
A do tego nie chce pobierać nowych, ze względu na limit.  >:(

RAD-Poland

#375
 :( :( :(

17.02.09
po zmianie url'a BM odesłał wszystkie 360 wu ale nie otrzymałem ani punkcika, kolejne próbki były ściągane co 50min także moje BM złapały tylko ok 80 wu

18.02.09
punktów za 360 w/w wu "ani widu ani słychu" - punkciki przepadły, za te 80 wu złapanych później punkciki zaliczyli

19:02.09
kolejna seria wu przechwycona ok 200 przeliczone i odesłane większości wiszą jako pending, ale pomału punktują
po powrocie do domku ze wszystkich BM Freehall'a liczyło tylko 3, reszta komunikat
Cytat[FreeHAL@home] Sending scheduler request: To fetch work.  Requesting 1 seconds of work, reporting 0 completed tasks
[FreeHAL@home] Scheduler request succeeded: got 0 new tasks
[FreeHAL@home] Message from server: %s
niestety restart projektu lub restart boinc spowodował wyłączenie 2 kolejnych BM  :(
został jeden działający BM, próbki zaczęli dawać co 10 sekund, (byłaby okazja zapunktować)

czy ktoś również ma takie komunikaty jak to naprawić ?
EDIT:
ok
restart boinc nic nie dał, ale pomogło wyłączenie i ponowne włączenie sieci w BM

   
WCG:
PG:         YOYO:

     

TJM

Jaki jest poprawny URL projektu obecnie ? Próbowałem ten co na stronie i skróconą wersję (bez tego między / łamańcami), w obu przypadkach nie mogę się podłączyć - wyskakuje mi jakiś parse error in scheduler reply.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

buninek

#377
Komunikatów o różnych błędach miałem bez liku. Rano calkowicie wyłączyłem sieć w klientach. Po południu
aktywowałem i ... zapchał cały upload. Przyciąłem.
Niby odsyłał, raportował i ... zapętlił się na dobre, czyli bez końca odsyłał i raportował te same wu. :o
Oczywiście bez rezultatu.
Spojrzałem w pliki client_state.xml podejrzanym wydał mi się podwójny wpis:
<scheduler_url>http://boinc.freehal.org/projects/freehal_at_home/freehal_at_home_cgi/cgi</scheduler_url>
<scheduler_url>http://boinc.freehal.org/projects/freehal_at_home/freehal_at_home_cgi/cgi.cgi</scheduler_url>

Skasowałem drugą linijkę. Zrestartowałem, odesłał wszystko. Pobierał nowe wu przez 1,5h i przeliczał.
Aktualnie wszystko odesłane. Brak nowych zadań.

Jak dla mnie projekt z gatunku podejrzanych.

Cytat: TJM w 19 Luty 2009, 19:54
Jaki jest poprawny URL projektu obecnie ? Próbowałem ten co na stronie i skróconą wersję (bez tego między / łamańcami), w obu przypadkach nie mogę się podłączyć - wyskakuje mi jakiś parse error in scheduler reply.

Adres raczej ten sam
http://boinc.freehal.org/projects/freehal_at_home/

KrzychuP

U mnie wygląda tak:
1. W domu pobiera i odsyła próbki normalnie, mimo że dalej wyskakuje ten zestaw wiadomości co w poprzednim poście podałem.
2. W pracy, zanim wyszedłem, wszystkie WU wisiały w kolejce do odesłania. Rano spróbuję je odesłać, jak znów coś z serwerem się nie będzie dziać.
3. Póki co, to nigdzie nic nie zmieniałem w plikach i sam się "naprawiał"

Zaraz wstrzymam przeliczanie Hal'a i po zaraportowaniu zresetuję projekt.
Spróbuję też mu, jak piszecie, zablokować i odblokować dostęp do sieci.
Zobaczymy, co to pomoże.

TJM

No to ekstra

Cytat
2009-02-20 09:49:29      Fetching configuration file from http://boinc.freehal.org/projects/freehal_at_home/get_project_config.php
2009-02-20 09:49:44   FreeHAL@home   Master file download succeeded
2009-02-20 09:49:50   FreeHAL@home   Sending scheduler request: Project initialization.
2009-02-20 09:49:50   FreeHAL@home   Requesting new tasks
2009-02-20 09:50:15   FreeHAL@home   [error] No start tag in scheduler reply

czyli mam pofreehalowane %-)

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

KrzychuP


malpi

Cytat
2009-02-20 09:49:29      Fetching configuration file from http://boinc.freehal.org/projects/freehal_at_home/get_project_config.php
2009-02-20 09:49:44   FreeHAL@home   Master file download succeeded
2009-02-20 09:49:50   FreeHAL@home   Sending scheduler request: Project initialization.
2009-02-20 09:49:50   FreeHAL@home   Requesting new tasks
2009-02-20 09:50:15   FreeHAL@home   [error] No start tag in scheduler reply
Mniełem to samo i restart kompa pomógł



AiDec

Info od opiekuna projektu:


I think that this is the case because BOINC has a cache for DNS requests. We have changed our IP, so BOINC is looking on the wrong server. Foor some users a simple reboot or stop/restart of the boinc daemon helped.

Best regards,
Tobias



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

maro86

A nie wystarczy samo:

ipconfig -flushdns
?

Xeon E5410@2.33GHz SCYTHE NINJA PLUS Rev.B (SCNJ-1100P)
Foxconn P35A-S@P36 2x Kingston HyperX KHX6400D2LL 1GB + 2x2GB Kingston 800Mhz
SAPPHIRE 5770 1GB DDR5 400/900 DVD LG
Corsair CMPSU-450VXEU - 450W Chieftec LBX-02BBB
Seagate Barracuda 7200.11 ST3500320AS 500GB + SAMSUNG HD120IJ 120 GB

AiDec

Mozliwe. U mnie na kilku kompach pomogl restart (jak Tobias napisal), natomiast nie niektorych restart sie nie sprawdzil, ale zadzialal refresh polaczenia.



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

TJM

U mnie z jakiegoś powodu nic nie pomaga, cały czas mam ten błąd. Zaczęło się od wyskakującego regularnie 'cannot rename output file.....' przy wszystkich zadaniach, próbowałem to wyleczyć przez ponowne podłączenie się do projektu no i mam teraz efekt.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

malpi

Sposób na ten problem z forumfreehala:
1. reset łącza
2. w menadżerze zadań zabiecie wszystkich zadań łącznie boincowych łącznie z boinctray
3. odczekać 30s
4. odpalić boinca i liczyć do upadłego
mam nadzieje że to ci pomoże ::)



buninek

Uwaga!!!
Jeśli aktualnie pobieracie nowe próbki, proponuję sprawdzić czy liczą się poprawnie.
Chyba jakaś wadliwa seria. U mnie i z tego co widzę nie tylko u mnie 100% kończy się
compute error a co za tym idzie 0 punktów.

TJM

#388
Na razie żadnych błędów w zadaniach nie zauważyłem, ale przeliczyło mi się dopiero kilka odkąd samoczynnie (uotafak?) minął problem o którym pisałem wyżej.
EDIT: jak to się mówi 'nie chwal dnia przed zachodem słońca'. Wrócił mi znienacka ten błąd śmieszny z 'cannot rename output file' na wszystkich managerach.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

RAD-Poland

wszystkie nowe próbki kończą się błędem  :(

Cytat22-Feb-2009 18:11:55 [FreeHAL@home] [error] Can't rename output file newFreeHAL_7811561955-de-wikipedia-org.protaaab-14107-5-13_0_0
22-Feb-2009 18:11:55 [FreeHAL@home] Computation for task newFreeHAL_7811561955-de-wikipedia-org.protaaab-14107-5-13_0 finished
22-Feb-2009 18:11:55 [FreeHAL@home] Output file newFreeHAL_7811561955-de-wikipedia-org.protaaab-14107-5-13_0_0 for task newFreeHAL_7811561955-de-wikipedia-org.protaaab-14107-5-13_0 absent

   
WCG:
PG:         YOYO:

     

sciagacz

u mnie tez sa same bledy

buninek

Nastąpiła znazczna poprawa w większości wszystko przelicza się ok, choć nie obywało się bez błędów.

Niestety niepokojącym objawem jest znaczny wzrost obciążenia cpu. O ile wcześniej 14 klientów pochłaniało ok 30% to obecnie jest to z 90%.

KrzychuP

U mnie pobiera i odsyła normalnie, wszystkie WU punktują, żadnych błędów, ale rzeczywiście wykorzystanie CPU bardzo wzrosło.
Przy 3 próbkach jednocześnie wzrasta nawet do 50% !!!  |-?

AiDec

#393
Obciazenie wzroslo bardzo, ale w bardzo specyficzny sposob:

1. Moj czolowy komp (czterordzeniowiec) przy normalnym obciazeniu 90% (3x Milky + 2x GPUGrid + 1x FreeHAL + 1x Almere) mial do niedawna ok 45C.
2. Przy pelnym 100%, ale normalnym obciazeniu (3x Milky + 2x GPUGrid + 1x FreeHAL + 20x Almere) temp wynosila ok. 50C.
3. Przy absolutnie maks obciazeniu z dodatkowymi klientami TJM`a (3x Milky + 2x GPUGrid + 1x FreeHAL + 1x Almere na podstawowym BM + ok. 100x FreeHAL na dodatkowych klientach) temp. nie przekraczala 55C.

4. Obecnie jak odpale wszystkie klienty HAL`owe to mi komp zwisa bo po 5 minutach temp przekracza 62C :(.

Moge odpalic wszystko na raz i masakrowac kompa 150 zadaniami na raz (120 FreeHAL`i, 20 Almerow itp.), ale musze zejsc do standardowego taktowania (3.2GHz) i standardowego V (1.3V) temp wtedy nie przekracza 35C i wszystko chula jak marzenie. Ale, dawniej dalo sie to zrobic przy 4.2GHz, a teraz trzeba zmniejszac OC. Co ciekawe, wciaz da sie liczyc po 150 zadan na raz, ale temp proca rosnie gwaltownie (zwlaszcza przy OC). Widzi mi sie (tak na moj gust) ze projekt zaczal wykorzystywac cache proca zamiast jak dotychczas pamieci RAM - to by wyjasnialo sytuacje (wzrost temp procka i podawanie obciazenia CPU).



Bo jest paru kumpli :),
Bo jest parę w życiu dobrych chwil...


Moja wizytowka i sygnaturka

buninek

#394
U mnie temperatura procka w normie 41-43C. Szkoda tylko, że bazowy projekt prime dostaje tak mało czasu procesora i najgorsze, znacznie spadła responsensywność na wszelakie operacje.
To po prostu czuć. :(

i te błędy. Znów 20-30% WU trafia do kosza. Czasem wszystko jest ok. Co za czort? >:(

Co ta aplikacja liczy, trudno powiedzieć. Przypuszczam, że wykonuje się jedynie jakiś skrypt w perlu.

ksysju

Witam

Coś mi w nocy powaliło prawie wszystkie boince, podejrzewam freehala, na jednej maszynce z windnows  to na pewno freehal, resztę próbuję zdalnie wybadać.

Jak u Was ?

--
ksysju
ksysju

emik

u mnie problemu nie stwierdziłem - teraz oczywiście nie mogę odesłać wyników, ale ostatnio to normalka


buninek

U mnie wszystkie się wykrzaczyły. Oczywiście podejrzanym jest freehal.
Pomógł upgrade managera do wersji 6.4.5.

ksysju

Hi

Odszczekuje ;-), to inny projekt mi taki numer wykręcił (seti)


--
ksyjsu
ksysju

eclipse99

Mnie też w nocy padł boinc pod vistą, po restarcie systemu po prostu po jakimś czasie się wyłączał, w procesach był tylko manager, przyczyny niestety ustalić nie potrafię.