Human Proteome Folding błędy

Zaczęty przez phobos, 20 Luty 2012, 11:38

phobos

Od ok tygodnia nie mogę przeliczyć żadnej próbki tego projektu, wszystkie wysypuje, dość szybko. Już ze 30 próbek mi zepsuło. Ktoś ma podobne problemy ? Macie jakiś pomysł co może być przyczyną? W końcu to projekt na cpu więc nie powinno być problemów a tu proszę...

Result Name   Device Name    Status   Sent Time   Time Due /
Return Time   CPU Time (hours)   Claimed/ Granted BOINC Credit
qb957_ 00127_ 0--    Pauline    In Progress    20.02.12 01:58:57   01.03.12 01:58:57   0.00   0.0 / 0.0
qb957_ 00146_ 3--    Pauline    In Progress    20.02.12 01:58:42   01.03.12 01:58:42   0.00   0.0 / 0.0
qb935_ 00085_ 12--    Pauline    Error    19.02.12 10:20:20   20.02.12 01:58:40   0.01   0.2 / 0.0
qb933_ 00043_ 15--    Pauline    Error    19.02.12 09:46:49   20.02.12 01:58:40   0.00   0.1 / 0.0
qb928_ 00103_ 8--    Pauline    Error    19.02.12 05:32:43   20.02.12 01:58:40   0.01   0.2 / 0.0
qb877_ 00041_ 16--    Pauline    Error    17.02.12 14:01:51   20.02.12 01:58:40   0.01   0.1 / 0.0

aborek

Jeśli masz BM 7.0.x, to pewnie jego wina. Ja w niektórych podprojektach WCG na tej wersji mam błąd pobierania lub coś w tym stylu.

phobos

Obecnie mam 6.12.34 64 bitowy

Troll81

a co masz w logach errorów?

Agbar

Cytat: aborek w 20 Luty 2012, 11:53
Jeśli masz BM 7.0.x, to pewnie jego wina. Ja w niektórych podprojektach WCG na tej wersji mam błąd pobierania lub coś w tym stylu.
Błąd jest w wersjach 7.0.12 do 7.0.14. Występuje przy ściąganiu plików *.gzb (tylko).

W wersji 7.0.16 jest jeszcze poprawione ściąganie *.gz, ale nie wiem na pewno, czy był to błąd w kliencie, czy problem leży po stronie WCG:
Cytat: SekeRob link=http://lists.ssl.berkeley.edu/mailman/private/boinc_alpha/2012-February/016474.html
-200 is a known issue at WCG, not specific to the client. It occassionally pops up.

phobos

Cytat: Troll81 w 20 Luty 2012, 20:08
a co masz w logach errorów?

Jak sądzę chodzi np. o takie coś z event loga, tak ?

Cytat2012-02-19 20:21:20 | World Community Grid | Starting task qb933_00043_15 using hpf2 version 640
2012-02-19 20:21:39 | World Community Grid | Computation for task qb933_00043_15 finished
2012-02-19 20:21:39 | World Community Grid | Output file qb933_00043_15_0 for task qb933_00043_15 absent

2012-02-19 21:06:21 | World Community Grid | Starting task qb935_00085_12 using hpf2 version 640
2012-02-19 21:07:21 | World Community Grid | Computation for task qb935_00085_12 finished
2012-02-19 21:07:21 | World Community Grid | Output file qb935_00085_12_0 for task qb935_00085_12 absent

Agbar

Raczej chodziło o logi z zadań. Tak do tego dojść na stronie WCG: Result status -> (kolumna) Result name -> Status.

phobos

Cytat<core_client_version>6.12.34</core_client_version>
<![CDATA[
<message>
Niepoprawna funkcja. (0x1) - exit code 1 (0x1)
</message>
<stderr_txt>
ERROR:: Exit at: .\read_paths.cc line:346

</stderr_txt>
]]>

sknd

nie moge odesłać wyników, trwa to od kilku dni... na poczatku myslałem, ze zwykła bolączka serwera, jak to czasem w WCG bywa, ale teraz zaczyna mnie to mierzić bo jednostki się powoli przeterminowują... w event logu jest tak:

pon, 5 lis 2012, 22:35:30 | World Community Grid | Temporarily failed upload of qi342_00099_7_0: connect() failed
pon, 5 lis 2012, 22:35:30 | World Community Grid | Backing off 3 hr 15 min 46 sec on upload of qi342_00099_7_0
pon, 5 lis 2012, 22:35:30 | World Community Grid | Started upload of qi507_00082_15_0
pon, 5 lis 2012, 22:35:30 | World Community Grid | Temporarily failed upload of qi536_00002_6_0: connect() failed
pon, 5 lis 2012, 22:35:30 | World Community Grid | Backing off 5 hr 51 min 0 sec on upload of qi536_00002_6_0
pon, 5 lis 2012, 22:35:30 | World Community Grid | Started upload of qi628_00034_18_0
pon, 5 lis 2012, 22:35:36 |  | Internet access OK - project servers may be temporarily down.


tylko że jak mówię, trwa to już parę dni...