dokumentacja projektow BOINC

Zaczęty przez filmowiec, 10 Marzec 2009, 17:46

filmowiec

Witam
jestem nowy , dzis licze swoje pierwsze próbki wysilajac swojego Q6600@3GHz do pracy na linuxie x64 dla Cosmology@home ,  interesuje sie fizyka , astronomia. Zastanawia mnie jedna rzecz ... brak dokumentacji przetwarzanych danych  i informacji co do stanu faktycznego prowadzonych badan. Nie interesuje mnie zabardzo jakis top ranking , punkty ale raczej sama idea przetwarzania rozproszonego . I jesli moge pomoc mocza obliczeniowa swojej jednostki w prowadzonych badaniach to bardzo dobrze. Z drugiej jednak strony pakiety mogly by miec jakas dokumentacje  z ktorej mozna by sie dowiedziec na jakim etapie aktualnie znajduja sie badania ... I nastepna rzecz ... skoro nie ma dokumentacji to jak mozna miec pewnosc ze przetwarzane dane dotycza postepow projektow a nie do jakichs innych celów.Cala idea jest bardzo sluszna ale sadze ze minusem jest brak jakichkolwiek danych nt przeliczanych pakietow .

kempler

Witam serdecznie.
Dokumentacja przetwarzanych danych. No cóż każdy projekt jest opisany bardziej lub mniej szczegółowo, zazwyczaj bardziej. Co za tym idzie opisany jest zakres badań jakie są wykonywane. Stan faktyczny także zazwyczaj jest podawany. Takie projekty jak Einstein, Rosetta czy Climateprediction i inne, mają bogate zaplecze badawcze i na bieżąco informują co w danej chwili jest przetwarzane i co jest w planach. Bardzo często admini projektu przekazują te informacje na forum projektu. Co do pewności co liczymy. Temat ten przewija się od początku BOINC a nawet Seti. Większość projektów ma zaplecze uniwersyteckie a to już zapewnia jakiś poziom zaufania. Dodatkowo tysiące, a nawet dziesiątki tysięcy użytkowników patrzy im na ręce. Są projekty które udostępniają kod danej aplikacji i każdy ma do niej wgląd. Opublikowano już naprawdę dużo artykułów i prac badawczy opierając się na wynikach uzyskanych w danym projekcie. Wyniki te są przedstawiane na konferencjach naukowych. Nie pamiętam aby do tej pory był jakiś przekręt z jakimś projektem. Każda przeliczana jednostka ma swoje oznaczenie. Najczęściej można się dowiedzieć co znaczą poszczególny liczby czy litery w danym oznaczeniu.

Pozdrawiam

Kury Nas pogryzą, Raptory zeżrą....

Aegis Maelstrom

#2
Hej i witamy na pokładzie! :)

Co do projektów: podobnie jak Ty jestem silnie zainteresowany do czego służy moja moc obliczeniowa, czy jest wykorzystywana w sposób należyty i gdzie moja moc byaby najbardziej przydatna.

Z pewnością nieźle wyjdziesz sprawdzając responsywność naukowców, ich dorobek, uczelnię, z którą są związani, wypytując się o efektywność wykorzystywanych mocy (replication rate) i jego uzasadnienie itp. Wiadomo mi tylko o jednym projekcie fałszywce, która do tego była łatwa do przewidzenia - BelgianBeer@Home. Projekty uniwersyteckie wyglądają dla mnie poważnie i IMVHO przynajmniej nie są "hoaksem".

Niestety, rozglądając się po projektach muszę stwierdzić, że dość niechętnie tłumaczą one co dokładnie i obecnie jest robione. Jedni tłumaczą się tu brakiem czasu, inni (jak ludzie z Rosetty) niemożnością pełnego ujawnienia postępów prac przed opublikowaniem badań w recenzowanym piśmie.

Mimo to projekty różnią się otwartością.
Wspomnianą Rosettę można zaliczyć do projektów dość otwartych: możesz łatwo sprawdzić jakie białko się u Ciebie zwija, zapoznać się z jego strukturą a nawet obejrzeć w odpowiednim programie przewidziany u siebie model. Co więcej, powinieneś po pewnym czasie móc porównać swój wynik na tle wyników innych uczestników liczących taką jednostkę. Co tu jest więc utajone? Dokładna metoda (a raczej różne wprowadzone jej modyfikacje), którą akurat dotarto do rezultatu - bo to właśnie ona jest przedmiotem badań. W tej materii naukowcy z Bakerlab udzielają podstawowych wskazówek co i dlaczego jest liczone, sprawdzane itd. i czemu to może służyć, nie wchodzą jednak w najgłębsze szczegóły - i nawet ich rozumiem.

Efektem pracy są publikacje oraz Rosetta - dostępne środowisku naukowemu oprogramowanie do predykcji zwijania białek i Robetta - serwer, na którym wykorzystuje się Rosettę w sposób produkcyjny.

Projekt siostrzany Rosetty - RALPH - to jej pole testowe więc tym lepiej wiadomo do czego to służy.

Z innych projektów w których uczestniczę: rezultaty SIMAPu są prędko przedstawiane środowisku naukowemu, więc to raczej działa. :) Poszukiwanie liczb pierwszych w PrimeGrid też zwraca jakieś rezultaty; ponadto masz kontrolę w którym podprojekcie uczestniczysz. :)
Ładnie opisuje cel jednostki Docking@Home i biorąc pod uwagę ich macierzysty uniwersytet chyba można im ufać. :) Z tego co widziałem, bardzo starał się też lider bardzo skromnego projektu - Magnetism@Home. Wiele dobrego słyszałem też o POEM i Einsteinie. Nieco gorzej jest z QMC czy Spinhenge, choć i tu chyba można przycisnąć naukowców i dowiedzieć się co dokładnie jest liczone.

Natomiast wiele złego słyszałem o SETI - łącznie z informacjami, że już zdarzało się, że te same jednostki były liczone ponownie (goście z SETI woleli je wysłać ponownie niż pozwolić ochotnikom odejść z kwitkiem :/) oraz to, że rezultaty sobie leżakują i nikt się nimi nie interesuje.

Osobiście mam też wątpliwości co do projektu AQUA - zarówno zaproponowanej i niedookreślonej techniki tzw. komputera kwantowego jak i metody samego eksperymentu (kanadyjska firma rzekomo buduje komputer kwantowy i sama liczy równolegle wynik metodami tradycyjnymi, aby wykazać zbieżność rozwiązań i własną skuteczność - przecież to śmierdzi).

Tak czy inaczej, polecam fora i działy Science tamże. Nic nie szkodzi też na przeszkodzie zadawać naukowcom własne pytania.

Pozdrawiam i powodzenia!

P.S. Oczywiście nie wymieniłem tu wszystkich dość pewnych projektów. Bardzo poważni ludzie stoją np. za Climateprediction i, może przede wszystkim, World Community Grid. Ekipa takiej Milky też wygląda poważnie, itd. itp.

Mchl

Co do BelgianBeer to chciałbym zauważyć, że projekt całkiem jawnie informował na czym ma polegać jego istota (liczenie innych projektów i zdobywanie w nich punktów na konto zespołu Boinc.be), oraz że tak naprawdę nigdy się do realizacji tego zamierzenia chyba się nawet nie zbliżył.

Z kolei zamieszanie z ponownym rozsyłaniem już przeliczonych jednostek w SETI miało jeśli dobrze pamiętam miejsce głównie w momencie przejściowym pomiędzy SETI@home Classic a S@h BOINC. Mieli wówczas dość poważne problemy ze sprzętem, lokalami, personelem, a z drugiej strony był to projekt flagowy nowopowstałej platformy, więc nieciekawie by było gdyby nie dawał pracy. Natomiast nie należy się sugerować datą rejestracji danych wyświetlaną podczas przetwarzania jednostki. Jeśli dobrze pamiętam, taśmy z zarejestrowanym nasłuchem są wybierane do generowania jednostek w sposób dosyć losowy (metodą, co mi się nawinie pod rękę jak sięgnę do pudła).

W nagłych wypadkach wzywać przez: mail: mchlpl[at]gmail.com | PM|mchl[a]boincatpoland.org

Troll81

Poza tym prawie każdy projekt ma u nas swój wątek i stronkę na naszej wiki. Tak że warto się zapoznać najpierw z jednym a potem drugim :D

Sdarząją się też projekty stricte komercyjne (eternity2.net) lub zabawowe (pPot, Sudoku, Nqueens, Chess960, reversi, ), wątpliwe moralnie (distRTgen),
Testowe (ralph, xterm, boinc alpha test) i inne dziwne (BURP)

Wybierz to co cię interesuje :D

Mchl

Nie wiem, czy zgodziłbym się z kategorią "zabawowe" :P

W nagłych wypadkach wzywać przez: mail: mchlpl[at]gmail.com | PM|mchl[a]boincatpoland.org

Troll81

obliczanie prawdopodobieństw i rozkładów w grze w pokera albo problemu N-Królowych na szachownicy to jednak nie są "bardzo poważne" badania naukowe. :D

Akira

DistrRTgen nie jest jeszcze taki wątpliwie moralny;-) Poczekajcie na zakończenie projektu, który tworze ze znajomymi (crackowanie haseł do plików) to będzie troszkę niemoralne. Ale ciii  ;)

Mchl

Teoria gier jest mimo wszystko poważną dziedziną matematyki.

A czy rozszyfrowanie komunikatu zaszyfrowanego enigmą nie jest moralnie wątpliwe? A co jeśli to list od żony kapitana U-Boota?

W nagłych wypadkach wzywać przez: mail: mchlpl[at]gmail.com | PM|mchl[a]boincatpoland.org

sesef

#9
Cytat: Troll81 w 11 Marzec 2009, 10:21wątpliwe moralnie (distRTgen)

Ja ten projekt bardzo popieram. Takie projekty doprowadzą może w końcu do opracowania nowych metod hashowania albo przejścia na inne bardziej bezpieczne które do wygenerowania kolizji będą już potrzebowały petabajtów miejsca na rainbow tables. Kiedy przechodzono z MD4 na MD5 nikt nie myślał o tym, że domowe komputery będą miały terabajtowe dyski twarde i w prosty sposób domowy komputer będzie w stanie wygenerować kolizje. Takie projekty może i budzą kontrowersje, ale chyba tylko w osobach, które wolą żyć w nieświadomości, tylko ciekawe co powiedzą jak ich domowy kalkulator będzie potrafił "złamać" ich 20 znakowe hasło do poczty.

Kryniek

Dla mnie najważniejszą sprawą jest że projekty są pod opieką uczelni i naukowców na nich pracujących. Wątpliwe jest aby uczelnia jedna z drugą "promowała" pod swoją "marką" jakiś bubel lub coś z czego mogłaby wyjść afera.

filmowiec

#11
problem w tym ze licząc te próbki nikt nie wie czy nie przelicza danych mających na celu łamanie jakichś zabezpieczeń , Np teoretycznie , jeśliby jakaś organizacja hakerska założyła swój projekt BOINC , który normalnie zajmowałby się jakimś szczytnym celem a w co 3 próbce przeliczał logi z ataków na jakieś instytucje to chyba nie mielibyśmy o tym bladego pojęcia ... Zresztą Pan Michał w swoim wywiadzie dla Radia Tok FM potwierdził ze każdy morze założyć własny projekt , wiec skąd wiadomo ze ta technologia nie dostała się w jakieś nieodpowiednie kręgi .

http://search.securityfocus.com/swsearch?sbm=%2F&metaname=alldoc&query=boinc&x=0&y=0

co do samej podatności na ataki każdy może sprawdzić sobie dowolna aplikacje używając stronki security focus .

Mchl

Tylko nie pan... proszę...

Gdyby tak było, że "co któraś" próbka zawierałaby istotnie inne dane, to byłoby to stosunkowo łatwe do zauważenia.

Poza tym nie oszukumy się, nawet aplikacje projektów, które nie udostępniły źródeł są rozkompilowaywane przez użytkowników.

W nagłych wypadkach wzywać przez: mail: mchlpl[at]gmail.com | PM|mchl[a]boincatpoland.org

Troll81

i nieraz przerabiane :D by liczyły szybciej :D fakt że wielu dłubie w kodach aplikacji. u nas w teamie przynajmniej kilku.

filmowiec

#14
chyba należy traktować jako ciekawostkę :

http://news.zdnet.co.uk/security/0,1000000189,39161876,00.htm
CytatSeti requires computer users to download a screensaver-type program that automatically downloads, analyses and returns 'units' of data collected from the Arecibo radio telescope in Puerto Rico.
.
http://www.securityfocus.com/bid/25644/discuss
http://pl.wikipedia.org/wiki/Cross-site_scripting
.
http://www.securityfocus.com/bid/25644/solution




Mchl

Są to luki w oprogramowaniu stron internetowych projektów BOINC. Z tego co widzę już załatane w aktualnej wersji.

W nagłych wypadkach wzywać przez: mail: mchlpl[at]gmail.com | PM|mchl[a]boincatpoland.org

Ufol

Problem z dostępnością dokumentacji projektów, to jedna z największych przeszkód w namówieniu kogoś do zostania liczydłowym. Gdy próbowałem namówić kogo kolwiek do uczestnictwa w Boinc@Poland często słyszałem, że jestem ostatnim durniem. Przecież uniwersytety mają pieniądze, a ludzie, którzy poświęcają swój sprzęt do obliczeń to frajerzy. Jaką mają gwarancję, że uczeni opublikują wszystko? Mój argument o publikowaniu w czasopismach specjalistycznych, również łatwo zbić. Nie muszą przecież opublikować wszystkiego. Jeżeli chcemy, aby liczydłowych było coraz więcej, to musimy znaleźć rzeczowe argumenty na uczciwość naukowców. Myślę, że na zaufanie zasługuje Poem, który publikuje swoje osiągnięcia w miarę na bierząco. Enigma jest również godna pełnego zaufania. Co do wielkich projektów, to największe emocje budzi Wcg. Osobiście jestem przekonany co do uczciwości przedsięwzięcia, upewniają mnie w tym jego sukcesy i nagrody otrzymywane przez biorących w nim udział uczonych. Zetknąłem się jednak z tezą, że Wcg nie publikuje wszystkich wyników obliczeń. Nie wiem czy to prawda, ale odeprzeć całkowicie tego argumentu nie potrafiłem.      

Troll81

Jak ktoś nie chce to zawsze znajdzie jakiś powód by nie liczyć. jak ktos chce to zawsze znajdzie powód by liczyć. Nikogo na siłe nie namawaim, tak jak i na krwiodawstwo. Ja oddaję regularnie bo mogę, i uważam że jesli w całym swoim życiu dzięki krwiodawstwu uratowałem choć jedną osobę to zrobiłem więcej niż wielu innych ludzi.

Kret_polny

Ano dokładnie - jak ktoś nie chce liczyć to znajdzie powód żeby nie liczyć. Tak miałem z jednym kolegą, który stwierdził, że mu BOINC wirusy na kompa ściąga. Chodziło o jakieś próbki Rosetty. Tłumaczyłem mu że to fałszywe alarmy są, ale i tak stwierdził, że jacyś tam ludzie z jakiegoś forum mają rację...