Milkyway@home

Zaczęty przez Bober, 28 Sierpień 2007, 22:40

Troll81

hm... cały czas dostaje "no work sent"

mam skasowac aplikację?? zresetowac projekt?

Pigu

pogoń optymalkę i mów jak punktuje

jarod_e

#82
No więc u mnie te krótsze wu nm_stripe82 trwają 660 sec i claimed credit= 3,62 granted 9,97
Czyli wychodzi 54,38/h na core x 4 = 217 punków/h ..  jak to wypada w porównaniu do wcześniejszej optymalki  ???
Jak się przemieli ta dłuższa to dam znać  :)

UPDATE:
dłuższe mają tak - cpu time - 2634, granted credit 39,85 - wychodzi tyle samo co za mniejsze wu ...

Pigu


jarod_e

Phenom 9850 @ 2900Mhz  :)

mindc

#85
trochę się pobawiłem nowymi źródłami, niektóre rzeczy pozmieniałem trochę na siłę,
nawet nie wiem czy przez to coś osiągnąłem, ale najważniejsze to że "pozbyłem" się podwójnego liczenia 'pow()' z najbardziej zagnieżdżonej pętli
i z 4 godzin zrobiło się 3 na atomie (bo na tej maszynie to testuję)
więc zysk ok. 25%  XD
biorąc pod uwagę że tylko w perlu dłubię, to i tak wielki sukces mi się wydaje  :attack:

no ale są jeszcze problemy z odpaleniem tego na jaju 2.4 (śledztwo trwa)
będę informował o postępach, może się znajdzie ochotnik co skompiluje to pod win



Pigu

a rezultaty wychodzą takie same jak z org app?

RAD-Poland

nie wiem jak wypadłaby w testach aplikacja by mindc

moje testy podstawowej aplikacji z nowymi mikami

Celeron 32bit  (identyczna punktacja starej app v1.22 i nowej v0,06)
Duron 32 bit ( podobnie v1,22=v0,06, nowa v0,07  +10%)
X2 64bit ( nowa v0,07 -20%) tzn było 54,85 pkt/h jest 45,90 pkt/h

   
WCG:
PG:         YOYO:

     

Pigu

porównujesz do aplikacji sprzed promocji, czy do tej zoptymalizowanej cudotwórczej?

mindc

Cytat: Pigu w 05 Grudzień 2008, 22:35
a rezultaty wychodzą takie same jak z org app?

heh, nawet tego nie chciało mi się sprawdzać na razie
sam widziałem jak w źródłach od starego milky
był błąd polegający na omyłkowej zamianie parametrów przy wywołaniu jednej z funkcji
czyli teoretycznie, wszystkie próbki były do... już nie powiem do czego

jutro w robocie, oczywiście potestuję prawidłowość przeliczonych próbek na szybszym sprzęcie niż atom  ;D

BTW
ktoś z was oglądał w ogóle te źródła?



Pigu

ni
powiedz w czym to kompilować? Borland C++ Builder się nada? kurcze z C jestem nieszczególnie biegły

mindc

#91
Cytat: Pigu w 06 Grudzień 2008, 00:53
ni
powiedz w czym to kompilować? Borland C++ Builder się nada? kurcze z C jestem nieszczególnie biegły

hmmm... pod windą to kompilowałem jedynie w DevC++, daaaaaawno temu (może bym tak spróbował znowu ;D )
teraz od rana do wieczora linux, więc tam się bawię

acha, jakby ktoś chciał się pobawić i samemu sprawdzić -> PM



TJM

Ja mam pod win różne kompilatory (Intel C/C++, MinGW, DevCPP + MingW, Visual Studio 2005 i 2008) więc jakby co mogę się pobawić, ale nie jestem pewien czy w ogóle uda mi się cokolwiek skompilować.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

mindc

wprowadziłem jeszcze kilka innych optymalizacji i szukam dalej...

acha, sprawdziłem czy wyniki się zgadzają i...
...pliki 'out' zgadzają się co do bajta  ;D

reszta jutro, idę spać...

Cytat: TJM w 06 Grudzień 2008, 03:08
(...) ale nie jestem pewien czy w ogóle uda mi się cokolwiek skompilować.

ale o co chodzi?


TJM

O to że cińki bolek ze mnie jeśli chodzi o kompilację softu pod windą %-) Nad BOINCem chyba z tydzień siedziałem zanim udało mi się usunąć wszystkie błędy kompilacji.
Którą wersję kodu edytujesz ? 0.7 ?

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

mindc

#95
tak, 0.7

po kolejnych kombinacjach na atomie czas liczenia WU
zszedłem z ok. 12800 sekund za 39.84 pkt do 6800 sekund za 41.09 pkt

kod:

EDIT:
no rzeczywiście, po co ja to wrzucam
zainteresowani -> PM


Pigu

hehe nie szalej tak publicznie z tym kodem :P konkurencja nie śpi

TJM

Próbowałem to kompilować - na razie że tak się wyrażę dupa zbita - w DevCpp ciężko skompilować nawet BOINC API a aplikacja wymaga tego do działania, więc odpada; w Visual Studio 2008 kod w ogóle nie chciał się kompilować bez drobnych przeróbek a na dodatek po przeróbkach nawet nie trybi coś z API które mam skompilowane (5.10.45).

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

sesef

Witam wszystkich


Mam takie może noobowskie pytanie, ale z czego mam skompilować BOINC API??

Obecnie przy linkowaniu dostaje takie błędy. Wyraźnie widać że brakuje mu liba od API tylko skąd mam go ściągnąć/z czego skompilować




Kompiluje na VS 2008 PRO, na początku było trochę błędów ale po dorzuceniu flagi /TP problemy znikły, ale pojawiły się następne.


TJM

Żeby skompilować BOINCa potrzebujesz jeszcze starsze wersje microsoftowego Platform SDK (ja używam takich od Win2k3, do ściągnięcia za free ze stron MS). Z tym nowszym BOINC nie chce się kompilować ze względu na jakieśtam różnice.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

sesef

Cytat: TJM w 06 Grudzień 2008, 17:22
Żeby skompilować BOINCa potrzebujesz jeszcze starsze wersje microsoftowego Platform SDK (ja używam takich od Win2k3, do ściągnięcia za free ze stron MS). Z tym nowszym BOINC nie chce się kompilować ze względu na jakieśtam różnice.


API bez problemów poszło na tej wersji SDK co jest z VS 2008, co do samego milky były kolizje dorzuciłem flagę /FORCE:MULTIPLE i wszystko ładnie się skompilowało :)

TJM

A które SDK tam masz ? Z moją wersją VS 2008 dołączone jest jakieś nowe SDK i na nim nic związanego z BOINCem nie chce się skompilować (bez edycji źródeł) ze względu na różnice w headerach. Możliwe, że w nowszych wersjach źródeł BOINCa już to uwzględnili, ja sorawdzałem z 5.10.45 i jakimś starszym z serii 6.0 beta; nowsze nie chcą mi się i tak w całości skompilować ze względu na brak WX.
Na forum Microsoftu doradzili mi żebym ściągnał starsze i takie ustawił w ścieżkach dodatkowych includów, po takiej zmianie manager poszedł od kopa.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

sesef

źródełka ściągnąłem z SVN-a z trunk/Boinc i z nich API bez problemów się skompilowało. Jedyny problem jaki napotkałem to że pewne fragmenty były "already defined in msvcprt.lib" ale o tym już wcześniej pisałem.

Co do SKD mam takie jakie instaluje się z VS 2008 PRO SP1 czyli 6.0a

mindc

ech
po przeprowadzeniu wnikliwych testów (nie za pomocą boinca)
wprowadzone optymalizacje poprawiają wydajność o...
ok. 1-2%, czyli...

...zapomnijcie o kilku fragmentach w tym wątku i przepraszam za zamieszanie

:closedeyes:


RAD-Poland

ważne są podjęte próby, nie zawsze efekty przychodzą natychmiast
- na pewno się da wyciągnąć dużo z tej aplikacji, zwłaszcza, że najprawdopodobniej Crunch3r znów ma najwydajniejszą aplikację

przed
Cytat57330513    57520212     7 Dec 2008 17:22:08 UTC     7 Dec 2008 18:36:04 UTC     Over     Success     Done     3,636.38     62.27     41.09
57330371    57520070    7 Dec 2008 17:18:29 UTC    7 Dec 2008 18:35:39 UTC    Over    Success    Done    4,630.00    79.29    39.85
57330368    57520067    7 Dec 2008 17:18:29 UTC    7 Dec 2008 18:35:16 UTC    Over    Success    Done    4,607.00    78.89    39.85
57330212    57519911    7 Dec 2008 17:17:08 UTC    7 Dec 2008 18:34:56 UTC    Over    Success    Done    4,668.00    79.94    39.84
57330196    57519895    7 Dec 2008 17:15:52 UTC    7 Dec 2008 18:33:49 UTC    Over    Success    Done    4,677.00    80.09    39.84
57330104    57519814    7 Dec 2008 17:15:52 UTC    7 Dec 2008 18:33:18 UTC    Over    Success    Done    3,737.94    64.01    41.09
57330048    57519758    7 Dec 2008 17:13:25 UTC    7 Dec 2008 18:33:18 UTC    Over    Success    Done    3,656.04    62.61    41.09
57329990    57519700    7 Dec 2008 17:12:03 UTC    7 Dec 2008 18:33:08 UTC    Over    Success    Done    3,627.49    62.12    41.09
57329987    57519697    7 Dec 2008 17:12:03 UTC    7 Dec 2008 18:33:08 UTC    Over    Success    Done    4,220.92    72.28    41.09
57329962    57519672    7 Dec 2008 17:12:03 UTC    7 Dec 2008 18:33:18 UTC    Over    Success    Done    4,875.00    83.48    39.85
po
Cytat57338363    57527819     7 Dec 2008 19:29:42 UTC     7 Dec 2008 19:35:52 UTC     Over     Success     Done     370.00     6.34     11.10
57338362    57527818    7 Dec 2008 19:29:42 UTC    7 Dec 2008 19:35:52 UTC    Over    Success    Done    370.00    6.34    11.10
57338361    57527817    7 Dec 2008 19:29:42 UTC    7 Dec 2008 19:36:23 UTC    Over    Success    Done    401.00    6.87    12.03
57338360    57527816    7 Dec 2008 19:29:42 UTC    7 Dec 2008 19:36:48 UTC    Over    Success    Done    426.00    7.29    12.78
57338359    57527815    7 Dec 2008 19:29:42 UTC    7 Dec 2008 19:32:32 UTC    Over    Success    Done    170.00    2.91    5.10
57338357    57527813    7 Dec 2008 19:29:43 UTC    7 Dec 2008 19:48:46 UTC    Over    Success    Done    1,143.00    19.57    34.29
57338356    57527812    7 Dec 2008 19:29:42 UTC    7 Dec 2008 19:32:22 UTC    Over    Success    Done    160.00    2.74    4.80
57338355    57527811    7 Dec 2008 19:29:43 UTC    7 Dec 2008 19:44:46 UTC    Over    Success    Done    903.00    15.46    27.09
57338354    57527810    7 Dec 2008 19:29:43 UTC    7 Dec 2008 19:46:44 UTC    Over    Success    Done    1,021.00    17.48    30.63
57338353    57527809    7 Dec 2008 19:29:42 UTC    7 Dec 2008 19:44:00 UTC    Over    Success    Done    858.00    14.69    25.74

od 4 do 10 razy szybciej wszystkie wyniki podpisane wersją 0,07 (chyba, że tak się wu zmieniły - przynajmniej u mnie tego nie zauważyłem)

   
WCG:
PG:         YOYO:

     

mindc

Cytat: RAD-Poland w 08 Grudzień 2008, 19:33
ważne są podjęte próby, nie zawsze efekty przychodzą natychmiast
- na pewno się da wyciągnąć dużo z tej aplikacji, zwłaszcza, że najprawdopodobniej Crunch3r znów ma najwydajniejszą aplikację

znowu kombinowałem, teraz to na pewno liczy ok. 30% szybciej
bo "pozbyłem" się w specyficzny sposób jednego pow() (innego niż wcześniej) z calculate_probabilities()

do Pigulca: tak, tak sprawdzałem, wyniki są poprawne...

i z drugiej strony, przemieliłem już wszystko i nie da się w magiczny sposób pozbyć tych
sqrt() i exp() z calculate_probabilities() którą muszą być przemielone każde po 10`752`000`000 razy  :ph34r:

Cytat: RAD-Poland w 08 Grudzień 2008, 19:33
od 4 do 10 razy szybciej wszystkie wyniki podpisane wersją 0,07 (chyba, że tak się wu zmieniły - przynajmniej u mnie tego nie zauważyłem)

zastanawia mnie, dlaczego czasy są tak różne od siebie, pewnie to jest jakiś trop
może jego aplikacja nie liczy pewnych rzeczy przy specyficznych parametrach wejściowych bo błąd w wyniku jest na poziomie LSB...
no i myślę że tam się dużo dzieje w assemblerze, ale ja nie czuję się pewnie w Intelach, kiedyś tam liznąłem Motorolę i AVR ale na co to mi teraz...




acha, wersja aplikacji zależy tylko i wyłącznie od tego, co się wpisze w app_info.xml




i jeszcze wracając do kompilowania...
skompilowałem wersję pod win32 przy pomocy najzwyklejszego Dev-Cpp i to nawet bez odpalania go
czy ściągania jakichś dodatkowych bibliotek czy coś
wykorzystałem tyko jego mingw i standardowe Makefile z BOINC (boinc\api\Makefile.mingw) i Milky (milkyway\bin\make.linux) po wcześniejszym poprawieniu ścieżek. W BOINC wystarczy skompilować tylko API, i wywalić z Makefile dla Milky linkowanie libboinc_api.a i to wszystko



TJM

Próbowałeś pod linuksem kompilatora Intela ? Jest za free a może się akurat zdarzyć, że jak w przypadku enigmy z miejsca 200% wydajności dostaniesz (zakładając ze masz proce Intelowe).

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

Pigu

mindc - ile teraz da się wyciągnąć z jajka q6600 na ok 2,8 GHz na twojej app?

Szopler

"BOINC RAC Live!" ???
How?

mindc

Cytat: TJM w 11 Grudzień 2008, 18:42
Próbowałeś pod linuksem kompilatora Intela ? Jest za free a może się akurat zdarzyć, że jak w przypadku enigmy z miejsca 200% wydajności dostaniesz (zakładając ze masz proce Intelowe).

sprawdzałem, jest trochę wolniejszy, ale testowałem tylko na atomie z włączonymi dla niego ustawieniami,
na q6600 nie sprawdzałem jeszcze....

Cytat: Pigu w 11 Grudzień 2008, 18:45
mindc - ile teraz da się wyciągnąć z jajka q6600 na ok 2,8 GHz na twojej app?

q6600 @ 3.0GHz (win x64)

Cytat
57675820    57856035     11 Dec 2008 12:01:14 UTC     11 Dec 2008 17:30:36 UTC     Over  Success     Done  1,847.52     12.54     39.84
57675707    57855922    11 Dec 2008 11:59:21 UTC    11 Dec 2008 17:20:25 UTC    Over    Success    Done    1,951.03    13.24    39.84
57675642    57855857    11 Dec 2008 12:00:58 UTC    11 Dec 2008 17:24:23 UTC    Over    Success    Done    1,962.23    13.31    39.84
57674939    57855169    11 Dec 2008 11:47:23 UTC    11 Dec 2008 17:16:43 UTC    Over    Success    Done    1,846.06    12.53    39.84
57673445    57853699    11 Dec 2008 11:25:09 UTC    11 Dec 2008 16:39:03 UTC    Over    Success    Done    1,854.59    12.58    41.09
57673309    57853563    11 Dec 2008 11:26:32 UTC    11 Dec 2008 16:51:51 UTC    Over    Success    Done    1,836.16    12.46    39.84
57673049    57853311    11 Dec 2008 11:18:25 UTC    11 Dec 2008 16:38:22 UTC    Over    Success    Done    1,855.23    12.59    41.09
57672615    57852877    11 Dec 2008 11:12:01 UTC    11 Dec 2008 16:34:04 UTC    Over    Success    Done    1,965.36    13.34    39.84
57670958    57851329    11 Dec 2008 10:48:15 UTC    11 Dec 2008 16:13:17 UTC    Over    Success    Done    1,860.97    12.63    41.09
57670797    57851168    11 Dec 2008 10:45:42 UTC    11 Dec 2008 16:01:12 UTC    Over    Success    Done    1,859.06    12.61    39.84
57670246    57850620    11 Dec 2008 10:37:05 UTC    11 Dec 2008 15:50:13 UTC    Over    Success    Done    1,839.61    12.48    39.84
57670223    57850597    11 Dec 2008 10:37:05 UTC    11 Dec 2008 16:00:37 UTC    Over    Success    Done    1,864.80    12.65    39.84
57668838    57849261    11 Dec 2008 10:17:03 UTC    11 Dec 2008 15:13:01 UTC    Over    Success    Done    1,845.14    12.52    41.09
57668437    57848860    11 Dec 2008 10:10:39 UTC    11 Dec 2008 15:30:34 UTC    Over    Success    Done    1,966.38    13.34    39.84
57668130    57848556    11 Dec 2008 10:05:42 UTC    11 Dec 2008 15:10:29 UTC    Over    Success    Done    1,860.52    12.62    39.84
57668129    57848555    11 Dec 2008 10:05:42 UTC    11 Dec 2008 15:13:01 UTC    Over    Success    Done    1,876.08    12.73    39.84
57666575    57847028    11 Dec 2008 9:45:40 UTC    11 Dec 2008 14:32:10 UTC    Over    Success    Done    1,844.14    12.51    39.84
57665924    57846391    11 Dec 2008 9:32:11 UTC    11 Dec 2008 14:32:10 UTC    Over    Success    Done    1,949.83    13.23    39.84
57665800    57846276    11 Dec 2008 9:30:50 UTC    11 Dec 2008 14:23:08 UTC    Over    Success    Done    1,837.36    12.47    41.09
57663559    57844078    11 Dec 2008 8:55:58 UTC    11 Dec 2008 14:23:08 UTC    Over    Success    Done    1,880.30    12.76    39.84

przelicz sam...

i ciekawostka, AMD Athlon(tm) Processor LE-1600 @ 2.2GHz (linux 2.4 x86)

Cytat
57635275    57816647     11 Dec 2008 1:36:11 UTC     11 Dec 2008 5:42:17 UTC     Over  Success     Done    1,645.27     3.18     39.84
57633651    57815030    11 Dec 2008 1:06:08 UTC    11 Dec 2008 5:18:15 UTC    Over    Success    Done    1,694.71    3.28    41.09
57630004    57811420    11 Dec 2008 0:06:11 UTC    11 Dec 2008 4:48:18 UTC    Over    Success    Done    1,631.38    3.16    39.85
57626310    57807798    10 Dec 2008 23:06:09 UTC    11 Dec 2008 4:18:07 UTC    Over    Success    Done    1,623.51    3.14    39.84
57622497    57804043    10 Dec 2008 22:06:12 UTC    11 Dec 2008 3:54:11 UTC    Over    Success    Done    1,683.66    3.26    41.09
57618528    57800137    10 Dec 2008 21:06:11 UTC    11 Dec 2008 3:00:10 UTC    Over    Success    Done    1,676.25    3.24    41.09
57615690    57797352    10 Dec 2008 20:24:12 UTC    11 Dec 2008 2:30:11 UTC    Over    Success    Done    1,687.30    3.26    41.09
57611271    57792982    10 Dec 2008 19:21:48 UTC    11 Dec 2008 2:00:10 UTC    Over    Success    Done    1,637.29    3.17    39.84
57608839    57790565    10 Dec 2008 18:57:44 UTC    11 Dec 2008 1:36:11 UTC    Over    Success    Done    1,640.10    3.17    39.84
57608276    57790002    10 Dec 2008 18:54:09 UTC    11 Dec 2008 1:06:08 UTC    Over    Success    Done    1,639.85    3.17    39.84
57607214    57789072    10 Dec 2008 17:51:26 UTC    11 Dec 2008 0:06:11 UTC    Over    Success    Done    1,652.76    3.20    39.84
57603868    57785821    10 Dec 2008 17:04:43 UTC    10 Dec 2008 23:06:08 UTC    Over    Success    Done    1,676.87    3.24    39.84
57600301    57782335    10 Dec 2008 16:14:20 UTC    10 Dec 2008 22:06:12 UTC    Over    Success    Done    1,691.50    3.27    39.84
57598678    57780753    10 Dec 2008 15:49:45 UTC    10 Dec 2008 21:06:11 UTC    Over    Success    Done    1,780.98    3.45    41.09

tylko jednego mam AMD, AMD szybsze w Milce?

Cytat: Szopler w 11 Grudzień 2008, 19:56
"BOINC RAC Live!" ???
How?

to jest kontynuacja tego, co kiedyś tam zacząłem opisywać w 'wizytówce'





Pigu

Cytatq6600 @ 3.0GHz (win x64)

hmm lekko z 7,5k? jak tylko oddam projektowi miesiąca co jego to zaraz się zgłoszę  :arrr:

sesef

Cytat: mindc w 11 Grudzień 2008, 18:36i z drugiej strony, przemieliłem już wszystko i nie da się w magiczny sposób pozbyć tych
sqrt() i exp() z calculate_probabilities() którą muszą być przemielone każde po 10`752`000`000 razy  :ph34r:

pozbyć może nie, ale myślę że zastosowanie SSE/SSE2 powinno skrócić trochę czas wykonywania danej pętli

Cytat: mindc w 11 Grudzień 2008, 18:36acha, wersja aplikacji zależy tylko i wyłącznie od tego, co się wpisze w app_info.xml

Jaką aktualnie trzeba wersje podać bo mi coś nie chce działać :(

TJM

Zobacz na stronie w aplikacjach jaka jest aktualna wersja, taka sama musi zadziałać.

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.

mindc

Cytat: sesef w 12 Grudzień 2008, 17:41
Cytat: mindc w 11 Grudzień 2008, 18:36acha, wersja aplikacji zależy tylko i wyłącznie od tego, co się wpisze w app_info.xml
Jaką aktualnie trzeba wersje podać bo mi coś nie chce działać :(

nie chodzi o wersje tylko o wpis w <app_name>milkyway</app_name>
musi być milkyway, inaczej nic nie będzie się ściagać, reszta dowolna...




Cytat: sesef w 12 Grudzień 2008, 17:41
(...) ale myślę że zastosowanie SSE/SSE2 powinno skrócić trochę czas wykonywania danej pętli

dokładnie, sprawdziłem jeszcze raz kompilator intela (linux)
ponieważ większość moich kompów które liczą to wysłużone pentium III, kompilowałem wszystko z myślą o nich i nie zauważyłem różnicy między intelem a gcc
i rzeczywiście, po odpaleniu sse2 (po odpaleniu na odpowiednich sprzętach oczywiście) widać wzrost, tak na o ok. 20-30% (nie robiłem dokładnych testów)

tylko że dlaczego gcc wykorzystuje tylko część instrukcji sse2 przy kompilowaniu?
olewając to co jest tu najważniejsze, czyli exp, pow i sqrt, ech.....



sesef

#115
No to ogólny postęp mamy taki:

Athlon 64 3200+@2,3  Ghz

Czysta aplikacja ze strony
Cytat57767878    57944857     12 Dec 2008 22:02:05 UTC     12 Dec 2008 23:05:48 UTC     Over     Success     Done     3,197.34     12.72     39.84

czysty kod z własną kompilacją na Vistual Studio 2008 + kilka flag do optymalizacji i /arch:SSE2
Cytat57762624    57939746     12 Dec 2008 20:53:00 UTC     12 Dec 2008 21:51:13 UTC     Over     Success     Done     2,908.55     11.57     39.84
57757606    57934937    12 Dec 2008 20:01:44 UTC    12 Dec 2008 20:59:02 UTC    Over    Success    Done    2,950.44    11.74    41.09

optymalka mindc z własną kompilacją na Visual Studio 2008 + kilka flag do optymalizacji i /arch:SSE2
Cytat57773535    57950357     12 Dec 2008 23:32:16 UTC     12 Dec 2008 23:57:30 UTC     Over     Success     Done     1,244.92     4.95     37.35
57772345    57949193    12 Dec 2008 23:10:57 UTC    12 Dec 2008 23:35:22 UTC    Over    Success    Done    1,242.48    4.94    37.27

Jakby ktoś chciał tego exe-ka pod Win32 to pisać na PW

@mindc
Jak kompilujesz na linuxie to gdzieś czytałem, że najnowszy kompilator intela ma też możliwość optymalizacji na SSE3, a ono akurat przyda się do stVector.c tylko kurde P3 nie ma chyba SSE3 :/

@Edit
Dobra 2 Wu przeliczyły się w porównywalnym czasie, czyli jak na razie u mnie liczy się 2x szybciej na noc wracam do WCG jutro jak wstanę to dalej będę grzebał za przykładami wykorzystania SSE/SSE2/SSE3, może uda się wydusić dodatkowo jeszcze kilkaset sekund :)

buninek

#116
Po zastosowaniu poprawki by mindc, zanotowałem pewnie największy zysk czasu przeliczania. XD
Proc amd k6-II@500
przed
Cytat57634807   57816179   11 Dec 2008 1:28:40 UTC   12 Dec 2008 9:46:16 UTC   Over   Success   Done   31,566.31   14.33   41.09
po
Cytat57718043   57897097   11 Dec 2008 22:07:24 UTC   13 Dec 2008 9:57:29 UTC   Over   Success   Done   17,285.90   9.66   39.84

mindc

#117
Cytat: sesef w 13 Grudzień 2008, 00:41
Jak kompilujesz na linuxie to gdzieś czytałem, że najnowszy kompilator intela ma też możliwość optymalizacji na SSE3, a ono akurat przyda się do stVector.c tylko kurde P3 nie ma chyba SSE3 :/

P3 ma tylko SSE

nie ma różnicy między SSE2 a SSE3 dla tego kodu
chyba żeby odpowiednio przepisać kod, aby kompilator dokonał odpowiednich optymalizacji

EDIT:
zapomniałem dopisać, wersja 11 kompilatora intel, wywala od razu aplikację... ma problemy jakieś ze stosem




TJM

Ale wtedy jedna aplikacja zajmuje wszystkie rdzenie

W razie jakiejś pilniejszej sprawy - jestem często dostępny na kanale IRC B@P, na forum czasami zapominam zajrzeć lub nie mam czasu.