Menu

Pokaż wiadomości

Ta sekcja pozwala Ci zobaczyć wszystkie wiadomości wysłane przez tego użytkownika. Zwróć uwagę, że możesz widzieć tylko wiadomości wysłane w działach do których masz aktualnie dostęp.

Pokaż wiadomości Menu

Wiadomości - buninek

#521
pod intela to nic się lepszego u mnie nie zrodziło
#522
Cytat: Mori w 09 Październik 2008, 19:53
Dawaj, Buniku, dawaj! Zawsze to będzie coś do przodu.

nowa wersja pod win (athlon64, amd x2) zmiana w hillclimb.c
http://www.adrive.com/public/32b92489374d4c8faccd3c04b73aa8650ddcda49045569608cb08340e3c5261d.html

raczej przyniesie efekt placebo (wynik benchmarku bez zmian)
#523
Trzeba poczekać na "nocne" wyniki lub przegonić graczy :) aby się wyniki ustabilizowały.

Ok. Podrzucę nową wersję.
#524
Jedyne zmiany to w score.c o których wcześniej wspominał TJM.
#525
Cytat: Mori w 09 Październik 2008, 13:06
...Buninku, dasz radę powtórzyć to? =]

Prawdopodobnie może to być kres możliwości duetu mingw+gcc-3.4 w przypadku amd.
Może inny kompilator lub ingerencja w kod źródłowy zwiększyłaby wydajność?

TJM w przypadku procesorów intela możliwym jest, że optymalizacje kompilatorem "icc"
są bliskie ideału. Starsze wersje gcc np. 3.4-4.1 nie wspierają tak dobrze procesorów
z instrukcjami SSSE3 i nowszymi (również amd phenoma) jak wersja gcc-4.3.
Pozostaje jeszcze pytanie czy kod enigmy jest w stanie z nich skorzystać.
#526
Cytat: Mori w 09 Październik 2008, 10:00
Obecny awgly100 był już przeliczony w ~55% przed podmianą, więc należy to wziąć pod uwagę. Efekty można, jak zwykle, obserwować na Enigma@home.
Pojawił się wynik. Obiecujący. Nie wiem czy wynik nie jest obciążony restartem?

Cytat: TJM w 09 Październik 2008, 10:53
Tutaj kolo też niezłą aplikację wykombinował:
http://www.enigmaathome.net/forum_thread.php?id=72
Może podlinkuj moją aplikację (linuksową) na forum projektu. Pod warunkiem, że przechodzi w 100% walidację.
#527
Właśnie doszedłem do wniosku, że im starsza wersja gcc tym aplikacja enigmy ma się lepiej.
Wcześniejsza kompilacja pod windowsa była oparta na mingw z gcc 4.1.0 a linuksowe o gcc 3.4.
Całe szczęscie, że na dysku pozostało mi stare PLD Ac. Zainstalowałem tam mingw oparte na gcc 3.4.
Według moich testów dla athlona64 moja nowa kompilacja powinna być szybsza o 15% od ostatniej.
Zapraszam testera. Mori ściągnij, podmień i przetestuj.
wersja pod windowsa (szczególnie athlon64, amd x2)
http://www.adrive.com/public/c16b671ff279e0f7e318e38a8df39089619af034f73a5c9668ad6acec5d334bf.html

jeszcze statyczna aplikacja pod linuksa dla procesorów amd (ver. 8.10.2008)
http://www.adrive.com/public/0aef0ad1cbf1aa5dab42359c77697565d8b6797040cdb9817ccfb0f34ed4b446.html
#528
Próbowałem dziś jeszcze z wersją windowsową. Niestety nie uzyskałem znacząco lepszych rezultatów.
6s w benchmarku (4:40 na 4:34), na granicy błędu.

Trudno mi testować, a ewentualnych opcji optymalizacyjnych jest mnóstwo. Poruszałem się po omacku,
wręcz na chybił-trafił.
Jestem i tak zdziwiony szybkością xena i windowsów w nim działających. Czas benchmarku pod win
4:34, natywna aplikacja linuksowa 3:00-2:59, linux32 pod xenem 3:03.
#530
Sprzęt / Odp: Access Point
07 Październik 2008, 21:43
nie jestem pewien czy z tym konkretnie modelem wrt54gl
http://snapvoip.blogspot.com/2007/01/asterisk-for-openwrt-my-linksys.html
#531
Sprzęt / Odp: Access Point
07 Październik 2008, 20:39
za jakość i możliwości trzeba płacić
Zalet ma bardzo dużo np.
-możesz z niego zrobić bramkę voice-over-iP (sip)
-zmodyfikować i w prosty sposób dołożyć kartę SD (i masz serwerek, np. instalujesz rtorrenta)

Podbicie TTL-a niestety pozostawia ślady i jest do wykrycia (ale zablokować się nie da).
Wszyskto zależy od umowy z ISP i od admina.

EDIT:
z rtorrentem to lekka przesada :no:
pamięci by raczej nie starczyło
#532
coś tam skleciłem
info poszło na maila
#533
Cytat: TJM w 07 Październik 2008, 17:31
Możesz spróbować wyskrobać jakiś exek pod c2d w mingw ? Może byłby szybszy od tego z dev-cpp, tam jest jakaś bardzo stara wersja kompilatora.
Mam jeszcze zrobiony pod mcpu=nocona
http://www.adrive.com/public/8ae498ac7deffe46ed107c35c0f1c3937dcf072bac49cd4e7ff4e21948731ecf.html
TJM ja jestem w sumie laikiem. Musiałbyś podpowiedzieć troszkę co i jak.
Generalnie cflags jest identyczny jak pod linuksem.
Żeby zrobić pod różne cpu muszę przenieść się pod inny system. To nie problem. Powiedz jakie mcpu +cflags i juź kompiluję.

EDIT:
Z mingw pod Arch linux nie szła kompilacja, ale pod PLD bez problemu.
PLD instaluje się z chroota. Generalnie nie ma instalatora dystrybucji (jest na pld live - wersja beta).
Proponuję ściągnąć np. PLD Live i zainstalujesz mingw bez problemu. Oczywiście do restartu kompa (jednorazowa instalacja).
Jest to banalnie proste. Odpalasz pld live  uruchamiasz  z konsoli "poldek". Pobiera bazę pakietów i instalujesz paczki.
Ewentualnie zainstaluj pld na dysku.

Ok, spróbuję ugotować wedle przepisu.

EDIT2:
Poldek ma dopełnianie nazw 'tabem'. Instalacja pakietów w poldku "i pakiet1 pakiet2 ...". Żeby uzyskać pomoc wpisz help.
Żadne zależności cię nie interesują. Tym zajmie się poldek.
Potrzebujesz  crossmingw32-gcc..., crossmingw32-runtime... może być i crossmingw32-w32api....

#534
Cytat: Mori w 07 Październik 2008, 17:30
Zobaczymy, jakie wyniki będą.
Jeszcze raz sprawdziłem rezultat benchmarku w wirtualce i nie jest chyba tak dobrze.
W drugim teście różnica była tylko o 10s

Dwa to jest optymalizowane pod amd x2 i phenomy (?), a ty bodajże używasz A64.
To wersja raczej do testów. Choć możesz przeliczyć jedną, dwie próbki i podzielić się rezultatami
#535
Jeśl wcześniej korzystałeś z optymalki.
Wstrzymaj projekt i pozostałe, wyjdź z mangera.
Zmień nazwę na taką jak wcześniejsza + dodaj rozszerzenie exe.
Podmień  i licz.
Trojanów ani rootkitów nie zawiera. Kod kompilowany bez żadnych zmian.
Nie jestem pewien tylko wydajności. Stabilność aplikacji i wyniki będą ok.
#536
tak
tylko to jest wersja niepewna (alfa :D)
może lepiej sprawdzić w benchmarku
#537
zainstalowałem mingw32 i udało się skompilować.
test wydajnościowy robiłem w win xp uruchomionym pod xenem (maszyna wirtualna)
proponuję przeprowadzić test wydajnościowy na benchmarku enigmy
moje wyniki
05:43s dla starej aplikacji i nowa 04:24s (zaznaczam moje wyniki mogą być błędne)
http://www.adrive.com/public/c16b671ff279e0f7e318e38a8df39089619af034f73a5c9668ad6acec5d334bf.html

kompilacja pod mcpu=k8 dla procesorów AMD
z pośpiechu nie zmieniłem nazwy i rozszerzenia
Mógłby ktoś sprawdzić wydajność pod windowsem w benchmarku nową aplikację?
#538
TJM może wykorzystaj do budowy windowsowych exeków pakiet mingw32-gcc.
Ja nie mam doświadczenia, wiedzy i zbytnio jak testować aplikacji (może w wirtualce).
Wieczorem poeksperymentuję.
#539
Zakończone projekty / Odp: Ramsey@home
07 Październik 2008, 00:02
Faktycznie. :D
Coś dla punktomaniaków :P
u mnie wu ok 800 s
24h*2 rdzenie = 4760  punktów

EDIT:
host Crunch3r (+ jego optymalka) mógłby teoretycznie złupić ponad 600 000 punktów dziennie
chyba tylko limit wu wstrzymuje
#540
aplikacja enigma najnowszy build z wszystkimi poprawkami przedstawionymi przez TJM

wersja statyczna  działająca pod linuksem x86_64 jak i x86 (32-bit)
http://www.adrive.com/public/fa21685fb9718b4920686a7776bbef3493b2cae74be457303f69f991843c58ac.html

optymalizacje tylko dla procesorów amd
choć będą działać(?!) również z procesorami intela (efektów nie znam)
oczywiście wymagane odpowiednie app_info.xml
i zmiana nazwy pliku na enigma_0.76_i686-pc-linux-gnu

kompilator gcc wersja 3.4.6
CFLAGS=-Wall -W -O2 -finline-functions -funroll-loops -ffast-math -mtune=athlon64 -march=x86-64 -fomit-frame-pointer -fschedule-insns
zmainy w kodzie score.c
dodane inline double biscore() przed definicjami *score

EDIT:
nadać prawo wykonywalności chmod +x
#541
Ja takowej nie jestem w stanie wykonać. Nie mam windowsa.
I narzędzi.

Cytat: RAD-Poland w 06 Październik 2008, 21:22
rewelacja  ;D

Linux64 + Athlon 64 X2 2,0@2,3
224 sek (64bit - enigma_static buninek)

Ja byłem tylko inspiratorem. Flagi kompilacji to zasługa TJM.
Niech udostępnia jak naszybciej publicznie.
#542
Cytat: TJM w 06 Październik 2008, 19:24
Udostępniaj, ja z gotowymi exekami poczekam aż wyskrobę jeszcze coś więcej.
Jeśli chcesz spróbować jeszcze czegoś, otwórz plik score.c i przed wszystkimi funkcjami *score (np. uniscore, biscore, triscore) podopisuj inline (np. inline double biscore()) - to trochę dopala aplikację, niestety nie na wszystkich systemach. Na niektórych efekt jest ujemny.

zmieniłem, zmiana w benchmarku to 2s (zawsze coś)
zainteresownia nową wersją nie ma
nie wiem jak dokładnie wykonujesz wersję statyczną, bo chyba tylko taka ma sens
LDFLAGS="-s -static"
#543
Wyniki benchmarku a rzeczywistego liczenia toszkę się różnią, ale i tak będą znacznie lepsze.
zysk na próbce awgly100_1_1
wcześniej śr ok 5500
teraz powinno być ok 4900-5000s
Trudno jednoznacznie stwierdzić. Komp jest teraz leciutko obciążony innymi zadaniami ok 1-5%.
Mogę udostępnić statyczną wersję. Nie wiem czy nie lepiej będzie jeśli zrobi TJM.
Podpowiedz gdzie wrzucić a zaraz będzie gotowa aplikacja.

EDIT:
wyniki dla awgly100_1_1
było ok 5500s
jest ok 4620s
Nowa aplikacja powinna przyspieszyć o ok 30-40% w stosunku do starej aplikacji (optymalki) udostępnianej przez TJM.
Mowa o amd x2 x86_64 linux. Jak będzie w innych przypadkach nie wiem.
Jeśli TJM nie ma nic przeciwko mogę ją udostępnić.

EDIT2:
Jeśli ktoś jest zainteresowany wersją statyczną lub dynamiczną (x86_64) pod linuksa podajcie namiar gdzie ją wrzucić.
wyniki się potwierdzają
wu awgly100_0_1..
było 3060
jest 2476
Spróbuję jeszcze skorzystać z podpowiedzi TJM.
#544
Oh Yeah Yeah :D
Przeniosłem się z kompilacją w system z gcc 3.4 i poszło.
Efekty świetne :)
było 245 (moja propozycja)
teraz 191 TJM,TJM,TJM
brawo brawo ::)

EDIT:
W boju wypada gorzej niż w benchmarku, ale i tak powinno być kilka procent zysku.
#545
Cytat: TJM w 06 Październik 2008, 01:49
Czas dorzucić trochę do pieca %-)

gcc -Wall -W -O2 -finline-functions -funroll-loops -ffast-math -mtune=athlon64 -march=k8 -fomit-frame-pointer -fschedule-insns
Próbowałem nowych propozycji z gcc 4.3.1. Niestety kompilator nie akceptuje -fschedule-insns, wywala błąd związany z hillclimb.c. Bez tej flagi jest ok, ale czas słabszy. Wieczorem spróbuję z gcc 3.4.
#546
Projekt miesiąca / Odp: 2008.10: Enigma@home
06 Październik 2008, 14:41
U mnie również występowały(ują) problemy z pobieraniem nowych zadań. Tylko ja podmieniłem aplikację.
Problem ustępuje po wstrzymaniu drugiego liczonego projektu (prima).
Wtedy pobiera natychmiastowo.
#547
Ja próbowałem icc z tej wersji l_cc_p_10.1.015_intel64.tar.gz i były problemy:
1) Pod x86_64 jest problem z instalacją. Musisz mieć część bibliotek 32-bitowych.
2) glibc wersja najwyżej 2.6 (u mnie były tylko 2.8 instalator odradzał instalację)
3) Do icc.cfg musiałem dać taki wpis "-idirafter /usr/include/linux"
4) Przy kompilacji pluł się o libimf.so. Musiałem ją statycznie zlinkować.
    Pojawił się problem. Aplikacje test przechodziły (wyniki raczej słabe)
    a z wrapperem już się krzaczyły.
#548
Wszystkie rodzaje?
Dawno nie liczyłeś. Jest sporo nowych.
moje wyniki: amd x2 4200@2700
http://www.enigmaathome.net/show_user.php?userid=3232
z ciekawości popatrz jak dużo kompów liczy bez optymalek.
Wyniki są beznadziejne.
#549
jedna przeliczna próbka (WU) przypada na jeden rdzeń

modyfikacji nie polecam  :no:
Cytat: Mori w 05 Październik 2008, 20:41
EDIT: Aaaa, czyli on oddaje 2x tyle rezultatów co ja, tak? A wynik jest tylko za 1 rdzeń, który jest porównywalny z moim?
zgadza się

EDIT:
Nie wszystkie wyprowadzenia (nóżki) na procesorze są wykorzystywane.
Ktoś kiedyś pisał w necie jak umieścił proc po przejściach bez kilkunastu nóżek w podstawce i działał bez zarzutu.
#550
AM2 ma o 1 nóżkę więcej bo ma podstawkę z 940 ;D
z ilu korzysta  X2 to nie wiem
#551
sporo amd x2 6000 przelicza te wu w  ok 2300s.
Pewnie nie ocnięte. Jego wyniki są jak najbardziej ok.

1 rdzeń A64 (socket 939) jest  szybszy od 1 rdzenia X2. Zegar w zegar.
#552
Archiwum / Odp: LiveCD Linux + Mosix + Boinc
05 Październik 2008, 19:00
nie sądzę
raczej nie ma
Musiałbyś wszystko sam przygotować.
Z resztą mosix na live cd!?! :o
#553
Może jeszcze cóś dałoby się uszczknąć?
#554
Cytat: TJM w 05 Październik 2008, 12:46
Dziwne, u mnie w ogóle nie ma żadnych różnic, odkąd bawię się exekami enigmy (praktycznie od powstania projektu M4 czyli gdzieś od początku 2006) wypróbowałem co najmniej kilkadziesiąt różnych kerneli i nie stwierdziłem, żeby któryś był szybszy od innych - różnice na poziomie błędu pomiarowego, między  2.4.19-16mdk a 2.6.18-własna kompilacja uśredniona różnica to 0.3% na tym samym sprzęcie, na korzyść tego drugiego.

Co do wersji kernela to trochę przesadziłem. Podałem skrajny przykład. Wersja 2.6.16, której używam ma nałożone różne patche. Pewnie one
pogarszają wydajność. Generalnie najlepsze są vaniliowe wersje.
Może inaczej to ujmę można skroić pod boinca nieznacznie lepszy wydajnościowo kernel, niż taki "zwykły" dystrybucyjny desktopowy.
#555
Ja użyłem
CFLAGS=-Wall -pedantic -funroll-all-loops -fomit-frame-pointer -march=x86-64 -mtune=athlon64 -O3 -pipe

EDIT:
bardzo dobry był gcc 3.3.6, ale od tego czasu sporo się zmieniło


#556
Cytat: RAD-Poland w 05 Październik 2008, 13:46
TJM ma dobry pomysł zrobić test na próbce testowej
Testy zawszy robiłem na tym benchmarku.
#557
Wersja kernela ma spore znaczenie. U mnie przy tym samym konfigu kernela, tych samych flagach kompilacji
róznica dochodzi do 12% np. miedzy 2.6.16 a 2.6.24.
Oczywiście linuks jako taki nie ma żadnej przewagi w prędkości liczenia nad widowsem.
Właśnie zapuściłem ten "exek" pod pentium III z sse2. Już się kończy liczyć pierwsza próbka. Efekt jest jaki był.
Czyli o 20% wolniej.

EDIT:
Poprawka nie o 20% a dużo więcej bo liczyła się aż 2885 (wznowiona od 770s).
Jest ciekawe nrzędzie do robienia statycznych wersji z gotowych dynamicznych.
http://statifier.sourceforge.net/statifier/main.html
#558
Co do icc i static, to faktycznie są  jakieś problemy. Ważna jest chyba wersja glibc.
Faktycznie pentium III śmiga ładnie. Jaki zegar? Mhm, trudno stwierdzić.
Wiem jedno kernel 2.4 jest bardzo szybki.
#559
TJM udało mi się uzyskać ok 20% wzrost wydaności na AMD X2 z użyciem
kompilatora gcc 4.3.2 pod x86_64. W stosunku do aplikacji pobranej z
http://tjm.boo.pl/enigma/app/app_test_522.tgz. Nic mi nie wiadomo pod jakie porcesory kompilowana (sse3?).

                          jest     było
hceyz72_0        1820    2260
hceyz72_1        3130    3940

Może warto jeszcze powrócić do gcc i próbować zmienić "standardową" wersję aplikacji dla procesorów AMD.
Trudno mi stwierdzić czy taki sam efekt będzie w przypadku x86.
Troszkę się dziwię, że tak zachwalasz przyspieszenie liczenia na linuksie.
Przeglądając wyniki poszczególnych hostów nie widzę takowych. Mam wrażenie, że są dużo niższe niż pod windowsem i
nie mam tu na uwadze tylko amd, ale również intela. Pokaż mi te hosty linuksowe, które mają tą 40% przewagę nad
windowsowymi. Widocznie 98% liczących jedzie na aplikacji jaką zassa manager boinca.

Amd to już zupełnie inna liga. Jedyny komputer z w miarę dobrymi wynikami to chyba ten
http://www.enigmaathome.net/show_host_detail.php?hostid=7888

#560
Archiwum / Odp: Achtung, achtung!
04 Październik 2008, 16:12