Pokaż wątki

#1

Enigma@home / Enigma Optima

16 Marzec 2016, 22:57

Teaser
Witajcie!
Po dłuższej przerwie wróciłem do mojego projektu optymalizacji enigmy. Widzę, że w międzyczasie sesef wydał swoją wersję, na szczęście moja jest szybsza (przynajmniej u mnie).

Trochę historii
W styczniu 2014 miałem wersję która działała zdecydowanie szybciej niż jakakolwiek kompilacja oryginalnego kodu 0.76.2. Poza tym, że mała część zadań zwracała błędy. Do tego na nieszczęście dostałem nową pracę i skończył mi się wolny czas %)

Projekt cały czas czekał na swoją kolej i w tym roku postanowiłem wygospodarować trochę "zasobów" na enigmę. Po czysto technicznych zmianach, jak migracja z Mercuriala (IMO przegrał wojnę z gitem) i przeniesienie z Bitbucket na Github mogłem zacząć odświeżać sobie znajomość kodu :attack:

Aktualny stan
Dość szybko znalazłem błąd, który prawdopodobnie był odpowiedzialny za niepoprawne wyniki sprzed dwóch lat. Wygląda na to, że to był naprawdę prosty błąd. Najwięcej czasu zajęła mi nauka google test (który jest bardzo prosty w użyciu, przynajmniej na tym poziomie, który jest wystarczający).

Szczegóły
Ta optymalizacja ma zaimplementowane 4 ścieżki (wersje):

Zoptymalizowaną wersję standardową.
Wersję SSSE3 (Intel Core 2+/Merom)
Wersję AVX (Sandy Bridge+)
Wersję AVX2 (Haswell)

Program wykrywa automatycznie dostępny zestaw instrukcji (CPUID) i wybiera najnowszy.
x86 < SSSE3 < AVX < AVX2

Zoptymalizowana wersja standardowa
Wymagany jest dowolny procesor. Kod został zmodyfikowany m.in. tak, aby symulować w GCC najważniejszą optymalizację, jaką robił kompilator Intela. Dzięki temu szybkość była porównywalna.

Wersja SSSE3
Najlepiej przetestowana. Mam dwa komputery, oba z procesorami Intel i5/i7 (pierwszej generacji). Działa szybko dzięki SIMD w szczególności operacji PSHUFB.

Wersja AVX
Kod źródłowy praktycznie nie różni się od wersji SSSE3, jednak może używać VEX. Nie spodziewam się dużej różnicy, szczególnie, że z VEXem wiąże się kilka pułapek wydajnościowych.¹
Ogólnie sprawdzone działanie w SDE
Szybkość nieznana.

Wersja AVX2
Kod praktycznie nie przetestowany. Z tego co przeczytałem przetwarzanie rozszerzone na 256 bitów, ale pamiętam, że nie wiąże się to z dwukrotnym przyspieszeniem dekodowania.

Bardzo szybkie porównanie szybkości
Test jest bardzo prosty, użyłem My old Windows benchmark
Wyniki z Intel i5-M580 (SSSE3).

	vanilla	sesef	Agbar
obciążony	43.9	30.7	37.4
nieobciążony	20.3	13.7	11.2

Jak widać przy systemie obciążonym w 100% innymi programami jest tylko 15% przyspieszenia w porównaniu do standardowej kompilacji (prawdopodobnie Hyper Threading, enigma używa też relatywnie dużo pamięci cache). Wersja sesefa daje około 30% przyspieszenia.
Odwrotnie wygląda sytuacja przy nieobciążonym systemie: odcinamy 45% czasu działania w porównaniu do 33% u sesefa.

Co dalej?
Nie wiem, czy sesef opublikował kod źródłowy swojej wersji. Powinien, bo enigma jest licencjonowana GNU GPLv2 i wymaga publikacji kodu źródłowego. Jestem ciekawy jakie zmiany wprowadził, z tego co widziałem w zdekompilowanym kodzie musiał znaleźć inne podejście. Właściwie tylko szybko rzuciłem okiem na ten plik i wolałbym nie tracić czasu na reverse engineering. Wydaje mi się, że sesef "żyje" na BOINC Polish National Team. Jeżeli ktoś z Was mógłby go tam zagadnąć, będę wdzięczny.

Skompilowany plik udostępnię, gdy przejdzie mi dostatecznie dużo zadań na E@H. Powinno wystarczyć koło 100, nie chciałbym publikować wersji, która niepotrzebnie będzie zaśmiecać serwer. Co prawda TJM pisał mi kiedyś, że serwer da sobie z tym radę, ale po co go męczyć (już i tak error rate jest 5.6%...)

Pierwszą wersję chciałbym opublikować wewnętrznie dla naszej drużyny, żeby mieć w miarę kontrolowany zbiór użytkowników. Trzeba sprawdzić, jak aplikacja liczy w rzeczywistych warunkach, nie tylko na moich komputerach ;)

Wydaje mi się, że da się ten program przyspieszyć jeszcze o jakieś 10% (w porównaniu do moich aktualnych wyników) więc w sumie działałaby 2 razy szybciej niż standardowa. A jeszcze po dodaniu voodoo od sesefa, kto wie? Może zwracać wynik jeszcze przed rozpoczęciem obliczeń :fright:

Co o tym myślicie? Kto by się zgłosił do przetestowania?

Przejście ze zwykłego/starego kodowania instrukcji na kodowanie VEX wiąże się z dość długą karą w cyklach. Problem do rozwiązania, ale możliwe, że skończymy z dwoma plikami: SSSE3 i AVX+

#2

Archiwum / Najmanovich Research Group

10 Listopad 2011, 23:12

Jest nowy projekt:
http://boinc.med.usherbrooke.ca/nrg/

Założyłem team; proszę o odebranie founda.

#3

Archiwum / Wysyłam GPU do szpitala ;( -> GSoD

25 Sierpień 2011, 16:17

Wysyłam moje GPU do szpitala. Późno zdiagnozowane GSoD. Życzcie mi i jej szczęścia ;)

#4

Aqua@home / Koniec AQUA@home

23 Sierpień 2011, 22:57

Koniec AQUA ;[

#5

Nieskategoryzowane / Surveill

22 Lipiec 2011, 22:00

TJM znalazł nowy projekt http://surveill.dei.uc.pt/surveill/
Założyłem team. (Trollu odbierz mi założycielstwo.)

Z opisu wynika, że to jest jakiś heartbeat, a raczej coś zbliżonego.
Artykuł o Surveill@Home na Wiki B@P

#6

Wizytówki / Agbar

18 Lipiec 2011, 20:48

WCG

PrimeGrid

Yoyo

#7

Klub Top 10 / KLUB TOP 10 głosowanie na projekt nr 9 - Ankieta

16 Lipiec 2011, 17:12

Kończy się regulaminowe ;) 100 dni na projekt TOP10, więc czas zacząć głosowanie na kolejny. Oczywiście nikt nie powiedział, że musi to być inny projekt. (Wiem, wiem: "następuje zmiana").

Ostatnio dało się, również dzięki projektowi miesiąca, zdobyć 11. miejsce; zaczynaliśmy z 14.

Lista do głosowania obejmuje projekty, w których zajmujemy poniżej 10 miejsca¹, poza wymienionymi nieaktywnymi (TTBOMK):

AndrOINC
~~QMC@Home~~
Orbit@Home
UCT Malaria

Z jakiegoś powodu nie mogę ukryć wyników do czasu ogłoszenia...

#8

Klub Top 10 / KLUB TOP 10 głosowanie na projekt nr 8 - Ankieta

02 Kwiecień 2011, 22:08

Ankieta na kolejny projekt TOP10. Dałem możliwość głosowania na 3 projekty, bo mało osób głosuje i inaczej jest duża szansa na remis;)
Dałem też czas na 14 dni, żeby trwała co najmniej do 15 kwietnia, zgodnie z tym co napisał legis¹.
Projekty i pozycje z BOINCStats² w stanie na teraz P-).

Oczywiście bezmyślnie przepisałem wszystkie, w których jesteśmy poniżej 10. miejsca. Dodałem też DNA, którego BS jeszcze nie wyświetla :(

Miłego głosowania :whip:

#9

Klub Top 10 / KLUB TOP 10 głosowanie na projekt nr 8

31 Marzec 2011, 10:38

Oto lista projektów, w których aktualnie jesteśmy poniżej 10 miejsca:

ABC@home	20
AndrOINC	11
AQUA@home	16
BOINC Alpha Test	23
BURP	31
Chess960@Home	21
Climate Prediction	12
Collatz Conjecture	14
Cosmology@Home	12
DNETC@HOME	19
Docking@Home	15
DrugDiscovery@Home	22
EDGeS@Home	18
Einstein@Home	14
Gerasim@Home	21
GPUGRID	25
Hydrogen@Home	13
IBERCIVIS	31
Leiden Classical	22
LHC@Home	19
Luxrenderfarm@home	15
Magnetism@home	15
MindModeling@Home	15

NFS@Home	12
Orbit@Home	11
POEM@HOME	17
PrimeGrid	17
QMC@Home	19
Quake Catcher Network	11
Renderfarm.fi	25
RNA World	11
Rosetta@Home	11
RSA Lattice Siever (2.0)	16
SETI@Home	23
SETI@Home Beta	21
SIMAP	15
Spinhenge@home	18
Sudoku@vtaiwan	18
Superlink@Technion	24
The Lattice Project	29
UCT Malaria	31
uFluids	11
WEP-M+2 Project	13
World Community Grid	33
yoyo@home	17

BOINC@Poland

Aktualności:

Pokaż wiadomości

Pokaż wątki - Agbar