-
Data: 2012-03-03 16:29:04
Temat: Re: OpenMP - jest szybciej czy wolniej?
Od: Edek Pienkowski <e...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]Dnia Sat, 03 Mar 2012 17:12:22 +0100, slawek napisal:
> Użytkownik "Edek Pienkowski" <e...@g...com> napisał w
> wiadomości grup dyskusyjnych:jite8a$dvn$1...@i...gazeta.pl...
>> OpenMP pozwala robić przede wszystkim coarse-grained, fine-grained może
>> i też, ale twoje pętla jest "mikro". Zrób zewnętrzną/wewnętrzną.
>
> Nie taka mikro ;)
Chodzi mi o jedną iterację.
>
> Nie da się - ta pętla to jedyny etap na którym coś sensownie (tj.
> bezmyślnie) można zrównoleglić.
>
> Było rzędu 1000
>
> Dałem docelowe N, czyli 10 000, i nagle... surprise, surprise
>
> (a nic innego nie zmieniałem!)
[...]
To jednak udawadnia twoją tezę, że to trochę chimeryczne stworzenie.
Dla mojej ciekawości: zrobiłbyś test N=1000 (zgubiłem się już, które to
N) i zrobił pętlę tak:
for i = 0 ; i += 1000 ; i < n
for private(j) = i; j < 1000 + i && j < n; j++)
(sam bym zrobił, ale chwilowo mi się system instaluje)
>
>> GPU działa inaczej. Taka pętla będzie "memory-bound", za mało liczenia.
>> W przypadku GPU mówi się o przepustowości, i generalnie przepustowość
>> obliczeniowa karty jest rzędu 8-10 x większa niż przepustowość
>
> Nie o to chodzi - po prostu dziwiłem się kiedyś, po co Intel dał GPU do
> CPU zamiast zrobić coś innego. Tłumaczył się wtedy (inż. z Intela), że
> mieli pusto na krzemie, bo obwód wafelka jest ograniczony prądowo przez
> I/O, więc przy malejącej szerokości ścieżki zostały puste placki, więc
> wsadzili tam coś, czyli GPU. Bardziej jednak prawdopodobne, że te GPU
> tam już teraz jest... aby kiedyś używać podobnie jak to robi CUDA.
Ciekawe story, ten ring danych to pewnie dlatego, że jej się LOTR
przyśnił? Pierścienie na wafelku?
Wiem, że iX mają GPU, ale to inne GPU niż Nvidii. Na nowych AMD,
Intelach może też, już GPU daje jakąś pomoc dla CPU w zwykłym kodzie
CPU, przynajmniej tomshardware tak twierdzi. Jak dla mnie to
chwilowo jest skomplikowane, a że "w domu" i "w pracy" mam
starszy sprzęt (pomijając może mainframe) to nie mam z tym do czynienia.
>
>> Ta, schedulera. W przypadku dwóch wątków na dwucorowym procku scheduler
>> nie ma nic do gadania.
>
> Niezupełnie - oddychają Windowsy, piszę newsy, coś się dzieje...
Ok, ruszysz myszką: przerwanie, I/O, kursor, itd. Podejrzewasz,
że jakikolwiek scheduler robi potem msleep(100)?
Jedyne o czym wiem, to Windows preferuje okienka z focusem. Chcesz
mieć szybciej działającą aplikację: zrób puste okienko. Albo zmień
ustwienia wydajności na "aplikacje w tle", serwerowe to się cyhba nazywa.
>
>> OpenMP jest fajny, RTFM. Trolujesz, czy serio narzekasz?
>
> Na serio narzekam. Powinno być tak prosto jak się da. A jest... no
> dobrze, jeszcze tylko dlaczego OpenMP nie chce działać pod GCC 4.7 ?!
> Tzn. coś mu się nie podoba "stara" glibc. Ok. Ale czy ja mam chęć
> walczyć z glibc - na każdym systemie na jaki przypadkiem trafię?! Nie
> mam!
Do pełni szczęścia dodaj -std=c++0x i miłego debugowania, ech.
>
>> Bo spieprzyłeś. Gcc wektoryzuje pętle. Jak masz task z 1 iteracją może
>> mieć problem (też bym liczył na to, że sobie poradzi, ale nie wszystkie
>> optymalizacje zawsze działają). Zresztą:
>
> Przełom jest przy około 50 tysiącach iteracji.
>
> Nagle wszystko robi się płynne, obciążenie CPU leci do 100%, oba wątki
> się dogadują - normalnie cud mniemany.
Na Thrust możesz zerknąć i tak, samo się na GPU przeniesie.
Edek
Następne wpisy z tego wątku
- 03.03.12 21:29
- 03.03.12 21:33 M.M.
- 03.03.12 23:13 slawek
- 04.03.12 05:46 M.M.
- 04.03.12 10:29 Roman W
- 04.03.12 11:13
- 05.03.12 11:02 Roman W
- 05.03.12 15:14 M.M.
- 05.03.12 18:33 slawek
- 05.03.12 18:42 fir kenobi
- 05.03.12 18:48 slawek
- 05.03.12 18:58 slawek
- 06.03.12 02:27 Michoo
- 06.03.12 06:04 Karol Y
- 06.03.12 09:43 slawek
Najnowsze wątki z tej grupy
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- U nas propagują modę na SI, a w Chinach naukowcy SI po kolei umierają w wieku 40-50lat
- C++. Podróż Po Języku - komentarz
- "Wuj dobra rada" z KDAB rozważa: Choosing the Right Programming Language for Your Embedded Linux Device
Najnowsze wątki
- 2025-05-30 Warszawa => Senior Account Manager <=
- 2025-05-30 Warszawa => Senior C++ Developer (analiza numeryczna i modelowanie) <=
- 2025-05-30 Gdańsk => Team Lead Data Engineer (Snowflake) <=
- 2025-05-30 Warszawa => Team Lead Data Engineer (obszar Snowflake) <=
- 2025-05-30 Gdańsk => Programista Delphi <=
- 2025-05-30 Warszawa => Software Engineer .Net <=
- 2025-05-30 Warszawa => Inżynier oprogramowania .Net <=
- 2025-05-30 Warszawa => Młodszy Specjalista ds. wsparcia sprzedaży <=
- 2025-05-30 Bieruń => Spedytor Międzynarodowy (handel ładunkami/prowadzenie flo
- 2025-05-30 Łódź => Mainframe (z/OS, Assembler) Developer <=
- 2025-05-30 Szczecin => Key Account Manager IT <=
- 2025-05-30 Wrocław => Controlling systems Consultant <=
- 2025-05-30 Żerniki => Dyspozytor Międzynarodowy <=
- 2025-05-29 Się mi gówno przykleiło
- 2025-05-30 Jeżeli ktoś rozpędza BMW na drodze publicznej do 250 km/godz. to tworzy narzędzie zbrodni