-
Data: 2010-07-31 13:29:13
Temat: Re: Przyspieszenie na OpenCL, CUDA, DirectCompute, itd
Od: Bronek Kozicki <b...@s...net> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]On 31/07/2010 01:09, Mariusz Marszałkowski wrote:
> W sumowanym wektorze są też liczby ujemne, nie można wybrać po
> prostu całego zakresu.
ok, więc nieco poważniejsze rozważania. Trzymanie w pamięci jednej
zmiennej suma do której wszystkie wątki zapisują, zupełnie się nie
skaluje. Musisz wymyśleć lepszy algorytm.
Np - w każdym wątku pętla od 0 do SIZE, wątków tyle ile kolumn. Każda
pętla tworzy histogram elementów w kolumnie. Dodatkowo (jeszcze jeden
niezależny wątek) pętla tworząca historam wektora. Na podstawie
ostatniego będziesz widział z których wierszy możesz zrezygnować z
najmniejszą stratą, na podstawie histogramów kolumn będziesz wiedział
które kolumny maję najmniejszy maksymalny element, drugi od końca itd. i
w ten sposób sobie dobierzesz minimalne wartości N i pasujący wybór
kolumn. Z perspektywy przetwarzania wielowątkowego ważne jest że w ten
sposób rozbiłeś część zadania na wiele (liczba kolumn + jeden na wektor)
niezależnych wątków wykonania z których każdy zapisuje swoje własne dane
do pamięci. Co więcej, każdy wątek bedzie później mógł niezależnie te
histogramy analizować ze stosunkowo niewielką wymianą danych między
wątkami (preferowane wiersze do utraty, przesłane z histogramu wektora
do histogramów kolumn).
Jak to się ma do CUDA? Nie wiem, bo w tym nie programuję. Ale,
skalowalność na wiele wątków (sprzętowych czy programowych) działa tylko
wtedy, jeżeli nie musisz dostępu do danych synchronizować w każdym kroku.
B.
Następne wpisy z tego wątku
- 01.08.10 01:14 Mariusz Marszałkowski
- 01.08.10 13:23 Bronek Kozicki
- 01.08.10 15:52 Mariusz Marszałkowski
- 01.08.10 16:30 Piotr Chamera
Najnowsze wątki z tej grupy
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
Najnowsze wątki
- 2025-09-25 jęczy wspomaganie
- 2025-09-24 "Wybitna" inteligencja AI
- 2025-09-24 test stereo
- 2025-09-24 Bluetooth stereo
- 2025-09-24 Rzeszów => International Freight Forwarder <=
- 2025-09-24 Gdańsk => Delphi Programmer <=
- 2025-09-24 Warszawa => BI Developer / Analityk BI <=
- 2025-09-24 Alior zmiana logowania
- 2025-09-24 Warszawa => Senior Microsoft Dynamics 365 Business Central Consultant
- 2025-09-24 Andżelika Borys odwiedziła [WIELKIEGO PATRIOTĘ - przyp. JMJ] Andrzeja Poczobuta w [białoruskiej - przyp. JMJ] kolonii karnej
- 2025-09-24 W USA budują pierwszą komercyjną elektrownię fuzji jądrowej
- 2025-09-24 W USA budują pierwszą komercyjną elektrownię fuzji jądrowej
- 2025-09-24 W USA budują pierwszą komercyjną elektrownię fuzji jądrowej
- 2025-09-24 W USA budują pierwszą komercyjną elektrownię fuzji jądrowej
- 2025-09-23 Re: Kolory już są