-
Data: 2010-07-31 13:29:13
Temat: Re: Przyspieszenie na OpenCL, CUDA, DirectCompute, itd
Od: Bronek Kozicki <b...@s...net> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]On 31/07/2010 01:09, Mariusz Marszałkowski wrote:
> W sumowanym wektorze są też liczby ujemne, nie można wybrać po
> prostu całego zakresu.
ok, więc nieco poważniejsze rozważania. Trzymanie w pamięci jednej
zmiennej suma do której wszystkie wątki zapisują, zupełnie się nie
skaluje. Musisz wymyśleć lepszy algorytm.
Np - w każdym wątku pętla od 0 do SIZE, wątków tyle ile kolumn. Każda
pętla tworzy histogram elementów w kolumnie. Dodatkowo (jeszcze jeden
niezależny wątek) pętla tworząca historam wektora. Na podstawie
ostatniego będziesz widział z których wierszy możesz zrezygnować z
najmniejszą stratą, na podstawie histogramów kolumn będziesz wiedział
które kolumny maję najmniejszy maksymalny element, drugi od końca itd. i
w ten sposób sobie dobierzesz minimalne wartości N i pasujący wybór
kolumn. Z perspektywy przetwarzania wielowątkowego ważne jest że w ten
sposób rozbiłeś część zadania na wiele (liczba kolumn + jeden na wektor)
niezależnych wątków wykonania z których każdy zapisuje swoje własne dane
do pamięci. Co więcej, każdy wątek bedzie później mógł niezależnie te
histogramy analizować ze stosunkowo niewielką wymianą danych między
wątkami (preferowane wiersze do utraty, przesłane z histogramu wektora
do histogramów kolumn).
Jak to się ma do CUDA? Nie wiem, bo w tym nie programuję. Ale,
skalowalność na wiele wątków (sprzętowych czy programowych) działa tylko
wtedy, jeżeli nie musisz dostępu do danych synchronizować w każdym kroku.
B.
Następne wpisy z tego wątku
- 01.08.10 01:14 Mariusz Marszałkowski
- 01.08.10 13:23 Bronek Kozicki
- 01.08.10 15:52 Mariusz Marszałkowski
- 01.08.10 16:30 Piotr Chamera
Najnowsze wątki z tej grupy
- Rosjanie chwalą się prototypem komputera kwantowego. "Najważniejszy projekt naukowy Rosji"
- A Szwajcarzy kombinują tak: FinalSpark grows human neurons from stem cells and connects them to electrode arrays
- Re: Najgorszy język programowania
- NOWY: 2025-09-29 Alg., Strukt. Danych i Tech. Prog. - komentarz.pdf
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
Najnowsze wątki
- 2026-01-01 Najbogatsi ludzie na świecie są jeszcze bogatsi. Bezprecedensowa skala zysków
- 2026-01-01 Najbogatsi ludzie na świecie są jeszcze bogatsi. Bezprecedensowa skala zysków
- 2026-01-01 Wszystkiego najlepszego
- 2025-12-31 Czy potrafisz wskazać różnice? [TVN v. RMF]
- 2025-12-31 I kolejny jebnięty
- 2025-12-31 Myślenice => Specjalista ds. kontrolingu <=
- 2025-12-31 Ostróda szlachetnie walczy
- 2025-12-31 Pierwsza mapa kosmosu w 102 długościach fal podczerwieni! To początek nowej ery w astronomii
- 2025-12-31 Rosjanie chwalą się prototypem komputera kwantowego. "Najważniejszy projekt naukowy Rosji"
- 2025-12-31 Rosjanie chwalą się prototypem komputera kwantowego. "Najważniejszy projekt naukowy Rosji"
- 2025-12-31 Pieniadze-cuchna-oddechem-nawalonego-tatusia
- 2025-12-31 Iran na skraju gospodarczego upadku. Na ulicach Teheranu (znów) wrze. To może być cios dla reżimu
- 2025-12-30 zasilacz
- 2025-12-30 Teraz System Plików PFS z sys. op. Amiga OS będziesz mógł zamontować pod sys. op. Linuks i Jabłoko Makintosz
- 2025-12-30 Aeor2 i ciągły internet 512kb




5 Najlepszych Programów do Księgowości w Chmurze - Ranking i Porównanie [2025]