-
Data: 2010-07-31 13:29:13
Temat: Re: Przyspieszenie na OpenCL, CUDA, DirectCompute, itd
Od: Bronek Kozicki <b...@s...net> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]On 31/07/2010 01:09, Mariusz Marszałkowski wrote:
> W sumowanym wektorze są też liczby ujemne, nie można wybrać po
> prostu całego zakresu.
ok, więc nieco poważniejsze rozważania. Trzymanie w pamięci jednej
zmiennej suma do której wszystkie wątki zapisują, zupełnie się nie
skaluje. Musisz wymyśleć lepszy algorytm.
Np - w każdym wątku pętla od 0 do SIZE, wątków tyle ile kolumn. Każda
pętla tworzy histogram elementów w kolumnie. Dodatkowo (jeszcze jeden
niezależny wątek) pętla tworząca historam wektora. Na podstawie
ostatniego będziesz widział z których wierszy możesz zrezygnować z
najmniejszą stratą, na podstawie histogramów kolumn będziesz wiedział
które kolumny maję najmniejszy maksymalny element, drugi od końca itd. i
w ten sposób sobie dobierzesz minimalne wartości N i pasujący wybór
kolumn. Z perspektywy przetwarzania wielowątkowego ważne jest że w ten
sposób rozbiłeś część zadania na wiele (liczba kolumn + jeden na wektor)
niezależnych wątków wykonania z których każdy zapisuje swoje własne dane
do pamięci. Co więcej, każdy wątek bedzie później mógł niezależnie te
histogramy analizować ze stosunkowo niewielką wymianą danych między
wątkami (preferowane wiersze do utraty, przesłane z histogramu wektora
do histogramów kolumn).
Jak to się ma do CUDA? Nie wiem, bo w tym nie programuję. Ale,
skalowalność na wiele wątków (sprzętowych czy programowych) działa tylko
wtedy, jeżeli nie musisz dostępu do danych synchronizować w każdym kroku.
B.
Następne wpisy z tego wątku
- 01.08.10 01:14 Mariusz Marszałkowski
- 01.08.10 13:23 Bronek Kozicki
- 01.08.10 15:52 Mariusz Marszałkowski
- 01.08.10 16:30 Piotr Chamera
Najnowsze wątki z tej grupy
- A Szwajcarzy kombinują tak: FinalSpark grows human neurons from stem cells and connects them to electrode arrays
- Re: Najgorszy język programowania
- NOWY: 2025-09-29 Alg., Strukt. Danych i Tech. Prog. - komentarz.pdf
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
Najnowsze wątki
- 2025-12-29 Warszawa => Konsultant Microsoft Dynamics AX/365 SCM Consultant - Serv
- 2025-12-29 Warszawa => IT Recruiter <=
- 2025-12-29 Warszawa => Solution Architect (Workday) - Legal Systems <=
- 2025-12-29 Warszawa => Microsoft Dynamics 365 Finance Consultant <=
- 2025-12-29 Warszawa => Senior Java Developer <=
- 2025-12-29 Katowice => Key Account Manager <=
- 2025-12-29 MON nabyło Hutę Częstochowa. "Historyczne znaczenie"
- 2025-12-28 Czwarta doba strajku na głębokości 500 metrów. "Ministerstwo robi sobie z nas jaja"
- 2025-12-29 Kolejny kraj [WB - przyp. JMJ] zakazuje chowu klatkowego. W Polsce żyje tak 40 mln kur
- 2025-12-29 MON nabyło Hutę Częstochowa. "Historyczne znaczenie"
- 2025-12-28 Norwegia kontra media społecznościowe
- 2025-12-28 PREZENTY OD MINISTRA FINANSÓW. SKĄD PIENIĄDZE?
- 2025-12-27 pompa CO
- 2025-12-27 Gdynia => Przedstawiciel handlowy / KAM (branża TSL) <=
- 2025-12-27 Ewakuacja ludności




5 Najlepszych Programów do Księgowości w Chmurze - Ranking i Porównanie [2025]