-
Data: 2014-06-30 12:16:29
Temat: Re: cpu shading by sse intrinsics
Od: firr <p...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]W dniu poniedziałek, 30 czerwca 2014 10:42:48 UTC+2 użytkownik Wojciech Muła napisał:
> On Saturday, June 28, 2014 12:48:05 PM UTC+2, firr wrote:
>
> > chodzi o dwie rzeczy
>
> >
>
> > 1) jak ew przyspieszyc czy ladniej to zapisac z poziomu c
>
>
>
> Nie licz za każdym razem normalnej, ani jej nie normalizuj (to
>
> pierwiastek i trzy dzielenia - dwie najwolniejsze operacje na CPU).
>
> Shader nie powinien liczyć normalnej, a jedynie intensywność światła.
>
> Mieszasz odpowiedzialności i wychodzi sieczka.
>
>
>
> > 2) jak przepisac to i przyspieszyc przy pomocy sse intrinsics (uzywam mingw gcc
4.7 wiec tak zeby poszlo pod tym kompilatorem)
>
>
>
> Najpierw dobrze napisz wersję skalarną, potem zastanawiaj się jak
>
> ją przyspieszyć SIMD-ami. Zresztą wątpliwe, czy zrobisz to lepiej niż
>
> kompilator, popatrz na http://locklessinc.com/articles/vectorize/.
>
>
nie przypuszczam zeby bylo to watpliwe, ztcw te wektoryzery potrafia wykonac ledwie
szczatkowe
operacje
co do przepisywania na razie chyba porobie troszke prostsze testy (bo w tych
wiekszych troche sie gubie) - zobacze np czy zwykle obracanie wektorow coskolwiek
przyspiesza
(nie spodziewam sie za wiele ale trzeba sprawdzic)
cos w stylu - pseudokod roboczy
float modelRight_x;
float modelRight_y;
float modelRight_z;
float modelUp_x;
float modelUp_y;
float modelUp_z;
float modelDir_x;
float modelDir_y;
float modelDir_z;
float normal_x[100*1000];
float normal_y[100*1000];
float normal_z[100*1000];
float n_x[100*1000];
float n_y[100*1000];
float n_z[100*1000];
for(int i=0; i<100*1000; i++)
{
normal_x[i] = n_x[i]*modelRight_x + n_y[i]*modelRight_y + n_z[i]*modelRight_z;
normal_y[i] = n_x[i]*modelUp_x + n_y[i]*modelUp_y + n_z[i]*modelUp_z;
normal_z[i] = n_x[i]*modelDir_x + n_y[i]*modelDir_y + n_z[i]*modelDir_z;
}
float4 modelRight_4x = populate(modelRight_x);
for(int i=0; i<100*1000; i+=4)
{
add_ps(
normal_x[i] = add_ps(
mul_ps(n_x, modelRight_x),
mul_ps(n_y, modelRight_y) ),
mul_ps(n_z, modelRight_z))
normal_y[i] = add_ps(
mul_ps(n_x, modelUp_x),
mul_ps(n_y, modelUp_y) ),
mul_ps(n_z, modelUp_z))
normal_z[i] = add_ps(
mul_ps(n_x, modelDir_x),
mul_ps(n_y, modelDir_y) ),
mul_ps(n_z, modelDir_z))
}
Następne wpisy z tego wątku
Najnowsze wątki z tej grupy
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- U nas propagują modę na SI, a w Chinach naukowcy SI po kolei umierają w wieku 40-50lat
- C++. Podróż Po Języku - komentarz
- "Wuj dobra rada" z KDAB rozważa: Choosing the Right Programming Language for Your Embedded Linux Device
- Nowa ustawa o ochronie praw autorskich - opis problemu i szkic ustawy
- Alg. kompresji LZW
Najnowsze wątki
- 2025-05-15 Nowy rodzaj zagrożenie ze strony elektryków :)
- 2025-05-15 Bus inpostu, przemycający ludzi, walnął w nocy w tira zaparkowanego na autostradzie 5 ofiar
- 2025-05-15 Alert RCB w sprawie dziewczynki
- 2025-05-15 Kurierski bus przemycał ludzi i zasnął nad ranem za kierownicą.
- 2025-05-15 Dęblin => JavaScript / Node / Fullstack Developer <=
- 2025-05-14 Tsue i smsy
- 2025-05-14 Biedna kobieta jechała samochodem na targ aby sprzedać klamoty i dostała 300 zł mandatu
- 2025-05-14 hot spot traci connected device
- 2025-05-14 John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- 2025-05-14 John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- 2025-05-14 Wariant rumuński
- 2025-05-14 Rolnicy protestują w Szczecinie
- 2025-05-14 Rolnicy protestują w Szczecinie
- 2025-05-14 Rolnicy protestują w Szczecinie
- 2025-05-14 Niemcy: Przychody ze sprzedaży produktów Fairtrade w 2024r. wzrosły o rekordowe 13% do 2,9GEUR