- 
X-Received: by 10.140.50.104 with SMTP id r95mr16130qga.13.1404123389530; Mon, 30 Jun
2014 03:16:29 -0700 (PDT)
X-Received: by 10.140.50.104 with SMTP id r95mr16130qga.13.1404123389530; Mon, 30 Jun
2014 03:16:29 -0700 (PDT)
Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!news.cyf-kr.edu.pl!news.nask
.pl!news.nask.org.pl!news.unit0.net!feeder.erje.net!us.feeder.erje.net!usenet.b
lueworldhosting.com!feeder01.blueworldhosting.com!peer01.iad.highwinds-media.co
m!news.highwinds-media.com!feed-me.highwinds-media.com!w8no3745841qac.0!news-ou
t.google.com!a8ni1qaq.1!nntp.google.com!w8no3745836qac.0!postnews.google.com!gl
egroupsg2000goo.googlegroups.com!not-for-mail
Newsgroups: pl.comp.programming
Date: Mon, 30 Jun 2014 03:16:29 -0700 (PDT)
In-Reply-To: <3...@g...com>
Complaints-To: g...@g...com
Injection-Info: glegroupsg2000goo.googlegroups.com; posting-host=78.30.97.8;
posting-account=Sb6m8goAAABbWsBL7gouk3bfLsuxwMgN
NNTP-Posting-Host: 78.30.97.8
References: <4...@g...com>
<3...@g...com>
User-Agent: G2/1.0
MIME-Version: 1.0
Message-ID: <9...@g...com>
Subject: Re: cpu shading by sse intrinsics
From: firr <p...@g...com>
Injection-Date: Mon, 30 Jun 2014 10:16:29 +0000
Content-Type: text/plain; charset=ISO-8859-2
Content-Transfer-Encoding: quoted-printable
X-Received-Bytes: 3831
X-Received-Body-CRC: 693634400
Xref: news-archive.icm.edu.pl pl.comp.programming:206081
[ ukryj nagłówki ]W dniu poniedziałek, 30 czerwca 2014 10:42:48 UTC+2 użytkownik Wojciech Muła napisał:
> On Saturday, June 28, 2014 12:48:05 PM UTC+2, firr wrote:
>
> > chodzi o dwie rzeczy
>
> >
>
> > 1) jak ew przyspieszyc czy ladniej to zapisac z poziomu c
>
>
>
> Nie licz za każdym razem normalnej, ani jej nie normalizuj (to
>
> pierwiastek i trzy dzielenia - dwie najwolniejsze operacje na CPU).
>
> Shader nie powinien liczyć normalnej, a jedynie intensywność światła.
>
> Mieszasz odpowiedzialności i wychodzi sieczka.
>
>
>
> > 2) jak przepisac to i przyspieszyc przy pomocy sse intrinsics (uzywam mingw gcc
4.7 wiec tak zeby poszlo pod tym kompilatorem)
>
>
>
> Najpierw dobrze napisz wersję skalarną, potem zastanawiaj się jak
>
> ją przyspieszyć SIMD-ami. Zresztą wątpliwe, czy zrobisz to lepiej niż
>
> kompilator, popatrz na http://locklessinc.com/articles/vectorize/.
>
>
nie przypuszczam zeby bylo to watpliwe, ztcw te wektoryzery potrafia wykonac ledwie
szczatkowe
operacje
co do przepisywania na razie chyba porobie troszke prostsze testy (bo w tych
wiekszych troche sie gubie) - zobacze np czy zwykle obracanie wektorow coskolwiek
przyspiesza
(nie spodziewam sie za wiele ale trzeba sprawdzic)
cos w stylu - pseudokod roboczy
float modelRight_x;
float modelRight_y;
float modelRight_z;
float modelUp_x;
float modelUp_y;
float modelUp_z;
float modelDir_x;
float modelDir_y;
float modelDir_z;
float normal_x[100*1000];
float normal_y[100*1000];
float normal_z[100*1000];
float n_x[100*1000];
float n_y[100*1000];
float n_z[100*1000];
for(int i=0; i<100*1000; i++)
{
normal_x[i] = n_x[i]*modelRight_x + n_y[i]*modelRight_y + n_z[i]*modelRight_z;
normal_y[i] = n_x[i]*modelUp_x + n_y[i]*modelUp_y + n_z[i]*modelUp_z;
normal_z[i] = n_x[i]*modelDir_x + n_y[i]*modelDir_y + n_z[i]*modelDir_z;
}
float4 modelRight_4x = populate(modelRight_x);
for(int i=0; i<100*1000; i+=4)
{
add_ps(
normal_x[i] = add_ps(
mul_ps(n_x, modelRight_x),
mul_ps(n_y, modelRight_y) ),
mul_ps(n_z, modelRight_z))
normal_y[i] = add_ps(
mul_ps(n_x, modelUp_x),
mul_ps(n_y, modelUp_y) ),
mul_ps(n_z, modelUp_z))
normal_z[i] = add_ps(
mul_ps(n_x, modelDir_x),
mul_ps(n_y, modelDir_y) ),
mul_ps(n_z, modelDir_z))
}
 
Następne wpisy z tego wątku
Najnowsze wątki z tej grupy
- NOWY: 2025-09-29 Alg., Strukt. Danych i Tech. Prog. - komentarz.pdf
 - Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
 - Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
 - Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
 - Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
 - We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
 - Ada-Europe - AEiC 2025 early registration deadline imminent
 - John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
 - Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
 - Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
 - ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
 - Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
 - Brednie w wiki - hasło Dehomag
 - Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
 - Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
 
Najnowsze wątki
- 2025-11-03 Gwarancja na używane AUTO. Czy dziś WARTO?
 - 2025-11-03 Znowu jakiś goooownoprawnik uważający się za KONSTYTUCJONALISTĘ
 - 2025-11-03 ABW już nie blokuje RT.com?
 - 2025-11-03 Czy ROZDANIE KPO śród swoich i nie swoich spowodowało KORZYŚĆ POLITYCZNĄ?
 - 2025-11-03 Warszawa => Starszy Konsultant SAP - obszar PP <=
 - 2025-11-03 Warszawa => International Freight Forwarder <=
 - 2025-11-03 Białystok => Programista React ze znajomością C++ <=
 - 2025-11-03 Warszawa => Generative AI Engineer <=
 - 2025-11-03 Warszawa => Gen AI Engineer <=
 - 2025-11-03 Białystok => Programista Delphi <=
 - 2025-11-03 Warszawa => Spedytor Międzynarodowy <=
 - 2025-11-02 totalna kontrola podatników?
 - 2025-11-02 Trzymacie pieniądze w bankach?
 - 2025-11-02 Bo sędzia prokuratorowi nie odmawia "niezawiśle" [rzepa: wnioski o areszt]
 - 2025-11-02 Michał Wawrykiewicz: "Prokuratura barszczyka bierze pod uwagę również INTENCJE uchwalaczy prawa
 




Elektromobilność dojrzewa. Auta elektryczne kupujemy z rozsądku, nie dla idei