-
Data: 2012-01-27 11:32:39
Temat: Re: [about] sse
Od: " " <f...@W...gazeta.pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]<f...@W...gazeta.pl> napisał(a):
> M.M. <m...@W...gazeta.pl> napisał(a):
>
> > <f...@W...gazeta.pl> napisał(a):
> >
> > > M.M. <m...@W...gazeta.pl> napisał(a):
> > >
> > > > <f...@g...SKASUJ-TO.pl> napisał(a):
> > > > > int iterPointTilescape(double4 pointReal, double4 pointImaginary)
> > > > Co to jest double4?
> > > > Pozdrawiam
> > > >
> > > >
> > >
> > > tutaj jest to
> > >
> > > "4 x 64 bity - wektor 4 liczb zmiennoprzecinkowych
> > > podwójnej precyzji"
> > >
> > > jeden z 'typow danych' na jakich operuja instrukcje sse (avx)
> > >
> > > proponuje wbudowac taki typ jako dodatkowy akcelerowany
> > > typ prosty w c (jako rozszerzenie specyficzne dla x86)
> > > - w tedy mozna by pisac w ce w prosty sposob akcelerowane
> > > kody pod sse/avx np "c = a * b " pomnoz 8 floatow a razy 8
> > > floatow b i zapisz do c i tak dalej - wiecej napisalem na
> > > pl.lang.c
> > Hmmm jeszcze dwa pytania mi sie nasuwaja:
> >
> > Po pierwsze czy w C++ nie ma czegos gotowego ze sie pisze
> > po prostu a = b * c ?
> >
> > Po drugie czy instrukcje SEE/AVX da sie wykorzystac do budowania
> > drzew/regul decyzyjnych? Innymi slowy czy da sie przyspieszyc ponizsza
> > pteleke, tak zeby jakos bral cztery/osiem wektorow na raz?
> >
> > int_or_short vectors[M][N+1] = { rand() };
> > int_or_short s = rand()%N;
> > int_or_short t = rand();
> >
> > for( int i=0 ; i<M ; i++ ) {
> > if( vectors[i][s] <= t )
> > vectors[i][N] = 1;
> > else
> > vectors[i][N] = 0;
> > }
> >
> troche nie rozumiem tego kodu bo o ile randy sa poza
> petla to mozna po prostu zrobic
>
> for( int i=0 ; i<M ; i++ )
> sseInt8[i] = value;
>
to troche zakrawa na przyblizenie, ale mozna
tak postrzegac czesc operacji np przerzutowanie
tablicy floatow na tablice ssefloat8 i liczenie
osmiu operacji arytmetycznych na raz
z tymi branchami jest problem, wogole jest problem
pt "jak dostosowac sse do przyspieszania jak najwiekszej
ilosci przypadkow intensywnych obliczen w petlach"
(niektorzy nazywaja takie miejsca chyba goracymi petlami
ale to okreslenie mi nie bardzo pasuje, slowko intensywne
tez nie jest calkiem dobre)
dla mnie sa to ciekawe tematy, obok wielopotokowosci
to jest drugi sposob zwiekszenia mocy przetwarzania
rdzenia
> gdzie value - np { 0.0, 0.0, 0.0 ,0.0 ,0.0 ,1.0 ,1.0 ,1.0}
>
> co do instrukcji do rozgalezien decyzyjnych
> to nie wiem jak na dzis ale chyba nie - sa blokowy
> operator porownania ktore zapisuja wyniki do rejestru
> cos w stylu a ?> b jesli a jest 8floatowe to dla tych
> par floatow dla ktorych a>b do a trafiaja 32 jedynki
> a w przeciwnym wypadku 32 zera
> (ale nie przejrzalem mnemonikow do konca)
>
> jak budowac z tego kody ktore by sie rozgalezialy
> decyzyjnie nie wiem, dla mnie jest to rzecz 'do
> opanowania' trzebe sie bedzie przylozyc to
> okaze sie co sie da zrobic i gdzie sa minusy
>
>
>
--
Wysłano z serwisu Usenet w portalu Gazeta.pl -> http://www.gazeta.pl/usenet/
Następne wpisy z tego wątku
- 27.01.12 15:51
- 27.01.12 18:47 M.M.
- 27.01.12 20:22
Najnowsze wątki z tej grupy
- A Szwajcarzy kombinują tak: FinalSpark grows human neurons from stem cells and connects them to electrode arrays
- Re: Najgorszy język programowania
- NOWY: 2025-09-29 Alg., Strukt. Danych i Tech. Prog. - komentarz.pdf
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
Najnowsze wątki
- 2025-12-25 Finlandia przywraca swastykę
- 2025-12-25 Skuteczność wymiaru sprawiedliwości
- 2025-12-24 Felgi
- 2025-12-24 2,5 x więcej niż Li-Ion
- 2025-12-24 No i kolejny ograniczony
- 2025-12-24 Warszawa => Młodszy Specjalista ds. wsparcia sprzedaży <=
- 2025-12-24 New York Times zagrożeniem bezpieczeństwa narodowego USA - POTUS D. Trump
- 2025-12-24 Podżeganie?
- 2025-12-24 => Senior Algorithm Developer (Java/Kotlin) <=
- 2025-12-24 otwarcie drugiej obwodnicy Trójmiasta
- 2025-12-24 Tfu! Przeklety prostokąt (czyli UPS i "sinus modyfikowany")
- 2025-12-23 Prezent dla kierowców od prezydenta Nawrockiego
- 2025-12-23 Warszawa => Asystent ds. Sprzedaży i Rozwoju Klienta <=
- 2025-12-23 Warszawa => Senior IT Recruitment Consultant <=
- 2025-12-22 czy wiedziałeś że?




7 pułapek i okazji - zobacz co cię czeka podczas kupna mieszkania na wynajem