-
Data: 2014-07-01 19:20:13
Temat: sse i skaczace wyniki
Od: firr <p...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]ostatnio sie troche chyba przekodowalem
i nie che mi sie kodowac (trzeba bedzie troche
odpoczac) ale robie jeszcze drobne testy
i np dziwi mnie ze sytuacja jaka mam
w przypadku prob porownywania mnozen
100k 3-floatowych wektorow przez 9-floatowa
tablice 100k x 12 bajtów = 1.2 MB
najdziwniejsze jest to ze wyniki strasznie
skaczą w zaleznosci np od kolejnosci
uruchamiania petli (czy float przy sse czy
sse po float, skacza tez przy zmiani ilosci
petlowania tego - i to skacza na tyle ze
po prostu te wyniki jest mi ciezko jednoznacznie
zinterpretowac - choc to moze dlatego ze
nie wiem czego sie spodziewac i jak to zinterpretowac
jak robilem proby to mam faktycznie 5 rodzajów wynikow
1) sse jest sloadowo szybszy od float
2) nieco szybsze jest to co jest wykonywane drugie
3) znacznie szybsze jest to co jest wykonywane drugie
4) sse jest 10 razy szybszy od float (?)
5) sse jest 5 razy szybszy od float
np dla ostatnich moich wynikow loopowanie 100
razy tego mnozenia 100k zajmuje 182 ms w zwylym mnozeniu przez floaty 44 ms w
mnozeniu przez sse
- sa to niby dosyc racjonalnie wygladajace wyniki
ale jednak wydawaloby sie ze jako ze raczej dominuje czytanie i pisanie do pamieci a
nie mnozenia i dodawania nie powinno to byc az tyle -- (ale to powiedzmy nie jest az
tak dziwne dziwne sa te
skoki - moj timer na ogol sie sprawdzal tj mierzyl
tak jak trzeba fizyczne czasy wiec chyba jest ok,
choc czasem jakis blad tez jest nietrudno zrobic
- tak ze w sumie nie wiem jak to rozumiec - trzeba bedzie tych testow porobic wiecej
-- juz troche nawyklem do intrisicow tak ze nawet pewnie dalbym rade przepisac cale
srodkowe* pipeline mojego rasteryzera
i wtedy najlepiej by bylo obejrzec to na czasach ramki
* bo samej rasteryzacji trojkata raczej sie nie da przepisac na sse bo nie sa to
zgodne operacje te trojkaty sa calkiem inne i gdzie iniedziej itp nie
dadza sie w ten sposob zrobic - jest to nawet chyba dobry przyklad kodu ktory jest w
ciezkim lópie a ktory absolutnie (chyba - a moze gdyby tak 4 scanline robic na raz,
nie wiem) nie da sie odpalic na sse - wiecej testow jak odpoczne
Następne wpisy z tego wątku
- 01.07.14 19:32 firr
Najnowsze wątki z tej grupy
- Xiaomi [Chiny - przyp. JMJ] produkuje w całkowitych ciemnościach i bez ludzi
- Prezydent SZAP/USONA Trump ułaskawił prezydenta Hondurasu Hernandeza skazanego na 45 lat więzienia
- Rosjanie chwalą się prototypem komputera kwantowego. "Najważniejszy projekt naukowy Rosji"
- A Szwajcarzy kombinują tak: FinalSpark grows human neurons from stem cells and connects them to electrode arrays
- Re: Najgorszy język programowania
- NOWY: 2025-09-29 Alg., Strukt. Danych i Tech. Prog. - komentarz.pdf
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
Najnowsze wątki
- 2026-01-29 KSeF - 13 wątpliwości
- 2026-01-29 A ja się pochwalę
- 2026-01-29 Warszawa => Mid/Senior IT Recruiter <=
- 2026-01-29 Warszawa => Senior Java Developer <=
- 2026-01-29 Warszawa => IT Recruiter <=
- 2026-01-28 Degradacja
- 2026-01-28 Wysoki Sąd poinstruował czego unikać wyzywając Owsiaka "Równiejszego"
- 2026-01-28 Białystok => Solution Architect (Workday) - Legal Systems <=
- 2026-01-28 Białystok => Preseles Inżynier (background baz danych) <=
- 2026-01-28 Wrocław => Konsultant wdrożeniowy ERP <=
- 2026-01-28 Łódź => Microsoft Engineer <=
- 2026-01-28 Białystok => Tester manualny <=
- 2026-01-27 Tradycja ciągania posłów po sądach za wystąpienia w Sejmie będzie kontynuowana [Lepper 2]
- 2026-01-27 Pierwszy raz sprzedano więcej samochodów zeeletryfikowanych niż ice
- 2026-01-27 Elektryczny Kałasznikow




Co zmienia darmowy dostęp do Rejestru Cen Nieruchomości?