-
Data: 2010-01-21 09:08:27
Temat: Re: matlab taki wydajny?
Od: thrunduil <t...@w...pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]On 21 Sty, 09:41, bartekltg <b...@g...com> wrote:
> U mnie dzieje sie to samo, przy parametrach jakie podal Mariusz
> mnozenia te nie sa robione zbyt wydajnie.
Co to znaczy, ze nie sa robione zbyt wydajnie?
MKL jest pisany tak, zeby byc bardzo optymalnym juz przy macierzach
rzedu 30x30.
To jest blisko dolnego limitu wielkosci blokow wykorzystywanych w
Lapacku u musi byc optymalne.
> No to sie okazuje, ze narzut matlaba dla niewielkich wektorkow jest
> spory.
To nie ma nic wspolnego z narzutem Matlaba.
To sie nie skaluje liniowo. Kod mnozenia gdy prawa strona jest
macierza robi pewna sztuczke - blocking, podstawowy kod mnozenia ma
conajmniej szesc zagniezdzonych petli w taki sposob aby potrzebne
rzeczy byly w pamieci cache.
Cache misses dla L2 to koszt rzedu 200-300 cykli procesora. Unikniecie
wiec koniecznosci czytania pamieci daje duze oszczednosci.
Da sie to zrobic gdy prawa strona jest macierza, Gdy mnozy sie
wielkokrotnie przez wektor z prawej strony wykorzystanie pamieci jest
duzo gorsze, stad roznica efektywnosci. Narzut petli powinien byc
zaniedbywalny.
> Intelowski BLAS pokazuje skrzydla dopiero dla konkretnej ilosci
> danych.
Nie specjalnie pokazuje, peak jest dla macierzy ok 1.5tys x 1.5 tys.
Pozniej nastepuje pewne zalamanie.
Następne wpisy z tego wątku
- 21.01.10 09:57 thrunduil
- 21.01.10 10:01 Wit Jakuczun
- 21.01.10 10:40 Mariusz Kruk
- 21.01.10 11:33 Stachu 'Dozzie' K.
- 21.01.10 13:23 thrunduil
- 21.01.10 13:29 Mariusz Kruk
- 21.01.10 13:34 thrunduil
- 21.01.10 13:37 Mariusz Kruk
- 21.01.10 13:53 thrunduil
- 21.01.10 14:01 Mariusz Kruk
- 21.01.10 14:05 Krzysiek Kowaliczek
- 21.01.10 14:39 thrunduil
- 21.01.10 14:56 Wit Jakuczun
- 21.01.10 15:03 Wit Jakuczun
- 21.01.10 15:10 bartekltg
Najnowsze wątki z tej grupy
- NOWY: 2025-09-29 Alg., Strukt. Danych i Tech. Prog. - komentarz.pdf
- Na grupie comp.os.linux.advocacy CrudeSausage twierdzi, że Micro$lop używa SI do szyfrowania formatu dok. XML
- Błąd w Sofcie Powodem Wymiany 3 Duńskich Fregat Typu Iver Huitfeldt
- Grok zaczął nadużywać wulgaryzmów i wprost obrażać niektóre znane osoby
- Can you activate BMW 48V 10Ah Li-Ion battery, connecting to CAN-USB laptop interface ?
- We Wrocławiu ruszyła Odra 5, pierwszy w Polsce komputer kwantowy z nadprzewodzącymi kubitami
- Ada-Europe - AEiC 2025 early registration deadline imminent
- John Carmack twierdzi, że gdyby gry były optymalizowane, to wystarczyły by stare kompy
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2025
- Linuks od wer. 6.15 przestanie wspierać procesory 486 i będzie wymagać min. Pentium
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
Najnowsze wątki
- 2025-11-11 BRAK emerytury z ZUS po 20 LATACH placenia skladek
- 2025-11-11 Warszawa => C Programmer <=
- 2025-11-11 ARANEA
- 2025-11-11 Gdańsk => iOS Developer <=
- 2025-11-11 Warszawa => Junior Rekruter <=
- 2025-11-10 100 metrów odstępu od kontrmanifestacji - "prawnik" J. Kaczyński oskarża policje
- 2025-11-10 emerytura z USA
- 2025-11-10 Warszawa => International Freight Forwarder <=
- 2025-11-10 Białystok => Delphi Programmer <=
- 2025-11-10 Warszawa => Generative AI Engineer <=
- 2025-11-10 Warszawa => Senior Microsoft Dynamics 365 Business Central Konsultant
- 2025-11-09 Węże do tlenu medycznego
- 2025-11-09 Więcej miejsca na buspasach :-)
- 2025-11-08 kable zawieraja skrobie?
- 2025-11-08 Klip testowy, jak sie to używa




Elektromobilność dojrzewa. Auta elektryczne kupujemy z rozsądku, nie dla idei