-
Data: 2015-10-06 01:09:20
Temat: Re: asm - przesuwanie wektora bajtow
Od: Waldek Hebisch <h...@a...uni.wroc.pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]szemrany <s...@o...off> wrote:
> Witam
>
> Potrzebuj? przesun?? tablic?/wektor bajt?w w lewo o zadan? liczb? bit?w. Po
> jakim? tam czasie czytania i pr?b zrobi?em prock? opart? o instrukcj? RCL
> przesuwaj?ca o jeden bit:
>
>
> mov ebx, x // liczba bajt?w w wektorze
> mov eax, end_byte // adres ostatniego elementu
> clc
> @@loop:
> mov cl, byte ptr [eax]
> rcl cl, 1
> mov byte ptr [eax], CL
> dec eax
> dec ebx
> jne @@loop
>
> Teraz, gdy chc? przesun?? o 3 bity to wykonuj? ten kod w p?tli trzy razy.
>
> Czy ten kod mo?na zoptymalizowa? bardziej?
> Czy mo?na to zrobi? inaczej, bez RCL?
>
Napisz w C (niekompletne i nieprzetestowane):
carry = 0
for(i = 0; i < n; i++) {
val = *src++;
*dst++ = val<<k | carry;
carry = val>>(M-k);
}
gdzie val i carry sa odpowidniego typu bez znaku, M to ilosc bitow
w tym typie, n to ilosc jednostek do przesuniecia, k to i ile bitow
przesuwamy. Jesli jednostka jest bajt to przy przesuwaniu o jeden
bit ta twoja petla ma szanse byc szybsza (ale RCL to powolna
intrukcja...). Przy przesuwaniu w wiecej niz jeden bit metoda
z dwoma przesunieciami bedzie szybsza. To wyzej moze pracowac
na wiekszych jednostkach, np. po 64 bity. Ta sama metoda
uzywajac SSE pozwala przerobic 128 bitow na krok. Oczywiscie
wtedy jest problem z wyrownywaniem (podzielnoscia adresow
przez 8 czy 16) i koncowka. Ale jak masz dluzsze ciagi to
sie oplaca. Jesli masz troche luzu w pamieci to naprosciej
od razu dzialac na ciagach odpowiednio dlugich slow.
Jeszcze jedno: jak przesuwasz o 0 bitow to ten kod wyzej ma
prawo nie dzialac, po prostu wtedy nalezy kopiowac.
P.S. Jesli koniecznie chcesz w asm, to kompilator Ci powie
jak to wyglada, zreszta recznie tez latwo przetlumaczyc.
--
Waldek Hebisch
Następne wpisy z tego wątku
- 06.10.15 06:55 slawek
- 06.10.15 10:26 Radoslaw Szwed
- 06.10.15 12:06 M.M.
Najnowsze wątki z tej grupy
- Do czego nadaje się QDockWidget z bibl. Qt?
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
- Ada 2022 Language Reference Manual to be Published by Springer
- Press Release - AEiC 2023, Ada-Europe Reliable Softw. Technol.
- Ada-Europe - AEiC 2023 early registration deadline approaching
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2023
- Ile cykli zajmuje mnożenie liczb 64-bitowych?
Najnowsze wątki
- 2024-06-10 wyobrazcie sobie ze
- 2024-06-10 malowanie samochodu
- 2024-06-10 News from Poland
- 2024-06-10 Czy na pewno będą CŁA na chińskie samochody?
- 2024-06-09 Dlaczego w Polsce sie nic nie udaje, na przykładzie niebieskiego lasera a teraz perskowitów
- 2024-06-09 Dlaczego w Polsce sie nic nie udaje, na przykładzie niebieskiego lasera a teraz perskowitów
- 2024-06-09 Wykrywanie przerwy w długim przewodzie zakopanym w ziemi.
- 2024-06-09 Czemu news.chmurka.nwt jest taki wolny?
- 2024-06-11 Funbox 3.0 zakres adresów DHCP
- 2024-06-11 Re: Funbox 3.0 zakres adresów DHCP
- 2024-06-09 Miernik szybkości netu
- 2024-06-11 Panele PV w pionie (prawie).
- 2024-06-11 czy ta grupa żyje?
- 2024-06-11 Warszawa => Senior React Native Developer <=
- 2024-06-11 Gdańsk => Kierownik Działu Spedycji Międzynarodowej <=