eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingjak napisać szybki programRe: jak napisać szybki program
  • Data: 2009-05-20 18:23:51
    Temat: Re: jak napisać szybki program
    Od: Michoo <m...@v...pl> szukaj wiadomości tego autora
    [ pokaż wszystkie nagłówki ]

    Marteno Rodia pisze:
    >>> albo co jest szybsze: int array[10] czy int *array = new int[10].
    >> Pierwsze to alokacja na stosie, drugie na tzw. stercie (dynamic storage)
    >> Ogólna zasada przy optymalizacji, to im mniej alokacji pamięci
    >> tym lepiej. Alokacja to wolna operacja.
    >
    > Super. To teraz inne pytanie: jakie są (relatywnie szybkie w wykonaniu
    > czy raczej wolne) operacje dostępu do bitów?
    >
    > Innymi słowy: potrzebuję przechować 100 trójek liczb całkowitych (a,
    > b, c), ale niewielkich, np. na a i b wystarczy po 12 bitow, a na c - 8
    > bitów. Te 3 liczby są jakoś semantycznie związane, więc warto, żeby
    > były "w kupie". Co jest szybsze?
    Co sprawdzasz? - to jest ważne.
    >
    > a) używanie struktury
    > struct Tripple { int a; int b; int c}
    > olewając jednocześnie marnotrawstwo pamięci.
    przy dobrych lotach na ia32 da to 3 instrukcje procesora[*] na
    załadowanie adresów, 3 na pobranie do rejestrów, 3 na porównania i 3 na
    zadecydowanie jaki branch
    od poprzedniego punktu - jakie operacje.
    lub 2 na pobranie, 1 na porównanie i 1 na branch (ze wsparciem sse, czy
    czegoś takiego)
    >
    > b) używanie struktury j.w. ale z typami short
    jak wyżej, ale jest szansa, że wszystkie 3 wartości polecą w jednym
    odwołaniu do pamięci, albo, że b będzie "trawiona dłużej" bo po pobraniu
    32 bitowego słowa procesor zrobi przesunięcie o 16 bitów żeby ja
    dostać. Może się też nic nie zmienić, ale zaoszczędzisz miejsce w cache,
    co da pewne przyspieszenie.
    >
    > c) używanie jednego integera do zapisu 3 liczb na różnych jego bitach
    > (2*12+8=32), tak że:
    > a = (liczby >>20) & 0xFF;
    > b = (liczby >> 8) & 0xFF;
    > c = liczby & 0xFF;
    To by miało szansę być najszybsze pod warunkiem, że testujesz tylko
    równość/różność a operacje "pakowania/rozpakowania" przeprowadzasz
    rzadko. Jakby zdefiniować metody do wygodnego operowania na tych
    składowych (a(),b(),c(), operator==) to byłoby to nawet względnie wygodne.

    Główna wada to komplikacja - popełniłeś błąd, którego szukałbyś raczej
    długo. Trzeba mieć dobry powód, żeby musieć tak kombinować.
    >
    > Co byście proponowali?
    "jaka architektura?" - co innego będzie szybsze na avr, co innego na
    arm9 a co innego na amd64. "jakie operacje?"

    [*] a to ile cykli zegara zabiera 1 instrukcja to już ina bajka

    --
    Pozdrawiam
    Michoo

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: