eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingJak liczyć cykle na bajt? › Re: Jak liczyć cykle na bajt?
  • Data: 2021-06-15 07:46:17
    Temat: Re: Jak liczyć cykle na bajt?
    Od: Wojciech Muła <w...@g...com> szukaj wiadomości tego autora
    [ pokaż wszystkie nagłówki ]

    On Saturday, June 5, 2021 at 12:19:23 PM UTC+2, slawek wrote:
    > Przy "dużych" CPU (takich jak Intel I9, w odróżnieniu od jakichś
    > popierdułek w rodzaju 8 bitowego ATmega8) jest jeszcze
    > ciekawiej:
    >
    > 1. Jest zegar, np. 3.5 GHz.
    > 2. Ale w trybie boost leci do 5GHz - jeżeli jeden rdzeń tylko pracuje.
    > 3. przetworzenie rozkazu może zająć kilka faktów (wczytanie
    > rozkazu, wczytanie danych, zapisanie danych)

    To jest szczegół techniczny, o którym należy zapomnieć. W rzeczywistości
    potoki są głębokie (co najmniej kilkanaście etapów). Dekodowanie rozkazów,
    ich scheduling na fizyczne jednostki wykonawcze i ich faktyczne
    wykonywanie są asynchroniczne. Procesor Skylake może obsługiwać ponad
    200 rozkazów w jednej chwili.

    Z punktu widzenia programisty istotne są tylko dwie liczby charakteryzujące
    instrukcje:
    - opóźnienie (latency) - po ilu cyklach zegara wynik instrukcji będzie dostępny,
    - przepustowość (throughput) - co ile cykli zegara można odpalać dany rozkaz.

    Np. mnożenie ma latency=3, ale throughput=1, co znaczy, że jak masz wykonać
    10 mnożeń, to ich wynik może być dostępny w najgorszym przypadku po 10*3
    cyklach, a w najlepszym po 3 + 9*1 cyklach.

    Albo latency=1, throughput=0.33 dla dodawania całkowitoliczbowego oznacza, że
    wynik będzie po cyklu, ale jak scheduler da radę i będą wolne jednostki wykonawcze,
    to trzy dodawania zostaną przekazane do wykonania w 1 cyklu.

    > 4. Ale jest pipeline i na jednym core jest na raz kilka rozkazów
    > (na różnych etapach realizacji)
    > 5. Są rozkazy SIMD i rejestry o długości tak z 2KB - teoretycznie
    > operacje na nich też są "w jednym cyklu"

    Nie istnieją takie duże rejestry SIMD. Największe obecnie to 64 bajty
    w AVX512 i niektórych implementacjach SVE; większość to 16 lub 32 bajty.
    Latency dla dużej części operacji wektorowych wynosi jeden cykl,
    bez cudzysłowu. Dlatego procesory się grzeją. :)

    w.

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: