-
Data: 2017-08-27 13:53:47
Temat: rdtsc discovery
Od: fir <p...@g...com> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]ostatnio odkrylam jak tak naprawde zaskakujaco latwo jest robic testy
na rdtsc (wewnetrznym liczniku cykli w procesorach, zdaje sie obecnym od pentium 1 w
gore) z poziomu c
- jako ze ta grupa zawsze podchwytywala dosyc sensownie temat optymalizacji, postuje
przykladowy kod, jakby co to jeszcze w przyszlosci pomierzy sie pare kawalkow i
powyciaga wnisoski czy jak to nazwac
baza
void GetRdtsc(unsigned* high, unsigned* low)
{
__asm__ volatile("rdtsc" : "=a" (*low), "=d" (*high) );
return;
}
to podaje aktualny stan zliczonych cykli (podwojne wywoalnie bez niczego 'w srodku'
i policznie roznicy u mie daje 70 lub 63 cykle)
mozna opakowac to w rozmaite wraperry ja na szybko skrobnalem
void rdtsc_test(char* test_description, void (*tested_function)() )
{
unsigned high_before,
low_before,
high_after,
low_after;
GetRdtsc(&high_before, &low_before);
tested_function();
GetRdtsc(&high_after, &low_after);
long long unsigned cycles_passed =
(((long long unsigned)(high_after-high_before))<<32) +
(low_after-low_before);
printf(test_description);
printf("\n %I64u cycles passed", cycles_passed);
printf(" ( %I64u mlns )", cycles_passed/1000/1000);
}
i przykladowa 'suita' testow
double x;
void foo_sin()
{
for(int i=0; i<1000*1000; i++)
{
x = sin((double)i);
}
}
void foo_sqrt()
{
for(int i=0; i<1000*1000; i++)
{
x = sqrt((double)i);
}
}
void foo_add()
{
for(int i=0; i<1000*1000; i++)
{
x += i;
}
}
void foo_div()
{
for(int i=0; i<1000*1000; i++)
{
x /= i;
}
}
int main()
{
rdtsc_test("\n 1mln sin testing", foo_sin);
rdtsc_test("\n 1mln sqrt testing", foo_sqrt);
rdtsc_test("\n 1mln add testing", foo_add);
rdtsc_test("\n 1mln div testing", foo_div);
return 0;
}
wyniki:
1mln sin testing
95116665 cycles passed ( 95 mlns )
1mln sqrt testing
57014027 cycles passed ( 57 mlns )
1mln add testing
1001189 cycles passed ( 1 mlns )
1mln div testing
6001233 cycles passed ( 6 mlns )
HAVE FUN
Następne wpisy z tego wątku
- 27.08.17 14:30 fir
- 28.08.17 01:51 M.M.
- 28.08.17 01:55 M.M.
- 28.08.17 12:48 Adam Wysocki
Najnowsze wątki z tej grupy
- Bibl. Qt jest sztucznie ograniczona - jest nieprzydatna do celów komercyjnych
- Co sciaga kretynow
- AEiC 2024 - Ada-Europe conference - Deadlines Approaching
- Jakie są dobre zasady programowania programów opartych na wtyczkach?
- sprawdzanie słów kluczowych dot. zła
- Re: W czym sie teraz pisze programy??
- Re: (PDF) Surgical Pathology of Non-neoplastic Gastrointestinal Diseases by Lizhi Zhang
- CfC 28th Ada-Europe Int. Conf. Reliable Software Technologies
- Młodzi programiści i tajna policja
- Ada 2022 Language Reference Manual to be Published by Springer
- Press Release - AEiC 2023, Ada-Europe Reliable Softw. Technol.
- Ada-Europe - AEiC 2023 early registration deadline approaching
- Ada-Europe Int.Conf. Reliable Software Technologies, AEiC 2023
- Ile cykli zajmuje mnożenie liczb 64-bitowych?
- Ideologia Polskiego Programisty wer.3
Najnowsze wątki
- 2024-04-27 Nowy, "szybki "komputer AsRock nie posiada modułu TPM
- 2024-04-27 Nowy, "szybki "komputer AsRock nie posiada modułu TPM
- 2024-04-27 Warszawa => Inżynier DevOps (projekt JP) <=
- 2024-04-27 Warszawa => Senior Account Manager (on-site) <=
- 2024-04-27 Wrocław => Dyrektor Sprzedaży (branża usług/produktów IT) <=
- 2024-04-27 Warszawa => Sales Representative for Outsourcing Services <=
- 2024-04-27 Chrzanów => Administrator i wdrożeniowiec Lotus Notes/Domino <=
- 2024-04-27 Ja pierdolę...
- 2024-04-27 Ryby i kawitacja
- 2024-04-27 Zabrze => Junior HelpDesk <=
- 2024-04-27 Katowice => Administrator IT - Wirtualizacja i Konteneryzacja <=
- 2024-04-27 Bażanowice => Inżynier Industrializacji - Elektronik <=
- 2024-04-27 Warszawa => Full Stack web developer (obszar .Net Core, Angular6+) <=
- 2024-04-27 Zadaszenie tarasu, a wymagany spadek
- 2024-04-27 Warszawa => Senior Account Manager <=