-
Data: 2012-03-02 12:03:24
Temat: Re: OpenMP - jest szybciej czy wolniej?
Od: "slawek" <s...@h...pl> szukaj wiadomości tego autora
[ pokaż wszystkie nagłówki ]
Użytkownik "Jordan Szubert" <u...@j...us.to> napisał w wiadomości grup
dyskusyjnych:o...@a...home...
> myślę, że może być tak, że dwurdzeniowy program poświęca dużo czasu na
> przerzucanie danych między rdzeniami, a jednordzeniowy cały czas ma dane w
> tym rdzeniu, co trzeba (bo jedynym)
Wic w tym, że nie trzeba tych danych przerzucać - bo i po co?
One są przetwarzane _równolegle_ - tj. wektor b jest tworzony z wektora a
tak, że połowę elementów b oblicza wątek 1, a drugą połowę wątek 2.
Oczywiście żaden z wątków nie używa wyników które są otrzymywane poza nim
samym.
W dodatku to był AMD, czyli _wspólne_ cache.
> może być coś innego, Fortrana ni OpenMP nie znam, nie wiem co twój kod
> robić próbuje...
Nie próbuje, tylko robi i to dość skutecznie (jeżeli jest jednowątkowy).
Jeżeli jest uruchomiony z OpenMP też robi to co powinien - tyle że
przeraźliwie wolno (2 minuty zamiast 5 sekund).
A najciekawsze, że profiler daje "dobre" oszacowania - dokładnie takie
jakich spodziewałbym się teoretycznie - tyle, że te oszacowania zupełnie
rozmijają się z tym, co widać na zegarku (takim na rękę, nakręcanym).
Gdzieś jest błąd. I oczywiście jest narzut na tworzenie wątków (200 tysięcy
razy są tworzone), ale: 1. tak to się w OpenMP robi "podręcznikowo"; 2. ten
narzut jest łapany przez profiler jako całkiem nieduży i akceptowalny.
Następne wpisy z tego wątku
- 02.03.12 12:12 Arkadiusz Dymek
- 02.03.12 12:12 slawek
- 02.03.12 12:16 Edek Pienkowski
- 02.03.12 12:28 slawek
- 02.03.12 12:35 slawek
- 02.03.12 12:46 Edek Pienkowski
- 02.03.12 12:52 Edek Pienkowski
- 02.03.12 13:00 slawek
- 02.03.12 13:01 Paweł Kierski
- 02.03.12 13:02 Paweł Kierski
- 02.03.12 13:07 slawek
- 02.03.12 13:12 Edek Pienkowski
- 02.03.12 13:21 slawek
- 02.03.12 13:24 slawek
- 02.03.12 13:25 slawek
Najnowsze wątki z tej grupy
- ,,Polski przemysł jest w stanie agonalnym" - podkreślił dobitnie, wskazując na brak zamówień.
- Rewolucja w debugowaniu!!! SI analizuje zrzuty pamięci systemu M$ Windows!!!
- Brednie w wiki - hasło Dehomag
- Perfidne ataki krakerów z KRLD na skrypciarzy JS i Pajton
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- Instytut IDEAS może zacząć działać: "Ma to być unikalny w europejskiej skali ośrodek badań nad sztuczną inteligencją."
- U nas propagują modę na SI, a w Chinach naukowcy SI po kolei umierają w wieku 40-50lat
- C++. Podróż Po Języku - komentarz
- "Wuj dobra rada" z KDAB rozważa: Choosing the Right Programming Language for Your Embedded Linux Device
- Nowa ustawa o ochronie praw autorskich - opis problemu i szkic ustawy
- Alg. kompresji LZW
- Popr. 14. Nauka i Praca Programisty C++ w III Rzeczy (pospolitej)
- Arch. Prog. Nieuprzywilejowanych w pełnej wer. na nowej s. WWW energokod.pl
- 7. Raport Totaliztyczny: Sprawa Qt Group wer. 424
Najnowsze wątki
- 2025-05-11 obca rejestracja budzi agresję
- 2025-05-11 Po nie udanej próbie egzekucji: Nigeryjczyk, który chciał zabić Polaka, nie odpowie za atak
- 2025-05-10 Szczecin => Key Account Manager IT <=
- 2025-05-10 Rudno => Administrator sieci IT <=
- 2025-05-10 Wrocław => Controlling systems Consultant <=
- 2025-05-10 Rudno => IT network administrator <=
- 2025-05-10 Warszawa => Customer Service with Spanish + translation <=
- 2025-05-10 Warszawa => Senior Account Manager <=
- 2025-05-10 Trójmiasto => Head of Social Media <=
- 2025-05-10 Warszawa => C Programmer <=
- 2025-05-10 Warszawa => Java Developer <=
- 2025-05-10 powąchaj instrybutor
- 2025-05-10 Prawomocny wyrok. Rowerzysta nie ma pierwszeństwa, dojeżdżając do przejazdu
- 2025-05-09 Propagation velocity v/c dla kabli RF
- 2025-05-09 Warszawa => Senior Node.js Developer (doświadczenie z framework Nest.