eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programming[trochę OT] Petaflopy › Re: [trochę OT] Petaflopy
  • Path: news-archive.icm.edu.pl!agh.edu.pl!news.agh.edu.pl!newsfeed2.atman.pl!newsfeed.
    atman.pl!.POSTED!not-for-mail
    From: Edek <e...@g...com>
    Newsgroups: pl.comp.programming
    Subject: Re: [trochę OT] Petaflopy
    Date: Mon, 21 Jul 2014 18:17:13 +0000 (UTC)
    Organization: ATMAN - ATM S.A.
    Lines: 62
    Message-ID: <lqjlf9$9k2$1@node1.news.atman.pl>
    References: <lqeli6$ajg$1@node2.news.atman.pl>
    <5...@g...com>
    <b...@g...com>
    NNTP-Posting-Host: 178-36-249-91.adsl.inetia.pl
    Mime-Version: 1.0
    Content-Type: text/plain; charset=UTF-8
    Content-Transfer-Encoding: 8bit
    X-Trace: node1.news.atman.pl 1405966633 9858 178.36.249.91 (21 Jul 2014 18:17:13 GMT)
    X-Complaints-To: u...@a...pl
    NNTP-Posting-Date: Mon, 21 Jul 2014 18:17:13 +0000 (UTC)
    User-Agent: Pan/0.139 (Sexual Chocolate; GIT bf56508 git://git.gnome.org/pan2)
    Xref: news-archive.icm.edu.pl pl.comp.programming:206378
    [ ukryj nagłówki ]

    Szarym od mżawki świtem Mon, 21 Jul 2014 10:31:18 -0700, firr wyrzucił
    pustą ćwiartkę i oznajmił:

    > ps co do zwyklych pecetóf to operuja one w skali gigafloatów (kiedys juz byla o tym
    mowa tj podawalem
    > swoje oszacowania ile to moze byc, nawet juz nie pamietam ile to wychodzilo, ale
    moje obecne oszacowania
    >
    > CPU
    >
    > "memory bandwidth" - 1-2 GigaFlopa, podobno dla danych w cache to moze byc 6x
    szybciej ale ja tego nie
    > obserwowalem, dominujacy czynnik to jest ta zwykla wartosc
    > "prosta arytmetyka" - tutaj w zasadzie nie wiem dokladnie ale z czytanych jakichs
    tam benchmarkow
    > i z wlasnych oszacowan wynikalo by ze jest to okolo
    > 2 gigaflopa dla kody skalarnego i ok 6 Gigaflopow
    > dla sse (na rdzeń) - nie sa to do konca pewne dla mnie wartosci ale chyba dosyc
    rozsadne w realnym kodzie pewnie mozna osciagnac jakies wyniki pod to podchodzace
    (czyli mozn anp ze 4 razy gorsze)
    >
    > GPU
    >
    > gpu sa podobno rozne i te slabsze 'na rynku' sa chyba kilkukrotnie slabsze niz te
    mocniejsze
    >
    > "memory bandwith" podobno gpu maja wiekszą wewnetrzna 'memory bandwidth' jesli
    chodzi o ich wewnetrzny vram (za to te przesylowa ram->vram podobno jest mw taka sama
    lub nawet ciut wolniejsza niz ta typowa dla ram i cpu - acz tego nie jestem pewiem
    ale ponoc) - zalezy chyba od karty ale np dla
    > mocniejszej karty jest to np 30 Gigaflopow (czyli kilkanascie razy wiecej)
    >
    > "prosta arytmatyka" - zalezy od karty ale podobno moze siegac tak ze 400 Gigaflopow
    (moze to jest troche przesadzone ale podobno) Porownywanie ze
    > skalarnym rczeniem dawalo by 200x wieksza moc,
    > z sse tak z 70x wieksza moc, z 8 rdzeniami z sse
    > 10 x wieksza moc (moze to jest i realistyczne
    > ale to jest dla mocnej karty, pewnie ta ktora ja mam jest akurat z 10 razy slabsza)
    >
    > podsumowujac
    > cpu 1-2 GF mem /2-6 x cores, GF arithmetic
    > gpu 3?-30? GF mem / 40? - 400? GF arithmetic
    >
    > sa to dane z roznych opinie w necie i troche z
    > moich testow jesli chodzi o cpu (te dane dot
    > gpu moga byc troche niepewne) ale z grubsza
    > jakos tak to chyba musi wygladac
    >
    > w jeszcze wiekszym skrócie cpu mem 1-2 GFloata
    > cpu arithmetic 5 GFloatow na rdzen, gpu kilka do
    > 30 razy lepiej niz cpu (z tym tez ze podobno
    > moc gpu szybko spada dla troche bardziej trudnych i rozgalezionych kerneli)
    >
    > (nie sa to dokladne dane ale chodzi o to by miec jakies wyobrazenie

    Topowe:

    330 GB/s RAM, jakieś 70 razy tyle pamięć na GPU. 5 TFlopów single precision.
    http://en.wikipedia.org/wiki/List_of_Nvidia_graphics
    _processing_units#GeForce_700_Series
    http://en.wikipedia.org/wiki/List_of_Nvidia_graphics
    _processing_units#Tesla

    Wybrane:
    GTX 650 Ti: 1.4 TFlopa, 80GB/s, 110W, jakieś 6 stówek czyli mniej niż porównywalne
    cpu.

    Oczywiście to są idealne dane, w real life ma się jakieś 70-90% przepustowości,
    zależnie od możliwości algorytmu może być dużo mniej. Najwolniejsze jest kopiowanie
    po PCIe.

    Poza tym nie wiem skąd masz dane o cpu, wyglądają antycznie albo laptopowo żeby nie
    powiedzieć kosmicznie.

    --
    Edek

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: