eGospodarka.pl
eGospodarka.pl poleca

eGospodarka.plGrupypl.comp.programmingKiedy będzie milion rdzeni? › Re: Kiedy będzie milion rdzeni?
  • X-Received: by 2002:a37:708:: with SMTP id 8mr12189743qkh.273.1569147065286; Sun, 22
    Sep 2019 03:11:05 -0700 (PDT)
    X-Received: by 2002:a37:708:: with SMTP id 8mr12189743qkh.273.1569147065286; Sun, 22
    Sep 2019 03:11:05 -0700 (PDT)
    Path: news-archive.icm.edu.pl!news.icm.edu.pl!newsfeed.pionier.net.pl!goblin1!goblin.
    stu.neva.ru!o24no9190971qtl.0!news-out.google.com!x7ni1351qtf.0!nntp.google.com
    !o24no9190968qtl.0!postnews.google.com!glegroupsg2000goo.googlegroups.com!not-f
    or-mail
    Newsgroups: pl.comp.programming
    Date: Sun, 22 Sep 2019 03:11:04 -0700 (PDT)
    In-Reply-To: <e...@g...com>
    Complaints-To: g...@g...com
    Injection-Info: glegroupsg2000goo.googlegroups.com; posting-host=5.172.255.70;
    posting-account=Sb6m8goAAABbWsBL7gouk3bfLsuxwMgN
    NNTP-Posting-Host: 5.172.255.70
    References: <d...@g...com>
    <2...@g...com>
    <6...@g...com>
    <e...@g...com>
    User-Agent: G2/1.0
    MIME-Version: 1.0
    Message-ID: <c...@g...com>
    Subject: Re: Kiedy będzie milion rdzeni?
    From: fir <p...@g...com>
    Injection-Date: Sun, 22 Sep 2019 10:11:05 +0000
    Content-Type: text/plain; charset="UTF-8"
    Content-Transfer-Encoding: quoted-printable
    Xref: news-archive.icm.edu.pl pl.comp.programming:214083
    [ ukryj nagłówki ]

    W dniu czwartek, 19 września 2019 21:12:40 UTC+2 użytkownik fir napisał:
    > W dniu środa, 18 września 2019 15:46:02 UTC+2 użytkownik fir napisał:
    > > W dniu środa, 18 września 2019 15:29:03 UTC+2 użytkownik fir napisał:
    > > > zalezy co rozumiec za rdzen/sprzetowy watek
    > > >
    > > > w swiecie gpu mowia o ile wiem o tzw kanalach, jeden kanal przypada na jednego
    floata (przypadajacego niezaleznie do obrobki)
    > > >
    > > > o tyle powstaje koncepcja zbudowania czegios w rodzaju komputacyjnej macierzy
    > > > (powiedzmy 1024x1024 floato) zdolnej np do zaladowania megabajta floatow w
    jednym cyklu dodania do niej drugiego miliona floatow w drugim cyklu i zapisania tego
    spowrotem w trzecim czy piatym
    > > >
    > > > taka komputacyjna macierz wydaje mi sie dobrym pomyslem, pisalem juz o tym choc
    nie jestem epwien czy na tej grupie.. (np o tym jak to zintegrowac z c)
    > > >
    > > > sporo czesc kodow np rysowanie zbioru mandelbrota (ale i zapewne wiele innych )
    daloby sie puscic na tej tablicy prawie bez zmian z milionowym przyspieszeniem (o ile
    sprzet mialby milion kanalow)
    > > >
    > > > jakies inne przykladowe kody typu jakis kontrast czy usrednienie pikseli itd
    (mam na mysli takie kody w ktorych kanal "czyta" wartisci np z 8-miu przylagajacych
    kanalow) tez chyab dobrze by szly bo jako ze wszystko jesli liczone w jednym
    kroku/cyklu to nei trzeba sie chyba martwic konfliktami w dostepach do pamieci, nie
    trzeba nic synchronizowac (choc moze to zalezy od przypadku trzebby przesledzic jakie
    algorytmy/kody dobrze wykonuja sie na takiej solidnej tablicy
    > > >
    > > > (solina nazywam ja bo kazdy taki kanal nie ma niezlaleznego instruction
    pointer...alternatywna bylaby jakas inna tablica gdzie kazdy z milionow kanalow
    mialby swoje ip, ale bylby to jakis inny rodzaj tablicy)
    > > >
    > > > gdyby mi sie chcialo to bym sie pozastanawial jak rozne algorytmy wpisuja sie
    ten schemat, ale ostatnio cos slabo z motywacja - nad pewnymi drobnymi rzeczami mozna
    sie jednak zastanowic
    > > >
    > > > np smieszne wydalo mi sie zastanowienie jak dzialalby na tym jakis
    raytracer/kod z duzymi ifami, bo byloby to wyglada smieszne:
    > > >
    > > > zalozmy ze taki kod mialby postac w stylu
    > > >
    > > > if(a)
    > > > {
    > > > if(b)
    > > > {
    > > >
    > > > }
    > > > }
    > > >
    > > > if(c)
    > > > {
    > > >
    > > > }
    > > >
    > > > gdzie te ify sa 'duze'
    > > >
    > > > wyglada na to ze taka macierz komputacyjna musialaby wchodzic w kazdy (scislej
    prwie kazdy) if poniewaz jakas czesc watkow mialaby byc dla nich liczona, resztka
    kanalow by w tym czasie sobie robila nic, alebo nic uzytecznego
    > > > po wyjsciu z ifa inne watki by wchodzily w inny if a inne by lezaly odlogiem -
    > > > slowem taki kod zawsze by wlazl w prawie wszystkie ify i tak by wygladal
    pojedynczy przebieg (akurat w przypadku raytracerow gdy odbicia promieni sie liczy do
    kilku odbic w glab itd to by moglo nieco zwolnic ale i tak bylby spory zysk na
    prostocie)
    > > > *(choc w tych niektorych raytracerach nie tylko liczy sie zalamane odbicia ale
    jeszcze np przy odbiciu wprowadza sie cala nowa petle by zeskanowac swiatlo z
    otoczenia dla roznych katow, wtedy jeden taki kanal by byl zatrudniony dla liczenia
    calej petli i mamy klasyczne zmulando, wiec moze w tym wypadku dynamiczna tablica
    kanalow z osobnymi ip sprawdzalaby sie lepiej, ale ja i tak pozostaje chyab pewnym
    fanem tej solidnej prostej tablicy 'wykonawczej' (choc tej drugiej pewnie tez)
    > > >
    > > > nie wiem jednak czy chce mi sie to rozwazac bo jest to dla nie troche malo
    praktyczne (bardziej praktyczne to mogloby byc dla intela/amd/nvidia ;c)
    > >
    > > skladnie w c w ekstremalnym uproszczeniu
    > > w jaki mozna by to wyrazic to cos w stylu
    > >
    > > for(1000) {}
    > >
    > > for(1000,1000) {}
    > >
    > > gdzie zamiast for moze byc tez jakies inne slowo np moze 'map' o ile tu pasuje
    > > (ciezko mi ocenic czy apsuje) lub jakies inne, podaje for dla uproszczenia
    > >
    > > liczba w for podaje ile watkow ma to liczyc, a numer watku jest domyslnie
    zapodany w i, jesli podac dwie liczby to i,j a jesli 3 to i,j,k
    > >
    > >
    > > for(1024,1024)
    > > {
    > > tab[i+j*1024] = tab[(i+1)+j*1024];
    > > }
    > >
    > > //przesuwa tablice 1 MB pixeli w lewo na milionie kanalow na raz
    >
    >
    > mozna by sie zastanowic jak rozne algorytmy/kody by sie zachowywaly/jak by sie je
    pisalo w takim ujeciu na owa tablice komputacyjna/macierz obliczeniowa, ale nie wiem
    czy mi sie chce
    >
    > na przyklad kod rasteryzera (czyli wazna rzecz): w pierwszej fazie po prostu
    bierzesz trojkaty z tablicy trojkatow i mnozysz przez maciez modelu i macierz kamery,
    wyrzucasz te ktore sa poza polem widzenia - w wyniku dostajesz np tablice trojkatow
    2d+depth, to sie paralelizuje chyba idealnie
    >
    > dalszy proces jednak juz jest gorszy bo trzeba wypelniac framebufor i tu juz tak
    prosto nie jest, chopc ew mozna by nad tym sie zastanowic

    z poczatku mysllem ze na takiej matrycy mozna by puszczac kody ktore by robily to
    samo defakto ten sam zsynchronizowany kod w asmie z tym ze ew niektore by wylaczaly
    sie czasowo na niektroych branczach

    ale jak sie zastanowic to np kod rasteryzacji na ekranie (trojkatow '2d+depth' z
    tablicy) raczej by tak nie poszedl bo trojkaty maja rozne rozmiary wiec ich wenetrzne
    peteli krecilyby sie inaczej,
    wyglada na to wiec ze trzbaby to odzielnie przmyslec

    co prawda jest opcja puscic to inaczej np rasteryzacje takich trojkatow puscic tak
    ze kazdy kanal renderuje jeden piksel na
    ekranie i kazdy po prostu leci po tablicy trojkatow i zmienia kolor na ten ktory
    napotkal jest najblizej (takie cos by szlo chyba rowno)

    troche cizeko powiedziac jkby to bylo bo chyab jest to troche nowatorska a
    przynajmniej szeroko chyba niezbyt popularna koncepcja

Podziel się

Poleć ten post znajomemu poleć

Wydrukuj ten post drukuj


Następne wpisy z tego wątku

Najnowsze wątki z tej grupy


Najnowsze wątki

Szukaj w grupach

Eksperci egospodarka.pl

1 1 1

Wpisz nazwę miasta, dla którego chcesz znaleźć jednostkę ZUS.

Wzory dokumentów

Bezpłatne wzory dokumentów i formularzy.
Wyszukaj i pobierz za darmo: