Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.

Problem sa Windows 10 i 16+core-a.

[es] :: Matične ploče, procesori i memorije :: Problem sa Windows 10 i 16+core-a.

Strane: 1 2

[ Pregleda: 3920 | Odgovora: 30 ] > FB > Twit

Postavi temu Odgovori

Autor

Pretraga teme: Traži
Markiranje Štampanje RSS

Ivan Dimkovic

Administrator
Član broj: 13
Poruke: 16683
*.adsl-surfen.hetnet.nl.



+7169 Profil

icon Re: Problem sa Windows 10 i 16+core-a.04.01.2019. u 19:30 - pre 63 meseci
Btw, cisto za zainteresovane da opisem koliko je NUMA gadan problem: DigiCortex ima interni "work stealing" scheduler koji na svakom jezgru trci radnu nit i daje im posao.

Zanimljivo, za compute-bound problem (inicijalizacija neuralne mreze gde neuroni "rastu") je isplativo da niti smeju da "kradu" posao nitima sa drugih NUMA nodova. Ovo se desava ako neko jezgro dobije mnogo "nezgodnih" neurona koji se mnogo vise granaju sto scheduler ne zna unapred, posto je odnos racunanja i pristupa memoriji povoljan, kradja posla drugom jezgru nije skupa i pozitivno utice na performanse zato sto ce se iskoristiti sva jezgra maksimalno.

U ovom slucaju je OK da radna nit na NUMA nodu X "ukrade" task od niti na NUMA nodu Y.

Ali kada se predje na simulaciju, koja je cisto ogranicena memorijskim bandwidth-om je stetno da nit krade posao nitima na stranim NUMA nodovima. Na Intel platformama kradjom dolazi do saturacije QPI/UPI linkova i performanse se gube zato sto sistem gubi vreme sa ogromnim bus traffic-om. U ovom slucaju je bolje da nit ode da spava i ceka kraj koraka nego da pokusava da krade posao nitima sa drugih NUMA nodova. Igrao sam se i sa threshold-ovanjem tipa koliko jedna nit treba da bude "iza" u poslu da postane isplativo krasti joj posao sa drugog NUMA noda, odgovor: skoro nikad.

Ovo vazi za vecinu sistema (nisam probao na 32-core TR-u!)... osim za par oddball Haswell EX 4S sistema gde, mislim, da prijavljena NUMA topologija ne odgovara pravom stanju stvari pa work-stealing zapravo smanjuje pad performansi.

Nisam nikad probao 2990WX, ali pretpostavljam da bi 2990WX bio bas takav oddball sistem - ako neko ima 2990WX bio bih zahvalan za volontiranje :-)

Ljudima koji rade HPC/serverske aplikacije ovo nije nista novo. Sta je bolje zavisi od konkretnog problema. Silne disertacije su napisane na ovu temu.

Ali AMD je celu problematiku sada uveo na desktop polje sa TR procesorima.

Ako neko ocekuje da OS scheduler to magicno resi... hahaha :)

Windows ocigledno ima TR-specific bag. Ali ni Windows ni Linux ne mogu biti pametniji od samih aplikacija.
DigiCortex (ex. SpikeFun) - Cortical Neural Network Simulator:
http://www.digicortex.net/node/1 Videos: http://www.digicortex.net/node/17 Gallery: http://www.digicortex.net/node/25
PowerMonkey - Redyce CPU Power Waste and gain performance! - https://github.com/psyq321/PowerMonkey
 
Odgovor na temu

Branimir Maksimovic

Član broj: 64947
Poruke: 5534
109.72.51.23



+1064 Profil

icon Re: Problem sa Windows 10 i 16+core-a.05.01.2019. u 17:56 - pre 63 meseci
Ove godine na Ryzenu sa 64 kora ;)
Mozda uzmes dual soket pa stavis 128 kora ;)
Tesko ce neko da kupi sada 2990WX, kosta 2k evra i TDP mu je 250W. Racunaj da to vuce minimum 400W na stoclk taktu (znaci minimalni takt) samo procesor ka d se upogoni ;)

 
Odgovor na temu

Ivan Dimkovic

Administrator
Član broj: 13
Poruke: 16683
*.speed.planet.nl.



+7169 Profil

icon Re: Problem sa Windows 10 i 16+core-a.05.01.2019. u 18:27 - pre 63 meseci
64 jezgra je za sada izvesno ove godine samo na serverskom trzistu (EPYC). Slazem se da ce 2S Rome masina sa 128 jezgara biti ubica.

Videcemo sta ce AMD uraditi na HEDT polju i da li ce zadrzati TR4 socket kompatibilnost (u kom slucaju cemo verovatno i dalje imati "krnjava" jezgra bez svog DRAM kontrolera u konfiguracijama sa 4 cipleta) ili ce novi Threadripper dobiti novi socket.

Rome EPYC ce biti socket kompatibilan sa trenutnom EPYC platformom (Naples), cak ce i sledeca generacija (Milan) isto zadrzati isti socket.

DigiCortex (ex. SpikeFun) - Cortical Neural Network Simulator:
http://www.digicortex.net/node/1 Videos: http://www.digicortex.net/node/17 Gallery: http://www.digicortex.net/node/25
PowerMonkey - Redyce CPU Power Waste and gain performance! - https://github.com/psyq321/PowerMonkey
 
Odgovor na temu

Ivan Dimkovic

Administrator
Član broj: 13
Poruke: 16683
*.adsl-surfen.hetnet.nl.



+7169 Profil

icon Re: Problem sa Windows 10 i 16+core-a.05.01.2019. u 22:58 - pre 63 meseci
Haha jao nesto sad razmisljam oko celog oddball NUMA dizajna 2990WX-a...

Znaci moja aplikacija sama kreira thread-ove za svaki CPU i alocira memoriju za svaki NUMA nod. Radna pretpostavka (Windows, posto nema potreban API) je da svaki NUMA nod ima jednaku kolicinu memorije, tako da se ceo problem podeli na N jednakih delova (gde je N - broj NUMA nodova).

Haha, znaci na Windows-u, ja lepo kazem VirtualAllocExNuma(bla bla) i lepo mislim da sam dobio memoriju u svom NUMA nodu.

Ali taj nod nema memorije :) Hahahahaha - sta ce da se desi? Pa dobicu memoriju, ali iz nekog N-tog NUMA noda, necu dobiti ni info u kom nodu sada sedi ta memorija. Windows API je takav, broj NUMA noda je samo "hint" alokatoru memorije koji ce koristiti i druge NUMA nodove ako ne moze da ispuni zahtev.

I tako, mojih 16 thread-ova (2 x 8) sirocica bez svoje memorije rade i misle da obradjuju lokalnu memoriju, a memorija razbacana negde u 3 lepe :)

Na Linuxu bih bar znao da je procesor bogalj i koja jezgra nemaju memoriju, pa bih mozda i nesto korisno mogao da uradim sa tom informacijom.
DigiCortex (ex. SpikeFun) - Cortical Neural Network Simulator:
http://www.digicortex.net/node/1 Videos: http://www.digicortex.net/node/17 Gallery: http://www.digicortex.net/node/25
PowerMonkey - Redyce CPU Power Waste and gain performance! - https://github.com/psyq321/PowerMonkey
 
Odgovor na temu

Branimir Maksimovic

Član broj: 64947
Poruke: 5534
109.72.51.23



+1064 Profil

icon Re: Problem sa Windows 10 i 16+core-a.06.01.2019. u 00:16 - pre 63 meseci
Znas kako ako pola procesora nema direktan pristup memoriji ne mozes tu puno. Jedino da rasporedis threadove koji rade sa malim slojem podataka tamo, ako je to uopste moguce.
 
Odgovor na temu

Ivan Dimkovic

Administrator
Član broj: 13
Poruke: 16683
*.adsl-surfen.hetnet.nl.



+7169 Profil

icon Re: Problem sa Windows 10 i 16+core-a.06.01.2019. u 09:26 - pre 63 meseci
Btw, moja greska, Windows API nudi funkciju koja daje informaciju koliko koji NUMA nod ima memorije: GetNumaAvailableMemoryNode(Ex)()

Jedino je jako tesko bilo naci ovaj API googlanjem iz nekog razloga.

Pretpostavljam da bi na 2990WX-u dobio informaciju da neki nodovi nemaju memoriju i procesorima iz tih nodova bi mogao da alociras manje posla. Problem je, naravno, sto kolicina posla koju ces im dati zavisi od koriscenja memorije i varira od problema do problema, mozda i unutar problema ako memorijske potrebe nisu konstantne u vremenu.

Moras uzeti u obzir da pristup stranoj memoriji, takodje, oduzima bandwidth i jezigrima na tom stranom nodu + zagusujes bus sa memorijskim saobracajem koji mozda delis i za PCIe, itd.

Cela stvar je fakat zivota u serverskom svetu, gde je obicno najlakse resenje iscepati server na VM-ove gde svaki dobija svoj nod, ako vec imas skalabilnu arhitekturu koja moze da trci na cloudu/clusteru, i ne moras uopste da mislis o NUMA optimizacijama.

Ali na desktop/WS-u obicno zelis da trcis neku kljucnu aplikaciju. U tom slucaju nema druge nego da app. vendor zasuce rukave i optimizuje app za ovakve procesore.
DigiCortex (ex. SpikeFun) - Cortical Neural Network Simulator:
http://www.digicortex.net/node/1 Videos: http://www.digicortex.net/node/17 Gallery: http://www.digicortex.net/node/25
PowerMonkey - Redyce CPU Power Waste and gain performance! - https://github.com/psyq321/PowerMonkey
 
Odgovor na temu

nkrgovic
Nikola Krgović
Beograd

Član broj: 3534
Poruke: 2807

ICQ: 49345867
Sajt: https://www.twinstarsyste..


+655 Profil

icon Re: Problem sa Windows 10 i 16+core-a.06.01.2019. u 13:38 - pre 63 meseci
Da, ali kao sto rekosmo u rugom thread-u, koliko onih koji imaju novca da kupe takve aplikacije, hoce da ih vozi na non-ECC masini? :)

Po meni, tezak edge case. Ne racunajuci one sto bi da imaju "najbolji na testovima", samo zbog toga, cenim da ThreadRipper i nema neko trziste. Intel je, na zalost, bolji izbor.
Please do not feed the Trolls!

Blasphemy? How can I blaspheme? I'm a god!'
 
Odgovor na temu

bojan_bozovic

Član broj: 29028
Poruke: 3292
87.116.183.*

Sajt: angelstudio.org


+392 Profil

icon Re: Problem sa Windows 10 i 16+core-a.07.01.2019. u 07:36 - pre 63 meseci
Intel i9-9900K je svakako najbolji izbor, bolji od Ryzena 7 2700X a i Ryzena TR za obicnog desktop korisnika, no ovde je bezobrazno skup. U USA je ispod 500 USD a ovde je cena osamdesetak hiljada!
 
Odgovor na temu

Ivan Dimkovic

Administrator
Član broj: 13
Poruke: 16683
*.adsl-surfen.hetnet.nl.



+7169 Profil

icon Re: Problem sa Windows 10 i 16+core-a.07.01.2019. u 10:20 - pre 63 meseci
Citat:
nkrgovic:
Da, ali kao sto rekosmo u rugom thread-u, koliko onih koji imaju novca da kupe takve aplikacije, hoce da ih vozi na non-ECC masini? :)

Po meni, tezak edge case. Ne racunajuci one sto bi da imaju "najbolji na testovima", samo zbog toga, cenim da ThreadRipper i nema neko trziste. Intel je, na zalost, bolji izbor.


Slazem se, ECC je prilicno neophodna stvar za bilo sta sto trci neko duze vreme na ovim masinama (renderi, simulacije).

AMD ima mnogo manje resursa nego Intel ili NVIDIA tako da su verovatno morali da prioritizuju EPYC i consumer Ryzen (ne TR) u ovoj iteraciji. Mozda ce im dodatna kinta omoguciti da R&D-uju nesto sto je ozbiljnije od trenutnog TR-a za WS upotrebu.

Meni trenutni TR deluje kao neki hobi projekat AMD tima - "hej, sta mozemo da uradimo sa EPYC procesorom sto pre i sa sto manje troskova za MB vendore". Sto je sasvim OK za HEDT (gaming) ali za WS je sasvim druga prica.

Za WS upotrebu bi AMD zapravo trebao da se fokusira na EPYC i ponudi SKU-ove koji rade na visljim frekvencijama, ali to ce verovatno zahtevati 7nm i nekakvu segmentaciju kako bi i dalje mogli da traze nekoliko hiljada $ za serverske/enterprise kupce (EPYC 601) a da ponude nesto jeftinije WS korisnicima.
DigiCortex (ex. SpikeFun) - Cortical Neural Network Simulator:
http://www.digicortex.net/node/1 Videos: http://www.digicortex.net/node/17 Gallery: http://www.digicortex.net/node/25
PowerMonkey - Redyce CPU Power Waste and gain performance! - https://github.com/psyq321/PowerMonkey
 
Odgovor na temu

Branimir Maksimovic

Član broj: 64947
Poruke: 5534
109.72.51.23



+1064 Profil

icon Re: Problem sa Windows 10 i 16+core-a.07.01.2019. u 12:31 - pre 63 meseci
Citat:
bojan_bozovic:
Intel i9-9900K je svakako najbolji izbor, bolji od Ryzena 7 2700X a i Ryzena TR za obicnog desktop korisnika, no ovde je bezobrazno skup. U USA je ispod 500 USD a ovde je cena osamdesetak hiljada!


Gde si video da je ispod 500$? Koliko vidim na amazonu ~530$ + jedno ~160$ za carinu i shipping. sto ce reci jedno ~700$. Agde je onda garancija?

edit: Inace na KP je jos skuplji nego u radnjama ;p
Uporedi to sa duplo jeftinijim 2700X i stavi na papir kolko moze 9900k da bude brzi od njega...
A od 9700K je brzi posto dobijas jedno 30% na SMT... kod AMD-a


[Ovu poruku je menjao Branimir Maksimovic dana 07.01.2019. u 14:04 GMT+1]
 
Odgovor na temu

bojan_bozovic

Član broj: 29028
Poruke: 3292
87.116.183.*

Sajt: angelstudio.org


+392 Profil

icon Re: Problem sa Windows 10 i 16+core-a.07.01.2019. u 13:04 - pre 63 meseci
Tacno izvinjavam se na dezinformaciji.
 
Odgovor na temu

[es] :: Matične ploče, procesori i memorije :: Problem sa Windows 10 i 16+core-a.

Strane: 1 2

[ Pregleda: 3920 | Odgovora: 30 ] > FB > Twit

Postavi temu Odgovori

Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.