Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.

Problem sa Windows 10 i 16+core-a.

[es] :: Matične ploče, procesori i memorije :: Problem sa Windows 10 i 16+core-a.

Strane: 1 2

[ Pregleda: 3917 | Odgovora: 30 ] > FB > Twit

Postavi temu Odgovori

Autor

Pretraga teme: Traži
Markiranje Štampanje RSS

Branimir Maksimovic

Član broj: 64947
Poruke: 5534
109.72.51.23



+1064 Profil

icon Problem sa Windows 10 i 16+core-a.03.01.2019. u 03:00 - pre 63 meseci
Interesantan video.
 
Odgovor na temu

Ivan Dimkovic

Administrator
Član broj: 13
Poruke: 16683
*.adsl-surfen.hetnet.nl.



+7169 Profil

icon Re: Problem sa Windows 10 i 16+core-a.03.01.2019. u 11:00 - pre 63 meseci
Situacija da imas vise NUMA nodova unutar jednog procesorskog paketa (socket-a) je relativno nova situacija na konzumerskim platformamama tj. AMD Threadripper je prvi CPU sa takvom arhitekturom namenjen kucnim korisnicima.

Ocigledno Windows kernel tim i AMD nisu radili dovoljno dugo na peglanju problema. Na dual-socket+ serverskim platformama je ovo matora problematika i u BIOS-ima cak imas gomilu preseta za odredjene aplikacije koji konfigurisu sistem kao NUMA ili UMA, Cluster on Die (Intel) i sl. zato sto nema "one size fits all" resenja. Siguran sam da su Intel i Microsoft radili godinama na tweak-ovanju schedulera u kernelu takodje, ne znam da li je AMD imao takav pristup i resurse, verovatno ne.

Na zalost, ne postoji magicni fix za sve aplikacije - u ovom konkretnom slucaju verovatno postoji bug u Windows kernelu vezan za AMD procesore, ali cak i kad se to resi, pitanje koji je idealan procesor za neki thread na NUMA sistemu je daleko od trivijalnog i u mnogim situacijama OS tu nece umeti sam da se snadje, vec ce sama aplikacija morati da se konfigurise kako treba uzimajuci u obzir topologiju sistema.

Interesantno, bez Hyper-V-a (koji ima performance counter-e koji ti daju hint), Windows recimo nema javni API koji bi prijavio koliko tacno fizicke memorije ima svaki NUMA nod kako bi aplikacija znala kako da balansira workload u slucaju da NUMA nodovi nemaju jednaku kolicinu memorije. Ako si memory-bound, radis neko streaming procesiranje podataka i CPU-ovi nisu "jednaki" (tj. neki imaju manje fizicke memorije ili je nemaju uopste) a ti to ne znas, imas problem, veliki problem zato sto neces moci da raspodelis posao "ravnopravno" zato sto ce neki CPU-ovi pre ili kasnije morati da pristupaju "stranoj" RAM memoriji koja se nalazi na drugom NUMA nodu.

Linux je tu bolji, libnuma daje vise podataka i prakticno ako je developer aplikacije spreman za optimizacije moze je 100% optimizovati da radi optimalno, pod uslovom da je OS svestan hardvera :-) U slucaju bare-metal masina sa korektno podesenim firmware-om to obicno jeste slucaj, ali u slucaju virtualizacije to nije nuzno tacno zato sto hipervizor moze biti konfigurisan da sakrije pravu sistemsku topologiju.

Sve u svemu, mislim da je mix NUMA-e i konzumerskih aplikacija losa stvar za korisnike zato sto donosi probleme koji se na serverskim platformama resavaju rucnom optimizacijom sistema i aplikacija, sto skoro niko od consumera nece biti spreman da radi.

Verovatno cemo imati razne "patcheve" i tool-ove za specificne procesore/aplikacije ali sve je to jedno veliki s*anje IMHO.

Ako hoces 16/32+ jezgara u kuci... dobrodosao u NUMA hell :-)
DigiCortex (ex. SpikeFun) - Cortical Neural Network Simulator:
http://www.digicortex.net/node/1 Videos: http://www.digicortex.net/node/17 Gallery: http://www.digicortex.net/node/25
PowerMonkey - Redyce CPU Power Waste and gain performance! - https://github.com/psyq321/PowerMonkey
 
Odgovor na temu

Branimir Maksimovic

Član broj: 64947
Poruke: 5534
109.72.51.23



+1064 Profil

icon Re: Problem sa Windows 10 i 16+core-a.03.01.2019. u 11:13 - pre 63 meseci
"AMD Threadripper je prvi CPU sa takvom arhitekturom namenjen kucnim korisnicima."

E sad, da li to znaci i da sa Intelom ima problema?
 
Odgovor na temu

Ivan Dimkovic

Administrator
Član broj: 13
Poruke: 16683
*.speed.planet.nl.



+7169 Profil

icon Re: Problem sa Windows 10 i 16+core-a.03.01.2019. u 11:24 - pre 63 meseci
Intel NUMA sistemi su obicno dual/quad/octal socket serverski procesori, ne secam se da je neko prijavljivao regresije u performansama ali, kao sto rekoh, na tim sistemima ima gomila firmware tweak-ova za specificne aplikacije.

Primetio sam interesantan problem sa Windows-om i 4S Haswell E7 Xeon-ima (128 thread-ova) sa mojim aplikacijama - iz nekog razloga procesori iz NUMA noda 0 i 3 ne mogu da izprocesiraju vise od ~50% podataka ako su thread-ovi naterani da procesiraju samo lokalne podatke unutar svog NUMA noda. Ako dozvolis thread-ovima da pristupaju i stranoj NUMA memoriji, onda sve procesore mozes drzati 100% zauzetim ali ni tada to nisu optimalne performanse posto tada procesori sigurno provode deo vremena procesirajuci "daleku" memoriju.

Dalje kopanje sa Linux-om pokazuje da na Linux-u sistem kompletno drugacije prijavljuje NUMA topologiju sto sugerise da mozda postoji neki bug ili u Windows-u ili u hipervizoru koji, mozda, pogresne procesore asocira sa NUMA nodovima pa niti 0-32 i 96-128 zapravo sve vreme pristupaju "dalekoj" memoriji. Tu sam i otkrio Windows problem da nemas API koji bi ti rekao koliko koji NUMA nod ima zaista fizicke memorije posto mi je prva pomisao bila da, mozda, procesori nemaju jednaku kolicinu fizicke memorije koja dolazi do njih.

Nisam imao ni vremena a ni neke motivacije dalje da kopam, 4S sistemi su retkost i cela stvar je cist hobi.

Ali ako sva ta kompleksnost stigne na kucne masine, to ce biti show.

Pazi, sam OS moze samo da nagadja sta tvoja aplikacija pokusava da radi i mislim da nije pametno resenje da se OS previse mesa u high-perf aplikacije. Ok je da OS scheduler rasporedjuje desktop aplikacije i tranzijentne procese kako vec misli da treba, ali nesto sto planira da 100% zakuca procesore... moze vrlo lako doci do konflikta izmedju OS-a i aplikacije ako sama aplikacija isto pokusava nesto da uradi po pitanju performansi.
DigiCortex (ex. SpikeFun) - Cortical Neural Network Simulator:
http://www.digicortex.net/node/1 Videos: http://www.digicortex.net/node/17 Gallery: http://www.digicortex.net/node/25
PowerMonkey - Redyce CPU Power Waste and gain performance! - https://github.com/psyq321/PowerMonkey
 
Odgovor na temu

Branimir Maksimovic

Član broj: 64947
Poruke: 5534
109.72.51.23



+1064 Profil

icon Re: Problem sa Windows 10 i 16+core-a.03.01.2019. u 11:56 - pre 63 meseci
Sve u svemu bice interesantna 2019 ;)
 
Odgovor na temu

nkrgovic
Nikola Krgović
Beograd

Član broj: 3534
Poruke: 2807

ICQ: 49345867
Sajt: https://www.twinstarsyste..


+655 Profil

icon Re: Problem sa Windows 10 i 16+core-a.03.01.2019. u 12:18 - pre 63 meseci
Cisto da dodam: Linux kernel ima Numa affinity podesen tako da izbegava pristup "dalekoj" memoriji, do tog nivoa da ce pre otici u swap nego traziti memoriju sa drugog procesora. Ovo zvuci kao redak slucaj, ali nije: Ja sam naleteo sa MySQL-om, ali svaki multi-threaded single-process kod koji proba da alocira vise memorije nego sto ima na jednom procesoru ce imati problem. Ja sam, kazem, probao da u masini sa 128GB RAM-a dam MySQL-u za InnoDB Buffer Pool nekih 96GB - i otisao u swap.

Postoje cak i userland fixes, pokrene se numactl kao wrapper, koji onda pokrece konkretan proces i kaze mu kako da hendluje memoriju. Bez toga, ova moja situacija gore, ako se podesi swappiness na 0 (nije dobro u praksi, ali odlicno za test), moze da se zavrsi tako sto na masini sa 128GB RAM-a jedini proces koji se pokrene, i zatrazi npr. 72GB RAM-a, ako je arhitektura 2xNUMA s 2x64GB, dobije Out of Memory!

Sve u svemu, na Linux-u je problem resiv, ali ako program nije explicitno pisan da to podrzi, onda ce biti problema. Ako u igru uleti virtuelizacija, iskreno, preporuka za KVM, bar iz nekog iskustva, je da se VM-ovi ogranice na jedan NUMA node. Preko toga, moze da se mapira drugacije, ali je veliko pitanje koliko se isplati virtuelizacija - to su oni problemi gde je bare metal jos uvek validan izbor.
Please do not feed the Trolls!

Blasphemy? How can I blaspheme? I'm a god!'
 
Odgovor na temu

Ivan Dimkovic

Administrator
Član broj: 13
Poruke: 16683
*.adsl-surfen.hetnet.nl.



+7169 Profil

icon Re: Problem sa Windows 10 i 16+core-a.03.01.2019. u 12:28 - pre 63 meseci
Windows ce isto izbegavati daleke NUMA pristupe po defaultu (ali, ako ne moze da izservisira zahtev za lokalnom memorijom, nece ici u swap vec ce deo memorije doci sa stranog NUMA noda), mozda u tome i lezi problem ovde zato sto, koliko razumem, u Threadripper situaciji postoje CPU-ovi koji uopste nemaju "svoju" memoriju vec moraju da pristupaju memoriji preko fabric-a. Moguce je da Windows scheduler stalno pokusava da premesti nit na drugi CPU zbog pristupa memoriji sto ocigledno nije najpametnije resenje ovde.

Slazem se za Nikolom, ako sam program nije napisan da bude NUMA svestan, problema ce vrlo verovatno biti kako god i za virtuelizaciju je najpametnije sisteme "izolovati" tako da svaki bude unutar svog NUMA noda.

Na zalost, koliko razumem, neki AMD-ovi procesori imaju jezgra koja nemaju svoj memorijski kontroler.
DigiCortex (ex. SpikeFun) - Cortical Neural Network Simulator:
http://www.digicortex.net/node/1 Videos: http://www.digicortex.net/node/17 Gallery: http://www.digicortex.net/node/25
PowerMonkey - Redyce CPU Power Waste and gain performance! - https://github.com/psyq321/PowerMonkey
 
Odgovor na temu

Branimir Maksimovic

Član broj: 64947
Poruke: 5534
109.72.51.23



+1064 Profil

icon Re: Problem sa Windows 10 i 16+core-a.03.01.2019. u 12:36 - pre 63 meseci
Ako nemaju memorijski kontroler onda to treba da bude transparentno i da se ne oseti po performansama, po meni. Svako bi tako razmisljao, zato sto bi onda problem bio i na Linux-u. Nego to sa swapom ce svakako da udari na Linux od 2020 kad DDR5 udje
u igru ;)
(pretpostavljam da ce tad 32GB biti ko sad 8 ;)
 
Odgovor na temu

Ivan Dimkovic

Administrator
Član broj: 13
Poruke: 16683
*.speed.planet.nl.



+7169 Profil

icon Re: Problem sa Windows 10 i 16+core-a.03.01.2019. u 12:47 - pre 63 meseci
Pretpostavljam da je na Linuxu neko implementirao fix koji "sirota" jezgra u TR procesorima ne tretira tako da stalno pokusava da im ukrade posao a da ocigledno Windows kernel ne resava ovu situaciju zadovoljavajuce - mozda AMD tim nije imao dovoljno resursa u MSFT-u posvecenih ovoj problematici. Ne znam kako uopste ide ta saradnja izmedju CPU vendora i Microsofta, pretpostavljam da dovoljno bitne arhitekture imaju neke timove koji rade na optimizaciji.

Na Linuxu je ocigledno to lakse posto je kod otvoren.

Ali ovo je samo jedan od mnogih mogucih problema sa ovakvim asimetricnim topologijama. Ovde je ocigledno slucaj OS-a koji pokusava da "optimizuje" stvari na los nacin ali i kad se to fixuje ostaje problem da u slucaju AMD TR-a sva jezgra nisu jednaka u smislu memorijskih performansi.
DigiCortex (ex. SpikeFun) - Cortical Neural Network Simulator:
http://www.digicortex.net/node/1 Videos: http://www.digicortex.net/node/17 Gallery: http://www.digicortex.net/node/25
PowerMonkey - Redyce CPU Power Waste and gain performance! - https://github.com/psyq321/PowerMonkey
 
Odgovor na temu

Branimir Maksimovic

Član broj: 64947
Poruke: 5534
109.72.51.23



+1064 Profil

icon Re: Problem sa Windows 10 i 16+core-a.03.01.2019. u 12:51 - pre 63 meseci
Citat:

Ne znam kako uopste ide ta saradnja izmedju CPU vendora i Microsofta, pretpostavljam da dovoljno bitne arhitekture imaju neke timove koji rade na optimizaciji.

Da, to je veliko pitanje. Pretpostavljam da su ili iz AMD-a ili iz M$-a jednostavno napravili propust iz ovog ili onog razloga. Sto je najveci fazon niko to ne bi ni primetio
da TR nema toliko bolje performanse na Linux-u ;)
 
Odgovor na temu

Ivan Dimkovic

Administrator
Član broj: 13
Poruke: 16683
*.speed.planet.nl.



+7169 Profil

icon Re: Problem sa Windows 10 i 16+core-a.03.01.2019. u 14:05 - pre 63 meseci
Mislim da ce to biti brzo reseno sada kada je AMD ponovo postao jak igrac, sumnjam da ce ih MS ignorisati sa resursima :)

Ali, kao sto rekoh, kada je NUMA u pitanju OS moze da bude pametan do neke mere, ali bez specificnih softverskih optimizacija nista od maksimalnih performansi osim ako ne iscepkas sistem na VM-ove gde je svaki VM izolovan u svom NUMA ostrvu (sto je nemoguce sa trenutnim TR-om). Mada i tada imas bar mali VM penal, ali sta je tu je.

Intel ima "CoD" (Cluster on Die) mod na serverskim procesorima, gde se jedan socket deli na vise NUMA nodova tako da svaki NUMA nod ima svoj memorijski kontroler i u njemu su jezgra koja imaju direktan pristup istom. Ovo je relevantno za HCC/XCC jezgra gde postoji vise memorijskih kontrolera. Ako se trce izuzetno optimizovane aplikacije ili se sistem cepka na VM-ove velicine NUMA noda, onda je ovo resenje dobro zato sto se izbegava cross-node saobracaj.

Inace, Windows zahteva koriscenje tzv. "procesorskih grupa" ako sistem ima vise od 64 jezgra - to znaci da ce za sisteme sa vise od 64 jezgra biti neophodna aplikativna podrska ako aplikacije hoce da iskoriste 100% potencijal procesora. Ako aplikacija koristi stare Win32 API-je (pre Win7 / Srv2008 R2), trci u jednoj procesorskoj grupi sto znaci max. 64 jezgra za 64-bitne aplikacije. Pretpostavljam da za high-level jezike to resava sistemski runtime, ali za "native" developere koji koriste direktno Windows API ce ovo takodje biti bitna stvar koja je do sada kacila samo proizvodjace serverskih / WS aplikacija.

DigiCortex (ex. SpikeFun) - Cortical Neural Network Simulator:
http://www.digicortex.net/node/1 Videos: http://www.digicortex.net/node/17 Gallery: http://www.digicortex.net/node/25
PowerMonkey - Redyce CPU Power Waste and gain performance! - https://github.com/psyq321/PowerMonkey
 
Odgovor na temu

nkrgovic
Nikola Krgović
Beograd

Član broj: 3534
Poruke: 2807

ICQ: 49345867
Sajt: https://www.twinstarsyste..


+655 Profil

icon Re: Problem sa Windows 10 i 16+core-a.03.01.2019. u 17:25 - pre 63 meseci
Citat:
Ivan Dimkovic:
mozda u tome i lezi problem ovde zato sto, koliko razumem, u Threadripper situaciji postoje CPU-ovi koji uopste nemaju "svoju" memoriju vec moraju da pristupaju memoriji preko fabric-a.

Na zalost, koliko razumem, neki AMD-ovi procesori imaju jezgra koja nemaju svoj memorijski kontroler.

Iseckao sam quote, jer .... ovo BOLI.

Ne boli kao takvo, sve je to OK, to je ajde neka arhitektura, ali ovo boli kad se prave VM-ovi, ovo boli kad se koristi standardni Linux kernel. Ne sumnjam ja da je AMD napravo odgovarajuce patch-eve i da su oni usli u kernel, ali ja sam kapirao da AMD radi tako sto ima 4 numa "ostrva" sa fabricom izmedju njih, gde svako ima 2 memorijska kanala i svoj memorijski kontroler, koji pricaju kroz fabric na chip-u. Ako postoje jezgra koja nemaju pristup memorijskom kontroleru unutar ostrva, vec moraju da idu kroz druga jezgra, onda je to, po meni, prilicno lose... Intel nema taj problem na jednom chip-u koji ima 28 core-ova, najveci AMD blok ima 8 core-ova, ocekivao bi da svih osam mogu da gadjaju svoj memorijski kontroler ravnopravno, ne da su oni unutar tog numa ostrva nekako uvezani u dodatni fabric, a da je memorijski kontroler vezan samo za neke od njih...



Please do not feed the Trolls!

Blasphemy? How can I blaspheme? I'm a god!'
 
Odgovor na temu

Ivan Dimkovic

Administrator
Član broj: 13
Poruke: 16683
*.adsl-surfen.hetnet.nl.



+7169 Profil

icon Re: Problem sa Windows 10 i 16+core-a.03.01.2019. u 17:52 - pre 63 meseci
Evo slike:

https://images.anandtech.com/d...4/2990WX%20vs%202950X%20v2.jpg

U slucaju 2990WX, jezgra u modulu 1 i 3 nemaju svoje memorijske kontrolere vec idu preko fabric-a.

Pretpostavljam da ce AMD izbeci ovakvu konfiguraciju u sledecoj iteraciji posto je cela stvar prilicno nezgodna za softver.

AnandTech:

Citat:

The reason that these extra cores do not have direct access is down to the platform: the TR4 platform for the Threadripper processors is set at quad-channel memory and 60 PCIe lanes. If the other two dies had their memory and PCIe enabled, it would require new motherboards and memory arrangements.


EPYC nema ovaj problem (svaki modul ima svoje memorijske kontrolere) - mislim da je problem specifican samo za TR procesore sa 4 MCM modula.

Citat:

Going back to Threadripper 2, it is important to understand how the chip is going to be loaded. We confirmed this with AMD, but for the most part the scheduler will load up the cores that are directly attached to memory first, before using the other cores. What happens is that each core has a priority weighting, based on performance, thermals, and power – the ones closest to memory get a higher priority, however as those fill up, the cores nearby get demoted due to thermal inefficiencies. This means that while the CPU will likely fill up the cores close to memory first, it will not be a simple case of filling up all of those cores first – the system may get to 12-14 cores loaded before going out to the two new bits of silicon.


Zvuci kao horor.
DigiCortex (ex. SpikeFun) - Cortical Neural Network Simulator:
http://www.digicortex.net/node/1 Videos: http://www.digicortex.net/node/17 Gallery: http://www.digicortex.net/node/25
PowerMonkey - Redyce CPU Power Waste and gain performance! - https://github.com/psyq321/PowerMonkey
 
Odgovor na temu

nkrgovic
Nikola Krgović
Beograd

Član broj: 3534
Poruke: 2807

ICQ: 49345867
Sajt: https://www.twinstarsyste..


+655 Profil

icon Re: Problem sa Windows 10 i 16+core-a.04.01.2019. u 08:33 - pre 63 meseci
Die 1 i 3 nema ni PCIe kontrolere, koliko vidim, toliko od primena za neki NVMe storage....

OK, bar Epyc radi kako valja. Za desktop, sta ga znam....
Please do not feed the Trolls!

Blasphemy? How can I blaspheme? I'm a god!'
 
Odgovor na temu

Branimir Maksimovic

Član broj: 64947
Poruke: 5534
109.72.51.23



+1064 Profil

icon Re: Problem sa Windows 10 i 16+core-a.04.01.2019. u 10:21 - pre 63 meseci
Cek zar onda 2 i 4 nisu dovoljni, sto se tice NVMe?
 
Odgovor na temu

Ivan Dimkovic

Administrator
Član broj: 13
Poruke: 16683
*.speed.planet.nl.



+7169 Profil

icon Re: Problem sa Windows 10 i 16+core-a.04.01.2019. u 10:32 - pre 63 meseci
Problem te kaci samo ako hoces HEDT platformu (Threadripper) koja ima 4 MCM modula.

IMHO, AMD je verovatno procenio da je taj segment trzista mali, vise sluzi kao neki "halo" marketing i da je TR4 socket/MB kompatibilnost sa "sirotim" jezgrima bolji kompromis od prelaska na novi socket.

Mislim da je taj dizajn nakaradan i da treba da umre, verovatno ce i da umre kada AMD bude lansirao novu HEDT platformu.

Ali ko zna, mozda ce asimetricni dizajn ostati... na suprotnoj strani trzista se vec debelo prica o kombinaciji jakih i slabih jezgara kao na ARM platformi, mozda cela stvar ode i u visoki segment trzista. Izazov za kernel developere svakako i jos jedna za*bancija za ljude koji moraju da odrzavaju takve sisteme svakako.

Citat:
Branimir Maksimovic
Cek zar onda 2 i 4 nisu dovoljni, sto se tice NVMe?


"Dovoljni" jesu da platforma radi, ocigledno, ali ako se prica o maksimalnim performansama onda stvari nisu optimalne za jezgra u modulima koja nemaju svoje PCIe kontrolere posto ta jezgra prakticno moraju da delegiraju sve na druge module (memorijski i PCIe saobracaj).

Infinity Fabric link izmedju MCM modula ima bandwidth od 42.6 do 102.2 GB/s po AMD-ovim marketinskim specifikacijama - i tu moras da upakujes i pristup memoriji i PCIe transakcije. Modul ima 8 jezgara, sto znaci da u nekim situacijama sa visokim load-om ocigledno jezgra moraju ostati "gladna".
DigiCortex (ex. SpikeFun) - Cortical Neural Network Simulator:
http://www.digicortex.net/node/1 Videos: http://www.digicortex.net/node/17 Gallery: http://www.digicortex.net/node/25
PowerMonkey - Redyce CPU Power Waste and gain performance! - https://github.com/psyq321/PowerMonkey
 
Odgovor na temu

Branimir Maksimovic

Član broj: 64947
Poruke: 5534
109.72.51.23



+1064 Profil

icon Re: Problem sa Windows 10 i 16+core-a.04.01.2019. u 11:35 - pre 63 meseci
Heh, AMD se potrudio da zarad ne moranja menjanja maticne ploce za TR, obezbedi mozgalicu za MS ;)
Mozda ce to biti razlog da likovi koji su kupili tu zver konacno predju na Linux ;)
Ali ne mogu da zamislim koliko to struje moze da vuce kad ovo moje sa 8 kora vuce 200W na stock kloku ;)
 
Odgovor na temu

nkrgovic
Nikola Krgović
Beograd

Član broj: 3534
Poruke: 2807

ICQ: 49345867
Sajt: https://www.twinstarsyste..


+655 Profil

icon Re: Problem sa Windows 10 i 16+core-a.04.01.2019. u 11:50 - pre 63 meseci
Citat:
Branimir Maksimovic:
Cek zar onda 2 i 4 nisu dovoljni, sto se tice NVMe?

Zamisli da hoces da uguras recimo 20xNVMe drajva. Ili 24 . Svaki PCIex4 .

Nije HEDT, ali jeste za DC. Srecom, Epyc nema taj problem.....
Please do not feed the Trolls!

Blasphemy? How can I blaspheme? I'm a god!'
 
Odgovor na temu

Branimir Maksimovic

Član broj: 64947
Poruke: 5534
109.72.51.23



+1064 Profil

icon Re: Problem sa Windows 10 i 16+core-a.04.01.2019. u 12:05 - pre 63 meseci
Mislim da niko ko kupuje TR nece gurati 20 NVMe drajva ;)
TR je pandan Intel HEDT-una koji takodje ne moze 20 istih, tako da je AMD ovde verovatno racuna na to. Epyc je pandan Xeon-ima, cini se?
 
Odgovor na temu

Ivan Dimkovic

Administrator
Član broj: 13
Poruke: 16683
*.adsl-surfen.hetnet.nl.



+7169 Profil

icon Re: Problem sa Windows 10 i 16+core-a.04.01.2019. u 18:46 - pre 63 meseci
Citat:
Branimir Maksimovic
Heh, AMD se potrudio da zarad ne moranja menjanja maticne ploce za TR, obezbedi mozgalicu za MS ;)


Meni ovo vise deluje da se AMD i MS inzenjeri nisu bavili dovoljno tom platformom. Da li je to krivica AMD-a ili MS-a, pojma nemam.

Inace, da, TR je HEDT platforma (ne konkurent Xeon-ima, to je EPYC) i 32-core model je prakticno halo produkt rezervisan za vrrrrlo mali % korisnika.

Moje iskustvo sa NUMA platformama i Windows-om je bilo tako da sam na kraju presao na 100% kontrolu gde koji thread trci i koju memoriju koristi. Windows scheduler mi se ne mesa u posao posto svakom thread-u setujem afinitet i memoriju alociram "rucno" za svaki NUMA nod. I svima lepo :)

Na zalost, sa 32-core TR platformom ja ne znam da 2 od 4 NUMA noda >nemaju< memoriju. Windows API mi ne daje tu informaciju! Na Linuxu libnuma daje tu informaciju koja je u ovom slucaju vrlo vredna, posto bih onda mogao da, recimo, unapred dajem manje posla nitima koji trce na "sirotim" jezgrima zato sto su im svi pristupi memoriji sporiji.

Naravno, do toga mogu da dodjem i indirektno, posle nekoliko iteracija gde postaje jasno da CPU-ovi procesiraju manje podataka, ali bih sa direktnom informacijom mogao to znam bez nekog auto-tuning procesa.

DigiCortex (ex. SpikeFun) - Cortical Neural Network Simulator:
http://www.digicortex.net/node/1 Videos: http://www.digicortex.net/node/17 Gallery: http://www.digicortex.net/node/25
PowerMonkey - Redyce CPU Power Waste and gain performance! - https://github.com/psyq321/PowerMonkey
 
Odgovor na temu

[es] :: Matične ploče, procesori i memorije :: Problem sa Windows 10 i 16+core-a.

Strane: 1 2

[ Pregleda: 3917 | Odgovora: 30 ] > FB > Twit

Postavi temu Odgovori

Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.