Citat:
tosa: Ne koriste se pomenute operacije samo za 3D grafiku već i za razne vrste simulacija. Možeš mi dati bilo koji primer specijalizovane instrukcije koja je kontra produktivna, naravno uz odgovarajuću argumentaciju, smajli nije dovoljan.
(
gleda kako da se izvuče) A dva smajlija ako stavim?
Kao što pokušah da kažem, pitanje je više hipotetičko:
ako bi postojao odgovarajući optimizujući kompilator,
onda bi svakako specijalizovane instrukcije više odmagale nego pomagale. Stoga je rezonovanje čisto posredno i na osnovu dosadašnjih trendova u razvoju, očigledno se ne može proveriti kao takvo.
Npr. onaj test kojim određuju Top 500 listu superračunara, LU dekompozicija matrice. Npr.
http://www.ics.psu.edu/fallnotes/Kunz_Lecture_1.pdf, slajd 17, pokazuje oko 90% dostignutog teoretskog plafona performansi za dati vektorski procesor (što je donja granica, jer se radi o celom postrojenju, te su uključeni i troškovi komunikacije).
S druge strane,
http://gamma.cs.unc.edu/LU-GPU/lugpusc05slides.pdf daje fino upoređenje istog problema na P4 i Envidijinim 6800 i 7800 karticama. Osim u jednom slučaju, gde uspevaju da povuku performanse na konto inače neiskorišćenog memorijskog protoka (slajd 38), performanse 6800 su tek u rangu P4-vorke (slajd 36, 37). P4 pritom dostiže oko 50% sopstvenog teoretskog plafona (slajd 7), što izađe na nekih 12 GFLOPS (prema slajdu 10). 6800 onda pri oko 12 GFLOPS (ili nešto bolje) ne dostiže ni dvocifreni procenat svog teoretskog plafona (slajd 10, doduše daje podatke za 7800).
(Inače, ovo ne znači da je tu nešto razočaravajuće, za cene kartica takve kakve su. Onaj vektorski procesor odozgo košta đavo i po — mada je sada već mator, ali i njegov savremeniji, duplo brži naslednik isto košta đavo i po — da bi mogao da bude i opšta računaljka i zaista isporuči teoretski plafon. Zato se i polomiše oko primene GPUova u opšte računske svrhe, i zato i mene interesuje na šta će to da izađe...)
Drugi primer je Itanijum, baš poznat po tome što su ga napravili da bude glup ko panj, da izvršava program bez filozofiranja. Nikakve specijalne instrukcije, nikakvo hardversko preuređivanje redosleda ili predohvatanje podataka iz memorije, niti ostale pikanterije koje imaju P4 ili Opteron. Zato je Intelovcima trebalo (kako čuh) preko dve godine da dorade kompilator koji je Itanijum konačno ostvario kao onakvu računaljku kakvom je zamišljen (npr. slajd 16 u prvom dokumentu).