Da dodam samo da i u C++-u mozes da uradis dosta toga sto je vezano za
hardware, ako znas kako isti funkcionise. Toliko ima bitnijih stvari od low-level
optimizacije da ona postaje "deprecated" :)
Organizovati strukture tako da imaju cache-friendly velicinu, manje "skakanja" po
memoriji itd.
Primera radi:
Code:
memcpy( &matrix1, &matrix2, sizeof(matrix) );
je mnogo sporije od:
Code:
for (int i=0; i<16; ++i) matrix1[i] = matrix2[i];
sto opet moze biti sporije od:
Code:
for (int i=15; i>=0; --i) matrix1[i] = matrix2[i];