Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.

Konverzija ćirilice u latinicu i linkovi

[es] :: Predlozi i pitanja :: Konverzija ćirilice u latinicu i linkovi

Strane: 1 2

[ Pregleda: 4569 | Odgovora: 23 ] > FB > Twit

Postavi temu Odgovori

Autor

Pretraga teme: Traži
Markiranje Štampanje RSS

plus_minus

Član broj: 289459
Poruke: 2242
*.exe-net.net.

Sajt: https://hardcoder.xyz


+2247 Profil

icon Re: Konverzija ćirilice u latinicu i linkovi12.06.2020. u 14:41 - pre 47 meseci
Moram da prepravim samog sebe, jer sam toliko izmlatio u prethodnom postu, evo sad ... primetih, špartam po svom profilu i gde sam šta pisao. A prethodni post sam pisao .. pa ne znam ni ja šta mi bi, da se ne pro5er4vam i vadim sada, nego da cititam svoju idiotsku grešku, zbog onih koji zaista ne znaju o materiji, kojim slučajem hoće da uzmu u obzir deo mog prethodnog posta kao neku privremenu i početničku referencu (ako uopšte ima takvih).

Citat:
Ćirilica zauzima ni više ni manje po osam bita za svaki karakter.


Sramota, ali namerno neću da editujem, neka ostane. D se vidi kako "majstor plus_minus" lupi i ostade živ.

Ono što jeste tačno:

- Svaki ASCII karakter jeste `težak` jedan bajt ili 8 bit-a. A bit je kec ili nula. (slika u prilogu pojašnjava dodatno, šta je ASCII, ima tona materijala na netu o tome).
- Za ćirilicu mora više od `samo osam bita` po karakteru, jer je UNICODE *(utf-8 web standard) da tako kažemo - fleksibilan, pa će u nekim jezicima ići i po 2 ili 3 BAJTA za svaki karakter (i o tome ima tona materijala na izvol' te ...).

Evo dva primera.
Prvi, gde je reč `Latinica` napisana latinično (prvi primer) i drugi gde je reč `Latinica` ispisana ćirilicom.

Izraženo u binarnom, `sirovom` CPU formatu (ASCII/Unicode enkodiranje).


01001100 01100001 01110100 01101001 01101110 01101001 01100011 01100001



11010000 10011011 11010000 10110000 11010001 10000010 11010000 10111000 11010000 10111101 11010000 10111000 11010001 10000110 11010000 10110000


Zaključak je dakle da za ćirilicu treba po 2 bajta za svako slovo.
Zaključak je dakle da bi kompletna baza bila minimum - DUPLO veća.

Pa neka je sada, ovakva kakva je, mlatim -- nekih 2 terabajta .. a gabaritna *sql baza podataka ume da košta i to fino. (ovde već ne mlatim).
Uopšte - samo jedna dodatna *sql tabela - negde kod nekih hosting/sql provajdera košta i do 100 evra preko.
Pa neka ima i 3 recorda .. I tako ..

Možda je to Gojkov glavni razlog za nepostojanje ćirilice, arapskog, kineskog, japanskog.. pisma, a ne zato što je šatro `srbomrzac/domobran` i slične 3.14čke materine.


about:networking
Prikačeni fajlovi
 
Odgovor na temu

SlobaBgd

Član broj: 70350
Poruke: 2348



+5071 Profil

icon Re: Konverzija ćirilice u latinicu i linkovi12.06.2020. u 18:06 - pre 47 meseci
المزيد ناقص
עוד מינוס
减去更多
もっとマイナス
Plus Minus

Može arapski, može hebrejski, može kineski, može japanski, ali srpska ćirilica ne može.
Mora da je zbog ovog što si gore napisao.
 
Odgovor na temu

plus_minus

Član broj: 289459
Poruke: 2242
*.exe-net.net.

Sajt: https://hardcoder.xyz


+2247 Profil

icon Re: Konverzija ćirilice u latinicu i linkovi12.06.2020. u 18:55 - pre 47 meseci
^^

E, vidiš .. ako je tako kako veliš, a izgleda da jeste (definitivno nema mesta za sumnju) .. onda Gojko treba da napiše i neko smisleno objašnjenje.

Ovo gore sa (bajt * 2) jeste tačno i za cenu baze podataka i za sve ostalo i zaista može da bude dobar i logičan razlog za automatsko preslovljavanje .. međ' tim .. problem je mizeran, gorak i nažalost nije taj razlog ... čim ja mišem selektujem svaki karakter tvoj posta ..

Dobro. :)

- Nema mesta NAJSAVRŠENIJEM pismu .. na svetu .. ?
- Problem nije u mesečnom/godišnjem održavanju velike baze ... ?

Onda će i manje korisnika biti ubuduće (100% da hoće) na istoj adresi, `tak' prosto, kaj ne?`.

Jedan manje, sigurno.


きららしこんいいりにかいといそなすにかん

about:networking
 
Odgovor na temu

Branimir Maksimovic

Član broj: 64947
Poruke: 5534
109.72.51.23



+1064 Profil

icon Re: Konverzija ćirilice u latinicu i linkovi12.06.2020. u 23:39 - pre 47 meseci
Ne stoji ni teorija da treba dva bajta za cirilicu, zato sto ascii koristi 7 bita za enkodiranje, a sa punih 8 bita moze da se iskodira cela cirilica plus jos znakova stane :P
 
Odgovor na temu

[es] :: Predlozi i pitanja :: Konverzija ćirilice u latinicu i linkovi

Strane: 1 2

[ Pregleda: 4569 | Odgovora: 23 ] > FB > Twit

Postavi temu Odgovori

Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.