Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.

Dvobajtni karakteri u utf-8

[es] :: PHP :: Dvobajtni karakteri u utf-8

[ Pregleda: 4687 | Odgovora: 8 ] > FB > Twit

Postavi temu Odgovori

Autor

Pretraga teme: Traži
Markiranje Štampanje RSS

Nemanja Avramović
Engineering Manager
MENU Technologies
Beograd, Srbija

Moderator
Član broj: 32202
Poruke: 4391
91.150.113.*

Sajt: https://avramovic.info


+46 Profil

icon Dvobajtni karakteri u utf-823.08.2007. u 08:48 - pre 202 meseci
Radio sam neku migraciju sa jedne web aplikacije na drugu pa su mi se karakteri u tekstovima malo zeznuli

Planirao sam da prođem kroz sve tekstove u bazi, da replace-ujem dvobajtne karaktere sa odgovarajućim UTF-8 entitetima i da ih vratim nazad u bazu. To nije problem da uradim, ali me zanima koji su dvobajtni karakteri za naša velika slova. Za mala sam lako izvukao, i to su:

š - Å¡
đ - Ä‘
ž - ž
č - Ä
ć - ć

Našao sam da je za Č - ÄŒ, ali retko gde imam početak rečenice velikim slovom, a ne mogu da prolazim ručno kroz preko 100 tekstova da tražim odgovarajuće entitete, pa ako neko zna, bilo bi lepo da postavi ovde. Hvala unapred.

p.s. Pitanje nije baš za PHP forum jer nema neke veze sa samim PHPom, pa ako neko zna koji bi forum više odgovarao, neka javi, da prebacujem
Laravel Srbija.

[NE PRUŽAM PODRŠKU ZA PHP PREKO PRIVATNIH PORUKA!]
 
Odgovor na temu

broker

Član broj: 2415
Poruke: 8514
91.150.108.*



+11 Profil

icon Re: Dvobajtni karakteri u utf-823.08.2007. u 09:02 - pre 202 meseci
Na DPT sam svojevremeno ostavio gotovu funkciju koja radi tu konverziju.
 
Odgovor na temu

Nemanja Avramović
Engineering Manager
MENU Technologies
Beograd, Srbija

Moderator
Član broj: 32202
Poruke: 4391
91.150.113.*

Sajt: https://avramovic.info


+46 Profil

icon Re: Dvobajtni karakteri u utf-823.08.2007. u 09:36 - pre 202 meseci
Misliš na ono iz SMF foruma što si izvukao? Jedino sam to našao... mada mi je ono mnogo vezano za SMF, trebalo bi dosta da se menja... :/
Laravel Srbija.

[NE PRUŽAM PODRŠKU ZA PHP PREKO PRIVATNIH PORUKA!]
 
Odgovor na temu

Miroslav Ćurčić
ex mVeliki
Novi Sad

Član broj: 19034
Poruke: 1118
*.dynamic.sbb.co.yu.



+19 Profil

icon Re: Dvobajtni karakteri u utf-823.08.2007. u 09:49 - pre 202 meseci
Evo.
"The quieter you become, the more you are able to hear."
Blog | PowerCMS
Prikačeni fajlovi
 
Odgovor na temu

Nemanja Avramović
Engineering Manager
MENU Technologies
Beograd, Srbija

Moderator
Član broj: 32202
Poruke: 4391
91.150.113.*

Sajt: https://avramovic.info


+46 Profil

icon Re: Dvobajtni karakteri u utf-823.08.2007. u 10:19 - pre 202 meseci
Hvala. Mada neće ovo da radi tek tako, ja sam mislio da ću uspeti preko običnog:

Code:

$dvobajtni = array("Å¡","Ä‘","ž","Ä","ć","ÄŒ","Ć","Å","Đ","Ž");
$utfosam = array("š","đ","ž","č","ć","Č","Ć","Š","Đ","Ž");

$post_content = str_replace($dvobajtni,$utfosam,$page_content);


Ali to ne radi. Jel ima neko ideju kako ovo odraditi? Verujem da treba izvući hex vrednosti ovih karaktera ali mi ord/chr funkcije nisu pomogle. Hteo sam da pokušam nešto i preko iconv-a, ali nemam ga instaliranog na serveru
Laravel Srbija.

[NE PRUŽAM PODRŠKU ZA PHP PREKO PRIVATNIH PORUKA!]
 
Odgovor na temu

broker

Član broj: 2415
Poruke: 8514
91.150.108.*



+11 Profil

icon Re: Dvobajtni karakteri u utf-823.08.2007. u 10:20 - pre 202 meseci
Citat:
Nemanja Avramović: Misliš na ono iz SMF foruma što si izvukao? Jedino sam to našao... mada mi je ono mnogo vezano za SMF, trebalo bi dosta da se menja... :/


Da, to. Meni je funkcija delovala kao izolovana, a svakako ima tabele za translaciju koje su ti potrebne. Doduse ako ti je samolatinicni sadrzaj u pitanju mozes i sam da se snadjes, ali ako ima i cirilice, uh..
 
Odgovor na temu

Nemanja Avramović
Engineering Manager
MENU Technologies
Beograd, Srbija

Moderator
Član broj: 32202
Poruke: 4391
91.150.113.*

Sajt: https://avramovic.info


+46 Profil

icon Re: Dvobajtni karakteri u utf-823.08.2007. u 10:31 - pre 202 meseci
U pitanju je samo latinica. Ajde pogledaću detaljnije tu funkciju, pošto je sve ostalo propalo.

izmena: Pih, tamana sam se ponadao da ću uspeti sa utf8_decode da rešim stvar, ali... Ta funkcija mi lepo konvertuje slova ž, š i č, ali za ostala baguje

izmena 2: Sredio sam nekako http://blog.avramovic.info/2007/08/23/konverzija-zavrsena/

[Ovu poruku je menjao Nemanja Avramović dana 23.08.2007. u 13:12 GMT+1]
Laravel Srbija.

[NE PRUŽAM PODRŠKU ZA PHP PREKO PRIVATNIH PORUKA!]
 
Odgovor na temu

mb_sa

Član broj: 50529
Poruke: 172
89.146.161.*



Profil

icon Re: Dvobajtni karakteri u utf-823.08.2007. u 13:51 - pre 202 meseci
Citat:
Nemanja Avramović: Hvala. Mada neće ovo da radi tek tako, ja sam mislio da ću uspeti preko običnog:

Code:

$dvobajtni = array("Å¡","Ä‘","ž","Ä","ć","ÄŒ","Ć","Å","Đ","Ž");
$utfosam = array("š","đ","ž","č","ć","Č","Ć","Š","Đ","Ž");

$post_content = str_replace($dvobajtni,$utfosam,$page_content);


Ali to ne radi. Jel ima neko ideju kako ovo odraditi? Verujem da treba izvući hex vrednosti ovih karaktera ali mi ord/chr funkcije nisu pomogle. Hteo sam da pokušam nešto i preko iconv-a, ali nemam ga instaliranog na serveru :(


Cudi me kako ti ovo nije proslo? Ja sam prije 2-3 dana bio us slicnoj siutaciji (u bazi su bili pobrljavljeni karkateri kao u tvom slučaju), a i morao sam izvrsiti izmejene na strukturi tabela (neke vrijednsoti u koloni razdvojiti u dvije kolone i slcino). I na ovaj fazon sam rijesio. Radilo je sve bez problema. Jedino, sam poslije odabira baze SET-ovo kroz upit UTF8 i UTF8_general_ci.
 
Odgovor na temu

Nemanja Avramović
Engineering Manager
MENU Technologies
Beograd, Srbija

Moderator
Član broj: 32202
Poruke: 4391
91.150.113.*

Sajt: https://avramovic.info


+46 Profil

icon Re: Dvobajtni karakteri u utf-823.08.2007. u 14:07 - pre 202 meseci
Pa stvarno ne znam, meni je ovo sa replace (gore u kodu je typo, piše $post_content = ... $page_content);, ali kod je bio dobar) vraćalo iste dvobajtne karaktere. Tabela mi je posle migracije i bila utf8 (da li je general_ci ili unicode_ci, stvarno ne znam) ali karakteri su bili dvobajtni pošto skripta za migraciju sa bBloga na WP očigledno ne radi sve kako treba

No, nije ni bitno, bitno je da sam ja rešio problem
Laravel Srbija.

[NE PRUŽAM PODRŠKU ZA PHP PREKO PRIVATNIH PORUKA!]
 
Odgovor na temu

[es] :: PHP :: Dvobajtni karakteri u utf-8

[ Pregleda: 4687 | Odgovora: 8 ] > FB > Twit

Postavi temu Odgovori

Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.