Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.

Da li je moguce bas svaki karakter prebaciti u UTF-8?

[es] :: PHP :: Da li je moguce bas svaki karakter prebaciti u UTF-8?

[ Pregleda: 1574 | Odgovora: 12 ]

Postavi temu Odgovori

Autor

Pretraga teme: Traži
Markiranje Štampanje RSS

bmanj

Član broj: 50315
Poruke: 59
*.dialup.neobee.net.



Profil

icon Da li je moguce bas svaki karakter prebaciti u UTF-8?30.03.2005. u 19:23

Da li je moguce svaki karakter prebaciti u UTF-8 standard, i ako je moguce, kako to uraditi?

Dok ako nije, da li je moguce proveriti da li karakter postoji u UTF-8 standardu?
30.03.2005. u 19:23 

Not now, John!

Član broj: 231
Poruke: 1307
*.dialup.blic.net.



Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?30.03.2005. u 20:18
Moguće je.
"I'd take the awe of understanding over the awe of ignorance any day."
- Douglas Adams
30.03.2005. u 20:18 

Goran Rakić
Beograd

Moderator
Član broj: 999
Poruke: 2379
*.nat-pool.bgd.sbb.co.yu.

Jabber: grakic@jabber.org
Sajt: blog.goranrakic.com


Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?30.03.2005. u 20:42
UTF8 podrzava skoro sve moguce karaktere koji se upotrebljavaju u svetskim jezicima. Tako da jeste moguce ali obrati paznju da su UTF8 karakteri promenljive "duzine", tako da ce ASCII karakteri biti isto zapisani i u UTF8 kodnoj stranici.
http://sr.openoffice.org — slobodan kancelarijski paket, zamena za MS Office, na srpskom i engleskom, legalno bez troškova licenciranja
30.03.2005. u 20:42 

bmanj

Član broj: 50315
Poruke: 59
*.dialup.neobee.net.



Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 08:12
Da li postoji nacin da se (najbolje PHP-om, mada moze i neki skript u Linuxu ili Javi) proveri da li neki karakter pripada UTF-8 setu?

Konkretno me muci karakter koji podseca na ` ali takav da je "okrenut" na drugu stranu (ne znam cak ni kako da ga ukucam).

Predpostavljam na cu nailaziti na slicne probleme, i zato me zanima da li postoji neki nacim na proverim koji karakter ne mogu da prebacim u UTF-8.


Veliko, veliko hvala unapred!
31.03.2005. u 08:12 

jablan
Mladen Jablanović
Beograd

Član broj: 8286
Poruke: 3035
*.yubc.net.

Sajt: blog.radioni.ca


Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 08:55
Citat:
bmanj: Predpostavljam na cu nailaziti na slicne probleme, i zato me zanima da li postoji neki nacim na proverim koji karakter ne mogu da prebacim u UTF-8.

Glavno pitanje je odakle. Odakle hoćeš da prebaciš karakter u unikod?
31.03.2005. u 08:55 

bmanj

Član broj: 50315
Poruke: 59
*.dialup.neobee.net.



Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 11:06
Ovako:

Treba da isparsujem fajl, i da na osnovu toga kreiram drugi fajl, koji ce biti u utf-8 formatu.

Problem je sto prvi fajl, sadrzi neke karaktere koji ne pripadaju UTF-8.

Da li postoji neki nacin da ucitam prvi fajl, i da proverim da li svaki karakter moze da se prekonvertuje u utf-8 (makar isao karakter po karakter, nema veze sto ce biti sporo, vazno je samo da radi posao).

31.03.2005. u 11:06 

proNick

Član broj: 44117
Poruke: 53
*.dialup.neobee.net.



Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 11:17
Ovo bi (mozda) moglo da pomogne:

Code:

<?php 
if (iconv('UTF-8', 'UTF-8', $input) != $input) { 
       /* It's not UTF-8--for me, it's probably CP1252, the Windows
           version of Latin 1, with directed quotation marks and
           the Euro sign.  */
}
 ?>



Skinuto sa http://www.php.net/utf8-decode
31.03.2005. u 11:17 

bzero
dev null
europe

Član broj: 5907
Poruke: 371
*.nat-pool.nsad.sbb.co.yu.

Jabber: bzero@elitesecurity.org
Sajt: www.google.com/search?q=b..


Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 11:18
A taj prvi fajl, u kom je on kodnom rasporedu?
Never trust an operating system you don't have sources for.
31.03.2005. u 11:18 

bmanj

Član broj: 50315
Poruke: 59
*.dialup.neobee.net.



Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 11:25
Citat:
bzero: A taj prvi fajl, u kom je on kodnom rasporedu?



Ne postoji pravilo u kom formatu moze da bude prvi fajl.
31.03.2005. u 11:25 

Goran Rakić
Beograd

Moderator
Član broj: 999
Poruke: 2379
*.nat-pool.bgd.sbb.co.yu.

Jabber: grakic@jabber.org
Sajt: blog.goranrakic.com


Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 11:32
svaki moguci karakter moze da se pretvori u UTF8, inace ga ti ne bi video kada taj svoj fajl otvoris u editoru...

A evo dobrog linka koji sam koristio kada smo radili nekakav seminarski iz OP-a na fakultetu:
http://software.hixie.ch/utili...e-decoder/character-identifier
http://sr.openoffice.org — slobodan kancelarijski paket, zamena za MS Office, na srpskom i engleskom, legalno bez troškova licenciranja
31.03.2005. u 11:32 

bzero
dev null
europe

Član broj: 5907
Poruke: 371
*.nat-pool.nsad.sbb.co.yu.

Jabber: bzero@elitesecurity.org
Sajt: www.google.com/search?q=b..


Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 11:48
Code:

Ne postoji pravilo u kom formatu moze da bude prvi fajl


Ne mora da postoji pravilo, ali za konkretan fajl moras da znas u kom je kodnom rasporedu ako zelis da ga konverutjes u UTF-8.

Ako imas karkter 0xE4, u nekom jednobajtnom kodnom rasporedu, to ti ne govoris nista o tome koji je to karakter, jer kako ce taj karakter biti prikazan zavisi od kodnog rasporeda u kome se prikazuje. 0xE4 ce u iso-8859-1 biti prikazan kao ä , a na primer u windows-1251 kao d (d cirilicom), itd, itd. Shodno tome kada se 0xE4 konvertuje u UTF-8 koji ce se karkater dobiti zavisi od toga iz kojeg se kodnog raspreda konvertuje.
Never trust an operating system you don't have sources for.
31.03.2005. u 11:48 

bmanj

Član broj: 50315
Poruke: 59
*.dialup.neobee.net.



Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 14:49
Okej je, ovo proNickovo radi posao.



Sad da li bas svaki moze da se konvertuje u UTF-8 i da se dobije korektan karakter, nisam siguran:

http://www1.tip.nl/~t876506/entitiesTips.html


Sve jedno, moj problem je resen. Hvala proNick!
31.03.2005. u 14:49 

Goran Rakić
Beograd

Moderator
Član broj: 999
Poruke: 2379
*.nat-pool.bgd.sbb.co.yu.

Jabber: grakic@jabber.org
Sajt: blog.goranrakic.com


Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 15:00
Cekaj, ti hoces da proveris da li je neki fajl u UTF8 kodnom rasporedu? Ili zelis da proveris da li ces neki drugi raspored moci konvertovati u UTF8? U prvom slucaju ovaj kod radi, u drugom slucaju svakako moras znati u kojoj kodnoj stranici je originalni tekst jer preslikavanje nije jedinstveno (kodne stranice se preklapaju).
http://sr.openoffice.org — slobodan kancelarijski paket, zamena za MS Office, na srpskom i engleskom, legalno bez troškova licenciranja
31.03.2005. u 15:00 

[es] :: PHP :: Da li je moguce bas svaki karakter prebaciti u UTF-8?

[ Pregleda: 1574 | Odgovora: 12 ]

Postavi temu Odgovori

Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.