Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.

Da li je moguce bas svaki karakter prebaciti u UTF-8?

[es] :: PHP :: Da li je moguce bas svaki karakter prebaciti u UTF-8?

[ Pregleda: 5325 | Odgovora: 12 ] > FB > Twit

Postavi temu Odgovori

Autor

Pretraga teme: Traži
Markiranje Štampanje RSS

bmanj

Član broj: 50315
Poruke: 89
*.dialup.neobee.net.



Profil

icon Da li je moguce bas svaki karakter prebaciti u UTF-8?30.03.2005. u 19:23 - pre 232 meseci
Da li je moguce svaki karakter prebaciti u UTF-8 standard, i ako je moguce, kako to uraditi?

Dok ako nije, da li je moguce proveriti da li karakter postoji u UTF-8 standardu?
 
Odgovor na temu

Not now, John!

Član broj: 231
Poruke: 1318
*.dialup.blic.net.



+4 Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?30.03.2005. u 20:18 - pre 232 meseci
Moguće je.
"I'd take the awe of understanding over the awe of ignorance any day."
- Douglas Adams
 
Odgovor na temu

Goran Rakić
Beograd

Moderator
Član broj: 999
Poruke: 3766

Sajt: blog.goranrakic.com


+125 Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?30.03.2005. u 20:42 - pre 232 meseci
UTF8 podrzava skoro sve moguce karaktere koji se upotrebljavaju u svetskim jezicima. Tako da jeste moguce ali obrati paznju da su UTF8 karakteri promenljive "duzine", tako da ce ASCII karakteri biti isto zapisani i u UTF8 kodnoj stranici.
http://sr.libreoffice.org — slobodan kancelarijski paket, obrada teksta, tablice,
prezentacije, legalno bez troškova licenciranja
 
Odgovor na temu

bmanj

Član broj: 50315
Poruke: 89
*.dialup.neobee.net.



Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 08:12 - pre 232 meseci
Da li postoji nacin da se (najbolje PHP-om, mada moze i neki skript u Linuxu ili Javi) proveri da li neki karakter pripada UTF-8 setu?

Konkretno me muci karakter koji podseca na ` ali takav da je "okrenut" na drugu stranu (ne znam cak ni kako da ga ukucam).

Predpostavljam na cu nailaziti na slicne probleme, i zato me zanima da li postoji neki nacim na proverim koji karakter ne mogu da prebacim u UTF-8.


Veliko, veliko hvala unapred!
 
Odgovor na temu

jablan

Član broj: 8286
Poruke: 4541



+711 Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 08:55 - pre 232 meseci
Citat:
bmanj: Predpostavljam na cu nailaziti na slicne probleme, i zato me zanima da li postoji neki nacim na proverim koji karakter ne mogu da prebacim u UTF-8.

Glavno pitanje je odakle. Odakle hoćeš da prebaciš karakter u unikod?
 
Odgovor na temu

bmanj

Član broj: 50315
Poruke: 89
*.dialup.neobee.net.



Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 11:06 - pre 232 meseci
Ovako:

Treba da isparsujem fajl, i da na osnovu toga kreiram drugi fajl, koji ce biti u utf-8 formatu.

Problem je sto prvi fajl, sadrzi neke karaktere koji ne pripadaju UTF-8.

Da li postoji neki nacin da ucitam prvi fajl, i da proverim da li svaki karakter moze da se prekonvertuje u utf-8 (makar isao karakter po karakter, nema veze sto ce biti sporo, vazno je samo da radi posao).

 
Odgovor na temu

proNick

Član broj: 44117
Poruke: 53
*.dialup.neobee.net.



Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 11:17 - pre 232 meseci
Ovo bi (mozda) moglo da pomogne:

Code:

<?php 
if (iconv('UTF-8', 'UTF-8', $input) != $input) { 
       /* It's not UTF-8--for me, it's probably CP1252, the Windows
           version of Latin 1, with directed quotation marks and
           the Euro sign.  */
}
 ?>



Skinuto sa http://www.php.net/utf8-decode
 
Odgovor na temu

bzero
dev null
europe

Član broj: 5907
Poruke: 371
*.nat-pool.nsad.sbb.co.yu.

Jabber: bzero@elitesecurity.org
Sajt: www.google.com/search?q=b..


Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 11:18 - pre 232 meseci
A taj prvi fajl, u kom je on kodnom rasporedu?
Never trust an operating system you don't have sources for.
 
Odgovor na temu

bmanj

Član broj: 50315
Poruke: 89
*.dialup.neobee.net.



Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 11:25 - pre 232 meseci
Citat:
bzero: A taj prvi fajl, u kom je on kodnom rasporedu?



Ne postoji pravilo u kom formatu moze da bude prvi fajl.
 
Odgovor na temu

Goran Rakić
Beograd

Moderator
Član broj: 999
Poruke: 3766

Sajt: blog.goranrakic.com


+125 Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 11:32 - pre 232 meseci
svaki moguci karakter moze da se pretvori u UTF8, inace ga ti ne bi video kada taj svoj fajl otvoris u editoru...

A evo dobrog linka koji sam koristio kada smo radili nekakav seminarski iz OP-a na fakultetu:
http://software.hixie.ch/utili...e-decoder/character-identifier
http://sr.libreoffice.org — slobodan kancelarijski paket, obrada teksta, tablice,
prezentacije, legalno bez troškova licenciranja
 
Odgovor na temu

bzero
dev null
europe

Član broj: 5907
Poruke: 371
*.nat-pool.nsad.sbb.co.yu.

Jabber: bzero@elitesecurity.org
Sajt: www.google.com/search?q=b..


Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 11:48 - pre 232 meseci
Code:

Ne postoji pravilo u kom formatu moze da bude prvi fajl


Ne mora da postoji pravilo, ali za konkretan fajl moras da znas u kom je kodnom rasporedu ako zelis da ga konverutjes u UTF-8.

Ako imas karkter 0xE4, u nekom jednobajtnom kodnom rasporedu, to ti ne govoris nista o tome koji je to karakter, jer kako ce taj karakter biti prikazan zavisi od kodnog rasporeda u kome se prikazuje. 0xE4 ce u iso-8859-1 biti prikazan kao ä , a na primer u windows-1251 kao d (d cirilicom), itd, itd. Shodno tome kada se 0xE4 konvertuje u UTF-8 koji ce se karkater dobiti zavisi od toga iz kojeg se kodnog raspreda konvertuje.
Never trust an operating system you don't have sources for.
 
Odgovor na temu

bmanj

Član broj: 50315
Poruke: 89
*.dialup.neobee.net.



Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 14:49 - pre 232 meseci
Okej je, ovo proNickovo radi posao.



Sad da li bas svaki moze da se konvertuje u UTF-8 i da se dobije korektan karakter, nisam siguran:

http://www1.tip.nl/~t876506/entitiesTips.html


Sve jedno, moj problem je resen. Hvala proNick!
 
Odgovor na temu

Goran Rakić
Beograd

Moderator
Član broj: 999
Poruke: 3766

Sajt: blog.goranrakic.com


+125 Profil

icon Re: Da li je moguce bas svaki karakter prebaciti u UTF-8?31.03.2005. u 15:00 - pre 232 meseci
Cekaj, ti hoces da proveris da li je neki fajl u UTF8 kodnom rasporedu? Ili zelis da proveris da li ces neki drugi raspored moci konvertovati u UTF8? U prvom slucaju ovaj kod radi, u drugom slucaju svakako moras znati u kojoj kodnoj stranici je originalni tekst jer preslikavanje nije jedinstveno (kodne stranice se preklapaju).
http://sr.libreoffice.org — slobodan kancelarijski paket, obrada teksta, tablice,
prezentacije, legalno bez troškova licenciranja
 
Odgovor na temu

[es] :: PHP :: Da li je moguce bas svaki karakter prebaciti u UTF-8?

[ Pregleda: 5325 | Odgovora: 12 ] > FB > Twit

Postavi temu Odgovori

Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.