Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.

utf-8 encode udaljenog XML fajla

[es] :: PHP :: utf-8 encode udaljenog XML fajla

[ Pregleda: 2139 | Odgovora: 6 ] > FB > Twit

Postavi temu Odgovori

Autor

Pretraga teme: Traži
Markiranje Štampanje RSS

Nebojsa Marinkov
Zrenjanin

Član broj: 243992
Poruke: 40
*.bscomputer.com.



+1 Profil

icon utf-8 encode udaljenog XML fajla22.05.2012. u 16:35 - pre 144 meseci
Pozdrav svima
Već nedelju dana se zezam sa jednim problemom oko ispisa naših slova (č, ć, đ).
Cilj je da isparsiram xml string koji dobijam preko web servisa i to radim na sledeći način

Code:

//povlačenje sadržaja stringa
$xml_string= file_get_contents($url);


Zaustavimo se ovde kada štampam dobijeni string dobijam xml sa zaglavljem <?xml version="1.0" encoding="UTF-8"?> i svim ostalim podacima među kojima su i reči kao: upravljaè , štampaè , Kuæište itd, a taj string skripta prepoznaje kao UTF-8.

Kada ubacim
Code:
header('Content-type: text/html; charset=utf-8');

ili ako PHP skriptu enkodiram u utf-8 onda dobijem one masne upitnike namesto svih naših slova.

Kada ubacim
Code:
header('Content-type: text/xml; charset=utf-8');
i probam to da odštampam dobijem Xml parser error na prvom č tj na prvom è.

konačno kada probam da isparsiram taj XML pomoću
Code:
$products = simplexml_load_string($xml_string);

dobijam grešku:

Citat:
parser error : Input is not proper UTF-8, indicate encoding ! Bytes: 0xE8 0x3C 0x2F 0x74


Probao sam da koristim funkcije utf8_encode, mb_convert_encoding($xml, 'UTF-8', mb_detect_encoding($xml)); iconv('UTF-8', "UTF-8", $xml);
str_replace("è", "č", $xml);
Probao sam sa php skriptom u ASCII, UTF8 i UTF8 without BOM.
Uvek ili drugačija brljoka od slova ili znakovi pitanja

Kontaktirao sam programera sa druge strane i poslao mi je screenshot kako se kod njega xml fajl ispravno prikazuje u browseru

Inače koristim notepad++.

Prvi put radim ovako nešto, i nemam ideju šta još da pokušam. Ako bi neko mogao da da kakav trag bio bih zahvalan

Edit:
Koristim WAMP na localhostu na 32-bitnom windowsu7
PHP 5.3.10
apache 2.2.21
 
Odgovor na temu

webjunior

Član broj: 301714
Poruke: 106
193.107.4.*



+4 Profil

icon Re: utf-8 encode udaljenog XML fajla22.05.2012. u 21:06 - pre 144 meseci
koji browser koristis? namesti da enkoding prepoznaje automatski...
 
Odgovor na temu

pajaja
Beograd

Administrator
Član broj: 41598
Poruke: 3430
*.dynamic.sbb.rs.

Jabber: pajaja@elitesecurity.org
ICQ: 253317269


+144 Profil

icon Re: utf-8 encode udaljenog XML fajla22.05.2012. u 22:03 - pre 144 meseci
Pozdrav,

na osnovu primera koje si dao mogu da pretpostavim da taj xml string nije enkodovan kao utf-8, vec kao cp1250. Ako promenis charset na windows-1250 prikaz ce biti u redu. Takodje obrati paznju da iako su slicni i cesto se mesaju ISO-8859-2 i windows-1520 se ipak razlikuju, tako da je bitno da bas bude win1520. Proveri da li prvi karakter u stampac ima \0x9a hex vrednost, ili jednostavno samo probaj da odstampas xml sa windows-1520 charsetom, pa javi rezultat.
xxx
mali mali mali kamičak...nebo plave boje.
In Memoriam: Madzone Zeka(15.09.2005-16.09.2005)
 
Odgovor na temu

Nebojsa Marinkov
Zrenjanin

Član broj: 243992
Poruke: 40
*.bscomputer.com.



+1 Profil

icon Re: utf-8 encode udaljenog XML fajla23.05.2012. u 09:41 - pre 144 meseci
Citat:
webjunior: koji browser koristis? namesti da enkoding prepoznaje automatski...

Namestio sam da se encoding automatski prepoznaje i kaže da je UTF-8 i prikaz ipak nije dobar, ali....
Citat:
pajaja: ... Ako promenis charset na windows-1250 prikaz ce biti u redu. ...

Bingo! ubacim na vrhu jedan
Code:
header('Content-type: text/html; charset=windows-1250');

i konačno dobijam sve kako treba, YESS!! Znači, nikad ne bih rek'o.

Puno vam hvala na pomoći.
 
Odgovor na temu

Milan M. Radovic
Web Developer
Pančevo

Član broj: 16959
Poruke: 743
82.117.198.*



+25 Profil

icon Re: utf-8 encode udaljenog XML fajla23.05.2012. u 09:48 - pre 144 meseci
Prebaceno u CP1250. Sada nece praviti greske.

Code:
header('Content-Type: application/rss+xml; charset=ISO-8859-2');
echo "<?xml version=\"1.0\" encoding=\"ISO-8859-2\"?>";

I don't need a girl for sex , All I Need is Binary and HEX
 
Odgovor na temu

Nebojsa Marinkov
Zrenjanin

Član broj: 243992
Poruke: 40
*.bscomputer.com.



+1 Profil

icon Re: utf-8 encode udaljenog XML fajla23.05.2012. u 10:41 - pre 144 meseci
Tačno. Evo sada je sve u redu po defaultu i bez onog dodatnog headera, premda header ne smeta ni ako ostane.
 
Odgovor na temu

Milan M. Radovic
Web Developer
Pančevo

Član broj: 16959
Poruke: 743
82.117.198.*



+25 Profil

icon Re: utf-8 encode udaljenog XML fajla23.05.2012. u 11:54 - pre 144 meseci
Citat:
Nebojsa Marinkov: Tačno. Evo sada je sve u redu po defaultu i bez onog dodatnog headera, premda header ne smeta ni ako ostane.

Bolje ne stavljaj... evo sad se javili... smeta im cp1250 i hoce UTf-8... :( Probacu konverziju iz UTF-8 u CP1250.
I don't need a girl for sex , All I Need is Binary and HEX
 
Odgovor na temu

[es] :: PHP :: utf-8 encode udaljenog XML fajla

[ Pregleda: 2139 | Odgovora: 6 ] > FB > Twit

Postavi temu Odgovori

Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.