Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.

PHP DOM i character set problem

[es] :: PHP :: PHP DOM i character set problem

[ Pregleda: 773 | Odgovora: 2 ]

Postavi temu Odgovori

Autor

Pretraga teme: Traži
Markiranje Štampanje RSS

kukipei
Niš

Član broj: 19564
Poruke: 147
*.static.sbb.co.yu.

Sajt: www.gensunasumus.com


Profil

icon PHP DOM i character set problem06.12.2007. u 12:23

Pozdrav svima,

Pokusavam da resim jedan problem vec nekoliko dana.
Naime skrepujem jednu html stranicu koja je kodirana u utf-8. Na njoj postoje nasa slova latinice (š, ć, č itd).

ovaj deo koda mi je bitan
Code:
function handle_final_scrape($html, $ISIN, $mb)
{
    global $database;
    $ind1 = strpos($html, $ISIN);
    $ind1table = strpos($html, "<table", $ind1);
    $ind2table = strpos($html, "</table", $ind1table);
    $table = substr($html, $ind1table, $ind2table + 8 - $ind1table);
    
    echo $table;
    
    $dom = new DOMDocument("1.0", "UTF-8");
    @$dom->loadHTML($table);


naredba echo $table mi ispise lepo tabelu sa nasim slovima.
Medjutim posle ovih DOM naredba kada hocu da stampam neki tekst umesto slova šđč itd ispisuje mi neke gluposti. Kao da mi dom naredbe promene encoding.

Zna li neko resenje za ovaj problem.
Puno pozdrava,
Peda
06.12.2007. u 12:23 

fimalbonegaculo
Igor Milovanović
developer, sys-admin
beograd

Član broj: 395
Poruke: 158
*.dynamic.sbb.co.yu.

ICQ: 81662016
Sajt: www.linkedin.com/in/igorm..


Profil

icon Re: PHP DOM i character set problem17.12.2007. u 09:57
probaj da uradiš ovo:
Code:
$table= mb_convert_encoding($table, 'HTML-ENTITIES', "UTF-8");
ili da ipak dodaš head element svom dokumentu i specificiraš da je utf-8 način kodiranja dokumenta, pošto sam loadHTML neće ni pokušati da prepozna kodiranje.


"if you fail to plan, you plan to fail"
17.12.2007. u 09:57 

[KS]
Damir Kasipovic
Banjaluka

Član broj: 55395
Poruke: 46
*.broadband.blic.net.



Profil

icon Re: PHP DOM i character set problem12.01.2008. u 12:56
probaj sa

Code:

$table = rawurlencode($table);


a onda loadHTML (pretpostavljam da ima neki javascript u svemu tome), prepraviti da radi unescape() na svim dolaznim podatcima.
Meni kombinacija rawurlencode() i unescape() uvijek radi, cak i za AJAX i JSON.
Damir Kasipović
dkasipovic@gmail.com
+387 (0)65 979 949
12.01.2008. u 12:56 

[es] :: PHP :: PHP DOM i character set problem

[ Pregleda: 773 | Odgovora: 2 ]

Postavi temu Odgovori

Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.