Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.

regexp za parse članaka iz HTML strane

[es] :: PHP :: regexp za parse članaka iz HTML strane

[ Pregleda: 2773 | Odgovora: 2 ] > FB > Twit

Postavi temu Odgovori

Autor

Pretraga teme: Traži
Markiranje Štampanje RSS

dee_
domagoj horvat
zagreb

Član broj: 73648
Poruke: 98
195.29.5.*

Sajt: www.astro-art.net


Profil

icon regexp za parse članaka iz HTML strane20.08.2006. u 20:15 - pre 215 meseci
Molio bih iskusnije sa regexps da mi pomognu. Imam situaciju u kojoj moram parsat članke direktno sa stranice. Znaci, na stranici se izlista x članaka, ja bi trebao stranicu ucitat i nekako izvuc listu clanaka prikazanih na njoj. recimo da ih je 10, kako da to izvedem regexpom?


Code:

<tr valign=top>
<td width="100%" height="10" class="newsbox">
<font class="title">Naslov članka1</font>
</td>
</tr>
<tr>
<td width="100%" class="newsbox">    
<img src="http://slika1.jpg">
<p>Sadržaj članka 1
<a href="link1" class="artlink">Opširnije</A> </p><p></p>
</td>
</tr>


iz ovakvih 10 na stranici, kao rezultat mi treba nesto oblika:

$clanci[0][naslov] = 'Naslov članka1'
$clanci[0][tekst]= ' Sadržaj članka1'
$clanci[0][link]= 'Link članka1'
$clanci[0][slika]='http://slika1.jpg'
.
.
.



hvala!

PS.

znam da je kod neuredan, ali nemam nikakav utjecaj na njega



[Ovu poruku je menjao dee_ dana 20.08.2006. u 21:26 GMT+1]
 
Odgovor na temu

makempire
Dimitar Bosevski
Demir Hisar, Makedonija

Član broj: 137992
Poruke: 8
79.125.179.*



Profil

icon Re: regexp za parse članaka iz HTML strane13.10.2007. u 13:24 - pre 201 meseci
Ima neko resenje za ovo?

I meni treba...
Anyone who puts a small gloss on a fundamental technology, calls it proprietary, and then tries to keep others from building on it, is a thief. (Tim O'Reilly)
 
Odgovor na temu

357_97

Član broj: 53056
Poruke: 104
*.eunet.yu.



+5 Profil

icon Re: regexp za parse članaka iz HTML strane13.10.2007. u 18:33 - pre 201 meseci
Mislim da ce ti ovo pomoci.... Prouci malo code pa sam napisi regularni izraz za ostala dva primera...
Code:
$data = '
    <tr valign=top>
    <td width="100%" height="10" class="newsbox">
    <font class="title">Naslov članka br. 1</font>
    </td>
    </tr>
    <tr>
    <td width="100%" class="newsbox">
    <img src="http://slika1.jpg">
    <p>Sadržaj članka 1
    <a href="link1" class="artlink">Opširnije</A> </p><p></p>
    </td>
    </tr>
';

$pattern_naslovi = '/<.*?class="title">(.*?)<\/font>/s';
$pattern_sadrzaj = '/<p>(.*?)<a.*?>/s';

preg_match_all($pattern_naslovi, $data, $naslovi);
preg_match_all($pattern_sadrzaj, $data, $sadrzaj);

print_r($naslovi[1]);
print_r($sadrzaj[1]);
 
Odgovor na temu

[es] :: PHP :: regexp za parse članaka iz HTML strane

[ Pregleda: 2773 | Odgovora: 2 ] > FB > Twit

Postavi temu Odgovori

Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.