Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.

Podatci iz html fajla

[es] :: Art of Programming :: Podatci iz html fajla

[ Pregleda: 2165 | Odgovora: 3 ] > FB > Twit

Postavi temu Odgovori

Autor

Pretraga teme: Traži
Markiranje Štampanje RSS

boolee
Novi Sad

Član broj: 23226
Poruke: 89
*.adsl-a-11.sezampro.rs.

Sajt: https://www.facebook.com/..


Profil

icon Podatci iz html fajla12.05.2013. u 18:32 - pre 132 meseci
Tražio sam iskreno mnogo ali ne mogu naći.
Radi se o tome da mi trebaju podatci iz html fajlova jednog foldera na mom disku.
Svaki taj html fajl je standardna internet stranica sa svim svojim detaljima , ima ih nekoliko hiljada pa ne mogu peške.
Došlo je do toga da moram menjati koncept internet prodavnice a nemam pojma kako da prebacim podatke. Sve modularne kombinacije neće da rade. Treba mi programski kod ili rutina da otvara jedan po jedan htm fajl i nekako izdvoji na primer iz ovog prikazanog dela link slike, pa naziv artikla, cenu, cenu po jedinici mere, barkod , ja to sve moram smestiti u jedan .csv fajl da bih premestio onlineshop.
Razlog svega je upad hakera i rasturanje baze podataka i njeog redovnog bekapa + moja glupost svi bekapi na serveru(glupost je ogromna ne vredi je komentarisati) ... naravno ni ovo što ja tražim nije jednostavno, za nekog ko zna verovatno je smešna stvar, ali za mene je nepremostivo.
Otvoren sam za sve opcije i sve predloge.

Code:
<a href="/images/products/350/350104316l.gif" rel="colorbox_image" target="_blank" title="Pileća posebna sa povrćem kobasica rinfuz LTS Farmer"><img alt="" src="/images/products/350/350104316.gif?1351511712" /></a>    <a href="/images/products/350/350104316l.gif" class="povecaj" rel="colorbox_link" target="_blank" title="Pileća posebna sa povrćem kobasica rinfuz LTS Farmer">Uvećaj</a>
        </td>
        <td class="row2" style="border-top:solid 1px #e4e4e4;">
          <dl class="artiklInfo">
        
            <div class="Cena">Cena
              : 274,99 Din            </div>
            <br/>
            <div class="ArtiklPriceHolder">
          
        <div class="FloatLeft" style="margin-bottom: 1em;">
          Cena za jedinicu mere: <strong>274,99 Din / KG</strong>
        </div>
        <div class="clr"/>
          
            </div>
        
          <div>
        <table>
          <td><strong>Barkodovi:</strong></td>
          <td><div class="floatLeft">
              <div class="BarcodeBox">
            
              2730826<br/>


Da napomenem da nije samo ovo ukupan html kod , svaka stranica ima 500-600 linija kad se gleda u Dreamweaver-u .
 
Odgovor na temu

Radovan__III
Radovan__III
Beograd

Član broj: 15669
Poruke: 1245
*.dynamic.isp.telekom.rs.



+26 Profil

icon Re: Podatci iz html fajla12.05.2013. u 19:12 - pre 132 meseci
Ovo moze da se uradi uz pomoc razlicitih programskih jezika, npr java, c , php ...
Algoritam resavanja ovakvog problema bi trebalo da bude ovakav :
1. programu das ime foldera i on utvrdi koji su sve fajlovi tu , kako bi posle prosao kroz sve fajlove
2. prolazis kroz fajl i nalazis podatke *
3. podatke smestas u csv fajl

Ja verujem da je najtezi deo za tebe tu da vidis na koji nacin ces da date podatke nadjes u tom fajlu ( stavka 2. ) . To mozes da uradis na vise nacina, koristeci se nekom bibliotekom koja je direktno napravljena da parsuje html ( struktura html dokumenata mora da bude validna ) ili da prolazis kroz fajl i koristeci regularne izraze ( patern odgovarajuceg teksta ) da dodjes do datih podataka.

Ako ovo nije dovoljna pomoc javi, pa da vidimo nesto specificno za jezik koji znas ili za korak koji je direktno problem.


Aj sad svi u biblioteku da nesto pojedemo i popijemo ...
--------------------------------
Knjigovodstvo

 
Odgovor na temu

reiser

Član broj: 7895
Poruke: 2314



+102 Profil

icon Re: Podatci iz html fajla12.05.2013. u 19:18 - pre 132 meseci
Ili sam napises program koji ce ovo da izparsuje, ili unajmis nekog da ti odradi, trece nema. Bar do sada nisam cuo za neku alatku na trzistu koja je dovoljno fleksibilna da odradi ovo. Ako su HTML stranice konzistentnog sadrzaja to je cca 1h posla - imas pp.
 
Odgovor na temu

Mihajlo Cvetanović
Beograd

Moderator
Član broj: 37636
Poruke: 1249



+96 Profil

icon Re: Podatci iz html fajla12.05.2013. u 22:57 - pre 132 meseci
Za .NET sistem postoji HTML Agility Pack, koji omogućava parsiranje HTML strana i čitanje sadržaja. Koristio sam ga jednom i sviđa mi se.
 
Odgovor na temu

[es] :: Art of Programming :: Podatci iz html fajla

[ Pregleda: 2165 | Odgovora: 3 ] > FB > Twit

Postavi temu Odgovori

Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.