Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.

linuxjournal

[es] :: Linux mreže :: linuxjournal

[ Pregleda: 2812 | Odgovora: 10 ] > FB > Twit

Postavi temu Odgovori

Autor

Pretraga teme: Traži
Markiranje Štampanje RSS

amavisto
Nis

Član broj: 4256
Poruke: 18
*.ptt.yu

Jabber: amavisto@elitesecurity.org
ICQ: 85132898


Profil

icon linuxjournal23.10.2002. u 19:35 - pre 245 meseci
Casopis je linuxjournal. Arhiva svih brojeva se prodaje za 26$, i krenuh da je kupim al postarina izadje jos toliko otprilike :)

lm, svi brojevi su dostupni online. Link je: http://linuxjournal.com/article.php?sid=xxxx gde se xxxx menja od 0001 do nekih 6 hiljada (svi clanci iz 100 brojeva). Kako da ih skinem?

Da li moze wget i sa kojim opcijama? Ali samo da skida linkove sa http://linuxjournal.com/article.php?sid=****
 
Odgovor na temu

Dragoslav Krunić

Član broj: 225
Poruke: 1083
*.verat.net



Profil

icon Re: linuxjournal23.10.2002. u 20:56 - pre 245 meseci
Napraviš shell ili još bolje Perl skript koji ima petlju od 1 do n (gde je n max broj clanka) i koji u svakoj iteraciji skida članak čiji je redni broj jednak i. Po želji, sadržaj koji preuzmeš obrađuješ i smeštaš u neku bazu.
 
Odgovor na temu

random
Vladimir Vrzić
Beograd

Član broj: 85
Poruke: 3866
*.yubc.net

Sajt: www.last.fm/user/vrza


+4 Profil

icon Re: linuxjournal24.10.2002. u 02:21 - pre 245 meseci
wget ne može, ali curl može:

$ curl -O http://linuxjournal.com/article.php?sid=[0001-6999]
int rand(void);

Those who do not understand Unix are condemned to reinvent it, poorly.

Upali lampicu — koristi Jabber!
 
Odgovor na temu

Dragoslav Krunić

Član broj: 225
Poruke: 1083
217.26.67.*



Profil

icon Re: linuxjournal24.10.2002. u 09:41 - pre 245 meseci
Eto vidiš, za to nisam znao. Ali ako hoće da ih obrađuje i smešta samo tekst članka u neku bazu, onda je ono gore bolje rešenje. Hm...
 
Odgovor na temu

amavisto
Nis

Član broj: 4256
Poruke: 18
*.ptt.yu

Jabber: amavisto@elitesecurity.org
ICQ: 85132898


Profil

icon Re: linuxjournal24.10.2002. u 12:04 - pre 244 meseci
[quote]Ixqq:
Napraviš shell ili još bolje Perl ;) skript koji ima petlju od 1 do n (gde je n max broj clanka) i koji u svakoj iteraciji skida članak čiji je redni broj jednak
</quote>

Hm, a kako da napravim petlju koja broji od 0001 a ne 1?

 
Odgovor na temu

Dragoslav Krunić

Član broj: 225
Poruke: 1083
217.26.67.*



Profil

icon Re: linuxjournal24.10.2002. u 12:36 - pre 244 meseci
Pa lepo. Samo na trenutni broj dodaš onoliko nula koliko je dovoljno da taj broj (string) bude dužine 4 karaktera. Npr. u Perl-u:

Code:

#! /usr/bin/perl

$broj = 73; # uzimamo proizvoljan broj

while(length($broj)<4) #sve dok je duzina manja od 4 karaktera...
{
$broj = "0" . $broj; # ...dodaj nule ispred
}

print $broj; # voila!
 
Odgovor na temu

axez

Član broj: 1021
Poruke: 1388
*.nspoint.net



Profil

icon Re: linuxjournal24.10.2002. u 21:59 - pre 244 meseci
Ako neko skine sve te članke, jel može da stavi negde tarrball da se skine?
 
Odgovor na temu

Dragoslav Krunić

Član broj: 225
Poruke: 1083
*.verat.net



Profil

icon Re: linuxjournal24.10.2002. u 23:05 - pre 244 meseci
Evo, recimo, ti skineš i okačiš to negde. A, šta kažeš?
 
Odgovor na temu

axez

Član broj: 1021
Poruke: 1388
*.nspoint.net



Profil

icon Re: linuxjournal25.10.2002. u 13:35 - pre 244 meseci
Kažem da ima puno više ljudi sa stabilnijim i bržim vezama ka internetu nego ja te će oni to mnogo brže završiti.
 
Odgovor na temu

amavisto
Nis

Član broj: 4256
Poruke: 18
*.ptt.yu

Jabber: amavisto@elitesecurity.org
ICQ: 85132898


Profil

icon Re: linuxjournal25.10.2002. u 17:58 - pre 244 meseci
Citat:
axez:
Ako neko skine sve te članke, jel može da stavi negde tarrball da se skine?


Sudeci po velicini do sada skinutog, ceo linux journal ce biti oko 150MB (u html-u).
Kad bi se pobrisali svi nepotrebni tagovi + kompresija to bi moglo da se svede na
neku razumnu cifru za dl. Ja cu skinuti sve clanke, samo mi pomozite da
prvi deo odradim automatski (sed mozda?). Pogledajte jednu stranu.
Recimo od ove linije:

<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=ISO-8859-1">

moze da se brise sve do

<!-- END HEADER -->

To ukupno bude oko 230 linija, tj. preko 12KB. 6000 strana * 12KB = 72000KB
 
Odgovor na temu

Dragoslav Krunić

Član broj: 225
Poruke: 1083
*.verat.net



Profil

icon Re: linuxjournal25.10.2002. u 18:13 - pre 244 meseci
Pravljenje programa za skidanje je najmanji problem. Samo treba obratiti pažnju na to da LinuxJuornal možda blokira IP posle određenog broja zahteva, te zahteve treba ciklično slati kroz par različitih proxy-a. E sad, zaista treba neko sa bržom konekcijom da skida to... Ja zaista nisam imao pojma da je sve to ukupno toliko veliko.
 
Odgovor na temu

[es] :: Linux mreže :: linuxjournal

[ Pregleda: 2812 | Odgovora: 10 ] > FB > Twit

Postavi temu Odgovori

Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.