Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.

Ogromna PDF baza

[es] :: IT berza poslova :: Arhiva IT berze poslova :: Ogromna PDF baza

Strane: 1 2

[ Pregleda: 9072 | Odgovora: 27 ] > FB > Twit

Postavi temu Odgovori

Autor

Pretraga teme: Traži
Markiranje Štampanje RSS

popeye
Branko Ivanović
Beograd

Član broj: 3846
Poruke: 960
*.pristop.co.yu

Jabber: popeye@elitesecurity.org
ICQ: 18038966
Sajt: popeye.linuxo.org


Profil

icon Re: Ogromna PDF baza15.09.2004. u 23:28 - pre 238 meseci
Citat:
broker: Mislim da je pocetni zahtev da se svi brojevi unazad 40 godina pretvore u tekst radi pretrazivanja preteran i ekonomski neisplativ.


Ništa posebno, isti obim je i raditi 40 medija za godinu dana.
 
Odgovor na temu

jablan

Član broj: 8286
Poruke: 4541



+711 Profil

icon Re: Ogromna PDF baza16.09.2004. u 07:55 - pre 238 meseci
Na stranu problemi sa OCR-om, što se indeksiranja tiče nema problema jer stvarno nije velika količina podataka.

Ko je uopšte rekao da treba da se indeksiraju PDF-ovi? Indeksira se valjda tekst koji se u njima nalazi. Na stranici sumnjam da ima više od par kilobajta suvog teksta (ajde recimo 5). 5(k) * 40(strana) * 365(dana) * 40(godina) izađe oko 3 gigabajta. Sa tim bi čak i prosečan PC mogao da izađe na kraj.

PDFovi se čuvaju odvojeno i koriste samo za prikazivanje.
 
Odgovor na temu

djolep
Beograd

Član broj: 10598
Poruke: 739



+53 Profil

icon Re: Ogromna PDF baza16.09.2004. u 09:23 - pre 238 meseci
Citat:
broker:Mozda bi bilo zadovoljavajuce cuvati bitmapirane skenove a pored njih praviti bazu kljucnih reci za svaku stranu. Kljucne reci bi odredjivao neko ko je upucen u njihovu vaznost (urednik?)

Taj bi morao da pregleda 40*365*40=569.600 strana

 
Odgovor na temu

dr ZiDoo
Banja Luka

Član broj: 189
Poruke: 1728
*.teleklik.net.

Jabber: ZiDoo@elitesecurity.org
ICQ: 299539598
Sajt: zidoo.geek.rs.ba


Profil

icon Re: Ogromna PDF baza16.09.2004. u 11:36 - pre 238 meseci
Jeste vi meni likovi, ne znam zašto ste zapeli toliko za ta skeniranja. To je veliki projekat a ta skeniranja kada se rade ne rade se na jednom skeneru sa jednim čovjekom nego se za relativno sitne pare iznajme ljudi, honorarno, studenti, djaci, koji to izskeniraju za 1-2 mjeseca.

Nisam nikada radio ništa slično, ali mislim da prijekat nije težak 10 miliona dinara.
Sada je pitanje kako su zamislili arhiviranje toga, pretraživanje etc.
tu nema kašike....
 
Odgovor na temu

flylord
Ilić Aleksandar
Simplicity d.o.o.
Nis/Uzice

Član broj: 2954
Poruke: 3859
*.smdesign.co.yu

ICQ: 4849714


+68 Profil

icon Re: Ogromna PDF baza16.09.2004. u 11:50 - pre 238 meseci
Za sve postoji programi koji to rade!!! I za indeksiranje, i za pretrazivanje, i za skeniranje... Ne koriste se obicni skeneri, za OCR se ne koristi FineReader koji vi znate nego nesto drugacije...
A cena.. Prava sitnica: Posto su trazili i hardware i software, recimo da ce samo 1 skener i 2-3 programcica koji moraju da se koriste da ih kostaju izmedju 900 000 - 2 500 000 dinara. I to je neka minimalna cifra. Za sve ostalo, ko zna sta je sve potrebno neka se javi ljudima i poprica sa njima kao sto cu ja da uradim, ko ne zna, e pa sta cu, nek se raspita.
poz
 
Odgovor na temu

zsteva

Član broj: 503
Poruke: 31
*.smin.sezampro.yu.

ICQ: 26239191


Profil

icon Re: Ogromna PDF baza16.09.2004. u 13:07 - pre 238 meseci
Citat:
flylord: Za sve postoji programi koji to rade!!! I za indeksiranje, i za pretrazivanje, i za skeniranje... Ne koriste se obicni skeneri, za OCR se ne koristi FineReader koji vi znate nego nesto drugacije...
A cena.. Prava sitnica: Posto su trazili i hardware i software, recimo da ce samo 1 skener i 2-3 programcica koji moraju da se koriste da ih kostaju izmedju 900 000 - 2 500 000 dinara. I to je neka minimalna cifra. Za sve ostalo, ko zna sta je sve potrebno neka se javi ljudima i poprica sa njima kao sto cu ja da uradim, ko ne zna, e pa sta cu, nek se raspita.
poz


da ponovim josh jednom ;) kad posao bude gotov, a ja ti zelim sve najbolje,
a po najvishe razspolozenost poslodavca da plati poduhvat; ti napravi kratak dokumentarac
o samom poslu, bilo bi vrlo edukativno, a mozda i vrlo profitabilno za kasnije
poslove slicnog tipa. A posle toga mozesh da se okomish na razne knjige i slicno koje
leze po bibliotekama.



 
Odgovor na temu

madamov
Milan Adamov
vlasnik
Adamov Konsultacije d.o.o.
Beograd, Srbija

SuperModerator
Član broj: 21939
Poruke: 4413
*.nat-pool.bgd.sbb.co.yu

Sajt: www.adamov.rs


+138 Profil

icon Re: Ogromna PDF baza16.09.2004. u 13:33 - pre 238 meseci
Ovo može da se uradi, ali je skupo. Štaviše, neko je to već uradio u Beogradu, doduše ne baš kompletan OCR svega jer je reč o ćirličnim izdanjima. Najbolje rešenje za ovo je Acrobat Capture u saradnji sa brzim skenerom. On odmah skenira u PDF, ili već skenirani TIFF pretvara u PDF, pri tome OCR-ujući šta treba.

Deo ovog posla je uradio Pedja Milin iz Službenog Lista SCG, javi mi se privatnom porukom da ti dam njegov broj telefona na poslu. Naime, Pedja je prebacio sve Službene listove od 1945. na ovamo u PDF i Službeni list prodaje to na CD-ima.
 Certified Trainer Mojave 101 macOS Support Essentials 10.14
http://www.adamov.co.rs http://milan.adamov.rs http://www.infinitum.rs
 
Odgovor na temu

triD
Bojan Radulovic
Beograd

Član broj: 28379
Poruke: 7
62.108.111.*

Sajt: www.studiotrid.com


Profil

icon Re: Ogromna PDF baza17.09.2004. u 16:15 - pre 238 meseci
Rešio sam problem tako što sam našao firmu koja se profesionalno bavi arhiviranjem, hvala svima na sugestijama!
triD - dizajn studio
Krunska 46
011.32.42.899
www.studiotrid.com
[email protected]
 
Odgovor na temu

[es] :: IT berza poslova :: Arhiva IT berze poslova :: Ogromna PDF baza

Strane: 1 2

[ Pregleda: 9072 | Odgovora: 27 ] > FB > Twit

Postavi temu Odgovori

Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.