Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.

Text search koncept za Win Forms u C#-u

[es] :: .NET :: .NET Desktop razvoj :: Text search koncept za Win Forms u C#-u

[ Pregleda: 2457 | Odgovora: 9 ] > FB > Twit

Postavi temu Odgovori

Autor

Pretraga teme: Traži
Markiranje Štampanje RSS

erkan
Sarajevo

Član broj: 12339
Poruke: 267
*.bstelecom.ba.

ICQ: 238530669


Profil

icon Text search koncept za Win Forms u C#-u15.08.2005. u 09:25 - pre 226 meseci
Pozdrav svima,
radi se o sljedecem:
- postoji veliki broj textualnih fajlova (svaki sa naslovom) sa po oko 1000 znakova, otprilike;
- Broj fajlova je nekoliko desetina hiljada!!
Korisnik bi trebao ukucati neku rijec na osnovu koje ce se izbaciti lista
NASLOVA teksta (tj. fajla) koji sadrzi tu rijec (ili je ta rijec dio rijeci iz teksta).

Zanima me koncept po kom se to moze uraditi a da radi najbrze.
Dakle, ne treba mi gotovo rjesenje vec ideja ili prijedlog.
Da li je mozda bolje sve prebaciti i u jedan fajl a naslove nekako indeksirati, ili
koristiti bazu (prebaciti sve u bazu, mozda malo glupo, ali eto, i ta mogucnost postoji),
ili nesto trece, cetvrto...

Aplikacija bi trebala biti u C#-u




[Ovu poruku je menjao erkan dana 16.08.2005. u 10:28 GMT+1]

[Ovu poruku je menjao erkan dana 16.08.2005. u 10:28 GMT+1]
Samo se budala saplice na kamen iza sebe.
 
Odgovor na temu

spartak

Član broj: 5625
Poruke: 631
*.dialup.sezampro.yu.



+3 Profil

icon Re: Text search koncept za Win Forms u C#-u15.08.2005. u 12:05 - pre 226 meseci
Google-aj malo i naci ces par odlicnih open source resenja koji indeksiraju word, excel a mislim i pdf fajlove i omogucavaju ti da sve pumpas u bazu.

Mislim da je najsrecnije resenje za tebe da invoke-ujes taj third party paket svaki put kada se doda novi fajl ili izmeni postojeci, on onda asinhrono (u odnosu na tvoju aplikaciju) odradi indeksiranje i punjenje reci u bazu.

Naravno logiku da se prikaze naslov ili sta si vec hteo, vezan za tekst u kojem su pronadjene te reci treba da implementiras u svojoj (C# kako si rekao) aplikaciji.
 
Odgovor na temu

adnan78
Adnan Strujic
Software Engineer/System Architect
SCG

Član broj: 27187
Poruke: 55
*.yubc.net.

ICQ: 17136266


Profil

icon Re: Text search koncept za Win Forms u C#-u16.08.2005. u 02:15 - pre 226 meseci
Ja bih se manuo tih open source resenja i baze...
Vjerovatno si cuo za Google Desktop Search . Koliko sam shvatio ti treba da indexiras i sadrzaj fajlova... Prema tome idealna situacija da primjenis Google Desktop Search SDK Ne vjerujem da mozes napraviti nesto sto radi brze

http://desktop.google.com/developer.html

Nisam siguran koliko je "otvoren" SDK, ali definitivno vrijedi pokusati. Svidja mi se problem. Cim budem imao vremena probacu da iskoristim SDK!

Kao alternativu, u slucaju da google SDK nije dovoljno "otvoren", predlozio bih ti da iskoristis Microsoft Indexing Service.

http://www.codeguru.com/Csharp...a/searching/article.php/c9813/

Evo primjera problema kojeg mozes imati a kome je tesko uci u trag kada koristis indexing service...
Cim se promijeni file, indexing service indexira file, i u tom trenutku je lock-ovan. kad bildujes svoju aplikaciju, nekada se desi da Visual Studio pokusava da napravi izmjenu na fajlu, dok je file lock-ovan, pa ti aplikacija moze puci. Naravno ovo se samo desava kad razvijas i cesto bildujes na masini na kojoj se nalazi pokrenut indexing service za citav HDD, ili za recimo inetpub folder (mislim da je po defaultu ukljucen za inetpub kad se instalira...hm... nisam siguran provjeri)... Tako da bi trebao da indexiras samo neopodne stvari, a sve ostale indexe da pogasis.

Indexing service je super stvar samo zahtjeva da se uradi fine tuning, da bi sve proradilo kako treba, i da bi dobio optimalne performanse....

Probaj prvo sa Google-ovim SDK za desktop search ako imas vremena, to definitivno vrijedi probati, pa posalji iskustva, vec dugo se zanimam za to, al nikako da nadjem malo vremena da probam

Nadam se da sam pomogao...

Pozdrav,

[Ovu poruku je menjao adnan78 dana 16.08.2005. u 03:19 GMT+1]

[Ovu poruku je menjao adnan78 dana 16.08.2005. u 03:20 GMT+1]
 
Odgovor na temu

erkan
Sarajevo

Član broj: 12339
Poruke: 267
*.bstelecom.ba.

ICQ: 238530669


Profil

icon Re: Text search koncept za Win Forms u C#-u16.08.2005. u 07:40 - pre 226 meseci
Hvala obojici.
Zanimljivo je to sa Google SDK, vjerovatno cu probati ako ne uspije ovo sto sad
pokusavam (mada, trenutno radim na nekom drugom projektu a za ovaj - kad imam vremena), znaci malo sam juce citao o B tree algoritmu pa cu pokusati nesto. Kako god, bilo sta da uradim, poslacu ovdje, mozda se neko i okoristi. A ako neko ima jos neku
ideju ili primjer - ne bi bilo lose.
Pozdrav!
Samo se budala saplice na kamen iza sebe.
 
Odgovor na temu

spartak

Član broj: 5625
Poruke: 631
*.ppp-bg.sezampro.yu.



+3 Profil

icon Re: Text search koncept za Win Forms u C#-u16.08.2005. u 08:02 - pre 226 meseci
E ovo cu i ja definitivno probati! Adnane hvala.
 
Odgovor na temu

jablan

Član broj: 8286
Poruke: 4541



+710 Profil

icon Re: Text search koncept za Win Forms u C#-u16.08.2005. u 08:27 - pre 226 meseci
Citat:
erkan: malo sam juce citao o B tree algoritmu pa cu pokusati nesto

Ček ček malo... Momci su ti dali odgovor(e) za slučaj da hoćeš da pišeš aplikaciju koja, između ostalog, pretražuje fajlove. "Čitanje o B stablima" ukazuje da želiš da razvijaš endžin za pretragu, a ne da koristiš neki od postojećih, a to su dve potpuno različite stvari.

Uzgred, ne bih da te demorališem, ali mala je verovatnoća da možeš da napraviš search engine koji može da u bilo kom smislu parira Majkrosoftu i Guglu.

[Ovu poruku je menjao jablan dana 16.08.2005. u 09:28 GMT+1]
 
Odgovor na temu

erkan
Sarajevo

Član broj: 12339
Poruke: 267
*.bstelecom.ba.

ICQ: 238530669


Profil

icon Re: Text search koncept za Win Forms u C#-u16.08.2005. u 08:47 - pre 226 meseci
Pa, u principu ne volim da koristim 'sasvim' gotove stvari,
radije bih da sam napravim nesto a to je i prilika da malo pogledam stvari
koje ne poznajem dobro (dakle, nesto se nauci).
Mada sam u postu (na vrhu) naglasio da ne zelim gotovo rjesenje
(sad sam izmjenio post gore - boldirao i zacrvenio)
Naravno, ni ne pomisljam da to moze biti blizu Google-u ili MS-u.
Dakle, interna upotreba. Zadovoljstvo pricinjava kada aktivno koristis
prilicno korisnu stvar koju sam napravis.



[Ovu poruku je menjao erkan dana 16.08.2005. u 10:30 GMT+1]
Samo se budala saplice na kamen iza sebe.
 
Odgovor na temu

spartak

Član broj: 5625
Poruke: 631
*.dialup.sezampro.yu.



+3 Profil

icon Re: Text search koncept za Win Forms u C#-u16.08.2005. u 10:13 - pre 226 meseci
Ovo sto cu reci je off topic, ali izgleda da imas visak vremena :-)

Kad je nesto SDK definitivno nije gotovo resenje. Veruj mi da ces i za onakav pristup koji sam ti predlozio pokoju kap znoja da iskapljes.

U prosloj firmi gde sam radio, kolega je uradio takav sistem - i bilo je sve samo ne "koristim gotovo".
 
Odgovor na temu

erkan
Sarajevo

Član broj: 12339
Poruke: 267
*.bstelecom.ba.

ICQ: 238530669


Profil

icon Re: Text search koncept za Win Forms u C#-u16.08.2005. u 10:26 - pre 226 meseci
Hvala na savjetu, ipak,
nemam visak vremena, samo mi se ne zuri da napravim stvar
pa volim na tenane da malo procackam po teoriji i algoritmima
o kojima sam ranije znao malo ili nimalo

[Ovu poruku je menjao erkan dana 16.08.2005. u 11:28 GMT+1]
Samo se budala saplice na kamen iza sebe.
 
Odgovor na temu

ivan74
Beogad

Član broj: 59230
Poruke: 80
*.uzzpro.sr.gov.yu.



Profil

icon Re: Text search koncept za Win Forms u C#-u16.08.2005. u 10:30 - pre 226 meseci
Ja sam pre mesec dana zavrsio jednu aplikaciju koja radi sa Indexing service.
IS je na serveru i indeksira sve share foldere na mrezi (30 racunara) i tu ima oko 10.000 fajlova (office dokumenti i slike ) nije bilo mnogo tesko i radi prilicno dobro.
Problem je sto s vremena na vreme jednostavno nece da vrati nista, dok u tom trenutku ako direktno u IS sa servera napravim upit on radi normalno. Posto smo koleginica i ja to uradili vise iz zezanja i dosade nismo se mnogo upustali u to zasto se to desava, ako se to izuzme sve je Super!!
 
Odgovor na temu

[es] :: .NET :: .NET Desktop razvoj :: Text search koncept za Win Forms u C#-u

[ Pregleda: 2457 | Odgovora: 9 ] > FB > Twit

Postavi temu Odgovori

Navigacija
Lista poslednjih: 16, 32, 64, 128 poruka.