Paieškos priemonės Internete


Kaip veikia paieškos stotys?

Darbui su WWW yra naudojamos WWW naršyklės. Jos yra 2 tipų - grafinės ir tekstinės. Grafinės naršyklės (Netscape Navigator, Internet Explorer) aplinkoje galima atidaryti WWW dokumentus su tekstine, grafine, audio ir video informacija. Tekstinės naršyklės (Lynx) dirba tiktai tekstiniame režime. Ši naršyklė naudojama IBM, VAX ir UNIX šeimų kompiuteriuose.

Paieškos programos (Search engines). Pažodinis vertimas - paieškos variklis. Paieškos programos uždavinys yra naršyti po Internetą ir ieškoti vartotojo nurodytos informacijos. Paieškos programų objektai yra WWW dokumentai ir failai, į kuriuos yra ryšiai minėtuose dokumentuose. Paieškos programas galima suskirstyti į 2 pagrindines grupes - paieškos programos (Search engines) ir adresų katalogai (directories).

Paieškos programos (Search engines). Šio tipo programos dar vadinamos "vorais" (spiders). Toks pavadinimas panaudotas todėl, kad paieškos varikliai pastoviai lanko visas WWW vietas (sites) ir kuria WWW dokumentų katalogus(index). Tokiu būdu yra sukaupiamas milžiniškas dokumentų katalogas. Pagrindinis trūkumas yra tas, kad paieškos rezultate gauname daug nenaudingos informacijos - "šiukšlių".

Adresų katalogai (directories). Šio tipo programose WWW katalogas yra kuriamas ne automatiškai, o interaktyviai. Žmogaus dalyvavimas informacijos klasifikavimo procese sąlygoja tikslesnį informacijos paskirstymą. Paieškos rezultatai paprastai būna geresni negu "vorų" tipo programose. Pagrindinis trūkumas yra tas, kad paieška vykdoma tiktai tarp užregistruotų WWW dokumentų.

Mišrios paieškos programos. Šio tipo programose yra realizuota mišri paieška. Dalis WWW puslapių yra interaktyviai klasifikuota.

Kaip ieškoti?

Naudotis paieškos stotimi visai paprasta. Atvertus bet kurios stoties tinklalapį, matome užklausos laukelį. Jame parašykite reikiamus užklausos žodžius, nuspauskite mygtuką "Search", "Submit" arba "Seek" (užrašas įvairiose paieškos stotyse yra skirtingas ) ir po kelių sekundžių pasirodys tinklalapis su paieškos rezultatais.

Kaip formuoti užklausą?

Užklausas reikia formuoti pagal tam tikras taisykles. Nors kiekvienai sistemai taikomos skirtingos taisyklės, bet yra ir bendrų bruožų.
Užklausa sudaroma iš raktinių žodžių ("keywords"). Tai turėtų būti specifiniai žodžiai, kurie labiausiai tikėtini tik jus dominančiuose tinklalapiuose. Pavyzdžiui, ieškant informacijos apie kompiuterio klaviatūros tvarkykles ("keyboard driver"), tinkami raktiniai žodžiai būtų "keyboard", "driver", "device", "software". Jei žinoma kokios firmos tvarkyklė gali būti, reikėtų į užklausą įtraukti ir jos pavadinimą. Didžiąsias raides naudokite tik tada, kai žodyje jos visada turi būti didžiosios, nes kai kurios paieškos stotys, radusios didžiąją raidę, ieškos tiktai tiksliai taip parašytų žodžių.
Užklausoje esančių žodžių tvarka taip pat svarbi, nes kai kurios sistemos laiko svarbesniais tuos žodžius, kurie užklausoje yra pirmieji. Žodžių tvarka, galbūt, neturės įtakos rastų puslapių skaičiui, tačiau gali nulemti jų rikiavimo tvarką. Tai svarbu, nes dažnai paieškos rezultatas - keli tūkstančiai interneto adresų, tarp kurių yra tik keli tinkami.

Kaip rikiuojami paieškos rezultatai?

Paieškos sistema automatiškai rūšiuoja siunčiamus rezultatus taip, kad tinkamiausi dokumentai būtų pirmiausi. Dažnai nesvarbu, ar gauname 200 ar 2 000 000 dokumentų, atitinkančius norimus kriterijus - tinkamiausius iš jų randame pirmuose dviejuose puslapiuose. Jei nerandate reikalingos informacijos pirmuosiuose puslapiuose, patikslinkite paieškos programai duotus nurodymus.
Rezultatų puslapyje pateikiamas rastų tinklalapių sąrašas su trumpais aprašymais. Sąraše pateikiamos tinklalapių antraštės ir adresai. Pagal aprašymus ir antraštes, galima nuspręsti, ar tinklalapis tinkamas.

Paieškos stočių apžvalga

Internete yra daugybė paieškos stočių. Visos jos dirba šiek tiek skirtingai bei yra nuolatos tobulinamos, todėl tiksliai pasakyti, kuri geriausia, neįmanoma. Šiame skyrelyje apžvelgtos didžiausios bei dažniausiai naudojamos sistemos. Apžvalgoje paminėtos tik svarbiausios sistemų savybės ir galimybės, smulkiau apie jas galima paskaityti pačių paieškos sistemų pagalbos tinklalapiuose. Kai kurių paieškos sistemų adresai pateikti lentelėje.
Gerus paieškos rezultatus galima gauti tik teisingai suformulavus užklausą. Pradėkite nuo užklausos su specifiniais raktiniais žodžiais, o jei tinkamų puslapių neradote, tai pakartokite užklausą su bendresniais žodžiais. Daugiau raktinių žodžių užklausoje gali labai padidinti rezultatų skaičių, tačiau nereikia to išsigąsti, nes rezultatai rikiuojami pagal tinkamumą. Svarbesnius raktinius žodžius įrašykite užklausos pradžioje, frazes - tarp kabučių. Ženklų + ir - prieš žodžius naudojimas gali labai pagerinti rezultatus.
Jeigu tarp pirmųjų dešimties ar dvidešimties sąraše pateiktų tinklalapių neradote tinkamų, tai toliau rezultatų tikrinti neverta. Geriau suformuluokite naują tikslesnę užklausą ir ieškokite dar kartą arba pasirinkite kitą paieškos stotį. Žinokite, kad gali tekti pasinaudoti keliomis stotimis, nes nėra užklausos formavimo būdo, kuris visada užtikrintų gerus rezultatus.
Kai kurių stočių užklausose galima naudoti specialiuosius žodžius: url, title, host. damain arba site. Pavyzdžiui, stotis AltaVista "supranta" šiuos visus specialiuosius žodžius, o Infoseek - tik - title, site, HotBot - domain, title,url. Jeigu užklausa bus url:online, tai stotys ras tuos tinklalapius, kurių adresuose yra žodis "online", pavyzdžiui, http://www.online.lt.
Visada reikia prisiminti, kad tik pateikus gerai suformuluotą užklausą, galima tikėtis gerų rezultatų.

Search.lt
(http://www.search.lt)
Search.lt yra bendro pobūdžio bei specializuotos informacijos paieškos sistema Internete, turinti puslapių katalogą. Paieška veikia lietuvių, anglų ir rusų kalbomis. Lietuviškoje jos dalyje Search.lt pateikia dviejų tipų informaciją. Pirmas tipas - tai teminis puslapių katalogas. Čia rasite nuorodas į daugelį, vienaip ar kitaip su Lietuva susijusių, tinklalapių bei pavienių puslapių, suskirstytų į patogias, vartotojui ieškant reikiamos informacijos, kategorijas. Puslapių sąrašas nuolat tikrinamas ir atnaujinamas. Antras tipas - lietuviškų puslapių indeksas. Čia įrašyti  žodžiai bei kriterijai bus ieškomi visuose žinomuose lietuviškuose puslapiuose. Serveriai dirba visą savaitę, atnaujindami bazę. Veikia paprasta ir išplėsta paieška. Išplėsta paieška nevykdoma puslapių kataloge, tik pačiuose puslapiuose. Paieškos parametrai nurodomi naudojant sintaksę. Norint rasti frazę, ją reikia rašyti tarp kabučių, pavyzdžiui: "technologijos universitetas". "+" ženklas prieš žodį reiškia, jog reikia rasti dokumentus, kuriuose tas žodis yra,  "-" ženklas - kuriuose to žodžio nėra. Paprastai jungiami keli žodžiai, pvz.: +šuo -katė. Prie žodžio šaknies prirašius žvaigždutę (*), bus rasti žodžiai su įvairiomis galūnėmis, pvz. užrašius žurnal*, bus rasti dokumentai, kuriuose yra: žurnalas, žurnalai ir t.t. Daugiau informacijos galima rasti adresu: http://www.search.lt/help.asp?lang=L.

AltaVista
http://www.altavista.digital.com

Altavista buvo pirmoji ir gerai žinoma globaliosios paieškos sistema. Tai viena iš geriausių ir pakankamai greitų paieškos sistemų.  Joje paiešką galima atlikti įvairiomis pasaulio kalbomis, tame tarpe ir lietuvių. Altavista siūlo du paieškos modelius - paprastą ir sudėtingą. Paprastame naudojami ženklai "+" ir "-", o sudėtingame Būlio logikos AND, OR ir NOT operacijas. Jei žodis būtinai turi būti tinklalapyje, tai prieš jį dėkite ženklą "+", pavyzdžiui, +chemija. Jei žodžio neturi būti tinklalapyje, tai prieš jį dėkite ženklą "-", pavyzdžiui, -radijacija. Užklausos raktiniai žodžiai nagrinėjami po vieną, bet jei norite surasti frazę, tai ją užrašykite tarp kabučių. Galite nurodyti nepilną žodį, o vietoj trūkstamų raidžių įrašyti žvaigždutės simbolį "*". Tai naudojama, kai reikia rasti keletą žodžio formų, besiskiriančių galūne.

Excite
http://www.excite.com

Atliekant paiešką Excite, randamas puslapis, kuriame yra ieškomi žodžiai, net jeigu tikslių atitikmenų tame puslapyje nėra. Tai tarsi nuorodų paieška, atliekama su sinonimų žodynu. Pavyzdžiui, jei užklausoje yra žodžiai "pagyvenę žmonės", tai Excite ras ir tinklalapius, kuriuose yra žodžiai "vyresniojo amžiaus piliečiai". Tai veikia tik tada, kai užklausoje yra angliški žodžiai.
Kaip ir AltaVista stotyje, galima naudoti "+", "-" ir kt. operatoriai. Taip pat galima kabutėmis nurodyti frazes. Excite užklausoje negalima rašyti sutrumpintų žodžių, todėl jei norite, kad būtų rastos kelios vieno žodžio formos, turite jas visas išvardinti. Tai ir yra trūkumas, nes išvardijus visas žodžio formas, paieškos sistema mano, kad kiti žodžiai mažiau svarbūs, ir tai pakeičia rezultatų rikiavimo tvarką.

Infoseek
http://www.infoseek.com
Infoseek naudojama tik anglų kalba suformuluota užklausa. Taip pat galima naudoti "+" arba "-" prieš žodžius, jei norite, kad rastame tinklalapyje jie būtinai pasitaikytų arba kad jų nebūtų. Frazes nurodykite tarp kabučių. Galima naudoti žvaigždutę (*) nepilniems žodžiams nurodyti. Nenaudojama Būlio logikos operacijos. Infoseek rezultatus išdėsto pagal relevantiškumą (pagal tai, kurioje dokumento vietoje yra užklausoje pateikti terminai ir pagal tai, kaip dažnai tie terminai pasikartoja).

Kas yra metapaieškos priemonės?
Dar vienas būdas ieškoti informacijos Web'e - metapaieškos priemonės - metaindeksai, kurie leidžia vienu metu ieškoti įvairiose paieškos sistemose. Tačiau ši idėja dar nėra iki galo įgyvendinta - kai kurios paieškos stotys gali apklausti daugelį duomenų bazių, bet tik po vieną tuo pačiu metu. Nereikia pamiršti, kad metaindeksai negali turėti visų privalumų, kuriuos turi atskiros paieškos sistemos. Metapaieškos priemonės labiau tinka paprastoms užklausoms, norint greitai gauti rezultatų.

Metapaieškos stotys

SavvySearch
(http://www.savvysearch.com/)
Viena iš geresnių metapaieškos stočių - SavvySearch. Ši stotis gali vienu metu atlikti paiešką penkiose duomenų bazėse. Rezultatai pateikiami viename puslapyje, pasikartojanti informacija yra išmetama. Paieškos planui sukurti   SavvySearch naudoja paieškos terminus ir duomenis apie buvusias paieškas. Stotis sugrupuoja ir palygina net 21 paieškos priemonę, nustato jų naudingumo koeficientą konkrečiai paieškai. Lygiagrečiai galima atlikti papildomas paieškas. SavvySearch neieško šiose paieškos sistemose: AltaVista, Infoseek ir HotBot.

Ixquick
(http://www.ixquick.com/)
Ixquick paieškos sistema, kuri vienu metu atlieka paiešką iš 12 paieškos sistemų (Altavista, Yahoo, Go to, EuroSeek ir kt.), pašalindama pasikartojimus.

Paieškos stotys Lietuvoje ir pasaulyje


Turinys