Motor de căutare

De la Wikipedia, enciclopedia liberă
Salt la: Navigare, căutare

Un motor de căutare este un apelabil program căutător, care accesează Internetul în mod automat și frecvent și care stochează titlul, cuvinte cheie și, parțial, chiar conținutul paginilor web într-o bază de date. În momentul în care un utilizator apelează la un motor de căutare pentru a găsi o informație, o anumită frază sau un cuvânt, motorul de căutare se va uita în această bază de date și, în funcție de anumite criterii de prioritate, va crea și afișa o listă de rezultate (engleză: hit list ).

Problema nu este de loc trivială, deoarece:

  • există deja peste 100 milioane de situri web, sumând în total miliarde de pagini web, distribuite pe tot globul
  • conținutul acestori pagini nu este static, ci chiar extrem de dinamic (se schimbă frecvent)
  • răspunsul la o comandă de căutare trebuie să vină repede, în general în mai puțin de o jumătate de secundă, chiar atunci când lista de rezultate conține, să zicem, zeci de mii de pagini web potrivite la criteriile de căutare folosite.

Exemple[modificare | modificare sursă]

Cele mai utilizate motoare de căutare în iulie 2011 sunt[1]:

Motor de căutare Cotă de piață
Google 82,7%
Yahoo! 6,5%
Baidu 4,7%
Bing 3,7%
Ask 0,5%
Aol 0,4%
Excite 0,0%

Pentru crearea acestor motoare de căutare este necesar un spider (bot, spider, crawler) care este realizat într-un limbaj care poate fi Perl, Ruby, Java, Php. Acesta extrage linkurile utile. Apoi aceste linkuri se găsesc într-o formă prelucrată și filtrată prin metode specifice într-o bază de date.

Istoria motoarelor de cautare[modificare | modificare sursă]

Excite[modificare | modificare sursă]

A fost creat în 1993 de cinci studenți (Graham Spencer, Joe Kraus, Ben Lutch, Mark Van Haren, Ryan McIntyre și Martin Reinfried) la Universitatea Stanford,California în cadrul unui proiect de curs denumit Architext Software. Devenit Excite, acesta a falimentat în 2001. În prezent 3 dintre fondatori sunt angajați Google, 2 sunt întreprinzători particulari iar ultimul este specializat în jocuri pe calculator.

Yahoo – Yet Another Hierarchical Officious Oracle[modificare | modificare sursă]

A fost creat în 1994 (din nou) în campusul Universității Stanford, California de doi studenți (David Filo and Jerry Yang), inițial pentru a putea ține evidența link-urilor WWW cu informații folosite pentru elaborarea lucrării de doctorat. A fost lansat la început sub denumirea de “Jerry and David’s Guide to the World Wide Web” însă a fost redenumit ulterior YAHOO acronim pentru (Yet Another Hierarchical Officious Oracle). Vestea s-a răspândit pe www, astfel încât, în toamna lui 1994 site-ul a fost accesat într-o singură zi de 100.000 de vizitatori. În 1995 s-a fondat Yahoo! Inc. care a ajuns astăzi să fie accesat lunar de peste 350 milioane de utilizatori, fiind al doilea motor de căutare după Google.

Altavista – A view from above[modificare | modificare sursă]

La pătrunderea internetului pe scară largă în România, undeva în anul 1996, cel mai utilizat motor de căutare era Altavista. Lansat pe 15 Decembrie 1995, de către cercetătorii de la Digital Equipment Corporation’s Western Research Laboratory din Palo Alto, California, a furnizat din prima clipă o bază de date indexabilă ce conținea peste 16 milioane de documente. La sfârșitul zilei de 15 Decembrie 1995, peste 300.000 de utilizatori vizitaseră pagina Altavista. După primul an de funcționare Altavista servea peste 19 milioane de cereri de căutare zilnic. Pe parcursul timpului Altavista a patentat foarte multe idei cu privire la căutarea pe INTERNET. În 2003 Altavista a fost achiziționată de Ouverture pentru 140 de milioane de dolari. La sfârșitul lui 2003, Yahoo a cumpărat Ouverture, astfel încât Altavista a sfârșit prin a avea “motorizare” Yahoo.

Hotbot[modificare | modificare sursă]

Lansat în Mai 1996 de către Wired Magazine, HotBot a devenit în scurt timp un motor de căutare apreciat care avea în spate bazele de date Inktomi, LookSmart și din 1999 Open Directory. Lycos a achiziționat HotBoot în 1998 și pentru patru ani a aplicat tehnici greșite de marketing și de promovare care au dus compania aproape de faliment. Din 2002 a fost relansat iar în prezent oferă informații pe baza bazelor de date deținute de Google și Ask Jeeves (Teoma) – “motorizare” Google..

Google[modificare | modificare sursă]

Domeniul google.com a fost înregistrat pe 14 Septembrie 1997 de Larry Page și Sergey Brin, doi studenți, atenție tot la Universitatea Stanford,California. Aceștia au avut ideea în 1996 în cadrul unui proiect, să indexeze paginile de INTERNET nu după numărul de apariții al termenului de căutare în conținutul lor, ci după numărul de legături spre acea pagină provenite de pe alte pagini WWW. Acest lucru, stă de fapt la baza algoritmului PageRank – algoritmul de căutare al Google. Pe baza acestui algoritm, fiecare pagină web poate avea un anumit rang cuprins între 0 (minim) și 10 (maxim). Cu cât rangul este mai mare, cu atât aceasta apare mai repede la o căutare pe WWW. Google Corporation a fost fondată în 1998 și în decurs de 13 ani a ajuns cel mai cunoscut motor de căutare de pe WWW.

Bing[modificare | modificare sursă]

Proprietate a gigantului Microsoft, Bing a fost lansat de către CEO Microsoft, Steve Ballmer pe 28 Mai 2009. Bing a fost mai întâi Live Search după care a fost redenumit MSN Search pentru ca apoi sa devină Windows Live Search. MSN Search a fost lansat în 1998 și a depins până în 1999 de baza de date Inktomi. Din 1999 a avut “motorizare” Altavista. Începând din 2006, MSN Search a devenit Windows Live Search cu “motorizare” Microsoft. În 2009 Yahoo și Bing au încheiat un acord pe 10 ani prin care Yahoo urmează să își schimbe motorizarea astfel încât aceasta să devină Microsoft. În schimbul acestui acord, Yahoo obține 88 % din toată publicitatea pentru primii 5 ani.

La momentul actual, dupa cum am prezentat mai sus, toate căutările pe WWW sunt motorizate de Google, Yahoo si Microsoft, primele doua tehnologii fiind apărute la Standford University – California.

Note[modificare | modificare sursă]