Deep Web

De la Wikipedia, enciclopedia liberă
Salt la: Navigare, căutare

Deep Web (în traducere aproximativă „internetul în profunzime”) numit și Deepnet, Invisible Web, Undernet sau Hidden Web, este conținut al World Wide Web. Deep Web nu face parte a Internetului superficial (Surface Web), care este indexat de motoarele de căutare standard. El nu trebuie confundat cu dark Internet, sau cu rețeaua de găzduire și distribuție de fișiere Darknet. Există îngrijorarea că darknet poate fi utilizat pentru activități criminale destul de serioase.[1]

Majoritatea informației din internet este ascunsă în site-uri generate dinamic, și astfel motoarele de căutare tradiționale nu o pot găsi. În 2001, deep Web era de câteva zeci de ori mai voluminos decât internetul superficial.[2]

Mărimea[modificare | modificare sursă]

Estimările unui studiu realizat la Universitatea Berkeley din California în 2001,[2] indicau că deep Web constă din aproape 7,5 petabyte. Alte estimări indicau că în 2004 existau în jur de 300.000 de site-uri web în deep web,[3] iar, conform lui Șestakov, circa 14.000 de site-uri deep web existau în spațiul rusesc din internet în 2006.[4]

Resurse Deep Web[modificare | modificare sursă]

Metodele care împiedică paginile web să fie indexate de motoarele de căutare tradiționale pot fi clasificate în mai multe categorii:

  • pagini cu conținut dinamic: pagini dinamice care apar ca răspuns la un anumit tip de căutare sau care sunt accesate prin formulare web (câmpuri de text)
  • pagini care nu sunt legate de altele prin link-uri
  • web privat: pagini care necesită un nume de utilizator și parolă
  • web contextual: pagini al căror conținut variază în funcție de contextul în care sunt accesate (clasa de adresă IP, sau secvența de navigare precedentă).
  • pagini cu conținut limitat: pagini cu acces limitat tehnic (folosesc programe care împiedică sau chiar exclud accesul roboților de căutare și motoarelor de căutare să le indexeze și să creeze copii cache); pentru aceasta, robotul utilizează un fișier text (robots.txt) aflat în rădăcina site-ului care poate permite sau restricționa roboții motoarelor de căutare să acceseze paginile site-ului
  • conținut scriptat: pagini ce sunt accesibile doar prin link-uri de JavaScript, dar și alte conținuturi dinamice descărcate de pe serverele web
  • conținut non-HTML/text: conținut textual codat în fișiere multimedia sau alte formate specifice ce nu sunt suportate de motoarele de căutare. [5]

Motoare de căutare în Deep Web[modificare | modificare sursă]

  • Infomine: a fost realizat de mai multe biblioteci din S.U.A.; informații din baze de date, jurnale electronice, cărți electronice, buletine de știri, liste de mail, cataloage online, articole și alte resurse.
  • The WWW Virtual Library: considerat a fi cel mai vechi catalog web
  • Intute: motor de căutare care indexează site-urile unor universitati prestigioase, ce oferă resurse pentru studiu și cercetare.
  • Complete Planet: indexează în jur de 70.000 de baze de date al căror conținut variază de la agricultură la domeniul militar.
  • Infoplease: conține enciclopedii, almanahuri, atlase și biografii.
  • DeepPeep: accesează căutarea în interiorul mai multor domenii: auto, aviație, cărți, biologie, hotel, locuri de muncă, închirieri.
  • IncyWincy: folosește alte motoare de căutare și apoi filtrează rezultatele.
  • DeepWebTech: ofera 5 motoare de căutare pentru anumite subiecte; printre domeniile acoperite sunt din știinta, medicina și afaceri.
  • Scirus: motor de căutare puternic axat doar pe știință; indexează jurnale, site-uri personale ale unor savanți, materiale de curs și rețele instituționale.
  • TechXtra: motor de căutare axat pe inginerie, matematică și IT; indexează știrile din aceste domenii, oferte de muncă, rapoarte tehnice, documente electronice, resurse de studiu și cercetare, alte article și informatii relevante. [6][7]

Vezi și[modificare | modificare sursă]

Referințe[modificare | modificare sursă]

  1. ^ The Secret Web: Where Drugs, Porn and Murder Live Online
  2. ^ a b Bergman, Michael K (1 august 2001). „The Deep Web: Surfacing Hidden Value”. The Journal of Electronic Publishing 7 (1). doi:10.3998/3336451.0007.104. http://quod.lib.umich.edu/cgi/t/text/text-idx?c=jep;view=text;rgn=main;idno=3336451.0007.104. 
  3. ^ He, Bin (1 mai 2007). „Accessing the Deep Web: A Survey”. Communications of the ACM (CACM) 50 (2): 94–101. doi:10.1145/1230819.1241670. http://doi.acm.org/10.1145/1230819.1241670. 
  4. ^ Denis Shestakov (2011). „Sampling the National Deep Web” (în Russian) (PDF). Proceedings of the 22nd International Conference on Database and Expert Systems Applications (DEXA). Springer.com. pp. 331–340. Există o versiune arhivată la 2 septembrie 2011. http://link.springer.com/chapter/10.1007%2F978-3-642-23088-2_24. Accesat la 6 octombrie 2011. 
  5. ^ descopera.org: Deep Web – internetul ascuns 22 mai 2010
  6. ^ practictech.com: Ce este Deep WEB 13 Ianuarie 13 2015
  7. ^ deep-web.org: Deep Web Search Engines

Bibliografie[modificare | modificare sursă]

Legături externe[modificare | modificare sursă]