Da qualche tempo mi sto interessando al deepweb. Il deepweb è quella parte di internet non raggiungibile dai motori di ricerca e pertanto, alla maggior parte di noi, completamente sconosciuta e irraggiungibile. Intrigante non vi sembra?
Del resto, per molti, internet è solo ciò che possiamo ricercare e trovare con un motore di ricerca di nostro gradimento.
Le stime però parlano di scenari estremamente diversi. Una recente ricerca di BrightPlanet afferma che l’invisible web è dimensionalmente circa 500 volte il surface web (cioè quello indicizzato). E se prendiamo come riferimento Google ciò significa che si sta parlando di circa 500 Miliardi di pagine invisibili, non raggiungibili e ricolme di informazioni utili.
Ora vi starete domandando… “500 volte??? e che cavolo!? cosa saranno mai tutti questi contenuti non indicizzati?” la risposta è semplice… DATABASE! ovvero archivi di dati. Raccolte storiche di articoli di giornale, eventi vari, digitalizzazioni di pubblicazioni specializzate, etc… tutte tipologie alle quali manca il famoso “link” e/o la rappresentazione pubblica necessaria per essere raggiungibile dai sofisticati crawler dei nostri fidati motori di ricerca.
Estremizzando un pò si potrebbe pensare che noi stiamo guardando solo la “fuffa” visibile in internet e le cose “serie” le informazioni vere siano tutte nel deepweb in archivi difficilmente accessibili proprio a causa della loro estrema specializzazione.
Facciamo un’esempio. Google Schoolar è sicuramente un ottimo prodotto web che tenta una prima incursione nel mondo del web sommerso ma ne scopre solo una piccola parte e i risultati che vediamo sono già notevolissimi.
Non so se il web sommerso in futuro rimarrà tale o meno. Per adesso la ricercabilità è limitata. E i pochi siti che permettono un’accesso, anche solo a una parte di questo mondo, lo fanno a pagamento o comunque forniscono un accesso limitato.
Related posts:
- ricerche nascoste in google immagini
- Google search appliance per le aziende verso i 30 milioni di documenti indicizzabili
- Google Timeline search e Map View
- Google Hacking Database
- Google abilita la ricerca dei brevetti Google patents
Nessun commento:
Posta un commento