martedì 6 ottobre 2009

la semantica ed Il futuro di Google e Bing: tecnologie che entrano nel cuore della lingua e della cultura

da Noo'va , Sole24ore,. del 27/sett09 , DI MARCO VARONE Fra gli addetti ai lavori, ha fatto scalpore la recente dichiarazione dell'amministratore delegato di Googe, Eric Schmidt, che rappresenta un significativo cambio di direzione per il colosso di Mountain View: dopo avere sostenuto per anni che la tecnologia a keyword era più che sufficiente per ottenere i risultati migliori, Schimdt ha affermato che devono passare dalle parole al significato, per capire meglio cosa chiedono gli utenti e quale sia il contenuto dei documenti indicizzati. Da un certo punto di vista, non si tratta di nulla di nuovo perché ormai da tempo è in atto, sull'onda lunga del "semantic web", una qualche integrazione di tecnologie semantiche (cioè in grado di capire il significato) all'interno dei motori di ricerca: Microsoft, al momento del lancio di Bing, ha indicato che utilizzava elementi semantici (anche se, per ora, non è molto chiaro quali e in che modo essi diano un vantaggio nelle normali ricerche). Il fatto però che lo dichiari il leader assoluto di mercato costituisce una legittimazione e uno spartiacque fra prima e dopo: si apre ufficialmente l'era della semantica diffusa applicata al web. I motori di ricerca per internet ne hanno fatta di strada in questi anni, dai primi successi di Altavista e Lycos fino allo strapotere (giustificato dai risultati migliori di tutti gli altri) di Google ma negli ultimi due o tre anni Google stesso ha raggiunto una sorta di "plateau" dove le innovazioni che fanno la differenza sono sempre meno e la concorrenza (Bing in particolare) si avvicina molto più rapidamente che in passato. La tecnologia a keyword (integrata da una serie di elementi statistici come il famoso PageRank) ha avuto l'enorme vantaggio di essere semplice, facilmente applicabile a tante lingue e molto veloce: caratteristiche che erano fondamentali nei primi anni del web (dove investimenti e potenze di calcolo erano molto più ridotti) ma che adesso non sono così più importanti. Applicata al web, ha anche sfruttato il lavoro assolutamente gratuito e volontario di centinaia di milioni di persone che ogni giorno, facendo delle ricerche e cliccando su uno o più risultati, forniscono ai produttori una quantità enorme di informazioni di inestimabile valore per ordinare i risultati delle ricerche in modo ottimale (in un certo senso, questo volontariato è il prezzo che gli utenti pagano per usare servizi che sono gratuiti: invece di soldi, lavoro). Nonostante tutto questo, è ormai tempo che questa tecnologia sia affiancata da qualcosa di nuovo: non bisogna buttare via quanto fatto ma aggiungere tecnologie in grado di migliorare i risultati delle ricerche attualmente problematiche e di rendere più semplice trovare le informazioni desiderate anche alle persone che non sanno come comporre una ricerca ottimizzata. Occorre non avere paura di sporcarsi le mani e buttarsi nel cuore della lingua e della cultura di ogni paese: fino a ora, si è utilizzato un approccio molto "asettico" che non entrava nel merito ma lavorava a livello simbolico. Per comprendere il significato, invece, bisogna scendere al livello sottostante, capire che un testo è un insieme di frasi, concetti, attributi e relazioni che vanno analizzati nel loro insieme per riuscire a cogliere tutti gli aspetti importanti del contenuto e rispondere in maniera puntuale alle ricerche degli utenti. Servono investimenti significativi (ogni lingua è complessa di per sé e diversa dalle altre ed è spesso inscuidibile dalla cultura di un paese), più lavoro manuale e meno automatico e più potenza di calcolo rispetto a ora: questi aspetti accelereranno ancora di più la polarizzazione già in corso che porterà ad avere sostanzialmente solo due player, Google e Bing, nel mercato dei motori di ricerca generalisti. Realtà più piccole, esistenti o start-up, potranno dare il loro importante contributo per aspetti tecnologici innovativi o su contesti verticali (la semantica è una tecnologia ancora giovane e con molti spazi di crescita) ma molto difficilmente potranno competere su larga scala con i due giganti attuali. http://marcovarone. nova1oo. ilsole24ore.com

per saperne di piu' sulla semantica : da Wikipedia :......."La semantica è quella parte della linguistica che studia il significato delle parole (semantica lessicale), degli insiemi delle parole, delle frasi (semantica frasale) e dei testi.La semantica è una scienza in stretto rapporto con altre discipline, come la semiologia, la logica, la psicologia, la teoria della comunicazione, la stilistica e la filosofia del linguaggio. La posizione della semantica, studiata nell'ambito di una teoria generale dei segni, diventa più chiara se messa a confronto con la pragmatica e la sintassi."............

orso castano : un notevole passo avanti. Cercare il significato piu' pregnante tra le righe di quanto viene pubblicato sul web , studiare questa massa di dati importanti, elaborarne una staistica , accelerera' tutti i processi di costruzione e rilevazione di senso nell'analisi del mondo reale di cui, va sottolineato , il web e' solo un'immagine riflessa in uno specchio, immagine dinamica e cangiante, ma sicuramente sempre piu' importante nella costruzione della cultura in senso lato.

Nessun commento: