lunedì 17 agosto 2009

il Web Semantico , secondo il Turin Dams Review

powerset , es. di soft. semantico

Chi ha paura dei metadati (nel web)? di Rossana Damiano 17/09/2008 .....................I motori di ricerca non sono basati su metadati, se non in minima parte, ma ispezionano direttamente il contenuto delle risorse presenti in rete, cercando di estrarne le informazioni significative. Benchè i motori di ricerca abbiano supplito - con prestazioni più che accettabili - alla mancanza di una catalogazione delle risorse nel Web, essi possiedono alcuni limiti intrinseci. Si provi, per esempio, a inserire come termine di ricerca la parola "cappuccini" in un motore di ricerca specializzato in immagini: quelle che rappresentano la nota bevanda si presenteranno inframmezzate alle immagini di appartenenti al noto ordine religioso... A nulla valgono, infatti, le strategie di ricerca 'intelligenti' messe in atto dai motori di ricerca nell'ultimo decennio: la ricerca di tipo testuale che essi operano è chiaramente inadeguata ad un contesto che migra rapidamente dal testo verso la multimedialità (la stessa Turin Dams Review, per esempio, non contiene solo testo ma immagini - accessibili separatamente in apposite pagine - e materiale video nella sezione ‘Progetto Ibsen’). Inoltre, anche se le risorse di tipo non testuale - immagini, suono, video - fossero accompagnate da una descrizione in formato testuale, la ricerca di parole chiave resterebbe comunque confinata alla superficie di tale descrizione, dato che essa opera sulle parole in quanto sequenze di caratteri e non sul loro significato.  Per supplire alla mancanza di informazioni di natura semantica sul contenuto delle risorse presenti in rete, gli utenti hanno dato vita a un'iniziativa collettiva di ‘etichettatura’: la pratica che ne è derivata è nota come social tagging, cioè apposizione individuale di etichette che descrivono sinteticamente una risorsa, sia essa un video, un immagine o un oggetto audio. Nato nell’ambito dell’approccio partecipativo del ‘Web 2.0’, il social tagging si presenta in forme più o meno libere da schemi prefissati: nella maggior parte dei casi, gli utenti sono totalmente liberi di scegliere i tag in un insieme aperto: solo in pochi casi lo strumento di tagging propone alternative prefissate, magari insieme alla possibilità di aggiungere comunque liberamente nuovi tag. I tag inseriti dagli utenti diventano quindi parte dei percorsi di navigazione del sito, spesso attraverso la configurazione grafica denominata ‘nuvola dei tag’. Il social tagging si va affermando stabilmente soprattutto in ambiti in cui le valutazioni individuali possono liberamente associarsi alle risorse oggetto di etichettatura, caricando le risorse stesse di ulteriori significati (si veda per esempio l’esperimento di Arsmeteo, www.arsmeteo.org, in cui oggetto dell’etichettatura sono opere d’arte).  Nonostante la diffusione del social tagging, è ovvio che esso, come pratica di catalogazione, non è sufficiente a risolvere i problemi dell’accesso alle risorse nel Web. Nel web attuale, infatti, la logica localista del singolo sito cede il passo a uno schema più complesso, in cui i contenuti di ogni pagina si rieccheggiano in altre, in un’ottica di riutilizzo incoraggiata dalla natura composita e frammentaria del multimedia (si veda l’articolo "Editoria e storage della documentazione" di Giulio Lughi, pubblicato su Turin Dams Review il 26/06/2008). Questa editoria ‘diffusa’, che coinvolge il popolo dei bloggers come le fondazioni culturali, potrebbe trarre grande vantaggio da un sistema di etichettatura condivisa. Se oggi le operazioni di ricerca e selezione di contenuti vengono svolte, o almeno supervisionate, direttamente dagli utenti del Web (con importanti eccezioni: si veda l’esempio di Google News riportato nell’articolo citato), si moltiplicano gli sforzi affinchè tale processo sia svolto in maniera automatica, attraverso appositi servizi di calcolo presenti in rete (serivizi web), con l'obiettivo di migliorare e ottimizzare la ricerca e la selezione dei contenuti. Per ottenere questo scopo è necessario che le risorse presenti in rete siano non solo corredate di informazioni di natura semantica, che ne descrivano il contenuto, ma anche che tali informazioni siano vincolate a una semantica comune e che essa sia accessibile alle macchine: in poche parole, è necessario che i software che dovrebbero svolgere questi compiti capiscano, letteralmente, ‘di cosa parla il web’.  Porre le macchine in condizione di capire "di cosa parla il web" è, in sintesi, la missione del progetto internazionale denominato Web Semantico (Semantic Web), fondato nel 2001 da Tim Berners-Lee, già inventore del World Wide Web nel lontano 1990. L’attività del Web Semantico, fino ad ora, si è concentrata sulla creazione di che permettano di descrivere le risorse presenti nel Web e il loro contenuto sulla base di una semantica formale (Resource Definition Markup, RDF Schema, Ontology Web Language) ponendo le basi per le future applicazioni basate sulla condivisione di significati. Il culmine di tale iniziativa consiste nell’Ontology Web Language (OWL), il linguaggio per la codifica formale di ontologie concepito per supportare il ragionamento automatico.  La creazione di applicazioni basate sugli strumenti predisposti dal Web Semantico è ancora in una fase iniziale e ha come condizione necessaria la codifica di ontologie che descrivano settori di conoscenza specifici per l’uso da parte delle singole applicazioni. Le proposte di ontologie specifiche si moltiplicano, ma faticano a emergere veri e propri standard. Per citare solo alcune iniziative disparate: Music Ontology (ontologia di ambito musicale), Towntology (ontologia di ingegneria civile), COMM (ontologia del multimedia), CIDOC CRM Owl (ontologia dei beni culturali). Solo con lo sviluppo esteso e sistematico di ontologie standard sarà possibile per gli utenti godere dei benefici del Web Semantico: compiti quali la ricerca di documenti - di natura testuale e multimediale - opportunamente annotati, saranno svolti almeno in parte dalle macchine, che si faranno carico di quella faticosa attività di ricerca che oggi prevede l’inserimento di parole chiave e l’intelligente e attenta disamina dei contenuti reperiti, il loro eventuale filtraggio (di nuovo un processo intelligente) tramite parole chiave più restrittive oppure l’inizio di una nuova ricerca con parole chiave almeno parzialmente diverse.  Non solo: la condivisione di una base semantica comune permetterà di ottenere l’interoperabilità semantica dei dati, cioè di rendere comprensibile la conoscenza propria di un’applicazione, o di un’archivio, a un’altra applicazione o a un altro archivio, posto che vi sia un accordo sullo schema di annotazione. La descrizione semantica, infatti, non è sufficiente, da sola, a garantire che lo schema descrittivo sia condiviso, a patto che non ci si accordi sullo schema stesso. In quest’ottica è nata l’iniziativa Dublin Core (DCMI, Dublin Core Metadata initiative), che si occupa di definire e standardizzare uno schema di metadati ad hoc per il Web, leggero ma estensibile, concepito per l’annotazione di oggetti multimediali. Dublin Core definisce le proprietà di una risorsa rilevanti per la l'accesso e altri aspetti quali la tutela della proprietà intellettuale, demandando la descrizione effettiva di tali proprietà all'utilizzo di ontologie formali.  In conclusione: chi ha paura dei metadati? Nel suo piccolo, questo sito pensa che, con l’avvento di metadati per il web, accompagnati dalla descrizione semantica dei contenuti, i benefici che ne otterrà la comunità accademica saranno superiori al lavoro supplementare che, inevitabilmente, graverà sugli autori e sulle redazioni. Per ora, il sito della Turin Dams Review si è dotato di un meccanismo di social tagging, passando la parola agli autori e al pubblico. Sono in cantiere l'integrazione nel sito dello schema di metadati Dublin Core per la descrizione delle risorse pubblicate e la strutturazione del sito in forma di archivio delle uscite passate.

per l'articolo , clicca

per saperne di piu', clicca 

Nessun commento: