Quando il World Wide Web è andato online nel 1991 era composto di pagine di testo statiche collegate tra loro da collegamenti ipertestuali ed è rimasto così per anni. Ma fin dall’inizio, il suo inventore, Tim Berners-Lee, lo aveva immaginato molto più sofisticato. Il cosiddetto Web Semantico, che non solo conserva i dati, ma riesce a saperne il suo significato. Ora Berners-Lee è un professore del MIT e dirige anche il World Wide Web Consortium (W3C), un ente che include tutti i grandi stakeholder della rete,da Adobe a Yahoo. Il W3C ha appena pubblicato un nuovo standard che dovrebbe contribuire a portare il Web semantico molto più vicino alla sua realizzazione.
Se il Web attuale è come un gigantesco file di testo – su cui è possibile cercare per parole – il Web Semantico sarebbe come un database, dove ogni elemento di informazione è classificato, dando infinite possibilità per una sola query.
Ma mentre una banca dati comune ha le categorie scelte in anticipo da un programmatore, il Semantic Web è “un database in cui ogni persona controlli i propri dati“, spiega Sandro Hawke, architetto sistemi del World Wide Web Consortium (W3C). “Tu hai la tua parte del database, in modo da poter mettere i dati a prescindere dalle categorie di ricerca“.
Un enorme database in rete in cui gli utenti controllano i propri dati ha evidenti vantaggi : un numero enorme di persone può contribuire ad essa e possono garantire che i loro contributi non sono categorizzati o registrate in modo errato. Ma ha anche uno svantaggio evidente: non c’è alcuna garanzia che le persone si organizzano per etichettare i propri dati in modo uniforme.
In effetti, c’è già uno standard esistente, il Web Ontology Language, che risolve questo problema. Ma non è detto che sia sufficiente visto i tanti soggetti presenti.
Il nuovo standard rilasciato Semantic Web è chiamato il Rule Interchange Format, o RIF, e fornisce ai programmatori web un modo per scrivere le regole per la traduzione tra i dati sui diversi siti. “Parte del gioco è quello di avere standard di questi casi d’uso molto diverse attorno allo stesso tavolo e poi ottenere uno standard che possa essere utilizzato in tutti questi diversi pezzi di software “, dice Hawke .
Se lo standard RIF diventerà ampiamente adottato, è probabile che possa passare inosservato alla maggior parte degli utenti di Internet. Il Web è già piena di pagine che prendono i dati aggregati da altri siti: un home page personalizzata di Google , per esempio, potrebbe includere i titoli delle diverse fonti di notizie varie, previsioni del tempo da un altro sito e prezzi delle azioni da un’altra ancora. Ma, come dice Hawke: “Si possono sempre costruire processi per aggregare i dati che già si conoscono“.