Metadati web
https://csunibo.github.io/tecnologie-web/lucidi/teoria/23-metadati.pdf https://csunibo.github.io/tecnologie-web/lucidi/teoria/24-a-web-semantico-lod-rdf-json-ld.pdf
inconfrontabilità del sapere
- Stessa informazione in forme diverse
- Stessa parola per cose diversa.
Serializzazione
La semantica è relegata alle applicazioni che devono decidere in che modo interpretarli, oppure esseri umani.
PICS
Platform for Internet Content Selection vuole cercare di tenere sotto controllo i materiali del film. È un sistema di rating. → tanti criteri di classificazione a seconda dei criteri ideologici su cui voglio andare a basarmi.
- Classificare e categorizzare, non`e una cosa centralizzata da parte di un governo.
- Fonte terza, non è né l’usufruitore ne il creatore → metadati = dati sui dati.
Metadati
-
vantaggi e svantaggi
Tesauri e tassonomie
Si parla di gerarchizzazione e di relazione fra parole dello stesso livello
Tassonomia
- linneo
- Esempio di tassonomia
- La cosa che generalizza
Esempi di relazioni
- has_a
- is_a
- instance of
Classificazione a faccette
possibilità di descrivere un oggetto complesso attraverso un insieme di affermazioni appartenenti ad uno schema fisso di proprietà , ciascuna delle quali in grado di usare valori da un apposito tesauro.
Ontologie
- Vocabolario controllato
- Organizzato in thesaurus
Una ontologia è un sistema di classi, descritta da proprietà che hanno valori puri o riferimenti ad istanze di altre classi (credo che questa cosa sia molto simile anche in database o simili).
-
Critica alle ontologie
Complessivamente, sono un approccio costoso, ingessato, non democratico, centralizzato e riduzionistico.
Folksonomie
Semantic web
Resource description framework - RDF
Spieghiamo meglio in Graph Databases Sono delle triple soggetto predicato e oggetto, e posso creare degli alberi che sembrano delle tassonomie a riguardo.
Una cosa interessante è che tutto è identificato da URI, nomi, predicati e oggetti, a volte ci sono degli elementi vuoti chiamati blank nodes.
bisogna distinguere questo formato di triple con il formato di serializzazione che è la forma in cui sono rappresentati sottostante.
Problema delle relazioni n-arie
Reificazione 🟥
La differenza principale con la modellizzazione a relazione n-aria è che il blank era il soggetto e tutti erano oggetti di questo, mentre ora ogni cosa può essere soggetto oppure oggetto. In particolare rdf:statement sub, pred, obj, ci sono sempre queste predicati per la reificazione.
Ma ha un problema per i databases perché non vengono trovati le relazioni soggetto - predicato - oggetto classici.
Named graph
-
Slide named graph
ossia ho sempre delle triple, ma queste sono messe a livello differente.
Serializzazioni
Serializzazione significa dare una sintassi per andare a descrivere le informazioni di rdf in modo che sia possibile metterli in database.
RDF/XML
Turtle
JSON-LD
Generazione di conoscenza
- utilizzare il database RDF per andare a generare nuove informazioni
- Andare a verificare la coerenza delle informazioni che abbiamo giÃ
RDF schema
È l’insieme dei concetti possibili per un certo RDF.
Web Ontology language (OWL)
TODO
SPARQL
TODO