Metadati web

https://csunibo.github.io/tecnologie-web/lucidi/teoria/23-metadati.pdf https://csunibo.github.io/tecnologie-web/lucidi/teoria/24-a-web-semantico-lod-rdf-json-ld.pdf

inconfrontabilità del sapere

  • Stessa informazione in forme diverse
  • Stessa parola per cose diversa.

Serializzazione

image/universita/ex-notion/Metadati web e web semantico/Untitled

La semantica è relegata alle applicazioni che devono decidere in che modo interpretarli, oppure esseri umani.

PICS

Platform for Internet Content Selection vuole cercare di tenere sotto controllo i materiali del film. È un sistema di rating. → tanti criteri di classificazione a seconda dei criteri ideologici su cui voglio andare a basarmi.

  • Classificare e categorizzare, non`e una cosa centralizzata da parte di un governo.
  • Fonte terza, non è né l’usufruitore ne il creatore → metadati = dati sui dati.

Metadati

image/universita/ex-notion/Metadati web e web semantico/Untitled 1
  • vantaggi e svantaggi

    image/universita/ex-notion/Metadati web e web semantico/Untitled 2

Tesauri e tassonomie

Si parla di gerarchizzazione e di relazione fra parole dello stesso livello

Tassonomia

  • linneo
  • Esempio di tassonomia
  • La cosa che generalizza

Esempi di relazioni

  • has_a
  • is_a
  • instance of

Classificazione a faccette

possibilità di descrivere un oggetto complesso attraverso un insieme di affermazioni appartenenti ad uno schema fisso di proprietà, ciascuna delle quali in grado di usare valori da un apposito tesauro.

Ontologie

  • Vocabolario controllato
  • Organizzato in thesaurus

Una ontologia è un sistema di classi, descritta da proprietà che hanno valori puri o riferimenti ad istanze di altre classi (credo che questa cosa sia molto simile anche in database o simili).

  • Critica alle ontologie

    image/universita/ex-notion/Metadati web e web semantico/Untitled 3

Complessivamente, sono un approccio costoso, ingessato, non democratico, centralizzato e riduzionistico.

Folksonomie

Semantic web

Resource description framework - RDF

Spieghiamo meglio in Graph Databases Sono delle triple soggetto predicato e oggetto, e posso creare degli alberi che sembrano delle tassonomie a riguardo.

Una cosa interessante è che tutto è identificato da URI, nomi, predicati e oggetti, a volte ci sono degli elementi vuoti chiamati blank nodes.

bisogna distinguere questo formato di triple con il formato di serializzazione che è la forma in cui sono rappresentati sottostante.

Problema delle relazioni n-arie

Reificazione 🟥

La differenza principale con la modellizzazione a relazione n-aria è che il blank era il soggetto e tutti erano oggetti di questo, mentre ora ogni cosa può essere soggetto oppure oggetto. In particolare rdf:statement sub, pred, obj, ci sono sempre queste predicati per la reificazione. image/universita/ex-notion/Metadati web e web semantico/Untitled 4

Ma ha un problema per i databases perché non vengono trovati le relazioni soggetto - predicato - oggetto classici.

Named graph

  • Slide named graph

    image/universita/ex-notion/Metadati web e web semantico/Untitled 5

ossia ho sempre delle triple, ma queste sono messe a livello differente.

Serializzazioni

Serializzazione significa dare una sintassi per andare a descrivere le informazioni di rdf in modo che sia possibile metterli in database.

RDF/XML

Turtle

JSON-LD

Generazione di conoscenza

  • utilizzare il database RDF per andare a generare nuove informazioni
  • Andare a verificare la coerenza delle informazioni che abbiamo già

RDF schema

È l’insieme dei concetti possibili per un certo RDF.

image/universita/ex-notion/Metadati web e web semantico/Untitled 6

Web Ontology language (OWL)

TODO

SPARQL

TODO