Cloud Storage

Object Stores # Characteristics of Cloud Systems # Object storage design principles # We don't want the hierarchy that is common in Filesystem s, so we need to simplify that and have these four principles: Black-box objects Flat and global key-value model (trivial model, easy to…

June 7, 2025 · Reading Time: 20 minutes · By Xuanqiang Angelo Huang

Uniform Resource Identifier

URI # Sono stata LA vera invenzione di Berners Lee accennati in Storia del web . Il problema è avere un modo per identificare una risorsa in modo univoco sull’internet. Introduzione # La risorsa # Una risorsa è qualunque struttura che sia oggetto di scambio tra applicazioni…

January 28, 2025 · Reading Time: 7 minutes · By Xuanqiang Angelo Huang

Markup

Introduzione alle funzioni del markup # La semantica di una parola è caratterizzata dalla mia scelta (design sul significato). Non mi dice molto, quindi proviamo a raccontare qualcosa in più. Definiamo markup ogni mezzo per rendere esplicita una particolare interpretazione di un…

January 28, 2025 · Reading Time: 9 minutes · By Xuanqiang Angelo Huang

Massive Parallel Processing

We have a group of mappers that work on dividing the keys for some reducers that actually work on that same group of data. The bottleneck is the assigning part: when mappers finish and need to handle the data to the reducers. Introduction # Common input formats # You need to…

January 28, 2025 · Reading Time: 14 minutes · By Xuanqiang Angelo Huang

Data Models and Validation

A data model is an abstract view over the data that hides the way it is stored physically. The same idea from (Codd 1970) This is why we should not modify data directly, but pass though some abstraction that maintain the properties of that specific data model. Data Models # Tree…

January 26, 2025 · Reading Time: 10 minutes · By Xuanqiang Angelo Huang

Distributed file systems

We want to know how to handle systems that have a large number of data. In previous lesson we have discovered how to quickly access and make Scalable systems with huge dimensions, see Cloud Storage . Object storage could store billions of files, we want to handle millions of…

January 26, 2025 · Reading Time: 10 minutes · By Xuanqiang Angelo Huang

Performance at Large Scales

Some specific phenomenons in modern systems happen only when we scale into large systems. This note will gather some observations about the most important phenomena we observe at these scales. Tail Latency Phenomenon # Tail latency refers to the high-end response time…

January 18, 2025 · Reading Time: 3 minutes · By Xuanqiang Angelo Huang

Codifica dei caratteri

Introduzione sull'encoding # Ossia trattiamo metodi per codificare caratteri dei linguaggi umani, come ASCII, UCS e UTF. Digitalizzare significa encodarlo in un sistema che possa essere memorizzato su un dispositivo di memorizzazione elettronico. Ovviamente non possiamo…

January 15, 2025 · Reading Time: 10 minutes · By Xuanqiang Angelo Huang

Graph Databases

We have first cited the graph data model in the Introduction to Big Data note. Until now, we have explored many aspects of relational data bases, but now we are changing the data model completely. The main reason driving this discussion are the limitations of classical…

January 15, 2025 · Reading Time: 7 minutes · By Xuanqiang Angelo Huang

Normalizzazione dei database

Introduzione alla normalizzazione # Perché si normalizza? # Cercare di aumentare la qualità del nostro database, perché praticamente andiamo a risolvere delle anomalie possibili al nostro interno, e questo aiuta per la qualità. Solitamente queste anomalie sono interessanti per…

January 5, 2025 · Reading Time: 6 minutes · By Xuanqiang Angelo Huang