Notes

The RLHF pipeline

https://huyenchip.com/2023/05/02/rlhf.html è un blog post che lo descrive in modo abbastanza dettagliato e buono. Introduzione a RLHF # Questo è il processo che è quasi la migliore per la produzione di LLM moderni (maggior parte si basano su questo per dire). Struttura generale…

January 25, 2024 · Reading Time: 1 minutes · By Xuanqiang Angelo Huang

Tokenization

Introduction to tokenization # Tokenization is the process of converting normal strings into small little pieces that could be fed into one of our models. It usually comes from a tradition in programming languages, as we can see in Automi e Regexp where we define a specific…

January 20, 2024 · Reading Time: 3 minutes · By Xuanqiang Angelo Huang

Alberi di decisione

Introduzione agli alberi di decisione # Setting del problema # Spazio delle ipotesi # Definizione spazio ipotesi # Per spazio delle ipotesi andiamo a considerare l'insieme delle funzioni rappresentabili dal nostro modello . Questo implica che l'allenamento ricerca l'ipotesi…

Naïve Bayes

Introduzione a Naïve Bayes # NOTE: this note should be reviewed after the course I took in NLP. This is a very old note, not even well written. Bisognerebbe in primo momento avere benissimo in mente il significato di probabilità condizionata e la regola di naive Bayes in…

Reti convoluzionali

Abbiamo trattato i modelli classici in Convolutional Neural Network . Con i vecchi files di notion Il Kernel # I punti interessanti delle immagini sono solamente i punti di cambio solo che attualmente siamo in stato discreto, quindi ci è difficile usare una derivata, si usano…