Sembra essere molto simile a Central Limit Theorem and Law of Large Numbers però per Entropy. This is also called Shannon's source coding theorem see here
Enunciato AEP
Data una serie di variabili aleatorie i.i.d. se vale che
in probability (la definizione data in Central Limit Theorem and Law of Large Numbers#Convergence in probability).
Un modo alternativo per enunciarla è così, segue il metodo in (MacKay 2003).
Per un certo tenderà all'infinito.
Ossia a grandi linee: dato una variabile aleatoria e estrazioni della stessa, possiamo comprimere questa sequenza in .
Dimostrazione
Principalmente sorvolata, ma utilizza cose simili a Central Limit Theorem and Law of Large Numbers, e una idea simile a Monte Carlo Methods per le probabilità. In realtà nella prima formulazione è un concetto molto semplice il motivo per cui funziona.
La cosa principale da comprendere è come ci può essere questo fenomeno con convergenza in probabilità, che è una nozione più che altro tecnica per questo discorso.
Typical sets
Elements in the typical set have roughly the same probability.
Questo insieme è un oggetto matematico che ha delle proprietà interessanti, viene corretto analizzarlo dopo che si ha AEP, perché in breve la sua esistenza è giustificata da quello. È l'insieme delle sequenze prese da una distribuzione sempre uguale tale per cui valga
Il motivo per cui abbiamo le cose strane all'esponente è proprio la definizione di convergenza in probabilità data. (basta che le espandi) Ossia il fatto che
Se si espande quanto è presente dentro si ottiene quel bound di sopra.
Proprietà
Vedi 3.1.2 di (Cover & Thomas 2012).
Il risultato importante è che possiamo rappresentare sequenze di in media usando bits, senza perdita di informazione.
References
[1] MacKay “Information Theory, Inference and Learning Algorithms” Cambridge University Press 2003
[2] Cover & Thomas “Elements of Information Theory” John Wiley & Sons 2012