Sembra essere molto simile a Central Limit Theorem and Law of Large Numbers però per Entropy. This is also called Shannon's source coding theorem see here

Enunciato AEP

Data una serie di variabili aleatorie i.i.d. se vale che

in probability (la definizione data in Central Limit Theorem and Law of Large Numbers#Convergence in probability).

Un modo alternativo per enunciarla è così, segue il metodo in (MacKay 2003).

Per un certo tenderà all'infinito.

Ossia a grandi linee: dato una variabile aleatoria e estrazioni della stessa, possiamo comprimere questa sequenza in .

Dimostrazione

Principalmente sorvolata, ma utilizza cose simili a Central Limit Theorem and Law of Large Numbers, e una idea simile a Monte Carlo Methods per le probabilità. In realtà nella prima formulazione è un concetto molto semplice il motivo per cui funziona.

La cosa principale da comprendere è come ci può essere questo fenomeno con convergenza in probabilità, che è una nozione più che altro tecnica per questo discorso.

Typical sets

Elements in the typical set have roughly the same probability.

Questo insieme è un oggetto matematico che ha delle proprietà interessanti, viene corretto analizzarlo dopo che si ha AEP, perché in breve la sua esistenza è giustificata da quello. È l'insieme delle sequenze prese da una distribuzione sempre uguale tale per cui valga

Il motivo per cui abbiamo le cose strane all'esponente è proprio la definizione di convergenza in probabilità data. (basta che le espandi) Ossia il fatto che

Se si espande quanto è presente dentro si ottiene quel bound di sopra.

Proprietà

Vedi 3.1.2 di (Cover & Thomas 2012).

Il risultato importante è che possiamo rappresentare sequenze di in media usando bits, senza perdita di informazione.

References

[1] MacKay “Information Theory, Inference and Learning Algorithms” Cambridge University Press 2003

[2] Cover & Thomas “Elements of Information Theory” John Wiley & Sons 2012