9 Przegląd ważniejszych rozkładów

Celem tego rozdziału jest systematyzacja wiedzy o najczęściej spotykanych i wykorzystywanych rozkładach.

Rozkłady dyskretne

Zaczniemy od rozkładów skupionych na przeliczalnych zbiorach.

Definicja 9.1 Zmienna losowa \(X\) o rozkładzie \(\mu_X\) ma rozkład dyskretny jeżeli istnieje przeliczalny (skończony) zbiór \(S\) taki, że \(\mu_X(S)=1\).

Jeżeli \(X\) ma rozkład dyskretny to \[\begin{equation*} S = \left\{ x\in \mathbb{R}:\; \mathbb{P}[X = x]>0 \right\} \end{equation*}\] jest zbiorem atomów. Zbiór \(S\) można ustawić w ciąg \(S = \{s_k\}_{k \in \mathbb{N}}\). Mamy wówczas \[\begin{equation*} \sum_{k=1}^\infty \mathbb{P}[X=s_k]=1. \end{equation*}\]

Twierdzenie 8.1 dla zmiennych o rozkładzie dyskretnym zapisuje się w postaci sumy.

Wniosek 9.1 Jeżeli zmienna losowa \(X\) jest dyskretna ze zbiorem atomów \(S=\{s_k\}_{k}\), a \(\varphi \colon \mathbb{R} \to \mathbb{R}\) jest funkcją borelowską, to \(\mathbb{E} \left[\phi(X)\right]\) istnieje wtedy i tylko wtedy, gdy \(\sum_i |\phi(x_i)|\mathbb{P}[X=x_i]<\infty\). Wówczas \[ \mathbb{E} \left[\phi(X)\right] = \sum_i \phi(s_i)\mathbb{P}[X=s_i]. \]

Poniżej dokonamy przeglądu najczęściej spotykanych rozkładów dyskretnych.

Rozkład skupiony w punkcie

Rozkład skupiony w punkcie \(a\in \mathbb{R}\) odpowiada zmiennej losowej, która z prawdopodobieństwem jeden jest równa \(a\). Czyli \[\begin{equation*} \mathbb{P}[X=a]=1. \end{equation*}\] Wówczas odpowiadający rozkład jest skupiony w punkcie \(a\), czyli \(\mu_X=\delta_a\). W tym przypadku zbiór atomów jest jednopunktowy \(S = \{a\}\).

Rozkład dwumianowy (Bernoulliego)

Niech \(n\in\mathbb{N}\), \(p\in (0,1)\). Zmienna losowa \(X\) ma rozkład Bernoulliego z parametrami \(n\) i \(p\) jeżeli \[ \mathbb{P}[X=k] = {n\choose k} p^k (1-p)^{n-k}, \qquad k=0,1,\ldots,n. \] Piszemy wtedy \(X \sim Bin(n,p)\). Wówczas zmienna \(X\) opisuje liczbę sukcesów w \(n\) niezależnych próbach, w których sukces zachodzi z prawdopodobieństwem \(p\).

Rozkład Geometryczny

Niech \(p \in (0,1)\). Powiemy, że zmienna losowa \(X\) ma rozkład geometryczny z parametrem \(p\), jeżeli \[\begin{equation*} \mathbb{P}[X=j] = (1-p)^{j-1}p, \qquad j \geq 1. \end{equation*}\] Piszemy wtedy \(X \sim Geo(p)\). Wówczas \(X\) modeluje liczbę prób jaką należy wykonać aby uzyskać pierwszy sukces w ciągu prób, w którym w pojedynczej próbie sukces zachodzi z prawdopodobieństwem \(p\).

Należy mieć na względzie, że \(\mathbb{P}[X=j]>0\) dla każdego \(j\). Zera pojawiające się na powyższym histogramie wynikają wyłącznie z zaokrąglenia.

Rozkład Poissona

Niech \(\lambda\geq 0\). Powiemy, że zmienna losowa \(X\) ma rozkład Poissona z parametrem \(\lambda\), jeżeli \[\begin{equation*} \mathbb{P}[X=j] = e^{-\lambda} \frac{\lambda^j}{j!}, \quad j\geq 0 \tag{9.1} \end{equation*}\] Piszemy wtedy \(X \sim Pois(\lambda)\). Przypomnijmy, z podstawowego kursu analizy, że \[\begin{equation*} e^x = \sum_{k=0}^\infty \frac{x^k}{k!}, \end{equation*}\] więc (9.1) rzeczywiście zadaje rozkład prawdopodobieństwa (zadane wagi sumują się do jedności).

Pokażemy w zadaniu, że jeżeli wykonujemy \(n\) prób Bernoulliego z prawdopodobieństwem sukcesu \(p=\lambda/n\) to przy \(n \to \infty\) liczba sukcesów będzie miała w przybliżeniu rozkład Poissona z parametrem \(\lambda\). Oznacza to, że rozkład Poissona używany jest do opisu liczby rzadkich zdarzeń takich jak liczba wypadków samochodowych czy liczba chorych na rzadką chorobę.

Rozkłady absolutnie ciągłe

Definicja 9.2 Zmienna losowa \(X\) o rozkładzie \(\mu_X\) ma rozkład absolutnie ciągły (względem miary Lebesgue’a) jeżeli istnieje funkcja borelowska \(f_X:\mathbb{R}\to [0,\infty)\) taka, że dla dowolnego \(B\in \mathcal{B}or(\mathbb{R})\) \[ \mathbb{P}[X\in B] = \mu_X(B) = \int_B f_X(s)\mathrm{d}s. \] Funkcję \(f_X\) nazywamy gęstością rozkładu \(X\).

Gęstość jest jednoznacznie wyznaczona z dokładnością do zbiorów miary Lebesgue’a zero. Zauważmy, że \[\begin{equation*} \int_\mathbb{R} f_X(s) \mathrm{d}s=\mu_X(\mathbb{R}) =1. \end{equation*}\] Każda funkcja mierzalna i nieujemna \(f\) taka, że \(\int f(x)\mathrm{d}x = 1\) jest gęstością pewnej zmiennej losowej. Jeżeli przez \(F_X\) oznaczymy dystrybuantę zmiennej \(X\), to \[ F_X(t) = \int_{(-\infty,t]} f_X(s) \mathrm{d}s. \] Jeżeli \(f_X\) jest funkcją ciągłą, to powyższa całka jest całką Riemanna i wówczas \(F'_X = f_X\).

Wniosek 9.2 Jeżeli zmienna losowa \(X\) ma rozkład absolutnie ciągły z gęstością \(f_X\), to dla każdej borelowskiej \(\varphi \colon \mathbb{R} \to \mathbb{R}\) mamy \[\begin{equation*} \mathbb{E}[\varphi(X)] = \int_\mathbb{R} \varphi(s)f_X(s) \mathrm{d}s. \end{equation*}\]

Rozkład jednostajny

Niech \(D\in \mathcal{B}or(\mathbb{R})\) będzie dowolnym zbiorem o niezerowej mierze Lebesgue’a. Powiemy, że zmienna losowa \(X\) ma rozkład jednostajny na \(D\) jeżeli \[ f_X(s) = \frac{{\bf 1}_D(s)}{\lambda_1(D)}. \] Wtedy dla każdego \(B\in \mathcal{B}or(\mathbb{R})\) \[ \mathbb{P}[X\in B] = \int_B f_X(s)\mathrm{d}s = \frac{\lambda_1(B\cap D)}{\lambda_1(D)}. \] Dla przykładu jeżeli \(D=[a,b]\), to odpowiadająca gęstość zadaje się wzorem \[\begin{equation*} f_X(s) = \frac{1}{b-a} \mathbf{1}_{[a,b]}(s). \end{equation*}\]

a:
b:

Rozkład wykładniczy

Niech \(\lambda>0\). Powiemy, że zmienna losowa \(X\) ma rozkład wykładniczy z parametrem \(\lambda\) jeżeli jej rozkład jest absolutnie ciągły z gęstością \[ f_X(x) = \lambda e^{-\lambda x} {\bf 1}_{[0,\infty)}(x). \] Piszemy wtedy \(X \sim \mathrm{Exp}(\lambda)\). Wówczas dystrybuanta zadaje się wzorem \[\begin{equation*} \quad F(x) = \left\{ \begin{array}{cc} 0, & x<0 \\ 1-e^{-\lambda x}, & x\ge 0. \end{array}\right. \end{equation*}\]

Rozkład wykładniczy określa moment zajścia zdarzenia losowego

λ:

Rozkład normalny

Powiemy, że zmienna losowa \(X\) ma standardowy rozkład normalny, jeżeli jest rozkład jest absolutnie ciągły z gęstością \[\begin{equation*} f(x) = \frac{1}{\sqrt{2\pi}} e^{-x^2/2}. \end{equation*}\] Piszemy wtedy \(X \sim \mathcal{N}(0,1)\). Funkcja gęstości nie jest elementarna, więc dystrybuanta \(F_X\) nie ma zwartej postaci. \[\begin{equation*} F(x) = \frac 1{\sqrt {2\pi}} \int_{-\infty}^x e^{-t^2/2}\mathrm{d}t. \end{equation*}\] Niech \(\mu \in \mathbb{R}\) i \(\sigma^2>0\). Powiemy, że zmienna losowa \(X\) ma rozkład normalny z parametrami \(\mu\) oraz \(\sigma^2\), jeżeli ma gęstość \[\begin{equation*} f(x) = \frac{1}{\sqrt{2\pi}\sigma} e^{-(x-\mu)^2/(2\sigma^2)}. \end{equation*}\] Piszemy wtedy \(\mathcal{N}(\mu, \sigma^2)\).

μ:
σ:

Pozostałe rozkłady

Rozkłady dyskretne i ciągłe nie wyczerpują wszystkich możliwości. Wiemy, że każdą miarę \(\mu\) można jednoznacznie zapisać w postaci \[ \mu = \mu_{{\rm abs}} + \mu_{{\rm sing}}, \] gdzie \(\mu_{{\rm abs}} \ll{\rm Leb}\) (tzn. \(\mu_{{\rm abs}}\) jest absolutnie ciągła względem \({\rm Leb}\), a \(\mu_{{\rm sing}} \perp {\rm Leb}\) są wzajemnie singularne (rozkład Lebesgue’a).

OSZAR »