previous contents next

12. Оценка параметров распределения.

12.1 Постановка задачи.
Далее в этой главе будет рассматриваться случайная величина $\xi$ с функцией распределения $F(x,\theta_1,\ldots,\theta_n)$, где $\theta_1\ldots,\theta_n$ - неизвестные параметры функции распределения.

Определение 12.1: Пусть $x_1,\ldots,x_n$ - выборка над случайной величиной $\xi$, тогда любая случайная величина $\tilde\theta(x_1,\ldots,x_n)$ не зависящая от параметров $\theta_1,\ldots,\theta_n$ называется статистикой.
Статистика используемая для оценки параметра некорого распределения называется оценкой этого параметра.

Определение 12.2: Пусть $\Theta$ - множество значений параметра $\theta$, $E_{\theta}\tilde\theta$ - математическое ожидание оценки $\tilde\theta(x_1,\ldots,x_n)$ при фиксированном значении параметра распределения $F(x,\theta)$. Тогда оценка $\tilde\theta$ называется несмещённой если для любого $\theta\in\Theta$ $E_{\theta}\tilde\theta=\theta$.
Функция $b(\theta):\Theta\mathbb\to{R}$ такая, что для любого $\theta\in\Theta$ $b(\theta)=E_{\theta}\tilde\theta-\theta$ называется смещением оценки $\tilde\theta$.

Пример 12.1: Пусть случайная величина $\xi$ распределена нормально, т. е. $\xi\sim{N}(a,\sigma^2)$. В задаче 11.1 было показано, что $$E\overline{x}=E\xi=a$$ $$E(S^2)=\frac{(n-1)}{n}D\xi=\frac{(n-1)}{n}\sigma^2.$$ То есть выборочное среднее $\overline{x}$ является несмещённой оценкой для $a$, а выборочная дисперсия $S^2$ - смещённая оценка для $\sigma^2$.

Определение 12.3: Оценка $\tilde\theta$ параметра $\theta$ называется состоятельной, если для любого $\theta\in\Theta$ $$\tilde\theta(x_1,\ldots,x_n)\xrightarrow[n\to\infty]{P}\theta,$$ или что тоже самое $$\forall\varepsilon>0\left(P\{|\tilde\theta(x_1,\ldots,x_n)-\theta|>\varepsilon\}\xrightarrow[n\to\infty]{}0\right).$$

Пример 12.2: В теореме 11.3 было показано, что для любого $k\in\mathbb{N}$ $$A_k\xrightarrow[n\to\infty]{P}\mu_k,\,M_k\xrightarrow[n\to\infty]{P}\nu_k.$$ В частности так как $A_1:=\overline{x}$, $M_2:=S^2$, $\mu_1:=E\xi$, $\nu_2:=D\xi$, то $\overline{x}$ и $S^2$ - состоятельные оценки для $E\xi$ и $D\xi$ соответственно. Покажем, что выборочное среднее $\overline{x}$ не является состоятельной оценкой для параметра $\theta$ распределения Коши $K(\theta,0)$. Действительно, \begin{multline*} \frac1{2\pi}\int\limits_{-\infty}^{\infty}e^{-\theta|t|}e^{itx}dt=\frac1{2\pi}\int\limits_{-\infty}^0e^{\theta{t}}e^{-itx}dt+\frac1{2\pi}\int\limits_0^{\infty}e^{-\theta{t}}e^{-itx}dt= \frac1{2\pi}\lim_{u\to-\infty}\left.\frac{e^{(\theta-ix)t}}{\theta-ix}\right|_{t=u}^0-\frac1{2\pi}\lim_{v\to\infty}\left.\frac{e^{-(\theta+ix)t}}{\theta+ix}\right|_0^{t=v}=\\= \frac1{2\pi}\frac1{\theta-ix}+\frac1{2\pi}\frac1{\theta+ix}=\frac1{\pi}\frac{\theta}{x^2+\theta^2}\sim{K}(\theta,0) \end{multline*} Следовательно, по теореме 6.8 функция $e^{-\theta|t|}$ является характеристической функцией для распределения $K(\theta,0)$. Тогда по п. п. 4, 5 теоремы 6.1 функция $$\varphi_{\overline{x}}(t)=\prod_{i=1}^ne^{-\theta|t/n|}=e^{-\theta|t|}$$ является характеристической функцией выборочного среднего $\overline{x}$ над распределением $K(\theta,0)$. Тогда в силу единственности характеристической функции (теорема 6.7) выборочное среднее распределено по закону Коши $K(\theta,0)$ при любом колличестве элементов выборки $n$, то есть $\overline{x}$ не может стремиться по вероятности к $\theta$ при $n\to\infty$.

Определение 12.4: Величина математического ожидания $E(\tilde\theta-\theta)^2$ называется среднеквадратичной ошибкой оценки $\tilde\theta$ для параметра $\theta$.

Замечание 12.1: \begin{multline*} E(\tilde\theta-\theta)^2=E(\tilde\theta-E\tilde\theta+E\tilde\theta-\theta)^2= E(\tilde\theta-E\tilde\theta)^2+2E((\tilde\theta-E\tilde\theta)(E\tilde\theta-\theta))+E(E\tilde\theta-\theta)^2= D\tilde\theta+2(E\tilde\theta-\theta)E(\tilde\theta-E\tilde\theta)+(E\tilde\theta-\theta)^2=D\tilde\theta+b^2(\theta) \end{multline*} В частности для несмещённой оценки $b(\theta)\equiv0$ и $E(\tilde\theta-\theta)^2=D\tilde\theta$.

12.2 Неравенство Рао-Крамера.

Теорема 12.1: Пусть $\xi$ случайная величина с плотностью распределения $p(x,\theta)$, $(x_1,\ldots,x_n)$ - выборка над $\xi$ тогда, если

  1. Множество $\{x\in\mathbb{R}:p(x,\theta)>0\}$ не зависит от выбора $\theta\in\Theta$.
  2. Интеграл $$\int\limits_{-\infty}^{\infty}p(x,\theta)dx=1$$ можно дифференцировать по $\theta$ под знаком интеграла.
  3. Функция смещения $b(\theta):=E\tilde\theta-\theta$ дифференцируема.
  4. Функцию $$ E\tilde\theta(x_1,\ldots,x_n):=\int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}\tilde\theta(x_1,\ldots,x_n)dF_{\tilde\theta}(x_1,\ldots,x_n)= \int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}\tilde\theta(x_1,\ldots,x_n)\prod_{i=1}^np(x_i,\theta)dx_1\cdots{d}x_n $$ можно дифференцировать по $\theta$ под знаком интеграла.
  5. Функция $$I(\theta):=\int\limits_{-\infty}^{\infty}\left(\frac{\partial\ln{p}(x_i,\theta)}{\partial\theta}\right)^2p(x_i,\theta)dx_i$$ положительна для любого $i\in\overline{1,n}$ и $\theta\in\Theta$.
то $$E(\tilde\theta-\theta)^2\geq\frac{(1+b'(\theta))^2}{nI(\theta)}.$$

Доказательство:
Обозначим набор переменных $x_1,\ldots,x_n$ как $\overline{x}$, тогда в силу независимости случайных величин в выборке \begin{multline*} \int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}\frac{\partial{p}(\overline{x};\theta)}{\partial\theta}dx_1\cdots{d}x_n= \int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}\frac{\partial\prod_{i=1}^np(x_i,\theta)}{\partial\theta}dx_1\cdots{d}x_n=\\= \int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}\sum_{i=1}^np(x_1,\theta)\cdots\frac{\partial{p}(x_i,\theta)}{\partial\theta}\cdots{p}(x_n,\theta)dx_1\cdots{d}x_n=\\= \sum_{i=1}^n\int\limits_{-\infty}^{\infty}p(x_1,\theta)dx_1\cdots\int\limits_{-\infty}^{\infty}\frac{\partial{p}(x_i,\theta)}{\partial\theta}dx_i\cdots\int\limits_{-\infty}^{\infty}p(x_n,\theta)dx_n=0 \end{multline*} Последнее равенство в силу того что для любого $i\in\overline{1,n}$ $i$-тый множитель в $i$-том слагаемом равен нулю. При этом продифференцировав по $\theta$ равенство $E\tilde\theta=\theta+b(\theta)$ получим $$\int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}\tilde\theta(\overline{x})\frac{\partial{p}(\overline{x};\theta)}{\partial\theta}dx_1\cdots{d}x_n=1+b'(\theta).$$ Вычитая из этого равенства равенство полученное выше умноженное на $\theta$ получим $$\int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}(\tilde\theta-\theta)\frac{\partial{p}(\overline{x};\theta)}{\partial\theta}dx_1\cdots{d}x_n=1+b'(\theta).$$ Умножми и разделим левую часть на $p(\overline{x};\theta)$ $$ \int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}(\tilde\theta-\theta)\sqrt{p(\overline{x};\theta)}\frac{\partial{p}(\overline{x};\theta)}{\partial(\theta)}\frac1{p(\overline{x};\theta)}\sqrt{p(\overline{x};\theta)}dx_1\cdots{d}x_n= 1+b'(\theta) $$ Из неравенства Коши-Буняковского на пространстве непрерывных функций ($\int{f}^2\int{g}^2\geq\left(\int{f}g\right)^2$ - пример 15.1.1 MA) следует $$ \int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}(\tilde\theta-\theta)^2p(\overline{x};\theta)dx_1\cdots{d}x_n\int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}\left(\frac{\partial\ln{p}(\overline{x};\theta)}{\partial\theta}\right)^2p(\overline{x};\theta)dx_1\cdots{d}x_n\geq(1+b'(\theta))^2. $$ Обозначим второй множитель левой части неравенства как $I_n(\theta)$, тогда $$E(\tilde\theta-\theta)^2I_n(\theta)\geq(1+b'(\theta))^2.$$ Осталость доказать, что $I_n(\theta)=nI(\theta)$. $$ E\frac{\partial\ln{p}(\overline{x};\theta)}{\partial\theta}=E\frac{\partial\ln\prod_{i=1}^n{p}(x_i,\theta)}{\partial\theta}=E\frac{\partial}{\partial\theta}\sum_{i=1}^n\ln{p}(x_i,\theta)=\sum_{i=1}^nE\frac{\partial\ln{p}(x_i,\theta)}{\partial\theta} $$ Для любого $i\in\overline{1,n}$ $$ E\frac{\partial\ln{p}(x_i,\theta)}{\partial\theta}=\int\limits_{-\infty}^{\infty}\frac{\partial\ln{p}(x_i,\theta)}{\partial\theta}p(x_i,\theta)dx_i=\int\limits_{-\infty}^{\infty}\frac{\partial{p}(x_i,\theta)}{\partial\theta}dx_i=0,\quad(*) $$ следовательно, $$E\frac{\partial\ln{p}(\overline{x};\theta)}{\partial\theta}=0.\quad(**)$$ Тогда \begin{multline*} I_n(\theta)=\int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}\left(\frac{\partial\ln{p}(\overline{x};\theta)}{\partial\theta}\right)^2p(\overline{x},\theta)dx_1\cdots{d}x_n= E\left(\frac{\partial\ln{p}(\overline{x};\theta)}{\partial\theta}\right)^2= D\frac{\partial\ln{p}(\overline{x};\theta)}{\partial\theta}=D\sum_{i=1}^n\frac{\partial\ln{p}(x_i,\theta)}{\partial\theta}=\\= \sum_{i=1}^nD\frac{\partial\ln{p}(x_i,\theta)}{\partial\theta}=\sum_{i=1}^nE\left(\frac{\partial\ln{p}(x_i,\theta)}{\partial\theta}\right)^2= \sum_{i=1}^n\int\limits_{-\infty}^{\infty}\left(\frac{\partial\ln{p}(\overline{x};\theta)}{\partial\theta}\right)^2p(x_i,\theta)dx_i=nI(\theta) \end{multline*} Здесь третье равенство в силу (**), пятое в силу независимости элементов выборки и п. 6 теоремы 4.20, а шестое в силу (*).

Замечание 12.2: Условия теоремы 12.1 называются условиями регулярности.

Определение 12.5: Функция $I(\theta)$ из условий регулярности называется информацией по Фишеру полученной из одного наблюдения над случайной величиной $\theta$.
Функция $I_n(\theta)=nI(\theta)$ назывется информацией по Фишеру полученной из $n$ наблюдений (или из выборки объёма $n$) над случайной величиной $\theta$.

Следствие 12.1: Если оценка $\tilde\theta$ несмещённая и выполняются условия теоремы 12.1, то $$D\tilde\theta\geq\frac1{nI(\theta)}.$$

Доказательство:
Утверждение следует из теоремы 12.1 и замечания 12.1

Следствие 12.2: Условия регулярности для дискретного случая.
Пусть $\xi$ дискретная случайная величина с множеством значений $X$, распределение которой зависит от параметра $\theta$; $\tilde\theta$ - оценка параметра $\theta$, множество значений котрого равно $\Theta$; $(y_1,\ldots,y_n)$ выборка над $\xi$. Для люого $x\in{X}$, $\theta\in\Theta$ обозначим $p(x,\theta):=P\{\xi=x,\theta\}$, тогда если

  1. Множество $\{x\in{X}:p(x,\theta)>0\}$ не зависит от выбора $\theta\in\Theta$.
  2. Ряд $\sum_{x\in{X}}p(x,\theta)=1$ можно дифференцировать почленно по $\theta$.
  3. Функция $b(\theta):=E\tilde\theta(y_1,\ldots,y_n)-\theta$ дифференцируема по $\theta$.
  4. Ряд $$E\tilde\theta(y_1,\ldots,y_n)=\sum_{y_1\in{X}}\cdots\sum_{y_n\in{X}}\tilde\theta(y_1,\ldots,y_n)\prod_{i=1}^np(y_i,\theta)$$ можно дифференцировать почленно по $\theta$.
  5. Для любого $\theta\in\Theta$ ряд $$I(\theta):=\sum_{x\in{X}}\left(\frac{\partial\ln{p}(x,\theta)}{\partial\theta}\right)^2p(x,\theta)$$ сходится к положительному числу.
то $$E(\tilde\theta-\theta)^2\leq\frac{(1+b'(\theta))^2}{nI(\theta)}$$

Доказательство:
Следует из теоремы 12.1 и равенства $$\int\limits_{-\infty}^{\infty}xdF_{\xi}(x)=\sum_{x\in{X}}xP\{\xi=x\}.$$

Пример 12.3: Пусть $$\xi\sim{p}(x,\theta):=\frac1{\sqrt{2\pi}\sigma}e^{-(x-\theta)^2/2\sigma^2},$$ значение $\theta:=E\xi$ неизвестно, значение $\sigma$ известно. Задача оценить $\theta$ по выборке объёма $n$ $(x_1,\ldots,x_n)$. Рассмотрим в качестве оценки выборочное среднее $\tilde\theta:=\overline{x}=\frac1{n}\sum_{i=1}^nx_i$. Проверим условия регулярности.

  1. Так как фунция нормальной плотности положительна при любом математическом ожидании, то $\{x\in\mathbb{R}:p(x,\theta)>0\}=\mathbb{R}$ для любого $\theta\in\mathbb{R}$.
  2. Применим следствие 13.2.1 MA. Условия 1, 2 очевидны условие 4 выполняется так как для любого $\theta\in\mathbb{R}$ $\int_{-\infty}^{\infty}p(x,\theta)=1$, проверим условие 3. \begin{multline*} \int\limits_{-\infty}^{\infty}\frac{\partial{p}(x,\theta)}{\partial\theta}dx= \int\limits_{-\infty}^{\infty}\frac1{\sqrt{2\pi}\sigma}e^{-(x-\theta)^2/2\sigma^2}\frac{x-\theta}{\sigma^2}dx= \frac1{\sqrt{2\pi}\sigma^3}\int\limits_{-\infty}^{\infty}(x-\theta)e^{-(x-\theta)^2/2\sigma^2}dx=\\= \frac1{\sigma^2}\left(\frac1{\sqrt{2\pi}\sigma}\int\limits_{-\infty}^{\infty}xe^{-(x-\theta)^2/2\sigma^2}dx- \theta\frac1{\sqrt{2\pi}\sigma}\int\limits_{-\infty}^{\infty}e^{-(x-\theta)^2/2\sigma^2}dx\right)= \frac1{\sigma^2}(E\xi-\theta)=0 \end{multline*} Значение интеграла не зависит от $\theta$ значит сходимость равномерная по $\theta$, т. е. условие 3 следствия 13.2.1 MA выполнено.
  3. В примере 12.1 было показано, что $\overline{x}$ несмещённая оценка для матожидания нормального распределения, то есть функция $b(\theta)\equiv0$ дифференцируема по $\theta$.
  4. Аналогично п. 2 проверим п. 3 условий следствия 13.2.1 MA. Так как \begin{multline*} E\tilde\theta=E\overline{x}=E\left(\frac1{n}\sum_{i=1}^nx_i\right)= \int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}\frac1{n}\sum_{i=1}^nx_ip(x_1,\ldots,x_n;\theta)dx_1\cdots{d}x_n= \frac1{n}\sum_{i=1}^n\int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}x_i\prod{p}(x_i,\theta)dx_1\dots{d}x_n=\\= \frac1{n}\sum_{i=1}^n\left(\int\limits_{-\infty}^{\infty}p(x_1,\theta)dx_1\cdots\int\limits_{-\infty}^{\infty}x_ip(x_i,\theta)dx_i\cdots\int\limits_{-\infty}^{\infty}p(x_n,\theta)dx_n\right)= \frac1{n}\sum_{i=1}^n\int\limits_{-\infty}^{\infty}x_ip(x_i,\theta)dx_i \end{multline*} и \begin{multline*} \int\limits_{-\infty}^{\infty}x\frac{\partial{p}(x,\theta)}{\partial\theta}dx=\frac1{\sqrt{2\pi}\sigma}\int\limits_{-\infty}^{\infty}xe^{-(x-\theta)/2\sigma^2}\frac{x-\theta}{\sigma^2}dx=\\= \frac1{\sqrt{2\pi}\sigma^3}\left(\int\limits_{-\infty}^{\infty}(x-\theta)^2e^{-(x-\theta)^2/2\sigma^2}dx+\theta\int\limits_{-\infty}^{\infty}(x-\theta)e^{-(x-\theta)^2/2\sigma^2}dx\right)= \frac1{\sigma^2}(\sigma^2+\theta(E\xi-\theta))=1 \end{multline*} то $$\frac{\partial{E}\tilde\theta}{\partial\theta}=\frac1{n}\sum_{i=1}^n\int\limits_{-\infty}^{\infty}x_i\frac{\partial{p}(x_i,\theta)}{\partial\theta}dx_i=1.$$ Так как полученное значение не зависит от $\theta$, то сходимость равномерна по $\theta$.
  5. \begin{multline*} I(\theta)=\int\limits_{-\infty}^{\infty}\left(\frac{\partial\ln{p}(x,\theta)}{\partial\theta}\right)^2p(x,\theta)dx= \int\limits_{-\infty}^{\infty}\left(\frac{\partial}{\partial\theta}\frac{(x-\theta)^2}{2\sigma^2}\right)^2p(x,\theta)dx= \int\limits_{-\infty}^{\infty}\frac{(x-\theta)^2}{\sigma^4}e^{-(x-\theta)^2/2\sigma^2}dx=\frac{\sigma^2}{\sigma^4}=\frac1{\sigma^2}>0 \end{multline*}
Таким обрзаом, по следствию 12.1 $$D\tilde\theta=D\overline{x}\geq\frac1{nI(\theta)}=\frac{\sigma^2}{n}.$$ С другой стороны, в задаче 11.1 было показано, что $D\overline{x}=\sigma^2/n$, то есть в данном случае неравенство Рао-Крамера обращается в равенство.

Определение 12.6: Несмещённая оценка удовлетворяющая условиям регулярности называется эффективной, если для неё неравенство Рао-Крамера обращается в равенство.
Эффективная оценка для которой при $n\to\infty$ выполняется $D\tilde\theta=o(1/n)$ называется сверхэффективной.

Пример 12.4: Пусть $$\xi\sim{p}(x,\theta)=\frac1{\sqrt{2\pi\theta}}e^{-(x-\mu)^2/2\theta},$$ $E\xi=\mu$ известно, $\sigma^2=\theta$ - неизвестно. Задача: оценить $\theta$ по выборке объёма $n$ $(x_1,\ldots,x_n)$. В примере 12.1 показано, что $E(S^2)=((n-1)\sigma^2)/n\neq\sigma^2$, то есть оценка $S^2$ смещённая. Тогда оценка $$\overline{S}^2:=\frac{n}{n-1}S^2=\frac1{n-1}\sum_{i=1}^n(x_i-\overline{x})^2$$ несмещённая. Проверим условия регулярности для оценки $\overline{S}^2$ параметра $\theta:=\sigma^2$.

  1. Так как функция плотности нормального распределения положительна при любом значении дисперсии, то $\{x\in\mathbb{R}:p(x,\theta)>0\}=\mathbb{R}$ при любом значении $\theta$.
  2. Аналогично п. 2 примера 12.3 проверим равномерную сходимость интеграла $\int_{-\infty}^{\infty}\frac{\partial}{\partial\theta}p(x,\theta)dx$. \begin{multline*} \int\limits_{-\infty}^{\infty}\frac{\partial}{\partial\theta}\left(\frac1{\sqrt{2\pi\theta}}e^{-(x-\mu)^2/2\theta}\right)dx= \int\limits_{-\infty}^{\infty}\frac1{\sqrt{2\pi}}\frac{-1}{2\theta^{3/2}}e^{-(x-\mu)^2/2\theta}dx+\int\limits_{-\infty}^{\infty}\frac1{\sqrt{2\pi\theta}}e^{-(x-\mu)^2/2\theta}\frac{(x-\mu)^2}{2\theta^2}dx=\\= -\frac1{2\theta}\int\limits_{-\infty}^{\infty}p(x,\theta)dx+\frac1{2\theta^2}\int\limits_{-\infty}^{\infty}(x-\mu)^2p(x,\theta)dx=-\frac1{2\theta}+\frac{\theta}{2\theta^2}=0 \end{multline*}
  3. Как было показано выше оценка $\overline{S}^2$ является несмещённой для параметра $\theta:=\sigma^2$, следовательно, функция $b(\theta)\equiv0$ дифференциреума по $\theta$.
  4. Аналогично п. 4 примера 12.3 проверим равномерную сходимость по $\theta$ матожидания $$E\frac{\partial\overline{S}^2}{\partial\theta}= \int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}\frac{\partial}{\partial\theta}\frac1{n-1}\sum_{i=1}^n(x_i-\overline{x})^2p(x_1,\ldots,x_n;\theta)dx_1\cdots{d}x_n.$$ без доказательства
  5. Так как $$ \frac{\partial}{\partial\theta}\ln\left(\frac1{\sqrt{2\pi\theta}}e^{-(x-\mu)^2/2\theta}\right)= \frac{\partial}{\partial\theta}\left(\ln\frac1{\sqrt{2\pi}}-\frac12\ln\theta-\frac{(x-\mu)^2}{2\theta}\right)=-\frac1{2\theta}+\frac{(x-\mu)^2}{2\theta^2} $$ то $$ I(\theta)=\int\limits_{-\infty}^{\infty}\left(-\frac1{2\theta}+\frac{(x-\mu)^2}{2\theta^2}\right)^2p(x,\theta)dx= \frac1{2\theta^2}\int\limits_{-\infty}^{\infty}p(x,\theta)dx-\frac1{2\theta^3}\int\limits_{-\infty}^{\infty}(x-\mu)^2p(x,\theta)dx+\frac1{4\theta^4}\int\limits_{-\infty}^{\infty}(x-\mu)^4p(x,\theta)dx= \frac1{4\theta^2}-\frac1{2\theta^2}+\frac3{4\theta^2}=\frac1{2\theta^2} $$ Здесь предпоследнее равенство в силу того, что для нормального распределения $\nu_4=3\sigma^4$ (пример 4.4).
Таким образом, условия регулярности выполняются т. е. $$D\overline{S}^2\geq\frac1{nI(\theta)}=\frac{2\theta^2}{n}\neq\frac{2\theta^2}{n-1}=D\overline{S}^2,$$ т. е. $\overline{S}^2$ не эффективная оценка для параметра $\theta$.

Задача 12.1: Доказать, что для случайной величины $\xi\sim{N}(\theta,\mu)$ $$D\overline{S}^2=\frac{2\theta^2}{n-1}$$.
Пусть $\xi\sim{N}(0,1)$, тогда из примера 4.4 следует $$D\xi^2=E\xi^4-(E\xi^2)^2=3\sigma^4-\sigma^4=2\sigma^4=2.$$ Так как $\xi_1^2+\cdots+\xi_n^2\sim\chi_n^2$, где для любого $i\in\overline{1,n}$ $\xi_i\sim{N}(0,1)$ (см. например Г. Крамер "Математические методы статистики" 1975 г. стр. 258) и случайные величины $\xi_1,\ldots,\xi_n$ независимы, то дисперсия распределения $\chi_n^2$ равна $2n$. $$\frac{n-1}{\theta}\overline{S}^2\sim\chi_{n-1}^2\Rightarrow\frac{(n-1)^2}{\theta^2}D\overline{S}^2=2(n-1)\Rightarrow{D}\overline{S}^2=\frac{2\theta^2}{n-1}$$ Доказательство первого соотношения это теорема Фишера доказательство будет приведено в разделе "Доверительные интервалы".

Задача 12.2: Пусть $$\xi\sim{p}(x;\theta):=\begin{cases}e^{\theta-x},x\geq\theta \\ 0, x<\theta\end{cases},$$ $\tilde\theta=\tilde\theta(x_1,\ldots,x_n)=\min(x_1,\ldots,x_n)$ - оценка для $\theta$, $\varphi(x)$ - плотность распределения $\tilde\theta$.

  1. Доказать, что $$E\tilde\theta=\int\limits_{\theta}^{\infty}x\varphi(x)dx=\theta+\frac1{n}.$$
  2. Проверить условия регулярности для оценки $\tilde\theta_1:=\theta-1/n$. Убедиться, что неравенство Рао-Крамера не выполняется.
  1. Несложно видеть, что $F(x):=1-e^{\theta-x}$ - функция распределения случайной величины $\xi$, тогда $$ 1-F_{\tilde\theta}(x)=P\{\min(x_1,\ldots,x_n)>x\}=P\{x_1>x,\ldots,x_n>x\}= \prod_{i=1}^n(1-F(x))=e^{n(\theta-x)}\Rightarrow{F}_{\tilde\theta}(x)=1-e^{n(\theta-x)}\Rightarrow\varphi(x)=F'_{\tilde\theta}(x)=ne^{n(\theta-x)} $$ \begin{multline*} E\tilde\theta=\int\limits_{\theta}^{\infty}nxe^{n(\theta-x)}dx= e^{n\theta}\int\limits_{\theta}^{\infty}nxe^{-nx}dx=e^{n\theta}\frac1{n}\int\limits_{n\theta}^{\infty}te^{-t}dt= -\frac{e^{n\theta}}{n}\int\limits_{n\theta}^{\infty}tde^{-t}= -\frac{e^{n\theta}}{n}\left(\left.te^{-t}\right|_{n\theta}^{\infty}-\int\limits_{n\theta}^{\infty}e^{-t}dt\right)= -\frac{e^{n\theta}}{n}\left(-n\theta{e}^{-n\theta}-e^{-n\theta}\right)=\theta+\frac1{n} \end{multline*} \begin{multline*} E\tilde\theta^2=\int\limits_{\theta}^{\infty}x^2\varphi(x)dx=\int\limits_{\theta}^{\infty}nx^2e^{n(\theta-x)}dx=\frac{e^{n\theta}}{n}\int\limits_{\theta}^{\infty}(nx)^2e^{-nx}dx= -\frac{e^{-n\theta}}{n^2}\int\limits_{n\theta}^{\infty}t^2de^{-t}=\frac{e^{n\theta}}{n^2}\left(\left.t^2e^{-t}\right|_{n\theta}^{\infty}-2\int\limits_{n\theta}^{\infty}te^{-t}dt\right)=\\= -\frac{e^{n\theta}}{n^2}\left(-(n\theta)^2e^{-n\theta}-2e^{-n\theta}(n\theta+1)\right)=\theta^2+\frac{2n}{\theta}+\frac2{n^2}= \left(\theta+\frac1{n}\right)^2+\frac1{n^2}=(E\tilde\theta)^2+\frac1{n^2} \end{multline*} Таким образом, $$D\tilde\theta=E\tilde\theta^2-(E\tilde\theta)^2=\frac1{n^2}={o}\left(\frac1{n}\right),n\to\infty,$$ оценка $\tilde\theta-1/n$ являлась бы сверхэффективной если бы она была эффективной.
  2. Проверим условия регулярности для оценки $\tilde\theta_1:=\tilde\theta-1/n$. Так как $\{x\in\mathbb{R}:p(x;\theta)>0\}=\{x\in\mathbb{R}:x\geq\theta\}$ зависит от выбора $\theta$, то первое условие регулярности не выполняется. $$I(\theta)=\int\limits_{\theta}^{\infty}\left(\frac{\partial\ln{p}(x;\theta)}{\partial\theta}\right)^2p(x;\theta)dx=\int\limits_{\theta}^{\infty}p(x;\theta)dx=1.$$ Следовательно, $1/nI(\theta)=1/n$ эта величина превышает $D\tilde\theta=1/n^2$ при любом $n>1$, то есть неравенство Рао-Крамера не выполняется.

Лемма 12.1: Неравенство Коши-Буняковского.
Пусть $\xi_1$ и $\xi_2$ не равные тождественно нулю случайные величины. Неравенство $(E|\xi_1\xi_2|)^2\leq{E}\xi_1^2E\xi_2^2$ обращается в равенство тогда и только тогда, когда случайные величины $|\xi_1|$ и $|\xi_2|$ линейно зависимы, то есть существуют $c_1,c_2\in\mathbb{R}/0$ такие, что $c_1|\xi_1|+c_2|\xi_2|=0(P_{\text{пн.}})$.

Доказательство:
$\Rightarrow)$ Пусть $(E|\xi_1\xi_2|)^2=E\xi_1^2E\xi_2^2$, тогда для любых $u,v\in\mathbb{R}$ $$ E(u|\xi_1|+v|\xi_2|)^2=u^2E\xi_1^2+2uvE|\xi_1\xi_2|+v^2E\xi_2^2= u^2E\xi_1^2+2uv\sqrt{E\xi_1^2E\xi_2^2}+v^2E\xi_2^2=\left(u\sqrt{E\xi_1^2}+v\sqrt{E\xi_2^2}\right)^2 $$ Положив $u:=1$, $v:=-\sqrt{E\xi_1^2}/\sqrt{E\xi_2^2}$, получим $E(u|\xi_1|+v|\xi_2|)^2=0$, тогда по п. 3 теоремы 4.5 $u|\xi_1|+v|\xi_2|=0(P_{\text{пн.}})$.
$\Leftarrow)$ Обозначим $q:=-c_2/c_1$, тогда $$\xi_1=-q\xi_2\Rightarrow\begin{cases}(E|\xi_1\xi_2|)^2=(E|-q\xi_2^2|)^2=q^2(E\xi_2^2)^2 \\ E\xi_1^2E\xi_2^2=E(q\xi_2)^2E\xi_2^2=q^2(E\xi_2^2)^2\end{cases}$$

Теорема 12.2: Несмещённая оценка $\tilde\theta$ параметра $\theta$ удовлетворяющая условиям регулярности является эффективной тогда и только тогда, когда функция правдоподобия $p(\overline{x};\theta)$ представима в виде $$e^{A(\theta)\tilde\theta+B(\theta)}H(\overline{x}),$$ где функции $A(\theta)$, $B(\theta)$ не зависят от наблюдений, а функция $H(\overline{x})$ не зависит от выбора $\theta$.

Доказательство:
$\Rightarrow)$ Обозначим $$f(\overline{x};\theta):=(\tilde\theta-\theta)\sqrt{p(\overline{x};\theta)},$$ $$g(\overline{x};\theta):=\frac{\partial{p}(\overline{x};\theta)}{\partial\theta}\frac1{p(\overline{x};\theta)}\sqrt{p(\overline{x};\theta)}.$$ Тогда из доказательства теоремы 12.1 следует, что при обращении неравенства Рао-Крамера в равенство справедливо $$ \left(\int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}f(\overline{x};\theta)g(\overline{x};\theta)dx_1\cdots{d}x_n\right)^2= \int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}f^2(\overline{x};\theta)dx_1,\cdots{d}x_n\int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}g^2(\overline{x};\theta)dx_1\cdots{d}x_n $$ или $$\left(Ef(\overline{x};\theta)g(\overline{x};\theta)\right)^2=Ef^2(\overline{x};\theta)Eg^2(\overline{x};\theta),$$ тогда по лемме 12.1 (?) функции $f(\overline{x};\theta)$ и $g(\overline{x};\theta)$ (или их модули?) линейно связаны, то есть существует функция $K(\theta)$ такая, что $$(\tilde\theta-\theta)\sqrt{p(\overline{x};\theta)}=K(\theta)\frac{\partial{p}(\overline{x};\theta)}{\partial\theta}\frac1{p(\overline{x};\theta)}\sqrt{p(\overline{x};\theta)}$$ $$\frac{\partial\ln{p}(\overline{x};\theta)}{\partial\theta}=\frac1{K(\theta)}(\tilde\theta-\theta).$$ Проинтегрировав по $\theta$ получим $$\ln{p}(\overline{x};\theta)=\tilde\theta\int\frac1{K(\theta)}d\theta-\int\frac{\theta}{K(\theta)}d\theta,$$ следовательно, положив $$A(\theta):=\int\frac1{K(\theta)}d\theta;\,B(\theta):=\int\frac{\theta}{K(\theta)}d\theta$$ получим $$p(\overline{x};\theta)=e^{A(\theta)\tilde\theta+B(\theta)}.$$ $\Leftarrow)$ См. задачу 12.3.

Задача 12.3: Доказать достаточность для теоремы 12.2.
Пусть существуют $A(\theta)$, $B(\theta)$, $H(\overline{x})$ такие, что $$p(\overline{x};\theta)=e^{A(\theta)\tilde\theta+B(\theta)}H(\overline{x}).$$ Из доказательства теоремы 12.1 следует, что неравество Рао-Крамера обращается в равенство при обращении в равенство неравенства $$ \left(\int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}(\tilde\theta-\theta)\frac{\partial{p}(\overline{x};\theta)}{\partial\theta}dx_1\cdots{d}x_n\right)^2\leq \int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}(\tilde\theta-\theta)^2p(\overline{x};\theta)dx_1\cdots{d}x_n\int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}\left(\frac{\partial\ln{p}(\overline{x};\theta)}{\partial\theta}\right)^2p(\overline{x};\theta)dx_1\cdots{d}x_n. $$ Подставляя сюда выражение для $p(\overline{x};\theta)$ получим \begin{multline*} \left(\int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}(\tilde\theta-\theta)(\tilde\theta{A}'(\theta)+B'(\theta))p(\overline{x};\theta)dx_1\cdots{d}x_n\right)^2\leq \int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}(\tilde\theta-\theta)^2p(\overline{x};\theta)dx_1\cdots{d}x_n \int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}(\tilde\theta{A}'(\theta)+B'(\theta))^2p(\overline{x};\theta)dx_1\cdots{d}x_n \end{multline*} или $$\left(E(\tilde\theta-\theta)(\tilde\theta{A}'(\theta)+B'(\theta))\right)^2\leq{E}(\tilde\theta-\theta)^2E(\tilde\theta{A}'(\theta)+B'(\theta))^2.\quad(*)$$ Так как \begin{multline*} \int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}p(\overline{x};\theta)dx_1\cdots{d}x_n=1\Rightarrow \int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}\frac{\partial{p}(\overline{x};\theta)}{\partial\theta}dx_1\cdots{d}x_n=0\Rightarrow\\\Rightarrow \int\limits_{-\infty}^{\infty}\cdots\int\limits_{-\infty}^{\infty}(\tilde\theta{A}'(\theta)+B'(\theta))p(\overline{x};\theta)dx_1\cdots{d}x_n={A}'(\theta)E\tilde\theta+B'(\theta)=0\Rightarrow{B}'(\theta)=-\theta{A}'(\theta), \end{multline*} следовательно, случайные величины $\tilde\theta-\theta$ и $\tilde\theta{A}'(\theta)+B'(\theta)$ линейно связаны. Тогда по лемме 12.1 неравенство $(*)$ обращается в равенство, то есть оценка $\tilde\theta$ эффективна.



previous contents next