В начало

Интервальные оценки (Лекция)

ПЛАН ЛЕКЦИИ

1. Оценка точности вычисления генеральной средней 

2. Оценка точности вычисления среднего квадратического отклонения генеральной совокупности по данным выборки

3. Доверительные интервалы для оценки генеральной средней

4. Доверительные границы для оценки σ0

 

Точечная оценка без указания степени точности и надежности малоинформативна, так как наблюдаемые значения статистики есть лишь значения случайной величины. Она может существенно отличаться от оцениваемого параметра при малом объеме выборки, что приводит к грубым ошибкам.

Интервальной оценкой параметра Q называют такой интервал (Qn*(1), Qn*(2)), относительно которого можно утверждать с определенной, близкой к единице вероятностью γ, что он содержит неизвестное значение параметра Q. Величину γ называют доверительной вероятностью или надежностью оценки параметра Q; Qn*(1) и Qn*(2) – некоторые функции от результатов выборочных наблюдений x1, x2, ..., хn.

Разность

h=Qn*(2)Qn*(1)

между верхней и нижней грaницами доверительного интервала называют шириной доверительного интервала, а величину δ=h/2 – точностью оценки.

Ширина доверительного интервала зависит от объема выборки n и от величины доверительной вероятности: она уменьшается с ростом n и увеличивается с приближением доверительной вероятности к единице.

Для построения интервальных оценок необходимо знать закон распределения статистики (выборочной характеристики) Qn*.

 

1. Оценка точности вычисления генеральной средней

Обозначим через ε точность приближенного равенства . Тогда определение точности вычисления генеральной средней  по данным выборки сведется к определению вероятности того, что истинное значение  находится в пределах , где ε>0, т.е.

.

Для определения вероятности γ можно воспользоваться распределением величины

.

Из статистики известно, что если генеральная совокупность имеет нормальное распределение, то величина t при любом n следует закону Стьюдента, который имеет следующее выражение:

,

где k=n-1 – число степеней свободы; Г(k) – гамма функция (интеграл Эйлера;

).

Значение Sk(t) зависит от переменной t и числа степеней свободы k. Поэтому, если задана вероятность γ, то можно найти такое положительное число tγ, которое будет зависеть только от γ и n:

.

Так как , то последнее выражение перепишем в виде

Значения tγ приводятся в справочной литературе по статистике. С достаточной для практической цели точностью значение tγ можно определить по следующим уравнениям, полученным в результате аппроксимации табличных значений для наиболее употребительных значений γ=0,9; 0,95; 0,99:

 

;  

 

;  

 

2. Оценка точности вычисления среднего квадратического отклонения генеральной совокупности по данным выборки

Задача сводится к определению вероятности γ приближенного равенства σ0s, точность которого равны ε. Здесь s – среднее квадратичное отклонение выборки из объема n.

Если известно, что случайная величина х в генеральной совокупности подчинена нормальному закону, то величина

имеет распределение χ2, дифференциальная функция которого имеет вид

.

Определим вероятность γ приближенного равенства σ0s

.

Преобразуем неравенство в скобках следующим образом, полагая, что s>0:

.

Умножим все члены неравенства на положительное число , получим

.

Обозначим . Откуда  и

Вероятность этого неравенства равна интегралу

.

Левая часть этого уравнения есть преобразованное выражение вероятности. С учетом этого окончательно можно записать

.

Значения интеграла  приводятся в таблице.

При числе степеней свободы k≥30 оценка может быть упрощена, так как величина , где  подчиняется нормальному закону распределения и, следовательно,

.

Полагая , получим  .

Следовательно,

,

где

 - нормированная функция Лапласа.

Значения функции Лапласа для различных  табулированы.

 

3. Доверительные интервалы для оценки генеральной средней

Статистическая оценка параметра, вычисленная по данным выборки, является приближенной. Такая оценка будет иметь смысл, если указан интервал, внутри которого будет находиться истинное значение параметра с заданной вероятностью

Значение t можно определить по таблицам или можно воспользоваться следующей аппроксимацией:

,

где а=-6,163127*10-5, b=1,255452, c=-2,3107156, d=1,0572091, f=-1,833726, g=0,56556408, h=0,4592514, m=-0,19052311.

Для выборок, объем которых меньше 25 – 30, величина t имеет распределение Стьюдента. В этом случае t определяется из таблиц распределения Стьюдента или вычисляется по формулам для t0,9;k, t0,95;k, t0,99;k, приведенным ранее для принятой вероятности γ и заданного числа n.

 

4. Доверительные границы для оценки σ0

Если генеральная совокупность имеет нормальное распределение, то величина, то величина  имеет χ2-распределение с числом степеней свободы k=n-1.

Задавшись вероятностью γ, определяют уровень значимости q=1-γ, а затем два значения χ2: одно для вероятности , а другое для вероятности . Первое из этих значений обозначим через χ12, а другое – χ22. Тогда вероятность того, что величина  будет находиться в границах от χ12до χ22, будет равна

.

С вероятностью γ будет выполняться следующее неравенство:

.

Значения χ2 для различных значений γ можно определить по следующим зависимостям:

;

 

;    

;  

 

;  

 

;   

 

;

 

;

;         

 

;     

;   

 

.    

Для больших выборок (n>30) можно использовать неравенство следующего вида

.