В начало

Биномиальное распределение (Тема)

 

Биномиальное распределение – это одно из самых распространенных дискретных распределений, оно служит вероятностной моделью для многих явлений. Оно возникает в тех случаях, когда нас интересует, сколько раз происходит некоторое событие в серии из определенного числа независимых наблюдений (опытов), выполняемых в одинаковых условиях. Поясним сказанное на примере.

Рассмотрим какое-либо массовое производство. Даже во время его нормальной работы иногда изготавливаются изделия, не соответствующие стандарту, т.е. дефектные. Обозначим долю дефектных изделий через q, 0<q<1. Какое именно произведенное изделие окажется негодным, сказать заранее (до его изготовления) невозможно.

Для описания подобной ситуации обычно используется следующая математическая модель:

а)   каждое изделие с вероятностью q может оказаться дефектным (с вероятностью p=1–q оно соответствует стандарту); эта вероятность для всех изделий одинакова;

б)   появление как дефектных, так и стандартных изделий происходит независимо друг от друга. Это значит, что в нормальном процессе производства появление бракованного изделия не влияет на возможность появления брака в дальнейшем. Нарушение этого условия означает сбой нормального технологического режима.

Последовательность независимых испытаний, в которых результатом каждого из испытаний может быть один из двух исходов (например, успех и неудача), и вероятность «успеха» (или «неудачи») в каждом из испытаний одна и та же, называется схемой испытаний Бернулли. Поэтому мы можем перефразировать вышесказанное так: в нормальных условиях технологический процесс производства математически пред­ставляется схемой испытаний Бернулли.

Для чего же на производстве требуется подсчитывать число дефектных изделий? Как правило, это делается для контроля технологического процесса. При массовом производстве сплошная проверка качества изготовленных изделий обычно неоправданна. Поэтому для контроля качества из произведенной продукции наудачу отбирают определенное количество изделий (в дальнейшем –n), проверяют их, регистрируют найденное число бракованных изделий (в дальнейшем – X) и в зависимости от значения X принимают то или иное решение о состоянии производственного процесса. Теоретически X может принимать любые целые значения от 0 до п включительно, но, конечно, вероятности этих значений различны. Для того, чтобы делаемые по значению X выводы были обоснованными, требуется знать распределение случайной величины X. Если выполняются приведенные выше условия схемы испытаний Бернулли, то распределение X является биномиальным распределением, и вероятности значений X можно получить очень просто.

Пронумеруем в произвольном порядке п проверяемых изделий (например, в порядке их поступления на контроль). Будем обозначать ход испытания каждого изделия нулем или единицей (ноль – нормальное изделие, единица – дефектное), и будем записывать итоги проверки партии из n изделий в виде последовательности из п нулей и единиц. Событие (X=z), или, другими словами «среди п испытаний изделий оказалось z бракованных, а остальные (п-z) – годные» – это совокупность всех последовательностей, содержащих в любом порядке z единиц и (п-z) нулей. Вероятность того, что в результате проверки будет получена любая из таких последовательностей, равна qz(1–q)n-z, а число таких последовательностей – . Поэтому, согласно свойствам вероятностей, вероятность события (Х=z) равна:

.        

Определение. Случайная величина X имеет биномиальное распределение с параметрами п и q, если она принимает значения 0, 1, …, п с вероятностями:

Параметр q обычно называют вероятностью «успеха» в испытании Бернулли. В приведенном выше примере «успех» соответствует обнаружению бракованной детали. Распределение называется биномиальным, потому что вероятности Р(Х=z) являются слагаемыми бинома Ньютона:

.

Чтобы подчеркнуть зависимость Р(Х=z) от q и n, вероятность Р(Х=z) обычно записывают в виде:

.

Свойства. Математическое ожидание и дисперсия случайной величины, имеющей биномиальное распределение, равны:

MX=пq,

DX=пq(1-q).

Эти выражения легко получить с помощью следующего полезного приема. Введем для каждого отдельного испытания Бернулли случайную величину ξ, которая может принимать только два значения: 1, если испытание закончилось успехом, и 0, если неудачей. Если дать номера 1,2,... отдельным испытаниям, то те же номера надо присвоить и соответствующим им случайным величинам ξ: ξ1, ξ2, … . Тогда X можно представить в виде: X=ξ1+ξ2+…+ξn, причем случайные слагаемые в данной формуле статистически независимы и одинаково распределены. Для любого z от 1 до п выполняется Мξz=q, z=q(1-q). Поэтому, согласно свойствам математического ожидания и дисперсии: MX=nMξ, DX = nDξ, что и приводит к указанным выше выражениям.

Ниже показаны вероятности Р(Х=z) при п=10 для различных значений р =0.1, 0.2, 0.4 и 0.5).

Рис. Вид биномиального распределения для различных значений q при п=10

 

Биномиальное распределение тесно связано с многими другими распределениями. Ниже мы укажем наиболее часто используемые из этих связей.

1. Биномиальное распределение с параметрами n и q может быть аппроксимировано нормальным распределением со средним пq и стандартным отклонением (пq(1-q))1/2, если только выполняются условия пq(1-q)>5 и 0,1≤q≤0,9. При условии nq(1-q)>25 эту аппроксимацию можно применять независимо от значения q.

2. Биномиальное распределение с параметрами n и q может быть аппроксимировано распределением Пуассона со средним пq при условии, что q<0,1 и n достаточно велико.

Для биномиального распределения, как и для других распределений вероятностей, есть два типа таблиц.

В таблицах первого типа приводятся вероятности Р(Х=z) при различных значениях q и n. В таблицах второго типа даны значения накопленных вероятностей биномиального распределения, т.е. значения

.

В описаниях таблиц обычно можно найти указания, как поступать, если интересующие нас значения п и/или р в данных таблицах отсутствуют.

Значения вероятностей Р(Х=z) биномиального распределения с параметром q>0,5 легко получить, зная соответствующие вероятности при q<0,5. Действительно, если вероятность «успеха» q>0,5, то вероятность «неудачи» p=1-q<0,5. Поменяв названия «успех» и «неудача» одно на другое, мы сведем случай q>0,5 к q<0,5. Другими словами:

.

Это свойство учитывается при составлении статистических таблиц биномиального распределения.

Здесь q – вероятность появления брака; р – вероятность появления годного изделия; Сnz – сочетание из n элементов по z; q и p характеризуют устойчивость технологического процесса.

Биномиальное распределение определяется параметрами q, p и n. При этом Мξ=nq, =nqp.