Распределение пуассона формула пример. Распределение Пуассона (закон редких событий)

Во многих практически важных приложениях большую роль играет распределение Пуассона. Многие из числовых дискретных величин являются реализациями пуассоновского процесса, обладающего следующими свойствами:

  • Нас интересует, сколько раз происходит некое событие в заданной области возможных исходов случайного эксперимента. Область возможных исходов может представлять собой интервал времени, отрезок, поверхность и т.п.
  • Вероятность данного события одинакова для всех областей возможных исходов.
  • Количество событий, происходящих в одной области возможных исходов, не зависит от количества событий, происходящих в других областях.
  • Вероятность того, что в одной и той же области возможных исходов данное событие происходит больше одного раза, стремится к нулю по мере уменьшения области возможных исходов.

Чтобы глубже понять смысл пуассоновского процесса, предположим, что мы исследуем количество клиентов, посещающих отделение банка, расположенное в центральном деловом районе, во время ланча, т.е. с 12 до 13 часов. Предположим, требуется определить количество клиентов, приходящих за одну минуту. Обладает ли эта ситуация особенностями, перечисленными выше? Во-первых, событие, которое нас интересует, представляет собой приход клиента, а область возможных исходов - одноминутный интервал. Сколько клиентов придет в банк за минуту - ни одного, один, два или больше? Во-вторых, разумно предположить, что вероятность прихода клиента на протяжении минуты одинакова для всех одноминутных интервалов. В-третьих, приход одного клиента в течение любого одноминутного интервала не зависит от прихода любого другого клиента в течение любого другого одноминутного интервала. И, наконец, вероятность того, что в банк придет больше одного клиента стремится к нулю, если временной интервал стремится к нулю, например, становится меньше 0,1 с. Итак, количество клиентов, приходящих в банк во время ланча в течение одной минуты, описывается распределением Пуассона.

Распределение Пуассона имеет один параметр, обозначаемый символом λ (греческая буква «лямбда») – среднее количество успешных испытаний в заданной области возможных исходов. Дисперсия распределения Пуассона также равна λ, а его стандартное отклонение равно . Количество успешных испытаний Х пуассоновской случайной величины изменяется от 0 до бесконечности. Распределение Пуассона описывается формулой:

где Р(Х) - вероятность X успешных испытаний, λ - ожидаемое количество успехов, е - основание натурального логарифма, равное 2,71828, X - количество успехов в единицу времени.

Вернемся к нашему примеру. Допустим, что в течение обеденного перерыва в среднем в банк приходят три клиента в минуту. Какова вероятность того, что в данную минуту в банк придут два клиента? А чему равна вероятность того, что в банк придут более двух клиентов?

Применим формулу (1) с параметром λ = 3. Тогда вероятность того, что в течение данной минуты в банк придут два клиента, равна

Вероятность того, что в банк придут более двух клиентов, равна Р(Х > 2) = Р(Х = 3) + Р(Х = 4) + … + Р(Х = ∞) . Поскольку сумма всех вероятностей должна быть равной 1, члены ряда, стоящего в правой части формулы, представляют собой вероятность дополнения к событию Х≤ 2. Иначе говоря, сумма этого ряда равна 1 – Р(Х ≤ 2). Таким образом, Р(Х> 2) = 1 – Р(Х≤2) = 1 – [Р(Х = 0) + Р(Х = 1) + Р(Х = 2)]. Теперь, используя формулу (1), получаем:

Таким образом, вероятность того, что в банк в течение минуты придут не больше двух клиентов, равна 0,423 (или 42,3%), а вероятность того, что в банк в течение минуты придут больше двух клиентов, равна 0,577 (или 57,7%).

Такие вычисления могут показаться утомительными, особенно если параметр λ достаточно велик. Чтобы избежать сложных вычислений, многие пуассоновские вероятности можно найти в специальных таблицах (рис. 1). Например, вероятность того, что в заданную минуту в банк придут два клиента, если в среднем в банк приходят три клиента в минуту, находится на пересечении строки X = 2 и столбца λ = 3. Таким образом, она равна 0,2240 или 22,4%.

Рис. 1. Пуассоновская вероятность при λ = 3

Сейчас вряд ли кто-то будет пользоваться таблицами, если под рукой есть Excel с его функцией =ПУАССОН.РАСП() (рис. 2). Эта функция имеет три параметра: число успешных испытаний Х , среднее ожидаемое количество успешных испытаний λ, параметр Интегральная , принимающий два значения: ЛОЖЬ – в этом случае вычисляется вероятность числа успешных испытаний Х (только Х), ИСТИНА – в этом случае вычисляется вероятность числа успешных испытаний от 0 до Х.

Рис. 2. Расчет в Excel вероятностей распределения Пуассона при λ = 3

Аппроксимация биноминального распределения с помощью распределения Пуассона

Если число n велико, а число р - мало, биномиальное распределение можно аппроксимировать с помощью распределения Пуассона. Чем больше число n и меньше число р , тем выше точность аппроксимации. Для аппроксимации биномиального распределения используется следующая модель Пуассона.

где Р(Х) - вероятность X успехов при заданных параметрах n и р , n - объем выборки, р - истинная вероятность успеха, е - основание натурального логарифма, X - количество успехов в выборке (X = 0, 1, 2, …, n ).

Теоретически случайная величина, имеющая распределение Пуассона, принимает значения от 0 до ∞. Однако в тех ситуациях, когда распределение Пуассона применяется для приближения биномиального распределения, пуассоновская случайная величина - количество успехов среди n наблюдений - не может превышать число n . Из формулы (2) следует, что с увеличением числа n и уменьшением числа р вероятность обнаружить большое количество успехов уменьшается и стремится к нулю.

Как говорилось выше, математическое ожидание µ и дисперсия σ 2 распределения Пуассона равны λ. Следовательно, при аппроксимации биномиального распределения с помощью распределения Пуассона для приближения математического ожидания следует применять формулу (3).

(3) µ = Е(Х) = λ = np

Для аппроксимации стандартного отклонения используется формула (4).

Обратите внимание на то, что стандартное отклонение, вычисленное по формуле (4), стремится к стандартному отклонению в биномиальной модели – , когда вероятность успеха p стремится к нулю, и, соответственно, вероятность неудачи 1 – р стремится к единице.

Предположим, что 8% шин, произведенных на некотором заводе, являются бракованными. Чтобы проиллюстрировать применение распределения Пуассона для аппроксимации биномиального распределения, вычислим вероятность обнаружить одну дефектную шину в выборке, состоящей из 20 шин. Применим формулу (2), получим

Если бы мы вычислили истинное биномиальное распределение, а не его приближение, то получили бы следующий результат:

Однако эти вычисления довольно утомительны. В то же время, если вы используете Excel для вычисления вероятностей, то применение аппроксимации в виде распределения Пуассона становится излишним. На рис. 3 показано, что трудоемкость вычислений в Excel одинакова. Тем не менее, этот раздел, на мой взгляд, полезен понимаем того, что при некоторых условиях биноминальное распределение и распределение Пуассона дают близкие результаты.

Рис. 3. Сравнение трудоемкости расчетов в Excel: (а) распределение Пуассона; (б) биноминальное распределение

Итак, в настоящей и двух предыдущих заметках были рассмотрены три дискретных числовых распределения: , и Пуассона. Чтобы лучше представлять, как эти распределения соотносятся друг с другом приведем небольшое дерево вопросов (рис. 4).

Рис. 4. Классификация дискретных распределений вероятностей

Используются материалы книги Левин и др. Статистика для менеджеров. – М.: Вильямс, 2004. – с. 320–328

Краткая теория

Пусть производится независимых испытаний, в каждом из которых вероятность появления события равна . Для определения вероятности появлений события в этих испытаниях используют формулу Бернулли . Если же велико, то пользуются или . Однако эта формула непригодна, если мала. В этих случаях ( велико, мало) прибегают к асимптотической формуле Пуассона .

Поставим перед собой задачу найти вероятность того, что при очень большом числе испытаний, в каждом из которых вероятность события очень мала, событие наступит ровно раз. Сделаем важное допущение: произведение сохраняет постоянное значение, а именно . Это означает, что среднее число появления события в различных сериях испытаний, т.е. при различных значениях , остается неизменным.

Пример решения задачи

Задача 1

На базе получено 10000 электроламп. Вероятность того, что в пути лампа разобьется, равна 0,0003. Найдите вероятность того, что среди полученных ламп будет пять ламп разбито.

Решение

Условие применимости формулы Пуассона:

Если вероятность появления события в отдельном испытании достаточно близка к нулю, то даже при больших значениях количества испытаний вероятность, вычисляемая по локальной теореме Лапласа, оказывается недостаточно точной. В таких случаях используют формулу, выведенную Пуассоном.

Пусть событие – 5 ламп будет разбито

Воспользуемся формулой Пуассона:

В нашем случае:

Ответ

Задача 2

На предприятии 1000 единиц оборудования определенного вида. Вероятность отказа единицы оборудования в течение часа составляет 0,001. Составить закон распределения числа отказов оборудования в течение часа. Найти числовые характеристики.

Решение

Случайная величина – число отказов оборудования, может принимать значения

Воспользуемся законом Пуассона:

Найдем эти вероятности:

.

Математическое ожидание и дисперсия случайной величины, распределенной по закону Пуассона равна параметру этого распределения:

Средняя стоимость решения контрольной работы 700 - 1200 рублей (но не менее 300 руб. за весь заказ). На цену сильно влияет срочность решения (от суток до нескольких часов). Стоимость онлайн-помощи на экзамене/зачете - от 1000 руб. за решение билета.

Заявку можно оставить прямо в чате, предварительно скинув условие задач и сообщив необходимые вам сроки решения. Время ответа - несколько минут.

Рассмотрим распределение Пуассона, вычислим его математическое ожидание, дисперсию, моду. С помощью функции MS EXCEL ПУАССОН.РАСП() построим графики функции распределения и плотности вероятности. Произведем оценку параметра распределения, его математического ожидания и стандартного отклонения.

Сначала дадим сухое формальное определение распределения, затем приведем примеры ситуаций, когда распределение Пуассона (англ. Poisson distribution ) является адекватной моделью для описания случайной величины.

Если случайные события происходят в заданный период времени (или в определенном объеме вещества) со средней частотой λ(лямбда ), то число событий x , произошедших за этот период времени, будет иметь распределение Пуассона .

Применение распределения Пуассона

Примеры, когда Распределение Пуассона является адекватной моделью:

  • число вызовов, поступивших на телефонную станцию за определенный период времени;
  • число частиц, подвергнувшихся радиоактивному распаду за определенный период времени;
  • число дефектов в куске ткани фиксированной длины.

Распределение Пуассона является адекватной моделью, если выполняются следующие условия:

  • события происходят независимо друг от друга, т.е. вероятность последующего события не зависит от предыдущего;
  • средняя частота событий постоянна. Как следствие, вероятность события пропорциональна длине интервала наблюдения;
  • два события не могут произойти одновременно;
  • число событий должно принимать значения 0; 1; 2…

Примечание : Хорошей подсказкой, что наблюдаемая случайная величина имеет распределение Пуассона, является тот факт, что приблизительно равно (см. ниже).

Ниже представлены примеры ситуаций, когда Распределение Пуассона не может быть применено:

  • число студентов, которые выходят из университета в течение часа (т.к. средний поток студентов не постоянен: во время занятий студентов мало, а в перерыве между занятиями число студентов резко возрастает);
  • число землетрясений амплитудой 5 баллов в год в Калифорнии (т.к. одно землетрясение может вызвать повторные толчки сходной амплитуды – события не независимы);
  • число дней, которые пациенты проводят в отделении интенсивной терапии (т.к. число дней, которое пациенты проводят в отделении интенсивной терапии всегда больше 0).

Примечание : Распределение Пуассона является приближением более точных дискретных распределений: и .

Примечание : О взаимосвязи распределения Пуассона и Биномиального распределения можно прочитать в статье . О взаимосвязи распределения Пуассона и Экспоненциального распределения можно прочитать в статье про .

Распределение Пуассона в MS EXCEL

В MS EXCEL, начиная с версии 2010, для Распределения Пуассона имеется функция ПУАССОН.РАСП() , английское название - POISSON.DIST(), которая позволяет вычислить не только вероятность того, что за заданный период времени произойдет х событий (функцию плотности вероятности p(x), см. формулу выше), но и (вероятность того, что за заданный период времени произойдет не меньше x событий).

До MS EXCEL 2010 в EXCEL была функция ПУАССОН() , которая также позволяет вычислить функцию распределения и плотность вероятности p(x). ПУАССОН() оставлена в MS EXCEL 2010 для совместимости.

В файле примера приведены графики плотности распределения вероятности и интегральной функции распределения .

Распределение Пуассона имеет скошенную форму (длинный хвост справа у функции вероятности), но при увеличении параметра λ становится все более симметричным.

Примечание : Среднее и дисперсия (квадрат ) равны параметру распределения Пуассона – λ (см. файл примера лист Пример ).

Задача

Типичным применением Распределения Пуассона в контроле качества является модель количества дефектов, которые могут появиться в приборе или устройстве.

Например, при среднем количестве дефектов в микросхеме λ (лямбда) равном 4, вероятность, что случайно выбранная микросхема будет иметь 2 или меньше дефектов, равна: =ПУАССОН.РАСП(2;4;ИСТИНА)=0,2381

Третий параметр в функции установлен = ИСТИНА, поэтому функция вернет интегральную функцию распределения , то есть вероятность того, что число случайных событий окажется в диапазоне от 0 до 4 включительно.

Вычисления в этом случае производятся по формуле:

Вероятность того, что случайно выбранная микросхема будет иметь ровно 2 дефекта, равна: =ПУАССОН.РАСП(2;4;ЛОЖЬ)=0,1465

Третий параметр в функции установлен = ЛОЖЬ, поэтому функция вернет плотность вероятности.

Вероятность того, что случайно выбранная микросхема будет иметь больше 2-х дефектов, равна: =1-ПУАССОН.РАСП(2;4;ИСТИНА) =0,8535

Примечание : Если x не является целым числом, то при вычислении формулы . Формулы =ПУАССОН.РАСП(2 ; 4; ЛОЖЬ) и =ПУАССОН.РАСП(2,9 ; 4; ЛОЖЬ) вернут одинаковый результат.

Генерация случайных чисел и оценка λ

При значениях λ>15 , Распределение Пуассона хорошо аппроксимируется Нормальным распределением со следующими параметрами: μ, σ 2 .

Подробнее о связи этих распределений, можно прочитать в статье . Там же приведены примеры аппроксимации, и пояснены условия, когда она возможна и с какой точностью.

СОВЕТ : О других распределениях MS EXCEL можно прочитать в статье .

Наиболее общим случаем различного рода вероятностных распределений является биномиальное распределение. Воспользуемся его универсальностью для определения наиболее часто встречающихся на практике частных видов распределений.

Биномиальное распределение

Пусть имеется некое событие A . Вероятность появления события A равна p , вероятность непоявления события A равна 1 – p , иногда ее обозначают как q . Пусть n — число испытаний, m — частота появления события A в этих n испытаниях.

Известно, что суммарная вероятность всех возможных комбинаций исходов равна единице, то есть:

1 = p n + n · p n – 1 · (1 – p ) + C n n – 2 · p n – 2 · (1 – p ) 2 + … + C n m · p m · (1 – p ) n – m + … + (1 – p ) n .

p n — вероятность того, что в n n раз;

n · p n – 1 · (1 – p ) — вероятность того, что в n n – 1) раз и не произойдет 1 раз;

C n n – 2 · p n – 2 · (1 – p ) 2 — вероятность того, что в n испытаниях событие A произойдет (n – 2) раза и не произойдет 2 раза;

P m = C n m · p m · (1 – p ) n – m — вероятность того, что в n испытаниях событие A произойдет m раз и не произойдет (n – m ) раз;

(1 – p ) n — вероятность того, что в n испытаниях событие A не произойдет ни разу;

— число сочетаний из n по m .

Математическое ожидание M биномиального распределения равно:

M = n · p ,

где n — число испытаний, p — вероятность появления события A .

Среднеквадратичное отклонение σ :

σ = sqrt(n · p · (1 – p )) .

Пример 1 . Вычислить вероятность того, что событие, имеющее вероятность p = 0.5 , в n = 10 испытаниях произойдет m = 1 раз. Имеем: C 10 1 = 10 , и далее: P 1 = 10 · 0.5 1 · (1 – 0.5) 10 – 1 = 10 · 0.5 10 = 0.0098 . Как видим, вероятность наступления этого события достаточно мала. Объясняется это, во-первых, тем, что абсолютно не ясно, произойдет ли событие или нет, поскольку вероятность равна 0.5 и шансы здесь «50 на 50»; а во-вторых, требуется исчислить то, что событие произойдет именно один раз (не больше и не меньше) из десяти.

Пример 2 . Вычислить вероятность того, что событие, имеющее вероятность p = 0.5 , в n = 10 испытаниях произойдет m = 2 раза. Имеем: C 10 2 = 45 , и далее: P 2 = 45 · 0.5 2 · (1 – 0.5) 10 – 2 = 45 · 0.5 10 = 0.044 . Вероятность наступления этого события стала больше!

Пример 3 . Увеличим вероятность наступления самого события. Сделаем его более вероятным. Вычислить вероятность того, что событие, имеющее вероятность p = 0.8 , в n = 10 испытаниях произойдет m = 1 раз. Имеем: C 10 1 = 10 , и далее: P 1 = 10 · 0.8 1 · (1 – 0.8) 10 – 1 = 10 · 0.8 1 · 0.2 9 = 0.000004 . Вероятность стала меньше, чем в первом примере! Ответ, на первый взгляд, кажется странным, но поскольку событие имеет достаточно большую вероятность, вряд ли оно произойдет только один раз. Более вероятно, что оно произойдет большее, чем один, количество раз. Действительно, подсчитывая P 0 , P 1 , P 2 , P 3 , …, P 10 (вероятность того, что событие в n = 10 испытаниях произойдет 0, 1, 2, 3, …, 10 раз), мы увидим:

C 10 0 = 1 , C 10 1 = 10 , C 10 2 = 45 , C 10 3 = 120 , C 10 4 = 210 , C 10 5 = 252 ,
C 10 6 = 210 , C 10 7 = 120 , C 10 8 = 45 , C 10 9 = 10 , C 10 10 = 1 ;

P 0 = 1 · 0.8 0 · (1 – 0.8) 10 – 0 = 1 · 1 · 0.2 10 = 0.0000… ;
P 1 = 10 · 0.8 1 · (1 – 0.8) 10 – 1 = 10 · 0.8 1 · 0.2 9 = 0.0000… ;
P 2 = 45 · 0.8 2 · (1 – 0.8) 10 – 2 = 45 · 0.8 2 · 0.2 8 = 0.0000… ;
P 3 = 120 · 0.8 3 · (1 – 0.8) 10 – 3 = 120 · 0.8 3 · 0.2 7 = 0.0008… ;
P 4 = 210 · 0.8 4 · (1 – 0.8) 10 – 4 = 210 · 0.8 4 · 0.2 6 = 0.0055… ;
P 5 = 252 · 0.8 5 · (1 – 0.8) 10 – 5 = 252 · 0.8 5 · 0.2 5 = 0.0264… ;
P 6 = 210 · 0.8 6 · (1 – 0.8) 10 – 6 = 210 · 0.8 6 · 0.2 4 = 0.0881… ;
P 7 = 120 · 0.8 7 · (1 – 0.8) 10 – 7 = 120 · 0.8 7 · 0.2 3 = 0.2013… ;
P 8 = 45 · 0.8 8 · (1 – 0.8) 10 – 8 = 45 · 0.8 8 · 0.2 2 = 0.3020… (самая большая вероятность!);
P 9 = 10 · 0.8 9 · (1 – 0.8) 10 – 9 = 10 · 0.8 9 · 0.2 1 = 0.2684… ;
P 10 = 1 · 0.8 10 · (1 – 0.8) 10 – 10 = 1 · 0.8 10 · 0.2 0 = 0.1074…

Разумеется, P 0 + P 1 + P 2 + P 3 + P 4 + P 5 + P 6 + P 7 + P 8 + P 9 + P 10 = 1 .

Нормальное распределение

Если изобразить величины P 0 , P 1 , P 2 , P 3 , …, P 10 , которые мы подсчитали в примере 3, на графике, то окажется, что их распределение имеет вид, близкий к нормальному закону распределения (см. рис. 27.1 ) (см. лекцию 25. Моделирование нормально распределенных случайных величин).

Рис. 27.1. Вид биномиального распределения
вероятностей для различных m при p = 0.8, n = 10

Биномиальный закон переходит в нормальный, если вероятности появления и непоявления события A примерно одинаковы, то есть, условно можно записать: p ≈ (1 – p ) . Для примера возьмем n = 10 и p = 0.5 (то есть p = 1 – p = 0.5 ).

Содержательно к такой задаче мы придем, если, например, захотим теоретически посчитать, сколько будет мальчиков и сколько девочек из 10 родившихся в роддоме в один день детей. Точнее, считать будем не мальчиков и девочек, а вероятность, что родятся только мальчики, что родится 1 мальчик и 9 девочек, что родится 2 мальчика и 8 девочек и так далее. Примем для простоты, что вероятность рождения мальчика и девочки одинакова и равна 0.5 (но на самом деле, если честно, это не так, см. курс «Моделирование систем искусственного интеллекта»).

Ясно, что распределение будет симметричное, так как вероятность рождения 3 мальчиков и 7 девочек равна вероятности рождения 7 мальчиков и 3 девочек. Наибольшая вероятность рождения будет у 5 мальчиков и 5 девочек. Эта вероятность равна 0.25, кстати, не такая уж она и большая по абсолютной величине. Далее, вероятность того, что родится сразу 10 или 9 мальчиков намного меньше, чем вероятность того, что родится 5 ± 1 мальчик из 10 детей. Как раз биномиальное распределение нам поможет сделать этот расчет. Итак.

C 10 0 = 1 , C 10 1 = 10 , C 10 2 = 45 , C 10 3 = 120 , C 10 4 = 210 , C 10 5 = 252 ,
C 10 6 = 210 , C 10 7 = 120 , C 10 8 = 45 , C 10 9 = 10 , C 10 10 = 1 ;

P 0 = 1 · 0.5 0 · (1 – 0.5) 10 – 0 = 1 · 1 · 0.5 10 = 0.000977… ;
P 1 = 10 · 0.5 1 · (1 – 0.5) 10 – 1 = 10 · 0.5 10 = 0.009766… ;
P 2 = 45 · 0.5 2 · (1 – 0.5) 10 – 2 = 45 · 0.5 10 = 0.043945… ;
P 3 = 120 · 0.5 3 · (1 – 0.5) 10 – 3 = 120 · 0.5 10 = 0.117188… ;
P 4 = 210 · 0.5 4 · (1 – 0.5) 10 – 4 = 210 · 0.5 10 = 0.205078… ;
P 5 = 252 · 0.5 5 · (1 – 0.5) 10 – 5 = 252 · 0.5 10 = 0.246094… ;
P 6 = 210 · 0.5 6 · (1 – 0.5) 10 – 6 = 210 · 0.5 10 = 0.205078… ;
P 7 = 120 · 0.5 7 · (1 – 0.5) 10 – 7 = 120 · 0.5 10 = 0.117188… ;
P 8 = 45 · 0.5 8 · (1 – 0.5) 10 – 8 = 45 · 0.5 10 = 0.043945… ;
P 9 = 10 · 0.5 9 · (1 – 0.5) 10 – 9 = 10 · 0.5 10 = 0.009766… ;
P 10 = 1 · 0.5 10 · (1 – 0.5) 10 – 10 = 1 · 0.5 10 = 0.000977…

Разумеется, P 0 + P 1 + P 2 + P 3 + P 4 + P 5 + P 6 + P 7 + P 8 + P 9 + P 10 = 1 .

Отразим на графике величины P 0 , P 1 , P 2 , P 3 , …, P 10 (см. рис. 27.2 ).

Рис. 27.2. График биномиального распределения при параметрах
p = 0.5 и n = 10, приближающих его к нормальному закону

Итак, при условиях m n /2 и p ≈ 1 – p или p ≈ 0.5 вместо биномиального распределения можно использовать нормальное. При больших значениях n график сдвигается вправо и становится все более пологим, так как математическое ожидание и дисперсия возрастают с увеличением n : M = n · p , D = n · p · (1 – p ) .

Кстати, биномиальный закон стремится к нормальному и при увеличении n , что вполне естественно, согласно центральной предельной теореме (см. лекцию 34. Фиксация и обработка статистических результатов).

Теперь рассмотрим, как изменится биномиальный закон в случае, когда p q , то есть p –> 0 . В этом случае применить гипотезу о нормальности распределения нельзя, и биномиальное распределение переходит в распределение Пуассона.

Распределение Пуассона

Распределение Пуассона — это частный случай биномиального распределения (при n >> 0 и при p –> 0 (редкие события)).

Из математики известна формула, позволяющая примерно подсчитать значение любого члена биномиального распределения:

где a = n · p — параметр Пуассона (математическое ожидание), а дисперсия равна математическому ожиданию. Приведем математические выкладки, поясняющие этот переход. Биномиальный закон распределения

P m = C n m · p m · (1 – p ) n – m

может быть написан, если положить p = a /n , в виде

Так как p очень мало, то следует принимать во внимание только числа m , малые по сравнению с n . Произведение

весьма близко к единице. Это же относится к величине

Величина

очень близка к e –a . Отсюда получаем формулу:

Пример . В ящике находится n = 100 деталей, как качественных, так и бракованных. Вероятность достать бракованное изделие составляет p = 0.01 . Допустим, что мы вынимаем изделие, определяем, бракованное оно или нет, и кладем его обратно. Поступая таким образом, получилось, что из 100 изделий, которые мы перебрали, два оказались бракованными. Какова вероятность этого?

По биномиальному распределению получаем:

По распределению Пуассона получаем:

Как видно, величины получились близкими, поэтому в случае редких событий вполне допустимо применять закон Пуассона, тем более что он требует меньших вычислительных затрат.

Покажем графически вид закона Пуассона. Возьмем для примера параметры p = 0.05 , n = 10 . Тогда:

C 10 0 = 1 , C 10 1 = 10 , C 10 2 = 45 , C 10 3 = 120 , C 10 4 = 210 , C 10 5 = 252 ,
C 10 6 = 210 , C 10 7 = 120 , C 10 8 = 45 , C 10 9 = 10 , C 10 10 = 1 ;

P 0 = 1 · 0.05 0 · (1 – 0.05) 10 – 0 = 1 · 1 · 0.95 10 = 0.5987… ;
P 1 = 10 · 0.05 1 · (1 – 0.05) 10 – 1 = 10 · 0.05 1 · 0.95 9 = 0.3151… ;
P 2 = 45 · 0.05 2 · (1 – 0.05) 10 – 2 = 45 · 0.05 2 · 0.95 8 = 0.0746… ;
P 3 = 120 · 0.05 3 · (1 – 0.05) 10 – 3 = 120 · 0.05 3 · 0.95 7 = 0.0105… ;
P 4 = 210 · 0.05 4 · (1 – 0.05) 10 – 4 = 210 · 0.05 4 · 0.95 6 = 0.00096… ;
P 5 = 252 · 0.05 5 · (1 – 0.05) 10 – 5 = 252 · 0.05 5 · 0.95 5 = 0.00006… ;
P 6 = 210 · 0.05 6 · (1 – 0.05) 10 – 6 = 210 · 0.05 6 · 0.95 4 = 0.0000… ;
P 7 = 120 · 0.05 7 · (1 – 0.05) 10 – 7 = 120 · 0.05 7 · 0.95 3 = 0.0000… ;
P 8 = 45 · 0.05 8 · (1 – 0.05) 10 – 8 = 45 · 0.05 8 · 0.95 2 = 0.0000… ;
P 9 = 10 · 0.05 9 · (1 – 0.05) 10 – 9 = 10 · 0.05 9 · 0.95 1 = 0.0000… ;
P 10 = 1 · 0.05 10 · (1 – 0.05) 10 – 10 = 1 · 0.05 10 · 0.95 0 = 0.0000…

Разумеется, P 0 + P 1 + P 2 + P 3 + P 4 + P 5 + P 6 + P 7 + P 8 + P 9 + P 10 = 1 .

Рис. 27.3. График распределения Пуассона при p = 0.05 и n = 10

При n –> ∞ распределение Пуассона переходит в нормальный закон, согласно центральной предельной теореме (см.

$Х$ имеет распределение Пуассона с параметром $\lambda$ ($\lambda$$>$0), если эта величина принимает целые неотрицательные значения $к=0, 1, 2,\dots$ с вероятностями $рк$=$\frac{\lambda ^{:} }{:!} \cdot 5^{-\lambda } .$ (Это распределение впервые было рассмотрено французским математиком и физиком Симеоном Дени Пуассоном в 1837 г.)

Распределение Пуассона также называют законом редких событий, потому, что вероятности рк дают приближенное распределение числа наступлений некоторого редкого события при большом количестве независимых испытаний. В этом случае полагают $\lambda =n \cdot р$ , где $n$- число испытаний Бернулли, $р$- вероятность осуществления события в одном испытании.

Правомерность использования закона Пуассона вместо биномиального распределения при большом числе испытаний дает следующая теорема.

Теорема 1

Теорема Пуассона.

Если в схеме Бернулли n$\rightarrow$$\infty$, p$\rightarrow$0, так что $n \cdot p$$\rightarrow$$\lambda$ (конечному числу), то

$!_{n}^{k} p^{k} (1-p)^{n-k} \to \frac{\lambda ^{k} }{k!} e^{-\lambda } $ при любых $k=0, 1, 2,... $

Без доказательства.

Примечание 1

Формула Пуассона становится точнее, при малениких $p$ и больших чисел $n$, причём $n \cdot p $

Математическое ожидание случайной величины, имеющей распределение Пуассона с параметром $\lambda$:

$М(Х)$=$\sum \limits _{k=0}^{\infty }k\cdot \frac{\lambda ^{k} }{k!} e^{-\lambda } =\lambda \cdot e^{-\lambda } \sum \limits _{k=1}^{\infty }\frac{\lambda ^{k} }{k!} =\lambda \cdot e^{-\lambda } \cdot e^{\lambda } = $$\lambda$.

Дисперсия случайной величины, имеющей распределение Пуассона параметром $\lambda$:

$D(X)$=$\lambda$ .

Применение формулы Пуассона при решении задач

Пример 1

Вероятность появления бракованного изделия при массовом производстве равна $0,002$. Найти вероятность того, что в партии из $1500$ изделий будет не более 3-х бракованных. Найти среднее число бракованных изделий.

  • Пусть $А$-число бракованных изделий в партии из $1500$ изделий. Тогда искомая вероятность, это вероятность того, что $А$ $\leq$ $3$. В данной задаче мы имеем схему Бернулли с $n=1500$ и $р=0,002$. Для применения теоремы Пуассона положим $\lambda=1500 \cdot 0,002=3$. Тогда искомая вероятность
\
  • Среднее число бракованных изделий $М(А)$=$\lambda$=3.

Пример 2

Коммутатор учреждения обслуживает $100$ абонентов. Вероятность того, что в течение $1$ минуты абонент позвонит, равна $0,01$. Найти вероятность того, что в течение $1$ минуты никто не позвонит.

Пусть $А$- число позвонивших на коммутатор в течение $1$ минуты. Тогда искомая вероятность -- это вероятность того, что $А=0$. В данной задаче применима схема Бернулли с $n=100$, $p=0,01$. Для использования теоремы Пуассона положим

$\lambda=100 \cdot 0,01=1$.

Тогда искомая вероятность

$Р = е^-1$ $\approx0,37$.

Пример 3

Завод отправил на базу $500$ изделий. Вероятность повреждения изделия в пути равна $0,002$. Найти вероятности того, что в пути будет повреждено

  1. ровно три изделия;
  2. менее трех изделий.

    Рассмотрев замечание к формуле Пуассона, поскольку вероятность $р=0,002$ повреждения изделия мала, а число изделий $n=500$ велико, и $a=n\cdot p=1

    Для решения второй задачи применима формула, где $k1=0$ и $k2=2$. Имеем:

\

Пример 4

Учебник издан тиражом $100000$ экземпляров. Вероятность того, что один учебник сброшюрован неправильно, равна $0,0001$. Какова вероятность того, что тираж содержит $5$ бракованных книг?

По условию задачи $n = 100000$, $p = 0,0001$.

События "из $n$ книг ровно $m$ книг сброшюрованы неправильно", где $m = 0,1,2, \dots ,100000$, являются независимыми. Так как число $n$ велико, а вероятность $p$ мала, вероятность $P_n (m)$ можно вычислить по формуле Пуассона: $P_n$(m)$\approx \frac{{\lambda }^m\cdot e^{-\lambda }}{m!}$ , где $\lambda = np$.

В рассматриваемой задаче

$\lambda = 100000 \cdot 0,0001 = 10$.

Поэтому искомая вероятность $P_{100000}$(5) определяется равенством:

$P_{100000}$ (5)$\approx \frac{e^{-10}\cdot {10}^5}{5!}\approx $ ${10}^5$ $\frac{0,000045}{120}$ = $0,0375$.

Ответ: $0,0375$.

Пример 5

Завод отправил на базу $5000$ доброкачественных изделий. Вероятность того, что в пути изделие повредиться равно $0,0002$. Найти вероятность того, что на базу прибудут три негодных изделия.

По условию $n=5000$; $р = 0,0002$; $k = 3$. Найдем $\lambda $:

$\lambda = n \cdot p = 5000 \cdot 0,0002 = 1$.

Искомая вероятность по формуле Пуассона равна:

Пример 6

Вероятность того, что на телефонную станцию в течение одного часа позвонит один абонент, равна 0,01. В течение часа позвонили 200 абонентов. Найти вероятность того, что в течение часа позвонят 3 абонента.

Рассматрев условие задачи видим, что:

Найдем $\lambda $ для формуллы Пуассона:

\[\lambda =np=200\cdot 0,01=2.\]

Подставим значения в формулу Пуассона и получим значение:

Пример 7

На факультете насчитывается 500 студентов. Какова вероятность того, что 1 сентября является днем рождения одновременно для 2-х студентов?

Имеем $n=500$; $p=1/365 \approx 0,0027$, $q=0,9973$. Поскольку количество испытаний велико, а вероятность выполнения очень мала и $npq=1,35 \