Теоретическая вероятность в excel

Очень часто при работе в Excel необходимо использовать вычисления вероятности появления некоторого события. Для этого используется статистическая функция ВЕРОЯТНОСТЬ.

Примеры использования функции вероятность для расчетов в Excel

Стоит отметить, что используются часто в Excel и другие статистические функции, к примеру:

  • ДИСП;
  • ГИПЕРГЕОМ.РАСП;
  • СРЗНАЧ и другие.

Функция выполняет вычисление вероятности того, что значения с интервала находятся в заданных пределах. В случае, если верхний предел не будет задан, то будет возвращена вероятность того, что значения аргумента x_интервал будет равно значению аргумента под названием нижний_предел.



Вычисление процента вероятности события в Excel

Пример 1. Дана таблица диапазона числовых значений, а также вероятностей, которые им соответствуют:

таблица диапазона числовых значений.

Необходимо при использовании данной статистической функции вычислить вероятность события, что значение с указанного интервала входит в интервал [1;4].

Для этого введем функцию со следующими аргументами:

ВЕРОЯТНОСТЬ"."

тут:

  • х_интервал – это начальные данные (0, …, 4);
  • интервал вероятностей является множеством вероятностей для начальных данных (0,15; 0,1; 0,15; 0,2; 0,4);
  • нижний предел равен значению 1;
  • верхний предел равен 4.

В результате выполненных вычислений получим:

В результате.

Пример 2. В условии предыдущего примера нужно вычислить вероятность события «значение х равно 4».

Введем в ячейку С3 введем функцию с такими аргументами:

введем функцию.

тут:

  • х_интервал – начальные параметры (0, …, 4);
  • интервал вероятностей – совокупность вероятностей для параметров (0,1; 0,15; 0,2; 0,15; 0,4);
  • нижний предел – 4;

В данном примере верхний предел не указан, поскольку необходимо конкретное значение вероятности, а именно для значения 4.

Получим:

верхний предел не указан.

Функция ВЕРОЯТНОСТЬ при нескольких условиях интервалов

Пример 3. В условии примера 1 нужно вычислить вероятность того, что значения интервала [0; 4] будут находится находятся внутри интервалов [0;1] и [3;4].

Введем формулу:

Описание формул аналогичные предыдущим примерам.

В результате выполненных вычислений получим:

при нескольких условиях.

Скачать примеры функции ВЕРОЯТНОСТЬ в Excel

Таким образом составив формулу можно с помощью данной функции вычислить процент вероятности при нескольких условиях.

Понравилось? Добавьте в закладки

Комбинаторика и вероятность

Ниже вы найдете основные формулы Excel, которые могут применяться при решении вероятностных задач и задач по комбинаторике.

ЧИСЛКОМБ / COMBIN

Возвращает количество сочетаний без повторений.

ФАКТР / FACT

Вычисляет факториал числа.

СЛЧИС / RAND

Выдает случайное число в интервале от 0 до 1 (равномерно распределенное).

СЛУЧМЕЖДУ / RANDBETVEEN

Выдает случайное число в заданном интервале.

БИНОМРАСП / BINOMDIST

Вычисляет отдельное значение биномиального распределения.

ГИПЕРГЕОМЕТ / HYRGEOMDIST

Определяет гипергеометрическое распределение.

НОРМРАСП / NORMDIST

Вычисляет значение нормальной функции распределения.

НОРМОБР / NORMINV

Выдает обратное нормальное распределение.

НОРМСТРАСП / NORMSDIST

Выдает стандартное нормальное интегральное распределение.

НОРМСТОБР / NORMSINV

Выдает обратное значение стандартного нормального распределения.

ПЕРЕСТ / PERMUT

Находит количество размещений без повторений

ВЕРОЯТНОСТЬ / PROB

Определяет вероятность того, что значение из диапазона находится внутри заданных пределов.

Подробнее: Формулы комбинаторики в Excel.

Подробно решим ваши задачи по теории вероятностей

Математическая статистика

При решении задач по математической статистике можно использовать те формулы, что перечислены выше, а также следующие (сгруппированы для удобства: обработка выборки, разные распределения, остальные формулы):

Обработка выборки: формулы Excel

СРОТКЛ / AVEDEV

Вычисляет среднее абсолютных значений отклонений точек данных от среднего.

СРЗНАЧ / AVERAGE

Вычисляет среднее арифметическое аргументов.

СРГЕОМ / GEOMEAN

Вычисляет среднее геометрическое.

СРГАРМ / HARMEAN

Вычисляет среднее гармоническое.

ЭКСЦЕСС / KURT

Определяет эксцесс множества данных.

МЕДИАНА / MEDIAN

Находит медиану заданных чисел.

МОДА / MODE

Определяет значение моды множества данных.

КВАРТИЛЬ / QUARTILE

Определяет квартиль множества данных.

СКОС / SKEW

Определяет асимметрию распределения.

СТАНДОТКЛОН / STDEV

Оценивает стандартное отклонение по выборке.

ДИСП / VAR

Оценивает дисперсию по выборке.

Законы распределений: формулы Excel

БЕТАРАСП / BETADIST

Определяет интегральную функцию плотности бета-вероятности.

БЕТАОБР / BETAINV

Определяет обратную функцию к интегральной функции плотности бета-вероятности.

ХИ2РАСП / CHIDIST

Вычисляет одностороннюю вероятность распределения хи-квадрат.

ХИ2ОБР / CHIINV

Вычисляет обратное значение односторонней вероятности распределения хи-квадрат.

ЭКСПРАСП / EXPONDIST

Находит экспоненциальное распределение.

FРАСП / FDIST

Находит F-распределение вероятности.

FРАСПОБР / FINV

Определяет обратное значение для F-распределения вероятности.

ФИШЕР / FISHER

Находит преобразование Фишера.

ФИШЕРОБР / FISHERINV

Находит обратное преобразование Фишера.

ГАММАРАСП / GAMMADIST

Находит гамма-распределение.

ГАММАОБР / GAMMAINV

Находит обратное гамма-распределение.

ПУАССОН / POISSON

Выдает распределение Пуассона.

СТЬЮДРАСП / TDIST

Выдает t-распределение Стьюдента.

СТЬЮДРАСПОБР / TINV

Выдает обратное t-распределение Стьюдента.

ВЕЙБУЛЛ / WEIBULL

Выдает распределение Вейбулла.

Другое (корреляция, регрессия и т.п.)

ДОВЕРИТ / CONFIDENCE

Определяет доверительный интервал для среднего значения по генеральной совокупности.

КОРРЕЛ / CORREL

Находит коэффициент корреляции между двумя множествами данных.

СЧЁТ / COUNT

Подсчитывает количество чисел в списке аргументов.

СЧЁТЕСЛИ / COUNTIF

Подсчитывает количество непустых ячеек, удовлетворяющих заданному условию внутри диапазона.

КОВАР / COVAR

Определяет ковариацию, то есть среднее произведений отклонений для каждой пары точек.

ПРЕДСКАЗ / FORECAST

Вычисляет значение линейного тренда.

ЛИНЕЙН / LINEST

Находит параметры линейного тренда.

ПИРСОН / PEARSON

Определяет коэффициент корреляции Пирсона.

Справочный файл по формулам Excel

Нужна шпаргалка по функциям Excel под рукой? Скачивайте файл: Математические и статистические формулы Excel

Полезные ссылки

  • Онлайн калькуляторы
  • Онлайн учебник для чайников
  • Более 200 примеров
  • Решенные контрольные
  • Формулы и таблицы
  • Решебник по ТВ
  • Решение на заказ
  • Онлайн помощь

А если у вас есть задачи, которые надо срочно сделать, а времени нет? Можете поискать готовые решения в решебнике:

  • Редакция Кодкампа

17 авг. 2022 г.
читать 2 мин


Вероятность описывает вероятность того, что некоторое событие произойдет.

Мы можем рассчитать вероятности в Excel, используя функцию PROB , которая использует следующий синтаксис:

ПРОБ(x_диапазон, вероятностный_диапазон, нижний_предел, [верхний_предел])

куда:

  • x_range: диапазон числовых значений x.
  • prob_range: диапазон вероятностей, связанных с каждым значением x.
  • нижний_предел: нижний предел значения, для которого вы хотите получить вероятность.
  • upper_limit: Верхний предел значения, для которого вы хотите получить вероятность. По желанию.

В этом руководстве представлено несколько примеров использования этой функции на практике.

Пример 1: Вероятность игры в кости

На следующем изображении показана вероятность выпадения кубика с определенным значением при данном броске:

Поскольку кости с одинаковой вероятностью выпадут на каждом значении, вероятность одинакова для каждого значения.

На следующем рисунке показано, как найти вероятность того, что кубик выпадет на число от 3 до 6:

Расчет вероятности в Excel

Вероятность оказывается равной 0,5 .

Обратите внимание, что аргумент верхнего предела является необязательным. Таким образом, мы могли бы использовать следующий синтаксис, чтобы найти вероятность того, что кости приземлятся только на 4:

Пример нахождения вероятности в Excel

Вероятность оказывается равной 0,166667 .

Пример 2: Вероятность продаж

На следующем изображении показана вероятность того, что компания продаст определенное количество товаров в предстоящем квартале:

На следующем рисунке показано, как найти вероятность того, что компания совершит 3 или 4 продажи:

Пример расчета вероятностей в Excel

Вероятность оказывается равной 0,7 .

Дополнительные ресурсы

Как рассчитать относительную частоту в Excel
Как рассчитать кумулятивную частоту в Excel
Как создать частотное распределение в Excel

Написано

Редакция Кодкампа

Замечательно! Вы успешно подписались.

Добро пожаловать обратно! Вы успешно вошли

Вы успешно подписались на кодкамп.

Срок действия вашей ссылки истек.

Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.

Успех! Ваша платежная информация обновлена.

Ваша платежная информация не была обновлена.

Excel для Microsoft 365 Excel для Microsoft 365 для Mac Excel для Интернета Excel 2021 Excel 2021 для Mac Excel 2019 Excel 2019 для Mac Excel 2016 Excel 2016 для Mac Excel 2013 Excel 2010 Excel 2007 Excel для Mac 2011 Excel Starter 2010 Еще…Меньше

В этой статье описаны синтаксис формулы и использование proB
 Функция Microsoft Excel.

Описание

Возвращает вероятность того, что значение из интервала находится внутри заданных пределов. Если верхний_предел не задан, то возвращается вероятность того, что значения в аргументе x_интервал равняются значению аргумента нижний_предел.

Синтаксис

ВЕРОЯТНОСТЬ(x_интервал;интервал_вероятностей;[нижний_предел];[верхний_предел])

Аргументы функции ВЕРОЯТНОСТЬ описаны ниже.

  • x_интервал    Обязательный. Диапазон числовых значений x, с которыми связаны вероятности.

  • Интервал_вероятностей    Обязательный. Множество вероятностей, соответствующих значениям в аргументе «x_интервал».

  • Нижний_предел    Необязательный. Нижняя граница значения, для которого вычисляется вероятность.

  • Верхний_предел    Необязательный. Верхняя граница значения, для которого вычисляется вероятность.

Замечания

  • Если значение в prob_range ≤ 0 или любое значение в prob_range > 1, функция PROB возвращает #NUM! (значение ошибки).

  • Если сумма значений в prob_range не равна 1, функция PROB возвращает #NUM! (значение ошибки).

  • Если верхний_предел опущен, то функция ВЕРОЯТНОСТЬ возвращает вероятность равенства значению аргумента нижний_предел.

  • Если x_интервал и интервал_вероятностей содержат различное количество точек данных, то функция ВЕРОЯТНОСТЬ возвращает значение ошибки #Н/Д.

Пример

Скопируйте образец данных из следующей таблицы и вставьте их в ячейку A1 нового листа Excel. Чтобы отобразить результаты формул, выделите их и нажмите клавишу F2, а затем — клавишу Enter. При необходимости измените ширину столбцов, чтобы видеть все данные.

Данные

Значение x

Вероятность

0

0,2

1

0,3

2

0,1

3

0,4

Формула

Описание

Результат

=ВЕРОЯТНОСТЬ(A3:A6;B3:B6;2)

Вероятность того, что x является числом 2.

0,1

=ВЕРОЯТНОСТЬ(A3:A6;B3:B6;1;3)

Вероятность того, что x находится в интервале от 1 до 3.

0,8

Нужна дополнительная помощь?


Probability describes the likelihood that some event occurs.

We can calculate probabilities in Excel by using the PROB function, which uses the following syntax:

PROB(x_range, prob_range, lower_limit, [upper_limit])

where:

  • x_range: The range of numeric x values.
  • prob_range: The range of probabilities associated with each x value.
  • lower_limit: The lower limit on the value for which you want a probability.
  • upper_limit: The upper limit on the value for which you want a probability. Optional.

This tutorial provides several examples of how to use this function in practice.

Example 1: Dice Probabilities

The following image shows the probability of a dice landing on a certain value on a given roll:

Since the dice is equally likely to land on each value, the probability is the same for each value.

The following image shows how to find the probability that the dice lands on a number between 3 and 6:

Calculating probability in Excel

The probability turns out to be 0.5.

Note that the upper limit argument is optional. So, we could use the following syntax to find the probability that the dice lands on just 4:

Example of finding probability in Excel

The probability turns out to be 0.166667.

Example 2: Sales Probabilities

The following image shows the probability of a company selling a certain number of products in the upcoming quarter:

The following image shows how to find the probability that the company makes either 3 or 4 sales:

Example of calculating probabilities in Excel

The probability turns out to be 0.7.

Additional Resources

How to Calculate Relative Frequency in Excel
How to Calculate Cumulative Frequency in Excel
How to Create a Frequency Distribution in Excel

Комбинаторика и вероятность

Ниже вы найдете основные формулы Excel, которые могут применяться при решении вероятностных задач и задач по комбинаторике.

ФАКТР / FACT

СЛЧИС / RAND

Выдает случайное число в интервале от 0 до 1 (равномерно распределенное).

СЛУЧМЕЖДУ / RANDBETVEEN

Выдает случайное число в заданном интервале.

БИНОМРАСП / BINOMDIST

Вычисляет отдельное значение биномиального распределения.

ГИПЕРГЕОМЕТ / HYRGEOMDIST

Определяет гипергеометрическое распределение.

НОРМРАСП / NORMDIST

Вычисляет значение нормальной функции распределения.

НОРМОБР / NORMINV

Выдает обратное нормальное распределение.

НОРМСТРАСП / NORMSDIST

Выдает стандартное нормальное интегральное распределение.

НОРМСТОБР / NORMSINV

Выдает обратное значение стандартного нормального распределения.

ПЕРЕСТ / PERMUT

ВЕРОЯТНОСТЬ / PROB

Определяет вероятность того, что значение из диапазона находится внутри заданных пределов.

Математическая статистика

При решении задач по математической статистике можно использовать те формулы, что перечислены выше, а также следующие (сгруппированы для удобства: обработка выборки, разные распределения, остальные формулы):

Обработка выборки: формулы Excel

СРОТКЛ / AVEDEV

Вычисляет среднее абсолютных значений отклонений точек данных от среднего.

СРЗНАЧ / AVERAGE

Вычисляет среднее арифметическое аргументов.

СРГЕОМ / GEOMEAN

Вычисляет среднее геометрическое.

СРГАРМ / HARMEAN

Вычисляет среднее гармоническое.

ЭКСЦЕСС / KURT

Определяет эксцесс множества данных.

МЕДИАНА / MEDIAN

Находит медиану заданных чисел.

МОДА / MODE

Определяет значение моды множества данных.

КВАРТИЛЬ / QUARTILE

Определяет квартиль множества данных.

СКОС / SKEW

Определяет асимметрию распределения.

СТАНДОТКЛОН / STDEV

Оценивает стандартное отклонение по выборке.

ДИСП / VAR

Оценивает дисперсию по выборке.

Законы распределений: формулы Excel

БЕТАРАСП / BETADIST

Определяет интегральную функцию плотности бета-вероятности.

БЕТАОБР / BETAINV

Определяет обратную функцию к интегральной функции плотности бета-вероятности.

ХИ2РАСП / CHIDIST

Вычисляет одностороннюю вероятность распределения хи-квадрат.

ХИ2ОБР / CHIINV

Вычисляет обратное значение односторонней вероятности распределения хи-квадрат.

ЭКСПРАСП / EXPONDIST

Находит экспоненциальное распределение.

FРАСП / FDIST

Находит F-распределение вероятности.

FРАСПОБР / FINV

Определяет обратное значение для F-распределения вероятности.

ФИШЕР / FISHER

Находит преобразование Фишера.

ФИШЕРОБР / FISHERINV

Находит обратное преобразование Фишера.

ГАММАРАСП / GAMMADIST

ГАММАОБР / GAMMAINV

Находит обратное гамма-распределение.

ПУАССОН / POISSON

Выдает распределение Пуассона.

СТЬЮДРАСП / TDIST

Выдает t-распределение Стьюдента.

СТЬЮДРАСПОБР / TINV

Выдает обратное t-распределение Стьюдента.

ВЕЙБУЛЛ / WEIBULL

Выдает распределение Вейбулла.

Другое (корреляция, регрессия и т.п.)

ДОВЕРИТ / CONFIDENCE

Определяет доверительный интервал для среднего значения по генеральной совокупности.

КОРРЕЛ / CORREL

Находит коэффициент корреляции между двумя множествами данных.

СЧЁТ / COUNT

Подсчитывает количество чисел в списке аргументов.

СЧЁТЕСЛИ / COUNTIF

Подсчитывает количество непустых ячеек, удовлетворяющих заданному условию внутри диапазона.

КОВАР / COVAR

Определяет ковариацию, то есть среднее произведений отклонений для каждой пары точек.

ПРЕДСКАЗ / FORECAST

Вычисляет значение линейного тренда.

ЛИНЕЙН / LINEST

Находит параметры линейного тренда.

ПИРСОН / PEARSON

Определяет коэффициент корреляции Пирсона.

Справочный файл по формулам Excel

Нужна шпаргалка по функциям Excel под рукой? Скачивайте файл: Математические и статистические формулы Excel

Полезные ссылки

А если у вас есть задачи, которые надо срочно сделать, а времени нет? Можете поискать готовые решения в решебнике:

Пример 4.В партии 20 изделий, из них 5 бракованных. Найти вероятность того, что в выборке из 4 изделий ровно одно бракованное.

Решение. В данной задаче, прежде всего, определим значения параметров: число_успехов_ в_ выборке = 1; размер_ выборки = 4; число_ успехов_ в_ совокупности = 5; размер_ совокупности = 20.

Искомую вероятность можно рассчитать с помощью функции =ГИПЕРГЕОМЕТ(1; 4; 5; 20), которая дает значение 0,4696.

Если производится несколько испытаний, причем ве­роятность события А в каждом испытании не зависит от исходов других испытаний, то такие испытания называют независимыми относительно событияА.

Пусть производится n независимых испытаний, в каждом из которых событие А может появиться либо не появиться. Вероятность события А в каждом испытании одна и та же, а именно равна р. Следовательно, вероятность ненаступления события А в каждом испытании также постоянна и равна q = 1 – р.

Вероятность того, что при n повторных независимых испытаниях событие А осуществится ровно k раз вычисляется по формуле Бернулли: .

Для нахождения наиболее вероятного числа успехов k по заданным n и р можно воспользоваться неравенствами np – q £ k£ np + p или правилом: если число np + p не целое, то k равно целой части этого числа.

В случае, если n велико, р мало, а , используют асимптотическую формулу Пуассона вычисления вероятности наступления события А ровно k раз при n повторных независимых испытаниях: .

Пример 5. Вероятность того, что расход электроэнергии на протяжении одних суток не превысит установленной нормы, равна р = 0,75. Найти вероятность того, что в ближайшие 6 суток расход электроэнергии в течение 4 суток не превысит нормы.

Решение. Вероятность нормального расхода элек­троэнергии на протяжении каждых из 6 суток постоянна и равна p = 0,75. Следовательно, вероятность перерасхода электроэнергии в каждые сутки также постоянна и равна q = 1— р = 1 — 0,75 = 0,25. Искомая вероятность по формуле Бернулли равна = 0,297. Для вычисления в Excel используем формулу =БИНОМРАСП(4; 6; 0,75; 0), которая дает значение 0,297. При этом определены следующие значения параметров: число_ успехов = 4; число_ испытаний = 6; вероятность_ успеха = 0,75; интегральная = 0. Подробно с синтаксисом функции БИНОМРАСП можно ознакомиться с помощью справки.

Пример 6. Телефонная станция обслуживает 400 абонентов. Для каждого абонента вероятность того, что в течение часа он позвонит на станцию, равна 0,01. Найти вероятность, что в течение часа ровно 5 абонентов позвонят на станцию.

Решение.Так как р = 0,01 мало и n = 400 велико, то будем пользоваться приближенной формулой Пуассона при l = 400 × 0,01 = 4. Тогда Р400(5) » » 0,156293. Для вычисления в Excel используем формулу =ПУАССОН(5; 4; 0), которая дает значение 0,156293. При этом определены следующие значения параметров: количество_ событий = 5; среднее(λ) = 4; интегральная = 0. Подробно с синтаксисом функции ПУАССОН можно ознакомиться в справке.

В случае, когда число повторных испытаний большое и формула Бернулли неприменима, используют формулы Лапласа.

Локальная теорема Лапласа. Если вероятность р появления события А в каждом испытании постоянна и отлична от нуля и единицы, то вероятность того, что событие А появится в n испытаниях ровно k раз, приближенно равна (тем точнее, чем больше n) значению функции , где .

Имеются таблицы, в которых помещены значения функции .

Интегральная теорема Лапласа. Если вероятность р наступления события А в каждом испытании постоянна и отлична от нуля и еди­ницы, то вероятность того, что событие А появится в n испытаниях от k1 до k2 раз, приближенно равна определенному интегралу:

, где .

При решении задач, требующих применения интеграль­ной теоремы Лапласа, пользуются специальными таблицами для интеграла , тогда .

Пример 7. Найти вероятность того, что событие А на­ступит ровно 80 раз в 400 испытаниях, если вероятность появления этого события в каждом испытании равна 0,2.

Решение. По условию n = 400; k = 80; р = 0,2; q = 0,8. Воспользуемся асимптотической формулой Лап­ласа: , , . Для вычисления в Excel используем формулу =НОРМРАСП(80; 80; 8; 0), которая дает значение 0,04986. При этом определены следующие значения параметров: k = 80; среднее= np = 80; стандартное_откл = = = 8, интегральная = 0. Подробно с синтаксисом функции НОРМРАСП можно ознакомиться с помощью справки.

Пример 8. Вероятность того, что деталь не прошла проверку ОТК, равна 0,2. Найти вероятность того, что среди 400 случайно отобранных деталей окажется непроверенных от 70 до 100 деталей.

Решение.Воспользуемся интегральной формулой Лапласа: n = 400; k1= 70; k2=100; р = 0,2; q = 0,8; . Так как функция является нечетной, то P400(70; 100) = Ф(2,5)+ + Ф(1,25) = 0,4938 + 0,3944 = 0,8882.

Для вычисления в Excel используем формулу нормального распределения =НОРМРАСП(100; 80; 8; 1) — НОРМРАСП(70; 80; 8; 1), которая дает значение 0,8882. При этом параметр интегральная = 1, остальные значения параметров определяются аналогично примеру, рассмотренному выше.

В этой статье описаны синтаксис формулы и использование функции ВЕРОЯТНОСТЬ в Microsoft Excel.

Описание

Возвращает вероятность того, что значение из интервала находится внутри заданных пределов. Если верхний_предел не задан, то возвращается вероятность того, что значения в аргументе x_интервал равняются значению аргумента нижний_предел.

Синтаксис

Аргументы функции ВЕРОЯТНОСТЬ описаны ниже.

x_интервал Обязательный. Диапазон числовых значений x, с которыми связаны вероятности.

Интервал_вероятностей Обязательный. Множество вероятностей, соответствующих значениям в аргументе «x_интервал».

Нижний_предел Необязательный. Нижняя граница значения, для которого вычисляется вероятность.

Верхний_предел Необязательный. Верхняя граница значения, для которого вычисляется вероятность.

Замечания

Если любое значение в аргументе интервал_вероятностей меньше 0 или если какое-либо значение в аргументе интервал_вероятностей больше 1, то функция ВЕРОЯТНОСТЬ возвращает значение ошибки #ЧИСЛО!.

Если сумма значений в аргументе интервал_вероятностей не равна 1, функция ВЕРОЯТНОСТЬ возвращает значение ошибки #ЧИСЛО!.

Если верхний_предел опущен, то функция ВЕРОЯТНОСТЬ возвращает вероятность равенства значению аргумента нижний_предел.

Если x_интервал и интервал_вероятностей содержат различное количество точек данных, то функция ВЕРОЯТНОСТЬ возвращает значение ошибки #Н/Д.

Пример

Скопируйте образец данных из следующей таблицы и вставьте их в ячейку A1 нового листа Excel. Чтобы отобразить результаты формул, выделите их и нажмите клавишу F2, а затем — клавишу ВВОД. При необходимости измените ширину столбцов, чтобы видеть все данные.


Даны определения Функции распределения случайной величины и Плотности вероятности непрерывной случайной величины. Эти понятия активно используются в статьях о статистике сайта

www.excel2.ru

. Рассмотрены примеры вычисления Функции распределения и Плотности вероятности с помощью функций MS EXCEL

.

Введем базовые понятия статистики, без которых невозможно объяснить более сложные понятия.

Генеральная совокупность и случайная величина

Пусть у нас имеется

генеральная совокупность

(population) из N объектов, каждому из которых присуще определенное значение некоторой числовой характеристики Х.


Примером генеральной совокупности (ГС) может служить совокупность весов однотипных деталей, которые производятся станком.

Поскольку в математической статистике, любой вывод делается только на основании характеристики Х (абстрагируясь от самих объектов), то с этой точки зрения

генеральная совокупность

представляет собой N чисел, среди которых, в общем случае, могут быть и одинаковые.


В нашем примере, ГС — это просто числовой массив значений весов деталей. Х – вес одной из деталей.

Если из заданной ГС мы выбираем случайным образом один объект, имеющей характеристику Х, то величина Х является

случайной величиной

. По определению, любая

случайная величина

имеет

функцию распределения

, которая обычно обозначается F(x).

Функция распределения


Функцией распределения

вероятностей

случайной величины

Х называют функцию F(x), значение которой в точке х равно вероятности события X

F(x) = P(X


Поясним на примере нашего станка. Хотя предполагается, что наш станок производит только один тип деталей, но, очевидно, что вес изготовленных деталей будет слегка отличаться друг от друга. Это возможно из-за того, что при изготовлении мог быть использован разный материал, а условия обработки также могли слегка различаться и пр. Пусть самая тяжелая деталь, произведенная станком, весит 200 г, а самая легкая — 190 г. Вероятность того, что случайно выбранная деталь Х будет весить меньше 200 г равна 1. Вероятность того, что будет весить меньше 190 г равна 0. Промежуточные значения определяются формой Функции распределения. Например, если процесс настроен на изготовление деталей весом 195 г, то разумно предположить, что вероятность выбрать деталь легче 195 г равна 0,5.

Типичный график

Функции распределения

для непрерывной случайной величины приведен на картинке ниже (фиолетовая кривая, см.

файл примера

):

В справке MS EXCEL

Функцию распределения

называют

Интегральной

функцией распределения

(

Cumulative

Distribution

Function

,

CDF

).

Приведем некоторые свойства

Функции распределения:


  • Функция распределения

    F(x) изменяется в интервале [0;1], т.к. ее значения равны вероятностям соответствующих событий (по определению вероятность может быть в пределах от 0 до 1);

  • Функция распределения

    – неубывающая функция;
  • Вероятность того, что случайная величина приняла значение из некоторого диапазона [x1;x2): P(x

    1
    <=X
    2

    )=F(x

    2

    )-F(x

    1

    ).

Существует 2 типа распределений:

непрерывные распределения

и

дискретные распределения

.

Дискретные распределения

Если случайная величина может принимать только определенные значения и количество таких значений конечно, то соответствующее распределение называется

дискретным

. Например, при бросании монеты, имеется только 2 элементарных исхода, и, соответственно, случайная величина может принимать только 2 значения. Например, 0 (выпала решка) и 1 (не выпала решка) (см.

схему Бернулли

). Если монета симметричная, то вероятность каждого исхода равна 1/2. При бросании кубика случайная величина принимает значения от 1 до 6. Вероятность каждого исхода равна 1/6. Сумма вероятностей всех возможных значений случайной величины равна 1.


Примечание

: В MS EXCEL имеется несколько функций, позволяющих вычислить вероятности дискретных случайных величин. Перечень этих функций приведен в статье

Распределения случайной величины в MS EXCEL

.

Непрерывные распределения и плотность вероятности

В случае

непрерывного распределения

случайная величина может принимать любые значения из интервала, в котором она определена. Т.к. количество таких значений бесконечно велико, то мы не можем, как в случае дискретной величины, сопоставить каждому значению случайной величины ненулевую вероятность (т.е. вероятность попадания в любую точку (заданную до опыта) для

непрерывной случайной величины

равна нулю). Т.к. в противном случае сумма вероятностей всех возможных значений случайной величины будет равна бесконечности, а не 1. Выходом из этой ситуации является введение так называемой

функции плотности распределения p(x)

. Чтобы найти вероятность того, что непрерывная случайная величина Х примет значение, заключенное в интервале (а; b), необходимо найти приращение

функции распределения

на этом интервале:

Как видно из формулы выше

плотность распределения

р(х) представляет собой производную

функции распределения

F(x), т.е. р(х) = F’(x).

Типичный график

функции плотности распределения

для непрерывной случайно величины приведен на картинке ниже (зеленая кривая):


Примечание

: В MS EXCEL имеется несколько функций, позволяющих вычислить вероятности непрерывных случайных величин. Перечень этих функций приведен в статье

Распределения случайной величины в MS EXCEL

.

В литературе

Функция плотности распределения

непрерывной случайной величины может называться:

Плотность вероятности, Плотность распределения, англ. Probability Density Function (PDF)

.

Чтобы все усложнить, термин

Распределение

(в литературе на английском языке —

Probability

Distribution

Function

или просто

Distribution

)

в зависимости от контекста может относиться как

Интегральной

функции распределения,

так и кее

Плотности распределения.

Из определения

функции плотности распределения

следует, что p(х)>=0. Следовательно, плотность вероятности для непрерывной величины может быть, в отличие от

Функции распределения,

больше 1. Например, для

непрерывной равномерной величины

, распределенной на интервале [0; 0,5]

плотность вероятности

равна 1/(0,5-0)=2. А для

экспоненциального распределения

с параметром

лямбда

=5, значение

плотности вероятности

в точке х=0,05 равно 3,894. Но, при этом можно убедиться, что вероятность на любом интервале будет, как обычно, от 0 до 1.

Напомним, что

плотность распределения

является производной от

функции распределения

, т.е. «скоростью» ее изменения: p(x)=(F(x2)-F(x1))/Dx при Dx стремящемся к 0, где Dx=x2-x1. Т.е. тот факт, что

плотность распределения

>1 означает лишь, что функция распределения растет достаточно быстро (это очевидно на примере

экспоненциального распределения

).


Примечание

: Площадь, целиком заключенная под всей кривой, изображающей

плотность распределения

, равна 1.


Примечание

: Напомним, что функцию распределения F(x) называют в функциях MS EXCEL

интегральной функцией распределения

. Этот термин присутствует в параметрах функций, например в

НОРМ.РАСП

(x; среднее; стандартное_откл;

интегральная

). Если функция MS EXCEL должна вернуть

Функцию распределения,

то параметр

интегральная

, д.б. установлен ИСТИНА. Если требуется вычислить

плотность вероятности

, то параметр

интегральная

, д.б. ЛОЖЬ.


Примечание

: Для

дискретного распределения

вероятность случайной величине принять некое значение также часто называется плотностью вероятности (англ. probability mass function (pmf)). В справке MS EXCEL

плотность вероятности

может называть даже «функция вероятностной меры» (см. функцию

БИНОМ.РАСП()

).

Вычисление плотности вероятности с использованием функций MS EXCEL

Понятно, что чтобы вычислить

плотность вероятности

для определенного значения случайной величины, нужно знать ее распределение.

Найдем

плотность вероятности

для

стандартного нормального распределения

N(0;1) при x=2. Для этого необходимо записать формулу

=НОРМ.СТ.РАСП(2;ЛОЖЬ)

=0,054 или

=НОРМ.РАСП(2;0;1;ЛОЖЬ)

.

Напомним, что

вероятность

того, что

непрерывная случайная величина

примет конкретное значение x равна 0. Для

непрерывной случайной величины

Х можно вычислить только вероятность события, что Х примет значение, заключенное в интервале (а; b).

Вычисление вероятностей с использованием функций MS EXCEL

1) Найдем вероятность, что случайная величина, распределенная по

стандартному нормальному распределению

(см. картинку выше), приняла положительное значение. Согласно свойству

Функции распределения

вероятность равна F(+∞)-F(0)=1-0,5=0,5.

В MS EXCEL для нахождения этой вероятности используйте формулу

=НОРМ.СТ.РАСП(9,999E+307;ИСТИНА) -НОРМ.СТ.РАСП(0;ИСТИНА)

=1-0,5. Вместо +∞ в формулу введено значение 9,999E+307= 9,999*10^307, которое является максимальным числом, которое можно ввести в ячейку MS EXCEL (так сказать, наиболее близкое к +∞).

2) Найдем вероятность, что случайная величина, распределенная по

стандартному нормальному распределению

, приняла отрицательное значение. Согласно определения

Функции распределения,

вероятность равна F(0)=0,5.

В MS EXCEL для нахождения этой вероятности используйте формулу

=НОРМ.СТ.РАСП(0;ИСТИНА)

=0,5.

3) Найдем вероятность того, что случайная величина, распределенная по

стандартному нормальному распределению

, примет значение, заключенное в интервале (0; 1). Вероятность равна F(1)-F(0), т.е. из вероятности выбрать Х из интервала (-∞;1) нужно вычесть вероятность выбрать Х из интервала (-∞;0). В MS EXCEL используйте формулу

=НОРМ.СТ.РАСП(1;ИСТИНА) — НОРМ.СТ.РАСП(0;ИСТИНА)

.

Все расчеты, приведенные выше, относятся к случайной величине, распределенной по

стандартному нормальному закону

N(0;1). Понятно, что значения вероятностей зависят от конкретного распределения. В статье

Распределения случайной величины в MS EXCEL

приведены распределения, для которых в MS EXCEL имеются соответствующие функции, позволяющие вычислить вероятности.

Обратная функция распределения (Inverse Distribution Function)

Вспомним задачу из предыдущего раздела:

Найдем вероятность, что случайная величина, распределенная по стандартному нормальному распределению, приняла отрицательное значение.

Вероятность этого события равна 0,5.

Теперь решим обратную задачу: определим х, для которого вероятность, того что случайная величина Х примет значение
медиану

или 50-ю

процентиль

).

Для этого необходимо на графике

функции распределения

найти точку, для которой F(х)=0,5, а затем найти абсциссу этой точки. Абсцисса точки =0, т.е. вероятность, того что случайная величина Х примет значение <0, равна 0,5.

В MS EXCEL используйте формулу

=НОРМ.СТ.ОБР(0,5)

=0.

Однозначно вычислить значение

случайной величины

позволяет свойство монотонности

функции распределения.

Обратите внимание, что для вычисления обратной функции мы использовали именно

функцию распределения

, а не

плотность распределения

. Поэтому, в аргументах функции

НОРМ.СТ.ОБР()

отсутствует параметр

интегральная

, который подразумевается. Подробнее про функцию

НОРМ.СТ.ОБР()

см. статью про

нормальное распределение

.


Обратная функция распределения

вычисляет

квантили распределения

, которые используются, например, при

построении доверительных интервалов

. Т.е. в нашем случае число 0 является 0,5-квантилем

нормального распределения

. В

файле примера

можно вычислить и другой

квантиль

этого распределения. Например, 0,8-квантиль равен 0,84.

В англоязычной литературе

обратная функция распределения

часто называется как Percent Point Function (PPF).


Примечание

: При вычислении

квантилей

в MS EXCEL используются функции:

НОРМ.СТ.ОБР()

,

ЛОГНОРМ.ОБР()

,

ХИ2.ОБР(),

ГАММА.ОБР()

и т.д. Подробнее о распределениях, представленных в MS EXCEL, можно прочитать в статье

Распределения случайной величины в MS EXCEL

.

В этой статье я расскажу о том, как решать задачи на применение формулы Бернулли в Эксель. Разберем формулу, типовые задачи — решим их вручную и в Excel. Вы разберетесь со схемой независимых ипытаний и сможете использовать расчетный файл эксель) для решения своих задач. Удачи!

Схема независимых испытаний

В общем виде схема повторных независимых испытаний записывается в виде задачи:

Пусть производится $n$ опытов, вероятность наступления события $A$ в каждом из которых (вероятность успеха) равна $p$, вероятность ненаступления (неуспеха) — соответственно $q=1-p$. Найти вероятность, что событие $A$ наступит в точности $k$ раз в $n$ опытах.

Эта вероятность вычисляется по формуле Бернулли:

$$ P_n(k)=C_n^k cdot p^k cdot (1-p)^=C_n^k cdot p^k cdot q^. qquad(1) $$

Данная схема описывает большой пласт задач по теории вероятностей (от игры в лотерею до испытания приборов на надежность), главное, выделить несколько характерных моментов:

  • Опыт повторяется в одинаковых условиях несколько раз. Например, кубик кидается 5 раз, монета подбрасывается 10 раз, проверяется 20 деталей из одной партии, покупается 8 однотипных лотерейных билетов.
  • Вероятность наступления события в каждом опыте одинакова. Этот пункт связан с предыдущим, рассматриваются детали, которые могут оказаться с одинаковой вероятностью бракованными или билеты, которые выигрывают с одной и той же вероятностью.
  • События в каждом опыте наступают или нет независимо от результатов предыдущих опытов. Кубик падает случайно вне зависимости от того, как упал предыдущий и т.п.

Если эти условия выполнены — мы в условиях схемы Бернулли и можем применять одноименную формулу. Если нет — ищем дальше, ведь классов задач в теории вероятностей существенно больше (и о решении некоторых написано тут): классическая и геометрическая вероятность, формула полной вероятности, сложение и умножение вероятностей, условная вероятность и т.д.

Подробнее про формулу Бернулли и примеры ее применения можно почитать в онлайн-учебнике. Мы же перейдем к вычислению с помощью программы MS Excel.

Формула Бернулли в Эксель

Для вычислений с помощью формулы Бернулли в Excel есть специальная функция =БИНОМ.РАСП() , выдающая определенную вероятность биномиального распределения.

Чтобы найти вероятность $P_n(k)$ в формуле (1) используйте следующий текст =БИНОМ.РАСП($k$;$n$;$p$;0) .

Покажем на примере. На листе подкрашены ячейки (серые), куда можно ввести параметры задачи $n, k, p$ и получить искомую вероятность (текст полностью виден в строке формул вверху).

Пример применения формулы на конкретных задачах мы рассмотрим ниже, а пока введем в лист Excel другие нужные формулы, которые пригодятся в решении:

Выше на скриншоте введены формулы для вычисления следующих вероятностей (помимо самих формул для Excel ниже записаны и исходные формулы теории вероятностей):

  • Событие произойдет в точности $k$ раз из $n$:
    =БИНОМ.РАСП(k;n;p;0)
    $$P_n(k)=C_n^k cdot p^k cdot q^$$
  • Событие произойдет от $k_1$ до $k_2$ раз:
    =БИНОМ.РАСП(k_2;n;p;1) — БИНОМ.РАСП(k_1;n;p;1) + БИНОМ.РАСП(k_1;n;p;0)
    $$P_n(k_1le X le k_2)=sum_^ C_n^i cdot p^i cdot q^$$
  • Событие произойдет не более $k_3$ раз:
    =БИНОМ.РАСП(k_3;n;p;1)
    $$P_n(0le X le k_3)=sum_^ C_n^i cdot p^i cdot q^$$
  • Событие произойдет не менее $k_4$ раз:
    =1 — БИНОМ.РАСП(k_4;n;p;1) + БИНОМ.РАСП(k_4;n;p;0)
    $$P_n(k_4le X le n)=sum_^ C_n^i cdot p^i cdot q^$$
  • Событие произойдет хотя бы один раз:
    =1-БИНОМ.РАСП(0;n;p;0)
    $$P_n( X ge 1)=1-P_n(0)=1-q^$$
  • Наивероятнейшее число наступлений события $m$:
    =ОКРУГЛВВЕРХ(n*p-q;0)
    $$np-q le m le np+p$$

Вы видите, что в задачах, где нужно складывать несколько вероятностей, мы уже используем функцию вида =БИНОМ.РАСП(k;n;p;1) — так называемая интегральная функция вероятности, которая дает сумму всех вероятностей от 0 до $k$ включительно.

Примеры решений задач

Рассмотрим решение типовых задач.

Пример 1. Произвели 7 выстрелов. Вероятность попадания при одном выстреле равна 0,75. Найти вероятность того, что при этом будет ровно 5 попаданий; от 6 до 7 попаданий в цель.

Решение. Получаем, что в задаче идет речь о повторных независимых испытаниях (выстрелах), всего их $n=7$, вероятность попадания при каждом одинакова и равна $p=0,75$, вероятность промаха $q=1-p=1-0,75=0,25$. Нужно найти, что будет ровно $k=5$ попаданий. Подставляем все в формулу (1) и получаем:

$$ P_7(5)=C_<7>^5 cdot 0,75^5 cdot 0,25^2 = 21cdot 0,75^5 cdot 0,25^2= 0,31146. $$

Для вероятности 6 или 7 попаданий суммируем:

$$ P_7(6)+P_7(7)=C_<7>^6 cdot 0,75^6 cdot 0,25^1+C_<7>^7 cdot 0,75^7 cdot 0,25^0= = 7cdot 0,75^6 cdot 0,25+0,75^7=0,44495. $$

А вот это решение в файле эксель:

Пример 2. В семье десять детей. Считая вероятности рождения мальчика и девочки равными между собой, определить вероятность того, что в данной семье:
1. Ровно 2 мальчика
2. От 4 до 5 мальчиков
3. Не более 2 мальчиков
4. Не менее 7 мальчиков
5. Хотя бы один мальчик
Каково наиболее вероятное число мальчиков и девочек в семье?

Решение. Сначала запишем данные задачи: $n=10$ (число детей), $p=0,5$ (вероятность рождения мальчика). Формула Бернулли принимает вид: $$P_<10>(k)=C_<10>^k cdot 0,5^kcdot 0,5^<10-k>=C_<10>^k cdot 0,5^<10>$$ Приступим к вычислениям:

$$1. P_<10>(2)=C_<10>^2 cdot 0,5^ <10>= frac<10!><2!8!>cdot 0,5^ <10>approx 0,044.$$ $$2. P_<10>(4)+P_<10>(5)=C_<10>^4 cdot 0,5^ <10>+ C_<10>^5 cdot 0,5^<10>=left( frac<10!> <4!6!>+ frac<10!> <5!5!>
ight)cdot 0,5^ <10>approx 0,451.$$ $$3. P_<10>(0)+P_<10>(1)+P_<10>(2)=C_<10>^0 cdot 0,5^ <10>+ C_<10>^1 cdot 0,5^<10>+ C_<10>^2 cdot 0,5^<10>=left( 1+10+ frac<10!> <2!8!>
ight)cdot 0,5^ <10>approx 0,055.$$ $$4. P_<10>(7)+P_<10>(8)+P_<10>(9)+P_<10>(10)= = C_<10>^7 cdot 0,5^ <10>+ C_<10>^8 cdot 0,5^<10>+ C_<10>^9 cdot 0,5^<10>+ C_<10>^10 cdot 0,5^ <10>==left(frac<10!><3!7!>+ frac<10!> <2!8!>+ 10 +1
ight)cdot 0,5^ <10>approx 0,172.$$ $$5. P_<10>(ge 1)=1-P_<10>(0)=1-C_<10>^0 cdot 0,5^ <10>= 1- 0,5^ <10>approx 0,999.$$

Наивероятнейшее число мальчиков найдем из неравенства:

$$ 10 cdot 0,5 — 0,5 le m le 10 cdot 0,5 + 0,5, 4,5 le m le 5,5, m=5. $$

Наивероятнейшее число — это 5 мальчиков и соответственно 5 девочек (что очевидно и по здравому смыслу, раз их рождения вероятность одинакова).

Проведем эти же расчеты в нашем шаблоне эксель, вводя данные задачи в серые ячейки:

Видно, что ответы совпадают.

Пример 3. Вероятность выигрыша по одному лотерейному билету равна 0,3. Куплено 8 билетов. Найти вероятность того, что а) хотя бы один билет выигрышный; б) менее трех билетов выигрышные. Какое наиболее вероятное число выигрышных билетов?

Решение. Полное решение этой задачи можно найти тут, а мы сразу введем данные в Эксель и получим ответы: а) 0,94235; б) 0,55177; в) 2 билета. И они совпадут (с точностью до округления) с ответами ручного решения.

Решайте свои задачи и советуйте наш сайт друзьям. Удачи!

Даны определения Функции распределения случайной величины и Плотности вероятности непрерывной случайной величины. Эти понятия активно используются в статьях о статистике сайта ]]> www.excel2.ru ]]> . Рассмотрены примеры вычисления Функции распределения и Плотности вероятности с помощью функций MS EXCEL.

Введем базовые понятия статистики, без которых невозможно объяснить более сложные понятия.

Генеральная совокупность и случайная величина

Пусть у нас имеется генеральная совокупность (population) из N объектов, каждому из которых присуще определенное значение некоторой числовой характеристики Х.

Примером генеральной совокупности (ГС) может служить совокупность весов однотипных деталей, которые производятся станком.

Поскольку в математической статистике, любой вывод делается только на основании характеристики Х (абстрагируясь от самих объектов), то с этой точки зрения генеральная совокупность представляет собой N чисел, среди которых, в общем случае, могут быть и одинаковые.

В нашем примере, ГС — это просто числовой массив значений весов деталей. Х – вес одной из деталей.

Если из заданной ГС мы выбираем случайным образом один объект, имеющей характеристику Х, то величина Х является случайной величиной. По определению, любая случайная величина имеет функцию распределения, которая обычно обозначается F(x).

Функция распределения

Функцией распределения вероятностей случайной величины Х называют функцию F(x), значение которой в точке х равно вероятности события X файл примера ):

В справке MS EXCEL Функцию распределения называют Интегральной функцией распределения (Cumulative Distribution Function, CDF).

Приведем некоторые свойства Функции распределения:

  • Функция распределения F(x) изменяется в интервале [0;1], т.к. ее значения равны вероятностям соответствующих событий (по определению вероятность может быть в пределах от 0 до 1);
  • Функция распределения – неубывающая функция;
  • Вероятность того, что случайная величина приняла значение из некоторого диапазона [x1;x2): P(x1 Примечание: В MS EXCEL имеется несколько функций, позволяющих вычислить вероятности дискретных случайных величин. Перечень этих функций приведен в статье Распределения случайной величины в MS EXCEL.

Непрерывные распределения и плотность вероятности

В случае непрерывного распределения случайная величина может принимать любые значения из интервала, в котором она определена. Т.к. количество таких значений бесконечно велико, то мы не можем, как в случае дискретной величины, сопоставить каждому значению случайной величины ненулевую вероятность (т.е. вероятность попадания в любую точку (заданную до опыта) для непрерывной случайной величины равна нулю). Т.к. в противном случае сумма вероятностей всех возможных значений случайной величины будет равна бесконечности, а не 1.
Выходом из этой ситуации является введение так называемой функции плотности распределения p(x). Чтобы найти вероятность того, что непрерывная случайная величина Х примет значение, заключенное в интервале (а; b), необходимо найти приращение функции распределения на этом интервале:

Как видно из формулы выше плотность распределения р(х) представляет собой производную функции распределения F(x), т.е. р(х) = F’(x).

Типичный график функции плотности распределения для непрерывной случайно величины приведен на картинке ниже (зеленая кривая):

Примечание: В MS EXCEL имеется несколько функций, позволяющих вычислить вероятности непрерывных случайных величин. Перечень этих функций приведен в статье Распределения случайной величины в MS EXCEL.

В литературе Функция плотности распределения непрерывной случайной величины может называться: Плотность вероятности, Плотность распределения, англ. Probability Density Function (PDF).

Чтобы все усложнить, термин Распределение (в литературе на английском языке — Probability Distribution Function или просто Distribution) в зависимости от контекста может относиться как Интегральной функции распределения, так и кее Плотности распределения.

Из определения функции плотности распределения следует, что p(х)>=0. Следовательно, плотность вероятности для непрерывной величины может быть, в отличие от Функции распределения, больше 1. Например, для непрерывной равномерной величины, распределенной на интервале [0; 0,5] плотность вероятности равна 1/(0,5-0)=2. А для экспоненциального распределения с параметром лямбда=5, значение плотности вероятности в точке х=0,05 равно 3,894. Но, при этом можно убедиться, что вероятность на любом интервале будет, как обычно, от 0 до 1.

Напомним, что плотность распределения является производной от функции распределения, т.е. «скоростью» ее изменения: p(x)=(F(x2)-F(x1))/Dx при Dx стремящемся к 0, где Dx=x2-x1. Т.е. тот факт, что плотность распределения >1 означает лишь, что функция распределения растет достаточно быстро (это очевидно на примере экспоненциального распределения).

Примечание: Площадь, целиком заключенная под всей кривой, изображающей плотность распределения, равна 1.

Примечание: Напомним, что функцию распределения F(x) называют в функциях MS EXCEL интегральной функцией распределения. Этот термин присутствует в параметрах функций, например в НОРМ.РАСП (x; среднее; стандартное_откл; интегральная). Если функция MS EXCEL должна вернуть Функцию распределения, то параметр интегральная, д.б. установлен ИСТИНА. Если требуется вычислить плотность вероятности, то параметр интегральная, д.б. ЛОЖЬ.

Примечание: Для дискретного распределения вероятность случайной величине принять некое значение также часто называется плотностью вероятности (англ. probability mass function (pmf)). В справке MS EXCEL плотность вероятности может называть даже «функция вероятностной меры» (см. функцию БИНОМ.РАСП() ).

Вычисление плотности вероятности с использованием функций MS EXCEL

Понятно, что чтобы вычислить плотность вероятности для определенного значения случайной величины, нужно знать ее распределение.

Найдем плотность вероятности для стандартного нормального распределения N(0;1) при x=2. Для этого необходимо записать формулу =НОРМ.СТ.РАСП(2;ЛОЖЬ) =0,054 или =НОРМ.РАСП(2;0;1;ЛОЖЬ) .

Напомним, что вероятность того, что непрерывная случайная величина примет конкретное значение x равна 0. Для непрерывной случайной величины Х можно вычислить только вероятность события, что Х примет значение, заключенное в интервале (а; b).

Вычисление вероятностей с использованием функций MS EXCEL

1) Найдем вероятность, что случайная величина, распределенная по стандартному нормальному распределению (см. картинку выше), приняла положительное значение. Согласно свойству Функции распределения вероятность равна F(+∞)-F(0)=1-0,5=0,5.

В MS EXCEL для нахождения этой вероятности используйте формулу =НОРМ.СТ.РАСП(9,999E+307;ИСТИНА) -НОРМ.СТ.РАСП(0;ИСТИНА) =1-0,5.
Вместо +∞ в формулу введено значение 9,999E+307= 9,999*10^307, которое является максимальным числом, которое можно ввести в ячейку MS EXCEL (так сказать, наиболее близкое к +∞).

2) Найдем вероятность, что случайная величина, распределенная по стандартному нормальному распределению, приняла отрицательное значение. Согласно определения Функции распределения, вероятность равна F(0)=0,5.

В MS EXCEL для нахождения этой вероятности используйте формулу =НОРМ.СТ.РАСП(0;ИСТИНА) =0,5.

3) Найдем вероятность того, что случайная величина, распределенная по стандартному нормальному распределению, примет значение, заключенное в интервале (0; 1). Вероятность равна F(1)-F(0), т.е. из вероятности выбрать Х из интервала (-∞;1) нужно вычесть вероятность выбрать Х из интервала (-∞;0). В MS EXCEL используйте формулу =НОРМ.СТ.РАСП(1;ИСТИНА) — НОРМ.СТ.РАСП(0;ИСТИНА) .

Все расчеты, приведенные выше, относятся к случайной величине, распределенной по стандартному нормальному закону N(0;1). Понятно, что значения вероятностей зависят от конкретного распределения. В статье Распределения случайной величины в MS EXCEL приведены распределения, для которых в MS EXCEL имеются соответствующие функции, позволяющие вычислить вероятности.

Обратная функция распределения (Inverse Distribution Function)

Вспомним задачу из предыдущего раздела: Найдем вероятность, что случайная величина, распределенная по стандартному нормальному распределению, приняла отрицательное значение.

Вероятность этого события равна 0,5.

Теперь решим обратную задачу: определим х, для которого вероятность, того что случайная величина Х примет значение =НОРМ.СТ.ОБР(0,5) =0.

Однозначно вычислить значение случайной величины позволяет свойство монотонности функции распределения.

Обратите внимание, что для вычисления обратной функции мы использовали именно функцию распределения, а не плотность распределения. Поэтому, в аргументах функции НОРМ.СТ.ОБР() отсутствует параметр интегральная, который подразумевается. Подробнее про функцию НОРМ.СТ.ОБР() см. статью про нормальное распределение.

Обратная функция распределения вычисляет квантили распределения, которые используются, например, при построении доверительных интервалов. Т.е. в нашем случае число 0 является 0,5-квантилем нормального распределения. В файле примера можно вычислить и другой квантиль этого распределения. Например, 0,8-квантиль равен 0,84.

В англоязычной литературе обратная функция распределения часто называется как Percent Point Function (PPF).

Примечание: При вычислении квантилей в MS EXCEL используются функции: НОРМ.СТ.ОБР() , ЛОГНОРМ.ОБР() , ХИ2.ОБР(), ГАММА.ОБР() и т.д. Подробнее о распределениях, представленных в MS EXCEL, можно прочитать в статье Распределения случайной величины в MS EXCEL.

События, характеризующие данные, могут носить случайный характер и появляться с разной вероятностью.

Вероятность события p есть отношение числа благоприятных исходов m к числу всех возможных исходов n этого события: p=m/n. Например, вероятность появления туза в наугад выбранной карте из колоды в 52 карты равна 4/52=0.0769, так как m=4, а n=52.

Если известно соответствие между появлениями (величинами) x1, x2, …, xn случайного события (переменной) X и соответствующими вероятностями их реализации p1, p2, …, pn, то говорят, что известен закон распределения случайной величины F(x). Большинство встречающихся на практике распределений вероятностей реализовано в Excel.

Распределения вероятностей имеют числовые характеристики.

Функции Excel для вычисления числовых характеристик распределения вероятностей. Они входят в группу Статистические. При вычислении функций в качестве случайных величин используйте следующие значения:

Математическое ожидание случайной величины (среднее арифметическое), характеризующее центр распределения вероятностей, вычисляется функцией СРЗНАЧ. СРЗНАЧ(A1:A7) = 9.

Дисперсия, характеризует разброс случайной величины относительно центра распределения вероятностей и вычисляется функцией ДИСПР. ДИСПР(A1:A7) = 4.857.

Среднеквадратичное отклонение есть квадратный корень из дисперсии, характеризует разброс случайной величины в единицах случайной величины и вычисляется функцией СТАНДОТКЛОНП. СТАНДОТКЛОНП(A1:A7) = 2.203893.

Квантиль случайной величины с законом распределения F(x) есть значение случайной величины x при заданной вероятности p., т.е. есть решение уравнения F(x)=p. Медиана есть квантиль с вероятностью p=0.5.

Excel, вместо квантилей содержит функции вычисления х для определенных уровней р: квартили (кварта – четверть), децили (дециль – десятая часть), персентили (персент – процент). Различают нижний квартиль с вероятностью p=0.25 и верхний квартиль с вероятностью p=0.75. Децили это квантили с вероятностью 0.1, 0.2, …, 0.9.

Функцию КВАРТИЛЬ используют, чтобы разбить данные на группы. В качестве второго аргумента указывают уровень (четверть), для которого нужно вернуть решение: 0 – минимальное значение распределения, 1 – первый, нижний квартиль, 2 – медиана, 3 – третий, верхний квартиль, 4 – максимальное значение. Например, КВАРТИЛЬ(A1:A7;3) = 10, т.е. 75% всех значений меньше 10, КВАРТИЛЬ(A1:A7;2) = 9.

Функция ПЕРСЕНТИЛЬ вычисляет квантиль указанного уровня вероятности и используется для определения порога приемлемости значений. В качестве второго аргумента указывают уровень 0.1, 0.2, …, 0.9. ПЕРСЕНТИЛЬ(A1:A7;0,9) = 11.8, т.е. 90% всех значений меньше 11.8.

Excel содержит инструмент Ранг и персентиль, который на основе набора данных формирует выходную таблицу, содержащую порядковый и процентный ранги для каждого значения в наборе данных. См. справку по F1. Ниже приведен пример установки надстройки Пактет анализа

Распределения вероятностей, реализованные в Excel.

Каждый закон распределения описывает процессы разной вероятностной природы и характеризуется специфическими параметрами:

равномерное распределениеn случайных чисел выпадает с одной и той же вероятностью p=1/n; характеризуется нижней и верхней границей; примером является появление чисел 1, 2, …, 6 при бросании игральной кости (p=1/6);

биномиальное распределение моделирует взаимосвязь числа успешных испытаний m и вероятностей успеха каждого испытания p при общем количестве испытаний n — функции БИНОМРАСП и КРИТБИНОМ;

нормальное (гауссово) распределение описывает процессы, в которых на результат воздействует большое число независимых случайных факторов, среди которых нет сильно выделяющихся – функции НОРМРАСП, НОРМСТРАСП, НОРМОБР, НОРМСТОБР и НОРМАЛИЗАЦИЯ;

распределение Пуассона, предсказывает число случайных событий на определенном отрезке времени или на определенном пространстве, позволяет аппроксимировать биномиальное распределение – функция ПУАССОН;

экспоненциальное (показательное) распределение, моделирует временные задержки между событиями, описывает процессы в задачах массового обслуживания и в задачах с «временем жизни» — ЭКСПРАСП;

распределение хи-квадрат, связано с нормальным, возвращает одностороннюю вероятность распределения и используется для сравнения предполагаемых и наблюдаемых значений – функция ХИ2РАСП;

распределение Стьюдента, связано с нормальным, возвращает вероятность для t-распределения Стьюдента и используется для проверки гипотез при малом объеме выборки – функция СТЬЮДРАСП;

F-распределение (Фишера), связано с нормальным и может быть использовано в F-тесте, который сравнивает степени разброса двух множеств данных – fраспобр;

гамма-распределение используется для изучения случайных величин, имеющих асимметричное распределение, в теории очередей – функция ГАММАРАСП;

а также другие распределения – функции БЕТАРАСП, ВЕЙБУЛЛ, ОТРБИНОМРАСП, ГИПЕРГЕОМЕТ, ЛОГНОРМРАСП и др.

Биномиальное распределение характеризуется числом успешных испытаний m, вероятностью успеха каждого испытания p и общим количеством испытаний n. Классическим примером использования биномиального распределения является выборочный контроль качества больших партий товара, изделий в торговле, на производстве, когда сплошная проверка невозможна. Из партии выбирают n образцов и регистрируют число бракованных m. Бракованными могут быть 1, 2, … , n образцов, но вероятности реального числа бракованных будут различными. Если контрольная вероятность брака ниже допустимой вероятности, то можно гарантировать достаточное качество всей партии.

В Excel функция БИНОМРАСП вычисляет вероятность отдельного значения распределения по заданным m, n и р, а функция КРИТБИНОМ – случайное число по заданной вероятности. Обычно функция КРИТБИНОМ используется для определения наибольшего допустимого числа брака.

В качестве примера построим график плотности вероятности биномиального распределения для n=10 (1, 2, …, 10) и p=0.2. Введите исходные данные, как показано на рисунке:

Далее в ячейку В4 введите статистическую функцию БИНОМРАСП и заполните ее параметры как показано на рисунке:

Здесь параметр Число_s есть число успешных испытаний m, Испытания – число независимых испытаний n, Вероятность_s – вероятность успеха каждого испытания p. Параметр Интегральный равен 0, если требуется получить плотность распределения (вероятность для значения m), и равен 1, если требуется получить вероятность с накоплением (вероятность того, что число успешных испытаний не меньше значения аргумента Число_s).

Формулу из В4 размножьте в ячейки В5:В13. Ниже показан результат:

В колонке В вычислены вероятности успешных испытаний m=1, 2, …, 10. Теперь по диапазону В4:В13 постройте график или гистограмму биномиальной функции плотности распределения – результат на рисунке. Поэкспериментируйте, изменяя значение вероятности в ячейке В1: 0.3, 0.4, 0.8, проследите за изменениями формы графика.

Для иллюстрации функции КРИТБИНОМ используем предыдущий пример – необходимо найти число m, для которого вероятность интегрального распределения больше или равна 0.75. Вызовите функцию КРИТБИНОМ и заполните параметры. Вы должны получить значение 3. Это означает, что при вероятности интегрального распределения >= 0.75 будет не менее трех (m>=3) успешных испытаний.

Нормальное распределение характеризуется средним арифметическим (математическим ожиданием) m и стандартным (среднеквадратичным) отклонением r. Дисперсия равна r 2 . Краткое обозначение распределения N(m,r 2 ). График нормального распределения симметричен относительно центра распределения (точки m), чем меньше r, тем больше вероятность появления случайной величины. В пределы [mr,m+r] нормально распределенная случайная величина попадает с вероятностью 0,683 в пределы [m-2r,m+2r] — с вероятностью 0,955 и т.д.

При m=0 и r=1 нормальное распределение называется стандартным или нормированным – N(0,1).

Нормальное распределение имеет очень широкий круг приложений. В качестве примера построим график плотности вероятностей нормального распределения при m=15 и r=1,5 в диапазоне [m-3r,m+3r] c шагом 0,5. Результат показан на рисунке.

Выполните следующие действия:

в ячейку А4 введите формулу =B1-3*B2, в ячейку А5 формулу =A4+B$3 и размножьте ее по ячейку А22;

в ячейку В4 введите функцию НОРМРАСП из группы Статистические – параметры заполните как на рисунке;

размножьте формулу из ячейки В4 по ячейку В22 и по диапазону В4:В22 постройте график; на 2-ом шаге мастера диаграмм в закладке Ряд введите подписи к оси х из диапазона А4:А22.

Понравилась статья? Поделить с друзьями:
  • Тень ячейки в excel
  • Тень от ячеек excel
  • Теневая цена в отчетах excel представляет собой двойственные переменные
  • Теневая цена excel что это
  • Тендерная таблица образец excel