Содержание
- Функция Лапласа
- Оператор НОРМ.СТ.РАСП
- Решение задачи
- Вопросы и ответы
Одной из самых известных неэлементарных функций, которая применяется в математике, в теории дифференциальных уравнений, в статистике и в теории вероятностей является функция Лапласа. Решение задач с ней требует существенной подготовки. Давайте выясним, как можно с помощью инструментов Excel произвести вычисление данного показателя.
Функция Лапласа
Функция Лапласа имеет широкое прикладное и теоретическое применение. Например, она довольно часто используется для решения дифференциальных уравнений. У этого термина существует ещё одно равнозначное название – интеграл вероятности. В некоторых случаях основой для решения является построение таблицы значений.
Оператор НОРМ.СТ.РАСП
В Экселе указанная задача решается с помощью оператора НОРМ.СТ.РАСП. Его название является сокращением от термина «нормальное стандартное распределение». Так как его главной задачей является возврат в выделенную ячейку стандартного нормального интегрального распределения. Данный оператор относится к статистической категории стандартных функций Excel.
В Excel 2007 и в более ранних версиях программы этот оператор назывался НОРМСТРАСП. Он в целях совместимости оставлен и в современных версиях приложений. Но все-таки в них рекомендуется использование более продвинутого аналога – НОРМ.СТ.РАСП.
Синтаксис оператора НОРМ.СТ.РАСП выглядит следующим образом:
=НОРМ.СТ.РАСП(z;интегральная)
Устаревший оператор НОРМСТРАСП записывается так:
=НОРМСТРАСП(z)
Как видим, в новом варианте к существующему аргументу «Z» добавлен аргумент «Интегральная». Нужно заметить, что каждый аргумент является обязательным.
Аргумент «Z» указывает числовое значение, для которого производится построение распределения.
Аргумент «Интегральная» представляет собой логическое значение, которое может иметь представление «ИСТИНА» («1») или «ЛОЖЬ» («0»). В первом случае в указанную ячейку возвращается интегральная функция распределения, а во втором – весовая функция распределения.
Решение задачи
Для того чтобы выполнить требуемое вычисление для переменной применяется следующая формула:
=НОРМ.СТ.РАСП(z;интегральная(1))-0,5
Теперь давайте на конкретном примере рассмотрим использование оператора НОРМ.СТ.РАСП для решения конкретной задачи.
- Выделяем ячейку, куда будет выводиться готовый результат и щелкаем по значку «Вставить функцию», расположенному около строки формул.
- После открытия Мастера функций переходим в категорию «Статистические» или «Полный алфавитный перечень». Выделяем наименование «НОРМ.СТ.РАСП» и жмем на кнопку «OK».
- Происходит активация окна аргументов оператора НОРМ.СТ.РАСП. В поле «Z» вводим переменную, к которой нужно произвести расчет. Также этот аргумент может быть представлен в виде ссылки на ячейку, которая содержит эту переменную. В поле «Интегральная» вводим значение «1». Это означает, что оператор после вычисления вернет в качестве решения интегральную функцию распределения. После того, как выполнены вышеперечисленные действия, жмем на кнопку «OK».
- После этого результат обработки данных оператором НОРМ.СТ.РАСП будет выведен в ячейку, которая указана в первом пункте данного руководства.
- Но и это ещё не все. Мы вычислили только стандартное нормальное интегральное распределение. Для того, чтобы посчитать значение функции Лапласа, нужно от него отнять число 0,5. Выделяем ячейку, содержащую выражение. В строке формул после оператора НОРМ.СТ.РАСП дописываем значение: -0,5.
- Для того, чтобы произвести вычисление, жмем на кнопку Enter. Полученный результат и будет искомым значением.
Как видим, вычислить функцию Лапласа для конкретного заданного числового значения в программе Excel не составляет особенного труда. Для этих целей применяется стандартный оператор НОРМ.СТ.РАСП.
Еще статьи по данной теме:
Помогла ли Вам статья?
Функция Лапласа и другие табличные статистические функции: считаем в Excel
При решении таких типовых задач математической статистики, как построение доверительных интервалов или проверка гипотез о параметрах случайных величин, широко используются несколько табличных функций, например,
функция Лапласа
или
квантили распределения хи-квадрат.
В наше время совершенно необязательно обращаться за недостающими в формуле величинами к толстым
справочникам со статистическими таблицами, можно всё посчитать непосредственно в Excel:
Формула =НОРМСТРАСП(x)-0,5
вычисляет значение функции Лапласа от аргумента x
(подставьте вместо x
соответствующую ячейку). При этом Ф(-x)=-Ф(x)
, а при x>3,85
значение Ф(x)=0,5
.
Вычислить значение обратной функции Лапласа от аргумента x
можно формулой =НОРМСТОБР(x)
. В Excel функция НОРМСТОБР (1-eps/2) даст требуемое критическое значение, соответствующее уровню значимости критерия, равному eps. Например, для критерия с критическим уровнем 0,05 (5%) формула НОРМСТОБР(1-0,05/2)=1,96
Критические точки t-критерия можно вычислить с помощью формулы =СТЬЮДРАСПОБР(α;n)
, где α
– уровень значимости (вероятность γ
или надёжность 1-γ
), n
– число степеней свободы (например, объём выборки в задачах о построении доверительных интервалов). При числе степеней свободы n≥30
распределение сводится к нормальному с параметрами α=0
, σ=корень(n/(n-2))
.
Критические точки распределения Пирсона χ2
можно вычислить с помощью формулы =ХИ2ОБР(a;n)
, где a
– уровень значимости, n
– число степеней свободы.
Получить значение функции плотности распределения Пуассона можно с помощью формулы =ПУАССОН(n;λ;0)
, где n
– число степеней свободы (количество событий), λ
– среднее число появлений события (ожидаемое численное значение).
В ряде случаев для расчёта с заданным значением параметра γ
функции Excel может понадобиться передать аргумент функции α=1-γ
, смотрите внимательно встроенную справку по функциям.
Математическая статистика — лекции и примеры в Excel
12.03.2013, 17:18 [54617 просмотров]
Распределение Лапласа зависит от двух параметров n и p; характеристики распределения выражаются через эти параметры: a = np, . При расчетах вручную используют таблицы дифференциальной и интегральной функции Лапласа . Тогда , где . Эта формула обычно называется как «локальная теорема Лапласа». Интегральная функция Лапласа используется для вычисления вероятности попадания m в заданный интервал: P(m1 £ m £ m2) = Ф(tm2) – Ф(tm1). Эта формула обычно называется как «интегральная теорема Лапласа». При расчетах на компьютере для этих же целей используется функция Excel: НОРМРАСП(m;a;sm;0) – возвращает значения вероятности Pn(m) и НОРМРАСП(m;a;sm;1) – возвращает значения интегральной функции распределения Лапласа F(m) = Ф(tm) + 0,5 (функция F(m) отличается постоянным слагаемым от функции Ф(tm)). Считается, что предельные формулы Лапласа можно применять при n ³ 30, a = np ³ 5 и nq ³ 5. Интегральную формулу Лапласа можно уточнить, если расширить интервал [m1 ; m2] на полшага влево и вправо: P(m1 £ m £ m2) = F(m2 + 1 /2) – F(m1 – 1 /2). Предлагается прямыми расчетами проверить точность локальной, интегральной и скорректированной интегральной формул Лапласа для n = 10, 20, 30, 40, 50 и p = 0,3. Фрагмент рабочего листа Excel приведен ниже.
A | B | C | D | E | F | G | H | I | J |
Распределение Лапласа | |||||||||
Pn(m)=НОРМРАСП(m;a;Sm;0) | a=np | Sm=КОРЕНЬ(npq) | |||||||
P(m1£m£m2)=НОРМРАСП(m2;a;Sm;1)–НОРМРАСП(m1;a;Sm;1) | Интегральная теорема | ||||||||
P(m1£m£m2)=НОРМРАСП(m2+1/2;a;Sm;1)–НОРМРАСП(m1-1/2;a;Sm;1) (Скорректированная) | |||||||||
Бернулли | |||||||||
n = | Ф(2)-Ф(-1)= | 0,81859 | P([m1;m2]) | n=10 | n=20 | n=30 | n=40 | n=50 | |
p = | 0,3 | Bernully | 0,8401 | 0,87577 | 0,90647 | 0,87422 | 0,83588 | ||
q = | 0,7 | M-Sm= | 1,550862 | Laplas | 0,73571 | 0,80996 | 0,86082 | 0,83047 | 0,79069 |
a = M = | M+2Sm= | 5,898275 | Correct | 0,84183 | 0,87469 | 0,90419 | 0,87395 | 0,83753 | |
Dm = | 2,1 | m1 = | Error% | -12,43% | -7,51% | -5,04% | -5,00% | -5,41% | |
Sm = | 1,449138 | m2 = | ErrCorr% | 0,21% | -0,12% | -0,25% | -0,03% | 0,20% | |
Б е р н у л л и | |||||||||
m | n=10 | F(m) | Laplas | P(a) | n=10 | n=20 | n=30 | n=40 | n=50 |
0,028248 | 0,028248 | 0,032298 | Bernully | 0,26683 | 0,19164 | 0,15729 | 0,13657 | 0,12235 | |
0,121061 | 0,149308 | 0,106215 | Laplas | 0,27530 | 0,19466 | 0,15894 | 0,13765 | 0,12312 | |
0,233474 | 0,382783 | 0,216969 | Correct | 0,26993 | 0,19275 | 0,15790 | 0,13697 | 0,12263 | |
0,266828 | 0,649611 | 0,275296 | Error% | 3,17% | 1,58% | 1,05% | 0,79% | 0,63% | |
0,200121 | 0,849732 | 0,216969 | ErrCorr% | 1,16% | 0,58% | 0,39% | 0,29% | 0,23% | |
0,102919 | 0,952651 | 0,106215 | |||||||
0,036757 | 0,989408 | 0,032298 | |||||||
0,009002 | 0,998410 | 0,006100 | |||||||
0,001447 | 0,999856 | 0,000716 | |||||||
0,000138 | 0,999994 | 5,22E-05 | |||||||
5,909E-06 | 1,000000 | 2,36E-06 |
Слева в столбцах А, В расположен блок расчетов по формуле Бернулли (сейчас принято n = 10). В соседнем столбце С приведены значения кумуляты (накопленных вероятностей) F(m) = S Pn(k), вычисленных по реккурентной формуле F(m) = F(m–1) + Pn(m), где F(0) = Pn(0) = q n . С помощью кумуляты одним вычитанием определяются вероятности попадания случайной величины m в любые заданные интервалы P(m1 £ m £ m2) = F(m2) – F(m1–1). Так, вероятность P(2£ m £6) можно вычислить как разность F(6) – F(1) = 0,989408 – 0,149308 = 0,840140; это же значение можно получить непосредственно, складывая вероятности Pn(m) для m =2, 3, 4, 5, 6 (цифры на сером фоне в столбце В). В следующем столбце D вычислены вероятности по локальной формуле Лапласа. По результатам расчетов построены графики распределения Бернулли и распределения Лапласа с теми же характеристиками. Изменяя n в ячейке В6, можно наблюдать, насколько хорошо распределение Бернулли описывается предельным распределением Лапласа. Ниже приведены два сравнительных графика для n = 10 и n = 20, откуда видно, что уже при n ³ 20 распределение Бернулли для р = 0,3 практически совпадает с предельным распределением. Таким образом, мы убедились, что локальная формула Лапласа достаточно точная.
Переходим к проверке точности расчетов по интегральной формуле Лапласа. Рассмотрим вероятность попадания случайной величины m в интервал [M – Sm; M + 2Sm]. Теоретически указанная вероятность вычисляется как разность Ф(2) – Ф(-1) = 0,81859. Однако формула эта выведена для непрерывного распределения, а распределение Лапласа – дискретное. Поэтому теоретическое значение (или близкое к нему) может быть получено только для очень большого n > 200. Проверим это утверждение. Выше над блоком расчетов по формуле Бернулли в столбцах C, D вычислены границы интервала: M – Sm = 1,551 и M + 2Sm = 5,898; полученные границы округлены до ближайших целых m1 = 2, m2 = 6. Необходимо сравнить точное значение P(2£ m £6) = 0,8401, полученное ранее с помощью кумуляты распределения Бернулли, с соответствующим значением по интегральной формуле Лапласа P(2£ m £6) » НОРМРАСП(6;a;Sm;1)–НОРМРАСП(2;a;Sm;1) = 0,73571. По сравнению с точным значением (0,8401) ошибка составила -12,43%. Эти расчеты оформлены в виде таблицы в строках 6–11 столбцы E, F. При изменении n в ячейке B6 все цифры в столбце F автоматически корректируются. Для того, чтобы сохранить результаты предыдущих расчетов, они были cкопированы Специальной вставкой – Только значения в продолжение таблицы вправо (столбцы G, H, I, J). Рассматривая заполненную таблицу (диапазон E6:J11), убеждаемся в довольно медленном приближении предельной формулы к точному значению. Теперь мы можем оценить эффективность скорректированной интегральной формулы Лапласа P(2 £ m £ 6) = НОРМРАСП(6,5;a;Sm;1)–НОРМРАСП(1,5;a;Sm;1) , которая уже для n = 10 привела к практически точному значению 0,8418 (погрешность 0,21%). Эффективность скорректированной формулы была также проверена на вычислении вероятности моды (наивероятнейшего значения m = a = np). Эти расчеты выполнены в таблице диапазона E13:J18. Интегральная функция Лапласа здесь дает значение 0, поэтому в таблице использовалась локальная формула Лапласа. Погрешности локальной формулы небольшие и быстро убывают с увеличением n (при n = 20 погрешность составляет всего 1,6%). Скорректированная интегральная формула оказалась еще более точной; она дает практически точные значения уже при n = 10.
Вычисление функции Лапласа в Microsoft Excel
Одной из самых известных неэлементарных функций, которая применяется в математике, в теории дифференциальных уравнений, в статистике и в теории вероятностей является функция Лапласа. Решение задач с ней требует существенной подготовки. Давайте выясним, как можно с помощью инструментов Excel произвести вычисление данного показателя.
Функция Лапласа
Функция Лапласа имеет широкое прикладное и теоретическое применение. Например, она довольно часто используется для решения дифференциальных уравнений. У этого термина существует ещё одно равнозначное название – интеграл вероятности. В некоторых случаях основой для решения является построение таблицы значений.
Оператор НОРМ.СТ.РАСП
В Экселе указанная задача решается с помощью оператора НОРМ.СТ.РАСП. Его название является сокращением от термина «нормальное стандартное распределение». Так как его главной задачей является возврат в выделенную ячейку стандартного нормального интегрального распределения. Данный оператор относится к статистической категории стандартных функций Excel.
В Excel 2007 и в более ранних версиях программы этот оператор назывался НОРМСТРАСП. Он в целях совместимости оставлен и в современных версиях приложений. Но все-таки в них рекомендуется использование более продвинутого аналога – НОРМ.СТ.РАСП.
Синтаксис оператора НОРМ.СТ.РАСП выглядит следующим образом:
Устаревший оператор НОРМСТРАСП записывается так:
Как видим, в новом варианте к существующему аргументу «Z» добавлен аргумент «Интегральная». Нужно заметить, что каждый аргумент является обязательным.
Аргумент «Z» указывает числовое значение, для которого производится построение распределения.
Аргумент «Интегральная» представляет собой логическое значение, которое может иметь представление «ИСТИНА» («1») или «ЛОЖЬ» («0»). В первом случае в указанную ячейку возвращается интегральная функция распределения, а во втором – весовая функция распределения.
Решение задачи
Для того чтобы выполнить требуемое вычисление для переменной применяется следующая формула:
Теперь давайте на конкретном примере рассмотрим использование оператора НОРМ.СТ.РАСП для решения конкретной задачи.
-
Выделяем ячейку, куда будет выводиться готовый результат и щелкаем по значку «Вставить функцию», расположенному около строки формул.
После открытия Мастера функций переходим в категорию «Статистические» или «Полный алфавитный перечень». Выделяем наименование «НОРМ.СТ.РАСП» и жмем на кнопку «OK».
Происходит активация окна аргументов оператора НОРМ.СТ.РАСП. В поле «Z» вводим переменную, к которой нужно произвести расчет. Также этот аргумент может быть представлен в виде ссылки на ячейку, которая содержит эту переменную. В поле «Интегральная» вводим значение «1». Это означает, что оператор после вычисления вернет в качестве решения интегральную функцию распределения. После того, как выполнены вышеперечисленные действия, жмем на кнопку «OK».
После этого результат обработки данных оператором НОРМ.СТ.РАСП будет выведен в ячейку, которая указана в первом пункте данного руководства.
Но и это ещё не все. Мы вычислили только стандартное нормальное интегральное распределение. Для того, чтобы посчитать значение функции Лапласа, нужно от него отнять число 0,5. Выделяем ячейку, содержащую выражение. В строке формул после оператора НОРМ.СТ.РАСП дописываем значение: -0,5.
Как видим, вычислить функцию Лапласа для конкретного заданного числового значения в программе Excel не составляет особенного труда. Для этих целей применяется стандартный оператор НОРМ.СТ.РАСП.
Мы рады, что смогли помочь Вам в решении проблемы.
Добавьте сайт Lumpics.ru в закладки и мы еще пригодимся вам.
Отблагодарите автора, поделитесь статьей в социальных сетях.
Опишите, что у вас не получилось. Наши специалисты постараются ответить максимально быстро.
Обчислення функції Лапласа в Microsoft Excel
Однією з найвідоміших неелементарних функцій, яка застосовується в математиці, в теорії диференціальних рівнянь, в статистиці і в теорії ймовірностей є функція Лапласа. Рішення задач з нею потребує суттєвого підготовки. Давайте з’ясуємо, як можна за допомогою інструментів Excel зробити обчислення даного показника.
функція Лапласа
Функція Лапласа має широке прикладне і теоретичне застосування. Наприклад, вона досить часто використовується для вирішення диференціальних рівнянь. Цей термін існує ще одне рівнозначне назва — інтеграл ймовірності. У деяких випадках основою для вирішення є побудова таблиці значень.
оператор НОРМ.СТ.РАСП
У Ексель зазначена завдання вирішується за допомогою оператора НОРМ.СТ.РАСП. Його назва є скороченням від терміна «нормальне стандартний розподіл». Так як його головним завданням є повернення в виділену клітинку стандартного нормального інтегрального розподілу. Даний оператор відноситься до статистичної категорії стандартних функцій Excel.
В Excel 2007 і в більш ранніх версіях програми цей оператор називався НОРМСТРАСП. Він з метою сумісності залишений і в сучасних версіях додатків. Але все-таки в них рекомендується використання більш просунутого аналога — НОРМ.СТ.РАСП.
Синтаксис оператора НОРМ.СТ.РАСП виглядає наступним чином:
Застарілий оператор НОРМСТРАСП записується так:
Як бачимо, в новому варіанті до існуючого аргументу «Z» доданий аргумент «Інтегральна». Потрібно зауважити, що кожен аргумент є обов’язковим.
Аргумент «Z» вказує числове значення, для якого проводиться побудова розподілу.
Аргумент «Інтегральна» являє собою логічне значення, яке може мати уявлення «ІСТИНА» ( «1») або «БРЕХНЯ» ( «0»). У першому випадку в зазначену осередок повертається інтегральна функція розподілу, а в другому — вагова функція розподілу.
Рішення завдання
Для того щоб виконати необхідну обчислення для змінної застосовується наступна формула:
Тепер давайте на конкретному прикладі розглянемо використання оператора НОРМ.СТ.РАСП для вирішення конкретного завдання.
- Виділяємо осередок, куди буде виводитися готовий результат і клацаємо по значку «Вставити функцію», розташованому біля рядка формул.
Після відкриття Майстра функцій переходимо в категорію «Статистичні» або «Повний алфавітний перелік». Виділяємо найменування «НОРМ.СТ.РАСП» і тиснемо на кнопку «OK».
Відбувається активація вікна аргументів оператора НОРМ.СТ.РАСП. В поле «Z» вводимо змінну, до якої потрібно провести розрахунок. Також цей аргумент може бути представлений у вигляді посилання на осередок, яка містить цю змінну. В поле «Інтегральна» вводимо значення «1». Це означає, що оператор після обчислення поверне в якості рішення інтегральну функцію розподілу. Після того, як виконані перераховані вище дії, тиснемо на кнопку «OK».
Після цього результат обробки даних оператором НОРМ.СТ.РАСП буде виведений в клітинку, яка вказана в першому пункті даного керівництва.
Але і це ще не все. Ми вирахували тільки стандартний нормальний інтегральний розподіл. Для того, щоб порахувати значення функції Лапласа, потрібно від нього забрати число 0,5. Виділяємо осередок, що містить вираз. У рядку формул після оператора НОРМ.СТ.РАСП дописуємо значення: -0,5.
Як бачимо, обчислити функцію Лапласа для конкретного заданого числового значення в програмі Excel не складає особливих труднощів. Для цих цілей застосовується стандартний оператор НОРМ.СТ.РАСП.
Функция Лапласа и другие табличные статистические функции: в Excel формуле
Привет, сегодня поговорим про функция лапласа, обещаю рассказать все что знаю. Для того чтобы лучше понимать что такое функция лапласа,другие табличные статистические в excel формуле , настоятельно рекомендую прочитать все из категории Теория вероятностей. Математическая статистика и Стохастический анализ
функция лапласа и другие табличные статистические функции: считаем в Excel
При решении таких типовых задач математической статистики, как построение доверительных интервалов или проверка гипотез о параметрах случайных величин, широко используются несколько табличных функций, например, функция Лапласа или квантили распределения хи- квадрат .
В наше время совершенно необязательно обращаться за недостающими в формуле величинами к толстым справочникам со статистическими таблицами, можно все посчитать непосредственно в Excel:
Формула =НОРМСТРАСП(x)-0,5 вычисляет значение функции Лапласа от аргумента x (подставьте вместо x соответствующую ячейку) . Об этом говорит сайт https://intellect.icu . При этом Ф(-x)=-Ф(x) , а при x>3,85 значение Ф(x)=0,5 .
Вычислить значение обратной функции Лапласа от аргумента x можно формулой =НОРМСТОБР(x) . В Excel функция НОРМСТОБР (1-eps/2) даст требуемое критическое значение, соответствующее уровню значимости критерия, равному eps. Например, для критерия с критическим уровнем 0,05 (5%) формула НОРМСТОБР(1-0,05/2)=1,96
Критические точки t-критерия можно вычислить с помощью формулы =СТЬЮДРАСПОБР(α,n) , где α – уровень значимости ( вероятность γ или надежность 1-γ ), n – число степеней свободы (например, объем выборки в задачах о построении доверительных интервалов). При числе степеней свободы n≥30 распределение сводится к нормальному с параметрами α=0 , σ= корень (n/(n-2)) .
Критические точки распределения Пирсона χ 2 можно вычислить с помощью формулы =ХИ2ОБР(a,n) , где a – уровень значимости, n – число степеней свободы.
Получить значение функции плотности распределения Пуассона можно с помощью формулы =ПУАССОН(n,λ,0) , где n – число степеней свободы (количество событий), λ – среднее число появлений события (ожидаемое численное значение).
В ряде случаев для расчета с заданным значением параметра γ функции Excel может понадобиться передать аргумент функции α=1-γ , смотрите внимательно встроенную справку по функциям.
Распределение Стьюдента
Понравилась статья про функция лапласа? Откомментируйте её Надеюсь, что теперь ты понял что такое функция лапласа,другие табличные статистические в excel формуле и для чего все это нужно, а если не понял, или есть замечания, то нестесняся пиши или спрашивай в комментариях, с удовольствием отвечу. Для того чтобы глубже понять настоятельно рекомендую изучить всю информацию из категории Теория вероятностей. Математическая статистика и Стохастический анализ
Функция лапласа в excel
БлогNot. Функция Лапласа и другие табличные статистические функции: считаем в Excel
Функция Лапласа и другие табличные статистические функции: считаем в Excel
При решении таких типовых задач математической статистики, как построение доверительных интервалов или проверка гипотез о параметрах случайных величин, широко используются несколько табличных функций, например, функция Лапласа или квантили распределения хи-квадрат.
В наше время совершенно необязательно обращаться за недостающими в формуле величинами к толстым справочникам со статистическими таблицами, можно всё посчитать непосредственно в Excel:
Формула =НОРМСТРАСП(x)-0,5 вычисляет значение функции Лапласа от аргумента x (подставьте вместо x соответствующую ячейку). При этом Ф(-x)=-Ф(x) , а при x>3,85 значение Ф(x)=0,5 .
Вычислить значение обратной функции Лапласа от аргумента x можно формулой =НОРМСТОБР(x) . В Excel функция НОРМСТОБР (1-eps/2) даст требуемое критическое значение, соответствующее уровню значимости критерия, равному eps. Например, для критерия с критическим уровнем 0,05 (5%) формула НОРМСТОБР(1-0,05/2)=1,96
Критические точки t-критерия можно вычислить с помощью формулы =СТЬЮДРАСПОБР(α;n) , где α – уровень значимости (вероятность γ или надёжность 1-γ ), n – число степеней свободы (например, объём выборки в задачах о построении доверительных интервалов). При числе степеней свободы n≥30 распределение сводится к нормальному с параметрами α=0 , σ=корень(n/(n-2)) .
Критические точки распределения Пирсона χ 2 можно вычислить с помощью формулы =ХИ2ОБР(a;n) , где a – уровень значимости, n – число степеней свободы.
Получить значение функции плотности распределения Пуассона можно с помощью формулы =ПУАССОН(n;λ;0) , где n – число степеней свободы (количество событий), λ – среднее число появлений события (ожидаемое численное значение).
В ряде случаев для расчёта с заданным значением параметра γ функции Excel может понадобиться передать аргумент функции α=1-γ , смотрите внимательно встроенную справку по функциям.
Математическая статистика — лекции и примеры в Excel
12.03.2013, 17:18; рейтинг: 43632
Одной из самых известных неэлементарных функций, которая применяется в математике, в теории дифференциальных уравнений, в статистике и в теории вероятностей является функция Лапласа. Решение задач с ней требует существенной подготовки. Давайте выясним, как можно с помощью инструментов Excel произвести вычисление данного показателя.
Функция Лапласа
Функция Лапласа имеет широкое прикладное и теоретическое применение. Например, она довольно часто используется для решения дифференциальных уравнений. У этого термина существует ещё одно равнозначное название – интеграл вероятности. В некоторых случаях основой для решения является построение таблицы значений.
Оператор НОРМ.СТ.РАСП
В Экселе указанная задача решается с помощью оператора НОРМ.СТ.РАСП. Его название является сокращением от термина «нормальное стандартное распределение». Так как его главной задачей является возврат в выделенную ячейку стандартного нормального интегрального распределения. Данный оператор относится к статистической категории стандартных функций Excel.
В Excel 2007 и в более ранних версиях программы этот оператор назывался НОРМСТРАСП. Он в целях совместимости оставлен и в современных версиях приложений. Но все-таки в них рекомендуется использование более продвинутого аналога – НОРМ.СТ.РАСП.
Синтаксис оператора НОРМ.СТ.РАСП выглядит следующим образом:
Устаревший оператор НОРМСТРАСП записывается так:
Как видим, в новом варианте к существующему аргументу «Z» добавлен аргумент «Интегральная». Нужно заметить, что каждый аргумент является обязательным.
Аргумент «Z» указывает числовое значение, для которого производится построение распределения.
Аргумент «Интегральная» представляет собой логическое значение, которое может иметь представление «ИСТИНА» («1») или «ЛОЖЬ» («0»). В первом случае в указанную ячейку возвращается интегральная функция распределения, а во втором – весовая функция распределения.
Решение задачи
Для того чтобы выполнить требуемое вычисление для переменной применяется следующая формула:
Теперь давайте на конкретном примере рассмотрим использование оператора НОРМ.СТ.РАСП для решения конкретной задачи.
-
Выделяем ячейку, куда будет выводиться готовый результат и щелкаем по значку «Вставить функцию», расположенному около строки формул.
После открытия Мастера функций переходим в категорию «Статистические» или «Полный алфавитный перечень». Выделяем наименование «НОРМ.СТ.РАСП» и жмем на кнопку «OK».
Происходит активация окна аргументов оператора НОРМ.СТ.РАСП. В поле «Z» вводим переменную, к которой нужно произвести расчет. Также этот аргумент может быть представлен в виде ссылки на ячейку, которая содержит эту переменную. В поле «Интегральная» вводим значение «1». Это означает, что оператор после вычисления вернет в качестве решения интегральную функцию распределения. После того, как выполнены вышеперечисленные действия, жмем на кнопку «OK».
После этого результат обработки данных оператором НОРМ.СТ.РАСП будет выведен в ячейку, которая указана в первом пункте данного руководства.
Но и это ещё не все. Мы вычислили только стандартное нормальное интегральное распределение. Для того, чтобы посчитать значение функции Лапласа, нужно от него отнять число 0,5. Выделяем ячейку, содержащую выражение. В строке формул после оператора НОРМ.СТ.РАСП дописываем значение: -0,5.
Для того, чтобы произвести вычисление, жмем на кнопку Enter. Полученный результат и будет искомым значением.
Как видим, вычислить функцию Лапласа для конкретного заданного числового значения в программе Excel не составляет особенного труда. Для этих целей применяется стандартный оператор НОРМ.СТ.РАСП.
Однією з найвідоміших неелементарних функцій, яка застосовується в математиці, в теорії диференціальних рівнянь, в статистиці і в теорії ймовірностей є функція Лапласа. Рішення задач з нею потребує суттєвого підготовки. Давайте з’ясуємо, як можна за допомогою інструментів Excel зробити обчислення даного показника.
функція Лапласа
Функція Лапласа має широке прикладне і теоретичне застосування. Наприклад, вона досить часто використовується для вирішення диференціальних рівнянь. Цей термін існує ще одне рівнозначне назва — інтеграл ймовірності. У деяких випадках основою для вирішення є побудова таблиці значень.
оператор НОРМ.СТ.РАСП
У Ексель зазначена завдання вирішується за допомогою оператора НОРМ.СТ.РАСП. Його назва є скороченням від терміна «нормальне стандартний розподіл». Так як його головним завданням є повернення в виділену клітинку стандартного нормального інтегрального розподілу. Даний оператор відноситься до статистичної категорії стандартних функцій Excel.
В Excel 2007 і в більш ранніх версіях програми цей оператор називався НОРМСТРАСП. Він з метою сумісності залишений і в сучасних версіях додатків. Але все-таки в них рекомендується використання більш просунутого аналога — НОРМ.СТ.РАСП.
Синтаксис оператора НОРМ.СТ.РАСП виглядає наступним чином:
Застарілий оператор НОРМСТРАСП записується так:
Як бачимо, в новому варіанті до існуючого аргументу «Z» доданий аргумент «Інтегральна». Потрібно зауважити, що кожен аргумент є обов’язковим.
Аргумент «Z» вказує числове значення, для якого проводиться побудова розподілу.
Аргумент «Інтегральна» являє собою логічне значення, яке може мати уявлення «ІСТИНА» ( «1») або «БРЕХНЯ» ( «0»). У першому випадку в зазначену осередок повертається інтегральна функція розподілу, а в другому — вагова функція розподілу.
Рішення завдання
Для того щоб виконати необхідну обчислення для змінної застосовується наступна формула:
Тепер давайте на конкретному прикладі розглянемо використання оператора НОРМ.СТ.РАСП для вирішення конкретного завдання.
- Виділяємо осередок, куди буде виводитися готовий результат і клацаємо по значку «Вставити функцію», розташованому біля рядка формул.
Після відкриття Майстра функцій переходимо в категорію «Статистичні» або «Повний алфавітний перелік». Виділяємо найменування «НОРМ.СТ.РАСП» і тиснемо на кнопку «OK».
Відбувається активація вікна аргументів оператора НОРМ.СТ.РАСП. В поле «Z» вводимо змінну, до якої потрібно провести розрахунок. Також цей аргумент може бути представлений у вигляді посилання на осередок, яка містить цю змінну. В поле «Інтегральна» вводимо значення «1». Це означає, що оператор після обчислення поверне в якості рішення інтегральну функцію розподілу. Після того, як виконані перераховані вище дії, тиснемо на кнопку «OK».
Після цього результат обробки даних оператором НОРМ.СТ.РАСП буде виведений в клітинку, яка вказана в першому пункті даного керівництва.
Але і це ще не все. Ми вирахували тільки стандартний нормальний інтегральний розподіл. Для того, щоб порахувати значення функції Лапласа, потрібно від нього забрати число 0,5. Виділяємо осередок, що містить вираз. У рядку формул після оператора НОРМ.СТ.РАСП дописуємо значення: -0,5.
Для того, щоб зробити обчислення, тиснемо на кнопку Enter. Отриманий результат і буде шуканим значенням.
Як бачимо, обчислити функцію Лапласа для конкретного заданого числового значення в програмі Excel не складає особливих труднощів. Для цих цілей застосовується стандартний оператор НОРМ.СТ.РАСП.
Содержание
- Вычисление функции Лапласа в Microsoft Excel
- Функция Лапласа
- Оператор НОРМ.СТ.РАСП
- Решение задачи
- Теория вероятности в эксель
- Комбинаторика и вероятность
- Математическая статистика
- Обработка выборки: формулы Excel
- Законы распределений: формулы Excel
- Другое (корреляция, регрессия и т.п.)
- Справочный файл по формулам Excel
- Полезные ссылки
- Описание
- Синтаксис
- Замечания
- Пример
Вычисление функции Лапласа в Microsoft Excel
Одной из самых известных неэлементарных функций, которая применяется в математике, в теории дифференциальных уравнений, в статистике и в теории вероятностей является функция Лапласа. Решение задач с ней требует существенной подготовки. Давайте выясним, как можно с помощью инструментов Excel произвести вычисление данного показателя.
Функция Лапласа
Функция Лапласа имеет широкое прикладное и теоретическое применение. Например, она довольно часто используется для решения дифференциальных уравнений. У этого термина существует ещё одно равнозначное название – интеграл вероятности. В некоторых случаях основой для решения является построение таблицы значений.
Оператор НОРМ.СТ.РАСП
В Экселе указанная задача решается с помощью оператора НОРМ.СТ.РАСП. Его название является сокращением от термина «нормальное стандартное распределение». Так как его главной задачей является возврат в выделенную ячейку стандартного нормального интегрального распределения. Данный оператор относится к статистической категории стандартных функций Excel.
В Excel 2007 и в более ранних версиях программы этот оператор назывался НОРМСТРАСП. Он в целях совместимости оставлен и в современных версиях приложений. Но все-таки в них рекомендуется использование более продвинутого аналога – НОРМ.СТ.РАСП.
Синтаксис оператора НОРМ.СТ.РАСП выглядит следующим образом:
Устаревший оператор НОРМСТРАСП записывается так:
Как видим, в новом варианте к существующему аргументу «Z» добавлен аргумент «Интегральная». Нужно заметить, что каждый аргумент является обязательным.
Аргумент «Z» указывает числовое значение, для которого производится построение распределения.
Аргумент «Интегральная» представляет собой логическое значение, которое может иметь представление «ИСТИНА» («1») или «ЛОЖЬ» («0»). В первом случае в указанную ячейку возвращается интегральная функция распределения, а во втором – весовая функция распределения.
Решение задачи
Для того чтобы выполнить требуемое вычисление для переменной применяется следующая формула:
Теперь давайте на конкретном примере рассмотрим использование оператора НОРМ.СТ.РАСП для решения конкретной задачи.
- Выделяем ячейку, куда будет выводиться готовый результат и щелкаем по значку «Вставить функцию», расположенному около строки формул.
- После открытия Мастера функций переходим в категорию «Статистические» или «Полный алфавитный перечень». Выделяем наименование «НОРМ.СТ.РАСП» и жмем на кнопку «OK».
- Происходит активация окна аргументов оператора НОРМ.СТ.РАСП. В поле «Z» вводим переменную, к которой нужно произвести расчет. Также этот аргумент может быть представлен в виде ссылки на ячейку, которая содержит эту переменную. В поле «Интегральная» вводим значение «1». Это означает, что оператор после вычисления вернет в качестве решения интегральную функцию распределения. После того, как выполнены вышеперечисленные действия, жмем на кнопку «OK».
- После этого результат обработки данных оператором НОРМ.СТ.РАСП будет выведен в ячейку, которая указана в первом пункте данного руководства.
- Но и это ещё не все. Мы вычислили только стандартное нормальное интегральное распределение. Для того, чтобы посчитать значение функции Лапласа, нужно от него отнять число 0,5. Выделяем ячейку, содержащую выражение. В строке формул после оператора НОРМ.СТ.РАСП дописываем значение: -0,5.
- Для того, чтобы произвести вычисление, жмем на кнопку Enter. Полученный результат и будет искомым значением.
Как видим, вычислить функцию Лапласа для конкретного заданного числового значения в программе Excel не составляет особенного труда. Для этих целей применяется стандартный оператор НОРМ.СТ.РАСП.
Источник
Теория вероятности в эксель
Комбинаторика и вероятность
Ниже вы найдете основные формулы Excel, которые могут применяться при решении вероятностных задач и задач по комбинаторике.
ФАКТР / FACT СЛЧИС / RAND
Выдает случайное число в интервале от 0 до 1 (равномерно распределенное).
СЛУЧМЕЖДУ / RANDBETVEEN
Выдает случайное число в заданном интервале.
БИНОМРАСП / BINOMDIST
Вычисляет отдельное значение биномиального распределения.
ГИПЕРГЕОМЕТ / HYRGEOMDIST
Определяет гипергеометрическое распределение.
НОРМРАСП / NORMDIST
Вычисляет значение нормальной функции распределения.
НОРМОБР / NORMINV
Выдает обратное нормальное распределение.
НОРМСТРАСП / NORMSDIST
Выдает стандартное нормальное интегральное распределение.
НОРМСТОБР / NORMSINV
Выдает обратное значение стандартного нормального распределения.
ПЕРЕСТ / PERMUT ВЕРОЯТНОСТЬ / PROB
Определяет вероятность того, что значение из диапазона находится внутри заданных пределов.
Математическая статистика
При решении задач по математической статистике можно использовать те формулы, что перечислены выше, а также следующие (сгруппированы для удобства: обработка выборки, разные распределения, остальные формулы):
Обработка выборки: формулы Excel
Вычисляет среднее абсолютных значений отклонений точек данных от среднего.
СРЗНАЧ / AVERAGE
Вычисляет среднее арифметическое аргументов.
СРГЕОМ / GEOMEAN
Вычисляет среднее геометрическое.
СРГАРМ / HARMEAN
Вычисляет среднее гармоническое.
ЭКСЦЕСС / KURT
Определяет эксцесс множества данных.
МЕДИАНА / MEDIAN
Находит медиану заданных чисел.
МОДА / MODE
Определяет значение моды множества данных.
КВАРТИЛЬ / QUARTILE
Определяет квартиль множества данных.
СКОС / SKEW
Определяет асимметрию распределения.
СТАНДОТКЛОН / STDEV
Оценивает стандартное отклонение по выборке.
ДИСП / VAR
Оценивает дисперсию по выборке.
Законы распределений: формулы Excel
Определяет интегральную функцию плотности бета-вероятности.
БЕТАОБР / BETAINV
Определяет обратную функцию к интегральной функции плотности бета-вероятности.
ХИ2РАСП / CHIDIST
Вычисляет одностороннюю вероятность распределения хи-квадрат.
ХИ2ОБР / CHIINV
Вычисляет обратное значение односторонней вероятности распределения хи-квадрат.
ЭКСПРАСП / EXPONDIST
Находит экспоненциальное распределение.
FРАСП / FDIST
Находит F-распределение вероятности.
FРАСПОБР / FINV
Определяет обратное значение для F-распределения вероятности.
ФИШЕР / FISHER
Находит преобразование Фишера.
ФИШЕРОБР / FISHERINV
Находит обратное преобразование Фишера.
ГАММАРАСП / GAMMADIST ГАММАОБР / GAMMAINV
Находит обратное гамма-распределение.
ПУАССОН / POISSON
Выдает распределение Пуассона.
СТЬЮДРАСП / TDIST
Выдает t-распределение Стьюдента.
СТЬЮДРАСПОБР / TINV
Выдает обратное t-распределение Стьюдента.
ВЕЙБУЛЛ / WEIBULL
Выдает распределение Вейбулла.
Другое (корреляция, регрессия и т.п.)
Определяет доверительный интервал для среднего значения по генеральной совокупности.
КОРРЕЛ / CORREL
Находит коэффициент корреляции между двумя множествами данных.
Подсчитывает количество чисел в списке аргументов.
СЧЁТЕСЛИ / COUNTIF
Подсчитывает количество непустых ячеек, удовлетворяющих заданному условию внутри диапазона.
КОВАР / COVAR
Определяет ковариацию, то есть среднее произведений отклонений для каждой пары точек.
ПРЕДСКАЗ / FORECAST
Вычисляет значение линейного тренда.
ЛИНЕЙН / LINEST
Находит параметры линейного тренда.
ПИРСОН / PEARSON
Определяет коэффициент корреляции Пирсона.
Справочный файл по формулам Excel
Нужна шпаргалка по функциям Excel под рукой? Скачивайте файл: Математические и статистические формулы Excel
Полезные ссылки
А если у вас есть задачи, которые надо срочно сделать, а времени нет? Можете поискать готовые решения в решебнике:
Пример 4.В партии 20 изделий, из них 5 бракованных. Найти вероятность того, что в выборке из 4 изделий ровно одно бракованное.
Решение. В данной задаче, прежде всего, определим значения параметров: число_успехов_ в_ выборке = 1; размер_ выборки = 4; число_ успехов_ в_ совокупности = 5; размер_ совокупности = 20.
Искомую вероятность можно рассчитать с помощью функции =ГИПЕРГЕОМЕТ(1; 4; 5; 20), которая дает значение 0,4696.
Если производится несколько испытаний, причем вероятность события А в каждом испытании не зависит от исходов других испытаний, то такие испытания называют независимыми относительно событияА.
Пусть производится n независимых испытаний, в каждом из которых событие А может появиться либо не появиться. Вероятность события А в каждом испытании одна и та же, а именно равна р. Следовательно, вероятность ненаступления события А в каждом испытании также постоянна и равна q = 1 – р.
Вероятность того, что при n повторных независимых испытаниях событие А осуществится ровно k раз вычисляется по формуле Бернулли: .
Для нахождения наиболее вероятного числа успехов k по заданным n и р можно воспользоваться неравенствами np – q £ k £ np + p или правилом: если число np + p не целое, то k равно целой части этого числа.
В случае, если n велико, р мало, а , используют асимптотическую формулу Пуассона вычисления вероятности наступления события А ровно k раз при n повторных независимых испытаниях:
.
Пример 5. Вероятность того, что расход электроэнергии на протяжении одних суток не превысит установленной нормы, равна р = 0,75. Найти вероятность того, что в ближайшие 6 суток расход электроэнергии в течение 4 суток не превысит нормы.
Решение. Вероятность нормального расхода электроэнергии на протяжении каждых из 6 суток постоянна и равна p = 0,75. Следовательно, вероятность перерасхода электроэнергии в каждые сутки также постоянна и равна q = 1— р = 1 — 0,75 = 0,25. Искомая вероятность по формуле Бернулли равна = 0,297. Для вычисления в Excel используем формулу =БИНОМРАСП(4; 6; 0,75; 0), которая дает значение 0,297. При этом определены следующие значения параметров: число_ успехов = 4; число_ испытаний = 6; вероятность_ успеха = 0,75; интегральная = 0. Подробно с синтаксисом функции БИНОМРАСП можно ознакомиться с помощью справки.
Пример 6. Телефонная станция обслуживает 400 абонентов. Для каждого абонента вероятность того, что в течение часа он позвонит на станцию, равна 0,01. Найти вероятность, что в течение часа ровно 5 абонентов позвонят на станцию.
Решение.Так как р = 0,01 мало и n = 400 велико, то будем пользоваться приближенной формулой Пуассона при l = 400 × 0,01 = 4. Тогда Р400(5) » » 0,156293. Для вычисления в Excel используем формулу =ПУАССОН(5; 4; 0), которая дает значение 0,156293. При этом определены следующие значения параметров: количество_ событий = 5; среднее(λ) = 4; интегральная = 0. Подробно с синтаксисом функции ПУАССОН можно ознакомиться в справке.
В случае, когда число повторных испытаний большое и формула Бернулли неприменима, используют формулы Лапласа.
Локальная теорема Лапласа. Если вероятность р появления события А в каждом испытании постоянна и отлична от нуля и единицы, то вероятность того, что событие А появится в n испытаниях ровно k раз, приближенно равна (тем точнее, чем больше n) значению функции
, где
.
Имеются таблицы, в которых помещены значения функции .
Интегральная теорема Лапласа. Если вероятность р наступления события А в каждом испытании постоянна и отлична от нуля и единицы, то вероятность того, что событие А появится в n испытаниях от k1 до k2 раз, приближенно равна определенному интегралу:
, где
.
При решении задач, требующих применения интегральной теоремы Лапласа, пользуются специальными таблицами для интеграла , тогда
.
Пример 7. Найти вероятность того, что событие А наступит ровно 80 раз в 400 испытаниях, если вероятность появления этого события в каждом испытании равна 0,2.
Решение. По условию n = 400; k = 80; р = 0,2; q = 0,8. Воспользуемся асимптотической формулой Лапласа: ,
,
. Для вычисления в Excel используем формулу =НОРМРАСП(80; 80; 8; 0), которая дает значение 0,04986. При этом определены следующие значения параметров: k = 80; среднее= np = 80; стандартное_откл =
=
= 8, интегральная = 0. Подробно с синтаксисом функции НОРМРАСП можно ознакомиться с помощью справки.
Пример 8. Вероятность того, что деталь не прошла проверку ОТК, равна 0,2. Найти вероятность того, что среди 400 случайно отобранных деталей окажется непроверенных от 70 до 100 деталей.
Решение.Воспользуемся интегральной формулой Лапласа: n = 400; k1= 70; k2=100; р = 0,2; q = 0,8; . Так как функция
является нечетной, то P400(70; 100) = Ф(2,5)+ + Ф(1,25) = 0,4938 + 0,3944 = 0,8882.
Для вычисления в Excel используем формулу нормального распределения =НОРМРАСП(100; 80; 8; 1) — НОРМРАСП(70; 80; 8; 1), которая дает значение 0,8882. При этом параметр интегральная = 1, остальные значения параметров определяются аналогично примеру, рассмотренному выше.
В этой статье описаны синтаксис формулы и использование функции ВЕРОЯТНОСТЬ в Microsoft Excel.
Описание
Возвращает вероятность того, что значение из интервала находится внутри заданных пределов. Если верхний_предел не задан, то возвращается вероятность того, что значения в аргументе x_интервал равняются значению аргумента нижний_предел.
Синтаксис
Аргументы функции ВЕРОЯТНОСТЬ описаны ниже.
x_интервал Обязательный. Диапазон числовых значений x, с которыми связаны вероятности.
Интервал_вероятностей Обязательный. Множество вероятностей, соответствующих значениям в аргументе «x_интервал».
Нижний_предел Необязательный. Нижняя граница значения, для которого вычисляется вероятность.
Верхний_предел Необязательный. Верхняя граница значения, для которого вычисляется вероятность.
Замечания
Если любое значение в аргументе интервал_вероятностей меньше 0 или если какое-либо значение в аргументе интервал_вероятностей больше 1, то функция ВЕРОЯТНОСТЬ возвращает значение ошибки #ЧИСЛО!.
Если сумма значений в аргументе интервал_вероятностей не равна 1, функция ВЕРОЯТНОСТЬ возвращает значение ошибки #ЧИСЛО!.
Если верхний_предел опущен, то функция ВЕРОЯТНОСТЬ возвращает вероятность равенства значению аргумента нижний_предел.
Если x_интервал и интервал_вероятностей содержат различное количество точек данных, то функция ВЕРОЯТНОСТЬ возвращает значение ошибки #Н/Д.
Пример
Скопируйте образец данных из следующей таблицы и вставьте их в ячейку A1 нового листа Excel. Чтобы отобразить результаты формул, выделите их и нажмите клавишу F2, а затем — клавишу ВВОД. При необходимости измените ширину столбцов, чтобы видеть все данные.
Источник
Содержание
- Использование описательной статистики
- Подключение «Пакета анализа»
- Размах вариации
- Вычисление коэффициента вариации
- Шаг 1: расчет стандартного отклонения
- Шаг 2: расчет среднего арифметического
- Шаг 3: нахождение коэффициента вариации
- Простая формула для расчета объема выборки
- Пример расчета объема выборки
- Задачи о генеральной доле
- По части судить о целом
- Как рассчитать объем выборки
- Как определить статистические выбросы и сделать выборку для их удаления в Excel
- Способ 1: применение расширенного автофильтра
- Способ 2: применение формулы массива
- СРЗНАЧ()
- СРЗНАЧЕСЛИ()
- МАКС()
- МИН()
Использование описательной статистики
Под описательной статистикой понимают систематизацию эмпирических данных по целому ряду основных статистических критериев. Причем на основе полученного результата из этих итоговых показателей можно сформировать общие выводы об изучаемом массиве данных.
В Экселе существует отдельный инструмент, входящий в «Пакет анализа», с помощью которого можно провести данный вид обработки данных. Он так и называется «Описательная статистика». Среди критериев, которые высчитывает данный инструмент следующие показатели:
- Медиана;
- Мода;
- Дисперсия;
- Среднее;
- Стандартное отклонение;
- Стандартная ошибка;
- Асимметричность и др.
Рассмотрим, как работает данный инструмент на примере Excel 2010, хотя данный алгоритм применим также в Excel 2007 и в более поздних версиях данной программы.
Подключение «Пакета анализа»
Как уже было сказано выше, инструмент «Описательная статистика» входит в более широкий набор функций, который принято называть Пакет анализа. Но дело в том, что по умолчанию данная надстройка в Экселе отключена. Поэтому, если вы до сих пор её не включили, то для использования возможностей описательной статистики, придется это сделать.
- Переходим во вкладку «Файл». Далее производим перемещение в пункт «Параметры».
- В активировавшемся окне параметров перемещаемся в подраздел «Надстройки». В самой нижней части окна находится поле «Управление». Нужно в нем переставить переключатель в позицию «Надстройки Excel», если он находится в другом положении. Вслед за этим жмем на кнопку «Перейти…».
- Запускается окно стандартных надстроек Excel. Около наименования «Пакет анализа» ставим флажок. Затем жмем на кнопку «OK».
После вышеуказанных действий надстройка Пакет анализа будет активирована и станет доступной во вкладке «Данные» Эксель. Теперь мы сможем использовать на практике инструменты описательной статистики.
Размах вариации
Размах вариации – разница между максимальным и минимальным значением:
Ниже приведена графическая интерпретация размаха вариации.
Видно максимальное и минимальное значение, а также расстояние между ними, которое и соответствует размаху вариации.
С одной стороны, показатель размаха может быть вполне информативным и полезным. К примеру, максимальная и минимальная стоимость квартиры в городе N, максимальная и минимальная зарплата по профессии в регионе и проч. С другой стороны, размах может быть очень широким и не иметь практического смысла, т.к. зависит лишь от двух наблюдений. Таким образом, размах вариации очень неустойчивая величина.
Вычисление коэффициента вариации
Этот показатель представляет собой отношение стандартного отклонения к среднему арифметическому. Полученный результат выражается в процентах.
В Экселе не существует отдельно функции для вычисления этого показателя, но имеются формулы для расчета стандартного отклонения и среднего арифметического ряда чисел, а именно они используются для нахождения коэффициента вариации.
Шаг 1: расчет стандартного отклонения
Стандартное отклонение, или, как его называют по-другому, среднеквадратичное отклонение, представляет собой квадратный корень из дисперсии. Для расчета стандартного отклонения используется функция СТАНДОТКЛОН. Начиная с версии Excel 2010 она разделена, в зависимости от того, по генеральной совокупности происходит вычисление или по выборке, на два отдельных варианта: СТАНДОТКЛОН.Г и СТАНДОТКЛОН.В.
Синтаксис данных функций выглядит соответствующим образом:
= СТАНДОТКЛОН(Число1;Число2;…)
= СТАНДОТКЛОН.Г(Число1;Число2;…)
= СТАНДОТКЛОН.В(Число1;Число2;…)
- Для того, чтобы рассчитать стандартное отклонение, выделяем любую свободную ячейку на листе, которая удобна вам для того, чтобы выводить в неё результаты расчетов. Щелкаем по кнопке «Вставить функцию». Она имеет внешний вид пиктограммы и расположена слева от строки формул.
Выполняется активация Мастера функций, который запускается в виде отдельного окна с перечнем аргументов. Переходим в категорию «Статистические» или «Полный алфавитный перечень». Выбираем наименование «СТАНДОТКЛОН.Г» или «СТАНДОТКЛОН.В», в зависимости от того, по генеральной совокупности или по выборке следует произвести расчет. Жмем на кнопку «OK».
Открывается окно аргументов данной функции. Оно может иметь от 1 до 255 полей, в которых могут содержаться, как конкретные числа, так и ссылки на ячейки или диапазоны. Ставим курсор в поле «Число1». Мышью выделяем на листе тот диапазон значений, который нужно обработать. Если таких областей несколько и они не смежные между собой, то координаты следующей указываем в поле «Число2» и т.д. Когда все нужные данные введены, жмем на кнопку «OK»
Шаг 2: расчет среднего арифметического
Среднее арифметическое является отношением общей суммы всех значений числового ряда к их количеству. Для расчета этого показателя тоже существует отдельная функция – СРЗНАЧ. Вычислим её значение на конкретном примере.
- Выделяем на листе ячейку для вывода результата. Жмем на уже знакомую нам кнопку «Вставить функцию».
В статистической категории Мастера функций ищем наименование «СРЗНАЧ». После его выделения жмем на кнопку «OK».
Запускается окно аргументов СРЗНАЧ. Аргументы полностью идентичны тем, что и у операторов группы СТАНДОТКЛОН. То есть, в их качестве могут выступать как отдельные числовые величины, так и ссылки. Устанавливаем курсор в поле «Число1». Так же, как и в предыдущем случае, выделяем на листе нужную нам совокупность ячеек. После того, как их координаты были занесены в поле окна аргументов, жмем на кнопку «OK».
Шаг 3: нахождение коэффициента вариации
Теперь у нас имеются все необходимые данные для того, чтобы непосредственно рассчитать сам коэффициент вариации.
- Выделяем ячейку, в которую будет выводиться результат. Прежде всего, нужно учесть, что коэффициент вариации является процентным значением. В связи с этим следует поменять формат ячейки на соответствующий. Это можно сделать после её выделения, находясь во вкладке «Главная». Кликаем по полю формата на ленте в блоке инструментов «Число». Из раскрывшегося списка вариантов выбираем «Процентный». После этих действий формат у элемента будет соответствующий.
Снова возвращаемся к ячейке для вывода результата. Активируем её двойным щелчком левой кнопки мыши. Ставим в ней знак «=». Выделяем элемент, в котором расположен итог вычисления стандартного отклонения. Кликаем по кнопке «разделить» (/) на клавиатуре. Далее выделяем ячейку, в которой располагается среднее арифметическое заданного числового ряда. Для того, чтобы произвести расчет и вывести значение, щёлкаем по кнопке Enter на клавиатуре.
Таким образом мы произвели вычисление коэффициента вариации, ссылаясь на ячейки, в которых уже были рассчитаны стандартное отклонение и среднее арифметическое. Но можно поступить и несколько по-иному, не рассчитывая отдельно данные значения.
- Выделяем предварительно отформатированную под процентный формат ячейку, в которой будет выведен результат. Прописываем в ней формулу по типу:
Вместо наименования «Диапазон значений» вставляем реальные координаты области, в которой размещен исследуемый числовой ряд. Это можно сделать простым выделением данного диапазона. Вместо оператора СТАНДОТКЛОН.В, если пользователь считает нужным, можно применять функцию СТАНДОТКЛОН.Г.
Существует условное разграничение. Считается, что если показатель коэффициента вариации менее 33%, то совокупность чисел однородная. В обратном случае её принято характеризовать, как неоднородную.
Как видим, программа Эксель позволяет значительно упростить расчет такого сложного статистического вычисления, как поиск коэффициента вариации. К сожалению, в приложении пока не существует функции, которая высчитывала бы этот показатель в одно действие, но при помощи операторов СТАНДОТКЛОН и СРЗНАЧ эта задача очень упрощается. Таким образом, в Excel её может выполнить даже человек, который не имеет высокого уровня знаний связанных со статистическими закономерностями.
Разделы: Математика
- Совершенствование умений и навыков нахождения статистических характеристик случайной величины, работа с расчетами в Excel;
- применение информационно коммутативных технологий для анализа данных; работа с различными информационными носителями.
- Сегодня мы научимся рассчитывать статистические характеристики для больших по объему выборок, используя возможности современных компьютерных технологий.
- Для начала вспомним:
– что называется случайной величиной? (Случайной величиной называют переменную величину, которая в зависимости от исхода испытания принимает одно значение из множества возможных значений.)
– Какие виды случайных величин мы знаем? (Дискретные, непрерывные.)
– Приведите примеры непрерывных случайных величин (рост дерева), дискретных случайных величин (количество учеников в классе).
– Какие статистические характеристики случайных величин мы знаем (мода, медиана, среднее выборочное значение, размах ряда).
– Какие приемы используются для наглядного представления статистических характеристик случайной величины (полигон частот, круговые и столбчатые диаграммы, гистограммы).
- Рассмотрим, применение инструментов Excel для решения статистических задач на конкретном примере.
Пример. Проведена проверка в 100 компаниях. Даны значения количества работающих в компании (чел.):
23 25 24 25 30 24 30 26 28 26 32 33 31 31 25 33 25 29 30 28 23 30 29 24 33 30 30 28 26 25 26 29 27 29 26 28 27 26 29 28 29 30 27 30 28 32 28 26 30 26 31 27 30 27 33 28 26 30 31 29 27 30 30 29 27 26 28 31 29 28 33 27 30 33 26 31 34 28 32 22 29 30 27 29 34 29 32 29 29 30 29 29 36 29 29 34 23 28 24 28 |
рассчитать числовые характеристики:
|
1. Занести данные в EXCEL, каждое число в отдельную ячейку.
23 | 25 | 24 | 25 | 30 | 24 | 30 | 26 | 28 | 26 |
32 | 33 | 31 | 31 | 25 | 33 | 25 | 29 | 30 | 28 |
23 | 30 | 29 | 24 | 33 | 30 | 30 | 28 | 26 | 25 |
26 | 29 | 27 | 29 | 26 | 28 | 27 | 26 | 29 | 28 |
29 | 30 | 27 | 30 | 28 | 32 | 28 | 26 | 30 | 26 |
31 | 27 | 30 | 27 | 33 | 28 | 26 | 30 | 31 | 29 |
27 | 30 | 30 | 29 | 27 | 26 | 28 | 31 | 29 | 28 |
33 | 27 | 30 | 33 | 26 | 31 | 34 | 28 | 32 | 22 |
29 | 30 | 27 | 29 | 34 | 29 | 32 | 29 | 29 | 30 |
29 | 29 | 36 | 29 | 29 | 34 | 23 | 28 | 24 | 28 |
2. Для расчета числовых характеристик используем опцию Вставка – Функция. И в появившемся окне в строке категория выберем – статистические, в списке: МОДА
В поле Число 1 ставим курсор и мышкой выделяем нашу таблицу:
Нажимаем клавишу ОК. Получили Мо = 29 (чел) – Фирм у которых в штате 29 человек больше всего.
Используя тот же путь вычисляем медиану.
Вставка – Функция – Статистические – Медиана.
В поле Число 1 ставим курсор и мышкой выделяем нашу таблицу:
Нажимаем клавишу ОК. Получили Ме = 29 (чел) – среднее значение сотрудников в фирме.
Размах ряда чисел – разница между наименьшим и наибольшим возможным значением случайной величины. Для вычисления размаха ряда нужно найти наибольшее и наименьшее значения нашей выборки и вычислить их разность.
Вставка – Функция – Статистические – МАКС.
В поле Число 1 ставим курсор и мышкой выделяем нашу таблицу:
Нажимаем клавишу ОК. Получили наибольшее значение = 36.
Вставка – Функция – Статистические – МИН.
В поле Число 1 ставим курсор и мышкой выделяем нашу таблицу:
Нажимаем клавишу ОК. Получили наименьшее значение = 22.
36 – 22 = 14 (чел) – разница между фирмой с наибольшим штатом сотрудников и фирмой с наименьшим штатом сотрудников.
Для построения диаграммы и полигона частот необходимо задать закон распределения, т.е. составить таблицу значений случайной величины и соответствующих им частот. Мы ухе знаем, что наименьшее число сотрудников в фирме = 22, а наибольшее = 36. Составим таблицу, в которой значения xi случайной величины меняются от 22 до 36 включительно шагом 1.
xi | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 |
ni |
Чтобы сосчитать частоту каждого значения воспользуемся
Вставка – Функция – Статистические – СЧЕТЕСЛИ.
В окне Диапазон ставим курсор и выделяем нашу выборку, а в окне Критерий ставим число 22
Нажимаем клавишу ОК, получаем значение 1, т.е. число 22 в нашей выборке встречается 1 раз и его частота =1. Аналогичным образом заполняем всю таблицу.
xi | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | 32 | 33 | 34 | 35 | 36 |
ni | 1 | 3 | 4 | 5 | 11 | 9 | 13 | 18 | 16 | 6 | 4 | 6 | 3 | 0 | 1 |
Для проверки вычисляем объем выборки, сумму частот (Вставка – Функция – Математические – СУММА). Должно получиться 100 (количество всех фирм).
Чтобы построить полигон частот выделяем таблицу – Вставка – Диаграмма – Стандартные – Точечная (точечная диаграмма на которой значения соединены отрезками)
Нажимаем клавишу Далее, в Мастере диаграмм указываем название диаграммы (Полигон частот), удаляем легенду, редактируем шкалу и характеристики диаграммы для наибольшей наглядности.
Для построения столбчатой и круговой диаграмм используем тот же путь (выбирая нужный нам тип диаграммы).
Диаграмма – Стандартные – Круговая.
Диаграмма – Стандартные – Гистограмма.
4. Сегодня на уроке мы научились применять компьютерные технологии для анализа и обработки статистической информации.
Простая формула для расчета объема выборки
где: n – объем выборки;
z – нормированное отклонение, определяемое исходя из выбранного уровня доверительности. Этот показатель характеризует возможность, вероятность попадания ответов в специальный – доверительный интервал. На практике уровень доверительности часто принимают за 95% или 99%. Тогда значения z будут соответственно 1,96 и 2,58;
p – вариация для выборки, в долях. По сути, p – это вероятность того, что респонденты выберут той или иной вариант ответа. Допустим, если мы считаем, что четверть опрашиваемых выберут ответ «Да», то p будет равно 25%, то есть p = 0,25;
q = (1 – p);
e – допустимая ошибка, в долях.
Пример расчета объема выборки
Компания планирует провести социологическое исследование с целью выявить долю курящих лиц в населении города. Для этого сотрудники компании будут задавать прохожим один вопрос: «Вы курите?». Возможных вариантов ответа, таким образом, только два: «Да» и «Нет».
Объем выборки в этом случае рассчитывается следующим образом. Уровень доверительности принимается за 95%, тогда нормированное отклонение z = 1,96. Вариацию принимаем за 50%, то есть условно считаем, что половина респондентов может ответить на вопрос о том, курят ли они – «Да». Тогда p = 0,5. Отсюда находим q = 1 – p = 1 – 0,5 = 0,5. Допустимую ошибку выборки принимаем за 10%, то есть e = 0,1.
Подставляем эти данные в формулу и считаем:
Получаем объем выборки n = 96 человек.
Задачи о генеральной доле
На вопрос «Накрывает ли доверительный интервал заданное значение p0?» — можно ответить, проверив статистическую гипотезу H0:p=p0. При этом предполагается, что опыты проводятся по схеме испытаний Бернулли (независимы, вероятность p появления события А постоянна). По выборке объема n определяют относительную частоту p* появления события A: где m — количество появлений события А в серии из n испытаний. Для проверки гипотезы H0 используется статистика, имеющая при достаточно большом объеме выборки стандартное нормальное распределение (табл. 1).
Таблица 1 – Гипотезы о генеральной доле
Гипотеза |
H0:p=p0 | H0:p1=p2 |
Предположения | Схема испытаний Бернулли | Схема испытаний Бернулли |
Оценки по выборке | ||
Статистика K | ||
Распределение статистики K | Стандартное нормальное N(0,1) | Стандартное нормальное N(0,1) |
Пример №1. С помощью случайного повторного отбора руководство фирмы провело выборочный опрос 900 своих служащих. Среди опрошенных оказалось 270 женщин. Постройте доверительный интервал, с вероятностью 0.95 накрывающий истинную долю женщин во всем коллективе фирмы.
Решение. По условию выборочная доля женщин составляет (относительная частота женщин среди всех опрошенных). Так как отбор является повторным, и объем выборки велик (n=900) предельная ошибка выборки определяется по формуле
(относительная частота женщин среди всех опрошенных). Так как отбор является повторным, и объем выборки велик (n=900) предельная ошибка выборки определяется по формуле
Значение uкр находим по таблице функции Лапласа из соотношения 2Ф(uкр)=γ, т.е. Функция Лапласа (приложение 1) принимает значение 0.475 при uкр=1.96. Следовательно, предельная ошибка
Функция Лапласа (приложение 1) принимает значение 0.475 при uкр=1.96. Следовательно, предельная ошибка и искомый доверительный интервал
(p – ε, p + ε) = (0.3 – 0.18; 0.3 + 0.18) = (0.12; 0.48)
Итак, с вероятностью 0.95 можно гарантировать, что доля женщин во всем коллективе фирмы находится в интервале от 0.12 до 0.48.
Пример №2. Владелец автостоянки считает день «удачным», если автостоянка заполнена более, чем на 80 %. В течение года было проведено 40 проверок автостоянки, из которых 24 оказались «удачными». С вероятностью 0.98 найдите доверительный интервал для оценки истинной доли «удачных» дней в течение года.
Решение. Выборочная доля «удачных» дней составляет
По таблице функции Лапласа найдем значение uкр при заданной
доверительной вероятности
По таблице функции Лапласа найдем значение uкр при заданной
доверительной вероятности
Ф(2.23) = 0.49, uкр = 2.33.
Считая отбор бесповторным (т.е. две проверки в один день не проводилось), найдем предельную ошибку:
где n=40, N = 365 (дней). Отсюда
где n=40, N = 365 (дней). Отсюда
и доверительный интервал для генеральной доли: (p – ε, p + ε) = (0.6 – 0.17; 0.6 + 0.17) = (0.43; 0.77)
С вероятностью 0.98 можно ожидать, что доля «удачных» дней в течение года находится в интервале от 0.43 до 0.77.
Пример №3. Проверив 2500 изделий в партии, обнаружили, что 400 изделий высшего сорта, а n–m – нет. Сколько надо проверить изделий, чтобы с уверенностью 95% определить долю высшего сорта с точностью до 0.01?
Решение ищем по формуле определения численности выборки для повторного отбора.
Ф(t) = γ/2 = 0.95/2 = 0.475 и этому значению по таблице Лапласа соответствует t=1.96
Выборочная доля w = 0.16; ошибка выборки ε = 0.01
Пример №4. Партия изделий принимается, если вероятность того, что изделие окажется соответствующим стандарту, составляет не менее 0.97. Среди случайно отобранных 200 изделий проверяемой партии оказалось 193 соответствующих стандарту. Можно ли на уровне значимости α=0,02 принять партию?
Решение. Сформулируем основную и альтернативную гипотезы.
H0:p=p0=0,97 — неизвестная генеральная доля p равна заданному значению p0=0,97. Применительно к условию — вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, равна 0.97; т.е. партию изделий можно принять.
H1:p<0,97 – вероятность того, что деталь из проверяемой партии окажется соответствующей стандарту, меньше 0.97; т.е. партию изделий нельзя принять. При такой альтернативной гипотезе критическая область будет левосторонней.
Наблюдаемое значение статистики K (таблица) вычислим при заданных значениях p0=0,97, n=200, m=193
Критическое значение находим по таблице функции Лапласа из равенства
По условию α=0,02 отсюда Ф(Ккр)=0,48 и Ккр=2,05. Критическая область левосторонняя, т.е. является интервалом (-∞;-Kkp)= (-∞;-2,05). Наблюдаемое значение Кнабл=-0,415 не принадлежит критической области, следовательно, на данном уровне значимости нет оснований отклонять основную гипотезу. Партию изделий принять можно.
Пример №5. Два завода изготавливают однотипные детали. Для оценки их качества сделаны выборки из продукции этих заводов и получены следующие результаты. Среди 200 отобранных изделий первого завода оказалось 20 бракованных, среди 300 изделий второго завода — 15 бракованных.
На уровне значимости 0.025 выяснить, имеется ли существенное различие в качестве изготавливаемых этими заводами деталей.
Решение. Это задача о сравнении генеральных долей двух совокупностей. Сформулируем основную и альтернативную гипотезы.
H0:p1=p2 — генеральные доли равны. Применительно к условию — вероятность появления бракованного изделия в продукции первого завода равна вероятности появления бракованного изделия в продукции второго завода (качество продукции одинаково).
H0:p1≠p2 — заводы изготавливают детали разного качества.
Для вычисления наблюдаемого значения статистики K (таблица) рассчитаем оценки по выборке.
Наблюдаемое значение равно
Так как альтернативная гипотеза двусторонняя, то критическое значение статистики K≈ N(0,1) находим по таблице функции Лапласа из равенства
Так как альтернативная гипотеза двусторонняя, то критическое значение статистики K≈ N(0,1) находим по таблице функции Лапласа из равенства
По условию α=0,025 отсюда Ф(Ккр)=0,4875 и Ккр=2,24. При двусторонней альтернативе область допустимых значений имеет вид (-2,24;2,24). Наблюдаемое значение Kнабл=2,15 попадает в этот интервал, т.е. на данном уровне значимости нет оснований отвергать основную гипотезу. Заводы изготавливают изделия одинакового качества.
По части судить о целом
О возможности судить о целом по части миру рассказал российский математик П.Л. Чебышев. «Закон больших чисел» простым языком можно сформулировать так: количественные закономерности массовых явлений проявляются только при
достаточном числе наблюдений
. Чем больше выборка, тем лучше случайные отклонения компенсируют друг друга и проявляется общая тенденция.
А.М. Ляпунов чуть позже сформулировал центральную предельную теорему. Она стала фундаментом для создания формул, которые позволяют рассчитать вероятность ошибки (при оценке среднего по выборке) и размер выборки, необходимый для достижения заданной точности.
Строгие формулировки:
С увеличением числа случайных величин их среднее арифметическое стремится к среднему арифметическому математических ожиданий и перестает быть случайным. Общий смысл закона больших чисел — совместное действие большого числа случайных факторов приводит к результату, почти не зависящему от случая.
Таким образом з.б.ч. гарантирует устойчивость для средних значений некоторых случайных событий при достаточно длинной серии экспериментов.
Распределение случайной величины, которая получена в результате сложения большого числа независимых случайных величин (ни одно из которых не доминирует, не вносит в сумму определяющего вклада и имеет дисперсию значительно меньшею по сравнению с дисперсией суммы) имеет распределение, близкое к нормальному.
Из ц.п.т. следует, что ошибки выборки также подчиняется нормальному распределению.
Еще раз: чтобы корректно оценивать популяцию по выборке, нам нужна не обычная выборка, а репрезентативная выборка достаточного размера. Начнем с определения этого самого размера.
Как рассчитать объем выборки
Достаточный размер выборки зависит от следующих составляющих:
- изменчивость признака (чем разнообразней показания, тем больше наблюдений нужно, чтобы это уловить);
- размер эффекта (чем меньшие эффекты мы стремимся зафиксировать, тем больше наблюдений необходимо);
- уровень доверия (уровень вероятности при который мы готовы отвергнуть нулевую гипотезу)
ЗАПОМНИТЕ
Объем выборки зависит от изменчивости признака и планируемой строгости эксперимента
Формулы для расчета объема выборки:
Формулы расчета объема выборки
Ошибка выборки значительно возрастает, когда наблюдений меньше ста. Для исследований в которых используется 30-100 объектов применяется особая статистическая методология: критерии, основанные на распределении Стьюдента или бутстрэп-анализ. И наконец, статистика совсем слаба, когда наблюдений меньше 30.
График зависимости ошибки выборки от ее объема при оценке доли признака в г.с.
Чем больше неопределенность, тем больше ошибка. Максимальная неопределенность при оценке доли — 50% (например, 50% респондентов считают концепцию хорошей, а другие 50% плохой). Если 90% опрошенных концепция понравится — это, наоборот, пример согласованности. В таких случаях оценить долю признака по выборке проще.
Для экспонирования и выделения цветом значений статистических выбросов от медианы можно использовать несколько простых формул и условное форматирование.
Первым шагом в поиске значений выбросов статистики является определение статистического центра диапазона данных. С этой целью необходимо сначала определить границы первого и третьего квартала. Определение границ квартала – значит разделение данных на 4 равные группы, которые содержат по 25% данных каждая. Группа, содержащая 25% наибольших значений, называется первым квартилем.
Границы квартилей в Excel можно легко определить с помощью простой функции КВАРТИЛЬ. Данная функция имеет 2 аргумента: диапазон данных и номер для получения желаемого квартиля.
В примере показанному на рисунке ниже значения в ячейках E1 и E2 содержат показатели первого и третьего квартиля данных в диапазоне ячеек B2:B19:
Вычитая от значения первого квартиля третьего, можно определить набор 50% статистических данных, который называется межквартильным диапазоном. В ячейке E3 определен размер межквартильного диапазона.
В этом месте возникает вопрос, как сильно данное значение может отличаться от среднего значения 50% данных и оставаться все еще в пределах нормы? Статистические аналитики соглашаются с тем, что для определения нижней и верхней границы диапазона данных можно смело использовать коэффициент расширения 1,5 умножив на значение межквартильного диапазона. То есть:
- Нижняя граница диапазона данных равна: значение первого квартиля – межкваритльный диапазон * 1,5.
- Верхняя граница диапазона данных равна: значение третьего квартиля + расширенных диапазон * 1,5.
Как показано на рисунке ячейки E5 и E6 содержат вычисленные значения верхней и нижней границы диапазона данных. Каждое значение, которое больше верхней границы нормы или меньше нижней границы нормы считается значением статистического выброса.
Чтобы выделить цветом для улучшения визуального анализа данных можно создать простое правило для условного форматирования.
Способ 1: применение расширенного автофильтра
Наиболее простым способом произвести отбор является применение расширенного автофильтра. Рассмотрим, как это сделать на конкретном примере.
- Выделяем область на листе, среди данных которой нужно произвести выборку. Во вкладке «Главная» щелкаем по кнопке «Сортировка и фильтр». Она размещается в блоке настроек «Редактирование». В открывшемся после этого списка выполняем щелчок по кнопке «Фильтр».
Есть возможность поступить и по-другому. Для этого после выделения области на листе перемещаемся во вкладку «Данные». Щелкаем по кнопке «Фильтр», которая размещена на ленте в группе «Сортировка и фильтр».
- После этого действия в шапке таблицы появляются пиктограммы для запуска фильтрования в виде перевернутых острием вниз небольших треугольников на правом краю ячеек. Кликаем по данному значку в заглавии того столбца, по которому желаем произвести выборку. В запустившемся меню переходим по пункту «Текстовые фильтры». Далее выбираем позицию «Настраиваемый фильтр…».
- Активируется окно пользовательской фильтрации. В нем можно задать ограничение, по которому будет производиться отбор. В выпадающем списке для столбца содержащего ячейки числового формата, который мы используем для примера, можно выбрать одно из пяти видов условий:
- равно;
- не равно;
- больше;
- больше или равно;
- меньше.
Давайте в качестве примера зададим условие так, чтобы отобрать только значения, по которым сумма выручки превышает 10000 рублей. Устанавливаем переключатель в позицию «Больше». В правое поле вписываем значение «10000». Чтобы произвести выполнение действия, щелкаем по кнопке «OK».
- Как видим, после фильтрации остались только строчки, в которых сумма выручки превышает 10000 рублей.
- Но в этом же столбце мы можем добавить и второе условие. Для этого опять возвращаемся в окно пользовательской фильтрации. Как видим, в его нижней части есть ещё один переключатель условия и соответствующее ему поле для ввода. Давайте установим теперь верхнюю границу отбора в 15000 рублей. Для этого выставляем переключатель в позицию «Меньше», а в поле справа вписываем значение «15000».
Кроме того, существует ещё переключатель условий. У него два положения «И» и «ИЛИ». По умолчанию он установлен в первом положении. Это означает, что в выборке останутся только строчки, которые удовлетворяют обоим ограничениям. Если он будет выставлен в положение «ИЛИ», то тогда останутся значения, которые подходят под любое из двух условий. В нашем случае нужно выставить переключатель в положение «И», то есть, оставить данную настройку по умолчанию. После того, как все значения введены, щелкаем по кнопке «OK».
- Теперь в таблице остались только строчки, в которых сумма выручки не меньше 10000 рублей, но не превышает 15000 рублей.
- Аналогично можно настраивать фильтры и в других столбцах. При этом имеется возможность сохранять также фильтрацию и по предыдущим условиям, которые были заданы в колонках. Итак, посмотрим, как производится отбор с помощью фильтра для ячеек в формате даты. Кликаем по значку фильтрации в соответствующем столбце. Последовательно кликаем по пунктам списка «Фильтр по дате» и «Настраиваемый фильтр».
- Снова запускается окно пользовательского автофильтра. Выполним отбор результатов в таблице с 4 по 6 мая 2016 года включительно. В переключателе выбора условий, как видим, ещё больше вариантов, чем для числового формата. Выбираем позицию «После или равно». В поле справа устанавливаем значение «04.05.2016». В нижнем блоке устанавливаем переключатель в позицию «До или равно». В правом поле вписываем значение «06.05.2016». Переключатель совместимости условий оставляем в положении по умолчанию – «И». Для того, чтобы применить фильтрацию в действии, жмем на кнопку «OK».
- Как видим, наш список ещё больше сократился. Теперь в нем оставлены только строчки, в которых сумма выручки варьируется от 10000 до 15000 рублей за период с 04.05 по 06.05.2016 включительно.
- Мы можем сбросить фильтрацию в одном из столбцов. Сделаем это для значений выручки. Кликаем по значку автофильтра в соответствующем столбце. В выпадающем списке щелкаем по пункту «Удалить фильтр».
- Как видим, после этих действий, выборка по сумме выручки будет отключена, а останется только отбор по датам (с 04.05.2016 по 06.05.2016).
- В данной таблице имеется ещё одна колонка – «Наименование». В ней содержатся данные в текстовом формате. Посмотрим, как сформировать выборку с помощью фильтрации по этим значениям.
Кликаем по значку фильтра в наименовании столбца. Последовательно переходим по наименованиям списка «Текстовые фильтры» и «Настраиваемый фильтр…».
- Опять открывается окно пользовательского автофильтра. Давайте сделаем выборку по наименованиям «Картофель» и «Мясо». В первом блоке переключатель условий устанавливаем в позицию «Равно». В поле справа от него вписываем слово «Картофель». Переключатель нижнего блока так же ставим в позицию «Равно». В поле напротив него делаем запись – «Мясо». И вот далее мы выполняем то, чего ранее не делали: устанавливаем переключатель совместимости условий в позицию «ИЛИ». Теперь строчка, содержащая любое из указанных условий, будет выводиться на экран. Щелкаем по кнопке «OK».
- Как видим, в новой выборке существуют ограничения по дате (с 04.05.2016 по 06.05.2016) и по наименованию (картофель и мясо). По сумме выручки ограничений нет.
- Полностью удалить фильтр можно теми же способами, которые использовались для его установки. Причем неважно, какой именно способ применялся. Для сброса фильтрации, находясь во вкладке «Данные» щелкаем по кнопке «Фильтр», которая размещена в группе «Сортировка и фильтр».
Второй вариант предполагает переход во вкладку «Главная». Там выполняем щелчок на ленте по кнопке «Сортировка и фильтр» в блоке «Редактирование». В активировавшемся списке нажимаем на кнопку «Фильтр».
При использовании любого из двух вышеуказанных методов фильтрация будет удалена, а результаты выборки – очищены. То есть, в таблице будет показан весь массив данных, которыми она располагает.
Способ 2: применение формулы массива
Сделать отбор можно также применив сложную формулу массива. В отличие от предыдущего варианта, данный метод предусматривает вывод результата в отдельную таблицу.
- На том же листе создаем пустую таблицу с такими же наименованиями столбцов в шапке, что и у исходника.
- Выделяем все пустые ячейки первой колонки новой таблицы. Устанавливаем курсор в строку формул. Как раз сюда будет заноситься формула, производящая выборку по указанным критериям. Отберем строчки, сумма выручки в которых превышает 15000 рублей. В нашем конкретном примере, вводимая формула будет выглядеть следующим образом:
=ИНДЕКС(A2:A29;НАИМЕНЬШИЙ(ЕСЛИ(15000<=C2:C29;СТРОКА(C2:C29);"");СТРОКА()-СТРОКА($C$1))-СТРОКА($C$1))
Естественно, в каждом конкретном случае адрес ячеек и диапазонов будет свой. На данном примере можно сопоставить формулу с координатами на иллюстрации и приспособить её для своих нужд.
- Так как это формула массива, то для того, чтобы применить её в действии, нужно нажимать не кнопку Enter, а сочетание клавиш Ctrl+Shift+Enter. Делаем это.
- Выделив второй столбец с датами и установив курсор в строку формул, вводим следующее выражение:
=ИНДЕКС(B2:B29;НАИМЕНЬШИЙ(ЕСЛИ(15000<=C2:C29;СТРОКА(C2:C29);"");СТРОКА()-СТРОКА($C$1))-СТРОКА($C$1))
Жмем сочетание клавиш Ctrl+Shift+Enter.
- Аналогичным образом в столбец с выручкой вписываем формулу следующего содержания:
=ИНДЕКС(C2:C29;НАИМЕНЬШИЙ(ЕСЛИ(15000<=C2:C29;СТРОКА(C2:C29);"");СТРОКА()-СТРОКА($C$1))-СТРОКА($C$1))
Опять набираем сочетание клавиш Ctrl+Shift+Enter.
Во всех трех случаях меняется только первое значение координат, а в остальном формулы полностью идентичны.
- Как видим, таблица заполнена данными, но внешний вид её не совсем привлекателен, к тому же, значения даты заполнены в ней некорректно. Нужно исправить эти недостатки. Некорректность даты связана с тем, что формат ячеек соответствующего столбца общий, а нам нужно установить формат даты. Выделяем весь столбец, включая ячейки с ошибками, и кликаем по выделению правой кнопкой мыши. В появившемся списке переходим по пункту «Формат ячейки…».
- В открывшемся окне форматирования открываем вкладку «Число». В блоке «Числовые форматы» выделяем значение «Дата». В правой части окна можно выбрать желаемый тип отображения даты. После того, как настройки выставлены, жмем на кнопку «OK».
- Теперь дата отображается корректно. Но, как видим, вся нижняя часть таблицы заполнена ячейками, которые содержат ошибочное значение «#ЧИСЛО!». По сути, это те ячейки, данных из выборки для которых не хватило. Более привлекательно было бы, если бы они отображались вообще пустыми. Для этих целей воспользуемся условным форматированием. Выделяем все ячейки таблицы, кроме шапки. Находясь во вкладке «Главная» кликаем по кнопке «Условное форматирование», которая находится в блоке инструментов «Стили». В появившемся списке выбираем пункт «Создать правило…».
- В открывшемся окне выбираем тип правила «Форматировать только ячейки, которые содержат». В первом поле под надписью «Форматировать только ячейки, для которых выполняется следующее условие» выбираем позицию «Ошибки». Далее жмем по кнопке «Формат…».
- В запустившемся окне форматирования переходим во вкладку «Шрифт» и в соответствующем поле выбираем белый цвет. После этих действий щелкаем по кнопке «OK».
- На кнопку с точно таким же названием жмем после возвращения в окно создания условий.
Теперь у нас имеется готовая выборка по указанному ограничению в отдельной надлежащим образом оформленной таблице.
СРЗНАЧ()
Статистическая функция СРЗНАЧ возвращает среднее арифметическое своих аргументов.
Данная функция может принимать до 255 аргументов и находить среднее сразу в нескольких несмежных диапазонах и ячейках:
Если в рассчитываемом диапазоне встречаются пустые или содержащие текст ячейки, то они игнорируются. В примере ниже среднее ищется по четырем ячейкам, т.е. (4+15+11+22)/4 = 13
Если необходимо вычислить среднее, учитывая все ячейки диапазона, то можно воспользоваться статистической функцией СРЗНАЧА. В следующем примере среднее ищется уже по 6 ячейкам, т.е. (4+15+11+22)/6 = 8,6(6).
Статистическая функция СРЗНАЧ может использовать в качестве своих аргументов математические операторы и различные функции Excel:
СРЗНАЧЕСЛИ()
Если необходимо вернуть среднее арифметическое значений, которые удовлетворяют определенному условию, то можно воспользоваться статистической функцией СРЗНАЧЕСЛИ. Следующая формула вычисляет среднее чисел, которые больше нуля:
В данном примере для подсчета среднего и проверки условия используется один и тот же диапазон, что не всегда удобно. На этот случай у функции СРЗНАЧЕСЛИ существует третий необязательный аргумент, по которому можно вычислять среднее. Т.е. по первому аргументу проверяем условие, по третьему – находим среднее.
Допустим, в таблице ниже собрана статистика по стоимости лекарств в городе. В одной аптеке лекарство стоит дороже, в другой дешевле. Чтобы посчитать стоимость анальгина в среднем по городу, воспользуемся следующей формулой:
Если требуется соблюсти несколько условий, то всегда можно применить статистическую функцию СРЗНАЧЕСЛИМН, которая позволяет считать среднее арифметическое ячеек, удовлетворяющих двум и более критериям.
МАКС()
Статистическая функция МАКС возвращает наибольшее значение в диапазоне ячеек:
МИН()
Статистическая функция МИН возвращает наименьшее значение в диапазоне ячеек:
Источники
- https://lumpics.ru/descriptive-statistics-in-excel/
- https://statanaliz.info/statistica/opisanie-dannyx/variatsiya-razmakh-srednee-linejnoe-otklonenie/
- https://www.hd01.ru/info/kak-poschitat-razmah-v-excel/
- http://galyautdinov.ru/post/formula-vyborki-prostaya
- https://math.semestr.ru/group/interval-estimation-share.php
- https://tidydata.ru/sample-size
- https://exceltable.com/formuly/raschet-statisticheskih-vybrosov
- https://lumpics.ru/how-to-make-a-sample-in-excel/
- https://office-guru.ru/excel/statisticheskie-funkcii-excel-kotorye-neobhodimo-znat-96.html