Распределение массива данных excel

  • Редакция Кодкампа

17 авг. 2022 г.
читать 2 мин


Распределение частоты описывает, как часто разные значения встречаются в наборе данных. Это полезный способ понять, как значения данных распределяются в наборе данных.

К счастью, легко создать и визуализировать частотное распределение в Excel, используя следующую функцию:

=ЧАСТОТА(массив_данных,массив_бинов)

куда:

  • data_array : массив необработанных значений данных
  • bins_array: массив верхних пределов для бинов

В следующем примере показано, как использовать эту функцию на практике.

Пример: частотное распределение в Excel

Предположим, у нас есть следующий набор данных из 20 значений в Excel:

Во-первых, мы укажем Excel, какие верхние пределы мы хотели бы использовать для интервалов нашего частотного распределения. Для этого примера мы выберем 10, 20 и 30. То есть мы найдем частоты для следующих интервалов:

  • от 0 до 10
  • с 11 до 20
  • от 21 до 30
  • 30+

Далее мы будем использовать следующую функцию =FREQUENCY() для вычисления частот для каждого бина:

=ЧАСТОТА( A2:A21 , C2:C4 )

Вот результаты:

Частотное распределение в Excel

Результаты показывают, что:

  • 6 значений в наборе данных находятся в диапазоне от 0 до 10.
  • 7 значений в наборе данных находятся в диапазоне 11-20.
  • 5 значений в наборе данных находятся в диапазоне 21-30.
  • 2 значения в наборе данных больше 30.

Затем мы можем использовать следующие шаги для визуализации этого частотного распределения:

  • Выделите частоты в диапазоне D2:D5 .
  • Нажмите на вкладку « Вставка », затем нажмите на диаграмму под названием « Двухмерный столбец » в группе « Диаграммы ».

Появится следующая диаграмма, отображающая частоты для каждого бина:

Визуализация частотного распределения в Excel

Не стесняйтесь изменять метки осей и ширину полос, чтобы сделать диаграмму более эстетичной:

Частотное распределение в Excel

Вы можете найти больше учебников по Excel здесь .

Написано

Редакция Кодкампа

Замечательно! Вы успешно подписались.

Добро пожаловать обратно! Вы успешно вошли

Вы успешно подписались на кодкамп.

Срок действия вашей ссылки истек.

Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.

Успех! Ваша платежная информация обновлена.

Ваша платежная информация не была обновлена.


Рассмотрим Нормальное распределение. С помощью функции

MS EXCEL

НОРМ.РАСП()

построим графики функции распределения и плотности вероятности. Сгенерируем массив случайных чисел, распределенных по нормальному закону, произведем оценку параметров распределения, среднего значения и стандартного отклонения

.


Нормальное распределение

(также называется распределением Гаусса) является самым важным как в теории, так в приложениях системы контроля качества. Важность значения

Нормального распределения

(англ.

Normal

distribution

)

во многих областях науки вытекает из

Центральной предельной теоремы

теории вероятностей.


Определение

: Случайная величина

x

распределена по

нормальному закону

, если она имеет

плотность распределения

:


СОВЕТ

: Подробнее о

Функции распределения

и

Плотности вероятности

см. статью

Функция распределения и плотность вероятности в MS EXCEL

.


Нормальное распределение

зависит от двух параметров: μ

(мю)

— является

математическим ожиданием (средним значением случайной величины)

, и σ (

сигма)

— является

стандартным отклонением

(среднеквадратичным отклонением). Параметр μ определяет положение центра

плотности вероятности

нормального распределения

, а σ — разброс относительно центра (среднего).


Примечание

: О влиянии параметров μ и σ на форму распределения изложено в статье про

Гауссову кривую

, а в

файле примера на листе Влияние параметров

можно с помощью

элементов управления Счетчик

понаблюдать за изменением формы кривой.

Нормальное распределение в MS EXCEL

В MS EXCEL, начиная с версии 2010, для

Нормального распределения

имеется функция

НОРМ.РАСП()

, английское название — NORM.DIST(), которая позволяет вычислить

плотность вероятности

(см. формулу выше) и

интегральную функцию распределения

(вероятность, что случайная величина X, распределенная по

нормальному закону

, примет значение меньше или равное x). Вычисления в последнем случае производятся по следующей формуле:

Вышеуказанное распределение имеет обозначение

N

(μ; σ).

Так же часто используют обозначение через

дисперсию

N

(μ; σ

2

).


Примечание

: До MS EXCEL 2010 в EXCEL была только функция

НОРМРАСП()

, которая также позволяет вычислить функцию распределения и плотность вероятности.

НОРМРАСП()

оставлена в MS EXCEL 2010 для совместимости.

Стандартное нормальное распределение


Стандартным нормальным распределением

называется

нормальное распределение

с

математическим ожиданием

μ=0 и

дисперсией

σ=1. Вышеуказанное распределение имеет обозначение

N

(0;1).


Примечание

: В литературе для случайной величины, распределенной по

стандартному

нормальному закону,

закреплено специальное обозначение z.

Любое

нормальное распределение

можно преобразовать в стандартное через замену переменной

z

=(

x

-μ)/σ

. Этот процесс преобразования называется

стандартизацией

.


Примечание

: В MS EXCEL имеется функция

НОРМАЛИЗАЦИЯ()

, которая выполняет вышеуказанное преобразование. Хотя в MS EXCEL это преобразование называется почему-то

нормализацией

. Формулы

=(x-μ)/σ

и

=НОРМАЛИЗАЦИЯ(х;μ;σ)

вернут одинаковый результат.

В MS EXCEL 2010 для

стандартного нормального распределения

имеется специальная функция

НОРМ.СТ.РАСП()

и ее устаревший вариант

НОРМСТРАСП()

, выполняющий аналогичные вычисления.

Продемонстрируем, как в MS EXCEL осуществляется процесс стандартизации

нормального распределения

N

(1,5; 2).

Для этого вычислим вероятность, что случайная величина, распределенная по

нормальному закону

N(1,5; 2)

, меньше или равна 2,5. Формула выглядит так:

=НОРМ.РАСП(2,5; 1,5; 2; ИСТИНА)

=0,691462. Сделав замену переменной

z

=(2,5-1,5)/2=0,5

, запишем формулу для вычисления

Стандартного нормального распределения:

=НОРМ.СТ.РАСП(0,5; ИСТИНА)

=0,691462.

Естественно, обе формулы дают одинаковые результаты (см.

файл примера лист Пример

).

Обратите внимание, что

стандартизация

относится только к

интегральной функции распределения

(аргумент

интегральная

равен ИСТИНА), а не к

плотности вероятности

.


Примечание

: В литературе для функции, вычисляющей вероятности случайной величины, распределенной по

стандартному

нормальному закону,

закреплено специальное обозначение Ф(z). В MS EXCEL эта функция вычисляется по формуле

=НОРМ.СТ.РАСП(z;ИСТИНА)

. Вычисления производятся по формуле

В силу четности функции

плотности стандартного нормального

распределения f(x), а именно f(x)=f(-х), функция

стандартного нормального распределения

обладает свойством Ф(-x)=1-Ф(x).

Обратные функции

Функция

НОРМ.СТ.РАСП(x;ИСТИНА)

вычисляет вероятность P, что случайная величина Х примет значение меньше или равное х. Но часто требуется провести обратное вычисление: зная вероятность P, требуется вычислить значение х. Вычисленное значение х называется

квантилем

стандартного

нормального распределения

.

В MS EXCEL для вычисления

квантилей

используют функцию

НОРМ.СТ.ОБР()

и

НОРМ.ОБР()

.

Графики функций

В

файле примера

приведены

графики плотности распределения

вероятности и

интегральной функции распределения

.

Как известно, около 68% значений, выбранных из совокупности, имеющей

нормальное распределение

, находятся в пределах 1 стандартного отклонения (σ) от μ(среднего или математического ожидания); около 95% — в пределах 2-х σ, а в пределах 3-х σ находятся уже 99% значений. Убедиться в этом для

стандартного нормального распределения

можно записав формулу:

=

НОРМ.СТ.РАСП(1;ИСТИНА)-НОРМ.СТ.РАСП(-1;ИСТИНА)

которая вернет значение 68,2689% — именно такой процент значений находятся в пределах +/-1 стандартного отклонения от

среднего

(см.

лист График в файле примера

).

В силу четности функции

плотности стандартного нормального

распределения:

f

(

x

)=

f

(-х)

, функция

стандартного нормального распределения

обладает свойством F(-x)=1-F(x). Поэтому, вышеуказанную формулу можно упростить:

=

2*НОРМ.СТ.РАСП(1;ИСТИНА)-1

Для произвольной

функции нормального распределения

N(μ; σ) аналогичные вычисления нужно производить по формуле:

=2* НОРМ.РАСП(μ+1*σ;μ;σ;ИСТИНА)-1

Вышеуказанные расчеты вероятности требуются для

построения доверительных интервалов

.


Примечание

: Для построения

функции распределения

и

плотности вероятности

можно использовать диаграмму типа

График

или

Точечная

(со сглаженными линиями и без точек). Подробнее о построении

диаграмм

читайте статью

Основные типы диаграмм

.


Примечание

: Для удобства написания формул в

файле примера

созданы

Имена

для параметров распределения: μ и σ.

Генерация случайных чисел

С помощью надстройки

Пакет анализа

можно сгенерировать случайные числа, распределенные по

нормальному закону

.


СОВЕТ

: О надстройке

Пакет анализа

можно прочитать в статье

Надстройка Пакет анализа MS EXCEL

.

Сгенерируем 3 массива по 100 чисел с различными μ и σ. Для этого в окне

Генерация

случайных чисел

установим следующие значения для каждой пары параметров:


Примечание

: Если установить опцию

Случайное рассеивание

(

Random Seed

), то можно выбрать определенный случайный набор сгенерированных чисел. Например, установив эту опцию равной 25, можно сгенерировать на разных компьютерах одни и те же наборы случайных чисел (если, конечно, другие параметры распределения совпадают). Значение опции может принимать целые значения от 1 до 32 767. Название опции

Случайное рассеивание

может запутать. Лучше было бы ее перевести как

Номер набора со случайными числами

.

В итоге будем иметь 3 столбца чисел, на основании которых можно, оценить параметры распределения, из которого была произведена выборка: μ и σ

.

Оценку для μ можно сделать с использованием функции

СРЗНАЧ()

, а для σ – с использованием функции

СТАНДОТКЛОН.В()

, см.

файл примера лист Генерация

.


Примечание

: Для генерирования массива чисел, распределенных по

нормальному закону

, можно использовать формулу

=НОРМ.ОБР(СЛЧИС();μ;σ)

. Функция

СЛЧИС()

генерирует

непрерывное равномерное распределение

от 0 до 1, что как раз соответствует диапазону изменения вероятности (см.

файл примера лист Генерация

).

Задачи


Задача1

. Компания изготавливает нейлоновые нити со средней прочностью 41 МПа и стандартным отклонением 2 МПа. Потребитель хочет приобрести нити с прочностью не менее 36 МПа. Рассчитайте вероятность, что партии нити, изготовленные компанией для потребителя, будут соответствовать требованиям или превышать их.

Решение1

: =

1-НОРМ.РАСП(36;41;2;ИСТИНА)


Задача2

. Предприятие изготавливает трубы, средний внешний диаметр которых равен 20,20 мм, а стандартное отклонение равно 0,25мм. Согласно техническим условиям, трубы признаются годными, если диаметр находится в пределах 20,00+/- 0,40 мм. Какая доля изготовленных труб соответствует ТУ?

Решение2

: =

НОРМ.РАСП(20,00+0,40;20,20;0,25;ИСТИНА)- НОРМ.РАСП(20,00-0,40;20,20;0,25)

На рисунке ниже, выделена область значений диаметров, которая удовлетворяет требованиям спецификации.

Решение приведено в

файле примера лист Задачи

.


Задача3

. Предприятие изготавливает трубы, средний внешний диаметр которых равен 20,20 мм, а стандартное отклонение равно 0,25мм. Внешний диаметр не должен превышать определенное значение (предполагается, что нижняя граница не важна). Какую верхнюю границу в технических условиях необходимо установить, чтобы ей соответствовало 97,5% всех изготавливаемых изделий?

Решение3

: =

НОРМ.ОБР(0,975; 20,20; 0,25)

=20,6899 или =

НОРМ.СТ.ОБР(0,975)*0,25+20,2

(произведена «дестандартизация», см. выше)


Задача 4

. Нахождение параметров

нормального распределения

по значениям 2-х

квантилей

(или

процентилей

). Предположим, известно, что случайная величина имеет нормальное распределение, но не известны его параметры, а только 2-я

процентиля

(например, 0,5-

процентиль

, т.е. медиана и 0,95-я

процентиль

). Т.к. известна

медиана

, то мы знаем

среднее

, т.е. μ. Чтобы найти

стандартное отклонение

нужно использовать

Поиск решения

. Решение приведено в

файле примера лист Задачи

.


Примечание

: До MS EXCEL 2010 в EXCEL были функции

НОРМОБР()

и

НОРМСТОБР()

, которые эквивалентны

НОРМ.ОБР()

и

НОРМ.СТ.ОБР()

.

НОРМОБР()

и

НОРМСТОБР()

оставлены в MS EXCEL 2010 и выше только для совместимости.

Линейные комбинации нормально распределенных случайных величин

Известно, что линейная комбинация нормально распределённых случайных величин

x

(

i

)

с параметрами μ

(

i

)

и σ

(

i

)

также распределена нормально. Например, если случайная величина Y=x(1)+x(2), то Y будет иметь распределение с параметрами μ

(1)+ μ(2)

и

КОРЕНЬ(σ(1)^2+ σ(2)^2).

Убедимся в этом с помощью MS EXCEL.

С помощью надстройки

Пакет анализа

сгенерируем 2 массива по 100 чисел с различными μ и σ.

Теперь сформируем массив, каждый элемент которого является суммой 2-х значений, взятых из каждого массива.

С помощью функций

СРЗНАЧ()

и

СТАНДОТКЛОН.В()

вычислим

среднее

и

дисперсию

получившейся

выборки

и сравним их с расчетными.

Кроме того, построим

График проверки распределения на нормальность

(

Normal

Probability

Plot

), чтобы убедиться, что наш массив соответствует выборке из

нормального распределения

.

Прямая линия, аппроксимирующая полученный график, имеет уравнение y=ax+b. Наклон кривой (параметр а) может служить оценкой

стандартного отклонения

, а пересечение с осью y (параметр b) –

среднего

значения.

Для сравнения сгенерируем массив напрямую из распределения

N

(μ(1)+ μ(2); КОРЕНЬ(σ(1)^2+ σ(2)^2)

).

Как видно на рисунке ниже, обе аппроксимирующие кривые достаточно близки.

В качестве примера можно провести следующую задачу.


Задача

. Завод изготавливает болты и гайки, которые упаковываются в ящики парами. Пусть известно, что вес каждого из изделий является нормальной случайной величиной. Для болтов средний вес составляет 50г, стандартное отклонение 1,5г, а для гаек 20г и 1,2г. В ящик фасуется 100 пар болтов и гаек. Вычислить какой процент ящиков будет тяжелее 7,2 кг.

Решение

. Сначала переформулируем вопрос задачи: Вычислить какой процент пар болт-гайка будет тяжелее 7,2кг/100=72г. Учитывая, что вес пары представляет собой случайную величину = Вес(болта) + Вес(гайки) со средним весом (50+20)г, и

стандартным отклонением

=КОРЕНЬ(СУММКВ(1,5;1,2))

, запишем решение =

1-НОРМ.РАСП(72; 50+20; КОРЕНЬ(СУММКВ(1,5;1,2));ИСТИНА)

Ответ

: 15% (см.

файл примера лист Линейн.комбинация

)

Аппроксимация Биномиального распределения Нормальным распределением

Если параметры

Биномиального распределения

B(n;p) находятся в пределах 0,1<=p<=0,9 и n*p>10, то

Биномиальное распределение

можно аппроксимировать

Нормальным распределением

.

При значениях

λ

>15

,

Распределение Пуассона

хорошо аппроксимируется

Нормальным распределением

с параметрами: μ



, σ

2

=

λ

.

Подробнее о связи этих распределений, можно прочитать в статье

Взаимосвязь некоторых распределений друг с другом в MS EXCEL

. Там же приведены примеры аппроксимации, и пояснены условия, когда она возможна и с какой точностью.


СОВЕТ

: О других распределениях MS EXCEL можно прочитать в статье

Распределения случайной величины в MS EXCEL

.

Теперь в каждой ячейке шаг за шагом прибавляем полученное значение ширины кармана: сначала к минимальному значению нашего массива (п. 3), затем в следующей ячейке ниже — к полученной сумме и т.д. Так постепенно доходим до максимального значения. Вот мы и построили интервалы карманов в виде столбца значений. Интервалом считается следующий диапазон : (i-1; i] или iСкачать бесплатно видеокурc по Excel

как сделать график распределения в excel

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Поделиться ссылкой:

Так как я часто имею дело с большим количеством данных, у меня время от времени возникает необходимость генерировать массивы значений для проверки моделей в Excel. К примеру, если я хочу увидеть распределение веса продукта с определенным стандартным отклонением, потребуются некоторые усилия, чтобы привести результат работы формулы СЛУЧМЕЖДУ() в нормальный вид. Дело в том, что формула СЛУЧМЕЖДУ() выдает числа с единым распределением, т.е. любое число с одинаковой долей вероятности может оказаться как у нижней, так и у верхней границы запрашиваемого диапазона. Такое положение дел не соответствует действительности, так как вероятность возникновения продукта уменьшается по мере отклонения от целевого значения. Т.е. если я произвожу продукт весом 100 грамм, вероятность, что я произведу 97-ми или 103-граммовый продукт меньше, чем 100 грамм. Вес большей части произведенной продукции будет сосредоточен рядом с целевым значением. Такое распределение называется нормальным. Если построить график, где по оси Y отложить вес продукта, а по оси X – количество произведенного продукта, график будет иметь колоколообразный вид, где наивысшая точка будет соответствовать целевому значению.

Таким образом, чтобы привести массив, выданный формулой СЛУЧМЕЖДУ(), в нормальный вид, мне приходилось ручками исправлять пограничные значения на близкие к целевым. Такое положение дел меня, естественно, не устраивало, поэтому, покопавшись в интернете, открыл интересный способ создания массива данных с нормальным распределением. В сегодняшней статье описан способ генерации массива и построения графика с нормальным распределением.

Характеристики нормального распределения

Непрерывная случайная переменная, которая подчиняется нормальному распределению вероятностей, обладает некоторыми особыми свойствами. Предположим, что вся производимая продукция подчиняется нормальному распределению со средним значением 100 грамм и стандартным отклонением 3 грамма. Распределение вероятностей для такой случайной переменной представлено на рисунке.

Из этого рисунка мы можем сделать следующие наблюдения относительно нормального распределения — оно имеет форму колокола и симметрично относительно среднего значения.

Стандартное отклонение имеет немаловажную роль в форме изгиба. Если посмотреть на предыдущий рисунок, то можно заметить, что практически все измерения веса продукта попадают в интервал от 95 до 105 граммов. Давайте рассмотрим следующий рисунок, на котором представлено нормальное распределение с той же средней – 100 грамм, но со стандартным отклонением всего 1,5 грамма

Здесь вы видите, что измерения значительно плотней прилегают к среднему значению. Почти все производимые продукты попадают в интервал от 97 до 102 грамм.

Небольшое значение стандартного отклонения выражается в более «тощей и высокой кривой, плотно прижимающейся к среднему значению. Чем больше стандартное, тем «толще», ниже и растянутее получается кривая.

Создание массива с нормальным распределением

Итак, чтобы сгенерировать массив данных с нормальным распределением, нам понадобится функция НОРМ.ОБР() – это обратная функция от НОРМ.РАСП(), которая возвращает нормально распределенную переменную для заданной вероятности для определенного среднего значения и стандартного отклонения. Синтаксис формулы выглядит следующим образом:

=НОРМ.ОБР(вероятность; среднее_значение; стандартное_отклонение)

Другими словами, я прошу Excel посчитать, какая переменная будет находится в вероятностном промежутке от 0 до 1. И так как вероятность возникновения продукта с весом в 100 грамм максимальная и будет уменьшаться по мере отдаления от этого значения, то формула будет выдавать значения близких к 100 чаще, чем остальных.

Давайте попробуем разобрать на примере. Выстроим график распределения вероятностей от 0 до 1 с шагом 0,01 для среднего значения равным 100 и стандартным отклонением 1,5.

Как видим из графика точки максимально сконцентрированы у переменной 100 и вероятности 0,5.

Этот фокус мы используем для генерирования случайного массива данных с нормальным распределением. Формула будет выглядеть следующим образом:

=НОРМ.ОБР(СЛЧИС(); среднее_значение; стандартное_отклонение)

Создадим массив данных для нашего примера со средним значением 100 грамм и стандартным отклонением 1,5 грамма и протянем нашу формулу вниз.

Теперь, когда массив данных готов, мы можем выстроить график с нормальным распределением.

Построение графика нормального распределения

Прежде всего необходимо разбить наш массив на периоды. Для этого определяем минимальное и максимальное значение, размер каждого периода или шаг, с которым будет увеличиваться период.

Далее строим таблицу с категориями. Нижняя граница (B11) равняется округленному вниз ближайшему кратному числу. Остальные категории увеличиваются на значение шага. Формула в ячейке B12 и последующих будет выглядеть:

=ЕСЛИ(A12;B11+$B$6; «»)

В столбце X будет производится подсчет количества переменных в заданном промежутке. Для этого воспользуемся формулой ЧАСТОТА(), которая имеет два аргумента: массив данных и массив интервалов. Выглядеть формула будет следующим образом =ЧАСТОТА(Data!A1:A175;B11:B20). Также стоит отметить, что в таком варианте данная функция будет работать как формула массива, поэтому по окончании ввода необходимо нажать сочетание клавиш Ctrl+Shift+Enter.

Таким образом у нас получилась таблица с данными, с помощью которой мы сможем построить диаграмму с нормальным распределением. Воспользуемся диаграммой вида Гистограмма с группировкой, где по оси значений будет отложено количество переменных в данном промежутке, а по оси категорий – периоды.

Осталось отформатировать диаграмму и наш график с нормальным распределением готов.

Итак, мы познакомились с вами с нормальным распределением, узнали, что Excel позволяет генерировать массив данных с помощью формулы НОРМ.ОБР() для определенного среднего значения и стандартного отклонения и научились приводить данный массив в графический вид.

Для лучшего понимания, вы можете скачать файл с примером построения нормального распределения.

Построим диаграмму распределения в Excel. А также рассмотрим подробнее функции круговых диаграмм, их создание.

График нормального распределения имеет форму колокола и симметричен относительно среднего значения. Получить такое графическое изображение можно только при огромном количестве измерений. В Excel для конечного числа измерений принято строить гистограмму.

Внешне столбчатая диаграмма похожа на график нормального распределения. Построим столбчатую диаграмму распределения осадков в Excel и рассмотрим 2 способа ее построения.

Имеются следующие данные о количестве выпавших осадков:

Первый способ. Открываем меню инструмента «Анализ данных» на вкладке «Данные» (если у Вас не подключен данный аналитический инструмент, тогда читайте как его подключить в настройках Excel):

Выбираем «Гистограмма»:

Задаем входной интервал (столбец с числовыми значениями). Поле «Интервалы карманов» оставляем пустым: Excel сгенерирует автоматически. Ставим птичку около записи «Вывод графика»:

После нажатия ОК получаем такой график с таблицей:

В интервалах не очень много значений, поэтому столбики гистограммы получились низкими.

Теперь необходимо сделать так, чтобы по вертикальной оси отображались относительные частоты.

Найдем сумму всех абсолютных частот (с помощью функции СУММ). Сделаем дополнительный столбец «Относительная частота». В первую ячейку введем формулу:

Способ второй. Вернемся к таблице с исходными данными. Вычислим интервалы карманов. Сначала найдем максимальное значение в диапазоне температур и минимальное.

Чтобы найти интервал карманов, нужно разность максимального и минимального значений массива разделить на количество интервалов. Получим «ширину кармана».

Представим интервалы карманов в виде столбца значений. Сначала ширину кармана прибавляем к минимальному значению массива данных. В следующей ячейке – к полученной сумме. И так далее, пока не дойдем до максимального значения.

Для определения частоты делаем столбец рядом с интервалами карманов. Вводим функцию массива:

Вычислим относительные частоты (как в предыдущем способе).

Построим столбчатую диаграмму распределения осадков в Excel с помощью стандартного инструмента «Диаграммы».

Частота распределения заданных значений:

Круговые диаграммы для иллюстрации распределения

С помощью круговой диаграммы можно иллюстрировать данные, которые находятся в одном столбце или одной строке. Сегмент круга – это доля каждого элемента массива в сумме всех элементов.

С помощью любой круговой диаграммы можно показать распределение в том случае, если

  • имеется только один ряд данных;
  • все значения положительные;
  • практически все значения выше нуля;
  • не более семи категорий;
  • каждая категория соответствует сегменту круга.

На основании имеющихся данных о количестве осадков построим круговую диаграмму.

Доля «каждого месяца» в общем количестве осадков за год:

Круговая диаграмма распределения осадков по сезонам года лучше смотрится, если данных меньше. Найдем среднее количество осадков в каждом сезоне, используя функцию СРЗНАЧ. На основании полученных данных построим диаграмму:

Получили количество выпавших осадков в процентном выражении по сезонам.

В двух словах: Добавляем полосу прокрутки к гистограмме или к графику распределения частот, чтобы сделать её динамической или интерактивной.

Уровень сложности: продвинутый.

На следующем рисунке показано, как выглядит готовая динамическая гистограмма:

Что такое гистограмма или график распределения частот?

Гистограмма распределения разбивает по группам значения из набора данных и показывает количество (частоту) чисел в каждой группе. Такую гистограмму также называют графиком распределения частот, поскольку она показывает, с какой частотой представлены значения.

В нашем примере мы делим людей, которые вызвались принять участие в мероприятии, по возрастным группам. Первым делом, создадим возрастные группы, далее подсчитаем, сколько людей попадает в каждую из групп, и затем покажем все это на гистограмме.

На какие вопросы отвечает гистограмма распределения?

Гистограмма – это один из моих самых любимых типов диаграмм, поскольку она дает огромное количество информации о данных.

В данном случае мы хотим знать, как много участников окажется в возрастных группах 20-ти, 30-ти, 40-ка лет и так далее. Гистограмма наглядно покажет это, поэтому определить закономерности и отклонения будет довольно легко.

«Неужели наше мероприятие не интересно гражданам в возрасте от 20 до 29 лет?»

Возможно, мы захотим немного изменить детализацию картины и разбить население на две возрастные группы. Это покажет нам, что в мероприятии примут участие большей частью молодые люди:

Динамическая гистограмма

После построения гистограммы распределения частот иногда возникает необходимость изменить размер групп, чтобы ответить на различные возникающие вопросы. В динамической гистограмме это возможно сделать благодаря полосе прокрутки (слайдеру) под диаграммой. Пользователь может увеличивать или уменьшать размер групп, нажимая стрелки на полосе прокрутки.

Такой подход делает гистограмму интерактивной и позволяет пользователю масштабировать ее, выбирая, сколько групп должно быть показано. Это отличное дополнение к любому дашборду!

Как это работает?

Краткий ответ: Формулы, динамические именованные диапазоны, элемент управления «Полоса прокрутки» в сочетании с гистограммой.

Формулы

Чтобы всё работало, первым делом нужно при помощи формул вычислить размер группы и количество элементов в каждой группе.

Чтобы вычислить размер группы, разделим общее количество (80-10) на количество групп. Количество групп устанавливается настройками полосы прокрутки. Чуть позже разъясним это подробнее.

Далее при помощи функции ЧАСТОТА (FREQUENCY) я рассчитываю количество элементов в каждой группе в заданном столбце. В данном случае мы возвращаем частоту из столбца Age таблицы с именем tblData.

=ЧАСТОТА(tblData;C13:C22)
=FREQUENCY(tblData,C13:C22)

Функция ЧАСТОТА (FREQUENCY) вводится, как формула массива, нажатием Ctrl+Shift+Enter.

Динамический именованный диапазон

В качестве источника данных для диаграммы используется именованный диапазон, чтобы извлекать данные только из выбранных в текущий момент групп.

Когда пользователь перемещает ползунок полосы прокрутки, число строк в динамическом диапазоне изменяется так, чтобы отобразить на графике только нужные данные. В нашем примере задано два динамических именованных диапазона: один для данных — rngGroups (столбец Frequency) и второй для подписей горизонтальной оси — rngCount (столбец Bin Name).

Элемент управления «Полоса прокрутки»

Элемент управления Полоса прокрутки (Scroll Bar) может быть вставлен с вкладки Разработчик (Developer).

На рисунке ниже видно, как я настроил параметры элемента управления и привязал его к ячейке C7. Так, изменяя состояние полосы прокрутки, пользователь управляет формулами.

Гистограмма

График – это самая простая часть задачи. Создаём простую гистограмму и в качестве источника данных устанавливаем динамические именованные диапазоны.

Есть вопросы?

Что ж, это был лишь краткий обзор того, как работает динамическая гистограмма.

Да, это не самая простая диаграмма, но, полагаю, пользователям понравится с ней работать. Определённо, такой интерактивной диаграммой можно украсить любой отчёт.

Более простой вариант гистограммы можно создать, используя сводные таблицы.

Пишите в комментариях любые вопросы и предложения. Спасибо!

Урок подготовлен для Вас командой сайта office-guru.ru
Источник: /> Перевел: Антон Андронов

Правила перепечаткиЕще больше уроков по Microsoft Excel

Оцените качество статьи. Нам важно ваше мнение:

Так как я часто имею дело с большим количеством данных, у меня время от времени возникает необходимость генерировать массивы значений для проверки моделей в Excel. К примеру, если я хочу увидеть распределение веса продукта с определенным стандартным отклонением, потребуются некоторые усилия, чтобы привести результат работы формулы СЛУЧМЕЖДУ() в нормальный вид. Дело в том, что формула СЛУЧМЕЖДУ() выдает числа с единым распределением, т.е. любое число с одинаковой долей вероятности может оказаться как у нижней, так и у верхней границы запрашиваемого диапазона. Такое положение дел не соответствует действительности, так как вероятность возникновения продукта уменьшается по мере отклонения от целевого значения. Т.е. если я произвожу продукт весом 100 грамм, вероятность, что я произведу 97-ми или 103-граммовый продукт меньше, чем 100 грамм. Вес большей части произведенной продукции будет сосредоточен рядом с целевым значением. Такое распределение называется нормальным. Если построить график, где по оси Y отложить вес продукта, а по оси X — количество произведенного продукта, график будет иметь колоколообразный вид, где наивысшая точка будет соответствовать целевому значению.

Таким образом, чтобы привести массив, выданный формулой СЛУЧМЕЖДУ(), в нормальный вид, мне приходилось ручками исправлять пограничные значения на близкие к целевым. Такое положение дел меня, естественно, не устраивало, поэтому, покопавшись в интернете, открыл интересный способ создания массива данных с нормальным распределением. В сегодняшней статье описан способ генерации массива и построения графика с нормальным распределением.

Содержание

  • 1
    Характеристики нормального распределения
  • 2
    Создание массива с нормальным распределением
  • 3
    Построение графика нормального распределения
  • 4
    Вам также могут быть интересны следующие статьи


Характеристики нормального распределения

Непрерывная случайная переменная, которая подчиняется нормальному распределению вероятностей, обладает некоторыми особыми свойствами. Предположим, что вся производимая продукция подчиняется нормальному распределению со средним значением 100 грамм и стандартным отклонением 3 грамма. Распределение вероятностей для такой случайной переменной представлено на рисунке.

95-1-Нормальное распределение в Excel

Из этого рисунка мы можем сделать следующие наблюдения относительно нормального распределения — оно имеет форму колокола и симметрично относительно среднего значения.

Стандартное отклонение имеет немаловажную роль в форме изгиба. Если посмотреть на предыдущий рисунок, то можно заметить, что практически все измерения веса продукта попадают в интервал от 95 до 105 граммов. Давайте рассмотрим следующий рисунок, на котором представлено нормальное распределение с той же средней — 100 грамм, но со стандартным отклонением всего 1,5 грамма

95-2-Нормальное распределение в Excel

Здесь вы видите, что измерения значительно плотней прилегают к среднему значению. Почти все производимые продукты попадают в интервал от 97 до 102 грамм.

Небольшое значение стандартного отклонения выражается в более «тощей и высокой кривой, плотно прижимающейся к среднему значению. Чем больше стандартное, тем «толще», ниже и растянутее получается кривая.


Создание массива с нормальным распределением

Итак, чтобы сгенерировать массив данных с нормальным распределением, нам понадобится функция НОРМ.ОБР() — это обратная функция от НОРМ.РАСП(), которая возвращает нормально распределенную переменную для заданной вероятности для определенного среднего значения и стандартного отклонения. Синтаксис формулы выглядит следующим образом:

=НОРМ.ОБР(вероятность; среднее_значение; стандартное_отклонение)

Другими словами, я прошу Excel посчитать, какая переменная будет находится в вероятностном промежутке от 0 до 1. И так как вероятность возникновения продукта с весом в 100 грамм максимальная и будет уменьшаться по мере отдаления от этого значения, то формула будет выдавать значения близких к 100 чаще, чем остальных.

Давайте попробуем разобрать на примере. Выстроим график распределения вероятностей от 0 до 1 с шагом 0,01 для среднего значения равным 100 и стандартным отклонением 1,5.

95-3-демонстрация функции НОРМОБР

Как видим из графика точки максимально сконцентрированы у переменной 100 и вероятности 0,5.

Этот фокус мы используем для генерирования случайного массива данных с нормальным распределением. Формула будет выглядеть следующим образом:

=НОРМ.ОБР(СЛЧИС(); среднее_значение; стандартное_отклонение)

Создадим массив данных для нашего примера со средним значением 100 грамм и стандартным отклонением 1,5 грамма и протянем нашу формулу вниз.

95-4-массив данных с нормальным распределением

Теперь, когда массив данных готов, мы можем выстроить график с нормальным распределением.


Построение графика нормального распределения

Прежде всего необходимо разбить наш массив на периоды. Для этого определяем минимальное и максимальное значение, размер каждого периода или шаг, с которым будет увеличиваться период.

95-5-данные для нормального распределения

Далее строим таблицу с категориями. Нижняя граница (B11) равняется округленному вниз ближайшему кратному числу. Остальные категории увеличиваются на значение шага. Формула в ячейке B12 и последующих будет выглядеть:

=ЕСЛИ(A12;B11+$B$6; «»)

В столбце X будет производится подсчет количества переменных в заданном промежутке. Для этого воспользуемся формулой ЧАСТОТА(), которая имеет два аргумента: массив данных и массив интервалов. Выглядеть формула будет следующим образом =ЧАСТОТА(Data!A1:A175;B11:B20). Также стоит отметить, что в таком варианте данная функция будет работать как формула массива, поэтому по окончании ввода необходимо нажать сочетание клавиш Ctrl+Shift+Enter.

95-6-таблица для нормального распределения

Таким образом у нас получилась таблица с данными, с помощью которой мы сможем построить диаграмму с нормальным распределением. Воспользуемся диаграммой вида Гистограмма с группировкой, где по оси значений будет отложено количество переменных в данном промежутке, а по оси категорий — периоды.

95-7-график нормального распределения в excel

Осталось отформатировать диаграмму и наш график с нормальным распределением готов.

95-8-график с нормальным распределением

Итак, мы познакомились с вами с нормальным распределением, узнали, что Excel позволяет генерировать массив данных с помощью формулы НОРМ.ОБР() для определенного среднего значения и стандартного отклонения и научились приводить данный массив в графический вид.

Для лучшего понимания, вы можете скачать файл с примером построения нормального распределения.


Вам также могут быть интересны следующие статьи

Интервальный вариационный ряд и его характеристики

Интервальный вариационный ряд – это ряд распределения, в котором однородные группы составлены по признаку, меняющемуся непрерывно или принимающему слишком много значений.

Здесь k — число интервалов, на которые разбивается ряд.

Размах вариации – это длина интервала, в пределах которой изменяется исследуемый признак: $ F=x_-x_ $

Правило Стерджеса
Эмпирическое правило определения оптимального количества интервалов k, на которые следует разбить ряд из N чисел: $ k=1+lfloorlog_2 Nrfloor $ или, через десятичный логарифм: $ k=1+lfloor 3,322cdotlg Nrfloor $

Скобка (lfloor rfloor) означает целую часть (округление вниз до целого числа).

Скобка (lceil rceil) означает округление вверх, в данном случае не обязательно до целого числа.

Заметим, что поскольку шаг h находится с округлением вверх, последний узел (a_kgeq x_).

Интервальный вариационный ряд и его характеристики: построение, гистограмма, выборочная дисперсия и СКО

Небольшое значение стандартного отклонения выражается в более «тощей и высокой кривой, плотно прижимающейся к среднему значению. Чем больше стандартное, тем «толще», ниже и растянутее получается кривая.

специалист

Мнение эксперта

Витальева Анжела, консультант по работе с офисными программами

Со всеми вопросами обращайтесь ко мне!

Задать вопрос эксперту

Получили следующий набор данных 18,38,28,29,26,38,34,22,28,30,22,23,35,33,27,24,30,32,28,25,29,26,31,24,29,27,32,24,29,29 Постройте интервальный ряд и исследуйте его. Если же вам нужны дополнительные объяснения, обращайтесь ко мне!

Частота интервалов – число, показывающее сколько раз значения, относящиеся к каждому интервалу группировки, встречаются в выборке. Поделив эти числа на общее количество наблюдений (n), находят относительную частоту (частость) попадания случайной величины X в заданные интервалы.

Эмпирические распределения — Мегаобучалка

Существует также теоретическая функция распределения (функция распределения генеральной совокупности). Ее отличие от выборочной функции распределения состоит в определении объективной возможности или вероятности события X

Создание массива с нормальным распределением

Итак, чтобы сгенерировать массив данных с нормальным распределением, нам понадобится функция НОРМ.ОБР() – это обратная функция от НОРМ.РАСП(), которая возвращает нормально распределенную переменную для заданной вероятности для определенного среднего значения и стандартного отклонения. Синтаксис формулы выглядит следующим образом:

=НОРМ.ОБР(вероятность; среднее_значение; стандартное_отклонение)

Другими словами, я прошу Excel посчитать, какая переменная будет находится в вероятностном промежутке от 0 до 1. И так как вероятность возникновения продукта с весом в 100 грамм максимальная и будет уменьшаться по мере отдаления от этого значения, то формула будет выдавать значения близких к 100 чаще, чем остальных.

Давайте попробуем разобрать на примере. Выстроим график распределения вероятностей от 0 до 1 с шагом 0,01 для среднего значения равным 100 и стандартным отклонением 1,5.

95-3-демонстрация функции НОРМОБР

Как видим из графика точки максимально сконцентрированы у переменной 100 и вероятности 0,5.

Этот фокус мы используем для генерирования случайного массива данных с нормальным распределением. Формула будет выглядеть следующим образом:

=НОРМ.ОБР(СЛЧИС(); среднее_значение; стандартное_отклонение)

Создадим массив данных для нашего примера со средним значением 100 грамм и стандартным отклонением 1,5 грамма и протянем нашу формулу вниз.

95-4-массив данных с нормальным распределением

Теперь, когда массив данных готов, мы можем выстроить график с нормальным распределением.

специалист

Мнение эксперта

Витальева Анжела, консультант по работе с офисными программами

Со всеми вопросами обращайтесь ко мне!

Задать вопрос эксперту

Все несколько проще Данные- Анализ данных- Генерация случайных чисел Распределение Нормальное Данные- Анализ данных- Гистограмма- Галка на вывод графика Карманы можно даже не задавать. Если же вам нужны дополнительные объяснения, обращайтесь ко мне!

После того, как вы создали гистограмму, вам может потребоваться внести корректировки в то, как выглядит ваш график. Для изменения дизайна и стиля используйте вкладку “Конструктор”. Эта вкладка отображается на Панели инструментов, когда вы выделяете левой клавишей мыши гистограмму. С помощью дополнительных настроек в разделе “Конструктор” вы сможете:

8. Постройте диаграмму относительных и накопленных частот. Щелчком указателя мыши по кнопке Анализ данных вкладки Данные вызовите Пакет анализа, выберите в нем опцию Гистограмма и постройте график абсолютных и накопленных частот. После редактирования диаграмма будет иметь такой вид, как на рис. 2.

Как сменить строки и столбцы в гистограмме

Для того чтобы сменить порядок строк и столбцов в гистограмме проделайте следующие шаги:

Построить Эмпирическую Функцию Распределения в Excel • Определение править

Построить Эмпирическую Функцию Распределения в Excel • Определение править

специалист

Мнение эксперта

Витальева Анжела, консультант по работе с офисными программами

Со всеми вопросами обращайтесь ко мне!

Задать вопрос эксперту

Построить эмпирическое распределение веса студентов в килограммах для следующей выборки 64, 57, 63, 62, 58, 61, 63, 70, 60, 61, 65, 62, 62, 40, 64, 61, 59, 59, 63, 61. Если же вам нужны дополнительные объяснения, обращайтесь ко мне!

8. Постройте диаграмму относительных и накопленных частот. Щелчком указателя мыши по кнопке Анализ данных вкладки Данные вызовите Пакет анализа, выберите в нем опцию Гистограмма и постройте график абсолютных и накопленных частот. После редактирования диаграмма будет иметь такой вид, как на рис. 2.
Построить Эмпирическую Функцию Распределения в Excel • Определение править

Эмпирическая функция распределения

  • автоматически рассчитаны интервалы значений (карманы);
  • подсчитано количество значений из указанного массива данных, попадающих в каждый интервал (построена таблица частот);
  • если поставлена галочка напротив пункта Вывод графика , то вместе с таблицей частот будет выведена гистограмма.

Размеры карманов одинаковы и равны 103,428571428571. Это значение можно получить так: =(МАКС( Исходные_данные )-МИН( Исходные_данные ))/7 где Исходные_данные – именованный диапазон , содержащий наши данные.

Как построить график

Построение графика эмпирической функции распределения возможно после вычисления ее значений на всей числовой оси. Для рассмотренного примера схематическое изображение будет выглядеть так:

График

Эмпирическая функция распределения

Гистограмма распределения – это инструмент, позволяющий визуально оценить величину и характер разброса данных. Создадим гистограмму для непрерывной случайной величины с помощью встроенных средств MS EXCEL из надстройки Пакет анализа и в ручную с помощью функции ЧАСТОТА() и диаграммы.

специалист

Мнение эксперта

Витальева Анжела, консультант по работе с офисными программами

Со всеми вопросами обращайтесь ко мне!

Задать вопрос эксперту

И так как вероятность возникновения продукта с весом в 100 грамм максимальная и будет уменьшаться по мере отдаления от этого значения, то формула будет выдавать значения близких к 100 чаще, чем остальных. Если же вам нужны дополнительные объяснения, обращайтесь ко мне!

Другими словами, я прошу Excel посчитать, какая переменная будет находится в вероятностном промежутке от 0 до 1. И так как вероятность возникновения продукта с весом в 100 грамм максимальная и будет уменьшаться по мере отдаления от этого значения, то формула будет выдавать значения близких к 100 чаще, чем остальных.

Характеристики нормального распределения

  1. Значения рассматриваемой функции F * (x) располагаются на отрезке [0; 1].
  2. Функция имеет неубывающий характер.
  3. При минимальной варианте x1 верно равенство F * (x)=0 при условии, что х1. При максимальной варианте хkверно равенство F * (x)=1 при условии х>xk.

Если выбор количества интервалов или их диапазонов не устраивает, то можно в диалоговом окне указать нужный массив интервалов (если интервал карманов включает текстовый заголовок, то нужно установить галочку напротив поля Метка ).

Блог о программе Microsoft Excel: приемы, хитрости, секреты, трюки

Как построить график с нормальным распределением в Excel

Так как я часто имею дело с большим количеством данных, у меня время от времени возникает необходимость генерировать массивы значений для проверки моделей в Excel. К примеру, если я хочу увидеть распределение веса продукта с определенным стандартным отклонением, потребуются некоторые усилия, чтобы привести результат работы формулы СЛУЧМЕЖДУ() в нормальный вид. Дело в том, что формула СЛУЧМЕЖДУ() выдает числа с единым распределением, т.е. любое число с одинаковой долей вероятности может оказаться как у нижней, так и у верхней границы запрашиваемого диапазона. Такое положение дел не соответствует действительности, так как вероятность возникновения продукта уменьшается по мере отклонения от целевого значения. Т.е. если я произвожу продукт весом 100 грамм, вероятность, что я произведу 97-ми или 103-граммовый продукт меньше, чем 100 грамм. Вес большей части произведенной продукции будет сосредоточен рядом с целевым значением. Такое распределение называется нормальным. Если построить график, где по оси Y отложить вес продукта, а по оси X – количество произведенного продукта, график будет иметь колоколообразный вид, где наивысшая точка будет соответствовать целевому значению.

Таким образом, чтобы привести массив, выданный формулой СЛУЧМЕЖДУ(), в нормальный вид, мне приходилось ручками исправлять пограничные значения на близкие к целевым. Такое положение дел меня, естественно, не устраивало, поэтому, покопавшись в интернете, открыл интересный способ создания массива данных с нормальным распределением. В сегодняшней статье описан способ генерации массива и построения графика с нормальным распределением.

Характеристики нормального распределения

Непрерывная случайная переменная, которая подчиняется нормальному распределению вероятностей, обладает некоторыми особыми свойствами. Предположим, что вся производимая продукция подчиняется нормальному распределению со средним значением 100 грамм и стандартным отклонением 3 грамма. Распределение вероятностей для такой случайной переменной представлено на рисунке.

Из этого рисунка мы можем сделать следующие наблюдения относительно нормального распределения — оно имеет форму колокола и симметрично относительно среднего значения.

Стандартное отклонение имеет немаловажную роль в форме изгиба. Если посмотреть на предыдущий рисунок, то можно заметить, что практически все измерения веса продукта попадают в интервал от 95 до 105 граммов. Давайте рассмотрим следующий рисунок, на котором представлено нормальное распределение с той же средней – 100 грамм, но со стандартным отклонением всего 1,5 грамма

Здесь вы видите, что измерения значительно плотней прилегают к среднему значению. Почти все производимые продукты попадают в интервал от 97 до 102 грамм.

Небольшое значение стандартного отклонения выражается в более «тощей и высокой кривой, плотно прижимающейся к среднему значению. Чем больше стандартное, тем «толще», ниже и растянутее получается кривая.

Создание массива с нормальным распределением

Итак, чтобы сгенерировать массив данных с нормальным распределением, нам понадобится функция НОРМ.ОБР() – это обратная функция от НОРМ.РАСП(), которая возвращает нормально распределенную переменную для заданной вероятности для определенного среднего значения и стандартного отклонения. Синтаксис формулы выглядит следующим образом:

=НОРМ.ОБР(вероятность; среднее_значение; стандартное_отклонение)

Другими словами, я прошу Excel посчитать, какая переменная будет находится в вероятностном промежутке от 0 до 1. И так как вероятность возникновения продукта с весом в 100 грамм максимальная и будет уменьшаться по мере отдаления от этого значения, то формула будет выдавать значения близких к 100 чаще, чем остальных.

Давайте попробуем разобрать на примере. Выстроим график распределения вероятностей от 0 до 1 с шагом 0,01 для среднего значения равным 100 и стандартным отклонением 1,5.

Как видим из графика точки максимально сконцентрированы у переменной 100 и вероятности 0,5.

Этот фокус мы используем для генерирования случайного массива данных с нормальным распределением. Формула будет выглядеть следующим образом:

=НОРМ.ОБР(СЛЧИС(); среднее_значение; стандартное_отклонение)

Создадим массив данных для нашего примера со средним значением 100 грамм и стандартным отклонением 1,5 грамма и протянем нашу формулу вниз.

Теперь, когда массив данных готов, мы можем выстроить график с нормальным распределением.

Построение графика нормального распределения

Прежде всего необходимо разбить наш массив на периоды. Для этого определяем минимальное и максимальное значение, размер каждого периода или шаг, с которым будет увеличиваться период.

Далее строим таблицу с категориями. Нижняя граница (B11) равняется округленному вниз ближайшему кратному числу. Остальные категории увеличиваются на значение шага. Формула в ячейке B12 и последующих будет выглядеть:

В столбце X будет производится подсчет количества переменных в заданном промежутке. Для этого воспользуемся формулой ЧАСТОТА(), которая имеет два аргумента: массив данных и массив интервалов. Выглядеть формула будет следующим образом =ЧАСТОТА(Data!A1:A175;B11:B20). Также стоит отметить, что в таком варианте данная функция будет работать как формула массива, поэтому по окончании ввода необходимо нажать сочетание клавиш Ctrl+Shift+Enter.

Таким образом у нас получилась таблица с данными, с помощью которой мы сможем построить диаграмму с нормальным распределением. Воспользуемся диаграммой вида Гистограмма с группировкой, где по оси значений будет отложено количество переменных в данном промежутке, а по оси категорий – периоды.

Осталось отформатировать диаграмму и наш график с нормальным распределением готов.

Итак, мы познакомились с вами с нормальным распределением, узнали, что Excel позволяет генерировать массив данных с помощью формулы НОРМ.ОБР() для определенного среднего значения и стандартного отклонения и научились приводить данный массив в графический вид.

Вам также могут быть интересны следующие статьи

12 комментариев

Ренат, добрый день.
Все несколько проще:
Данные->Анализ данных->Генерация случайных чисел (Распределение=Нормальное)
+
Данные->Анализ данных->Гистограмма->Галка на «вывод графика» («Карманы» можно даже не задавать)

Диаграмма нормального распределения (Гаусса) в Excel

Требуется построить диаграмму стандартного нормального распределения Гаусса (стандартное нормальное распределение имеет М = 0 и = 1), используя функцию НОРМСТРАСП.

1. В ячейку A3 введем символ х, а в ячейку ВЗ — символ функции плотности вероятности f(x).

2. Вычислим нижнюю М — За границу диапазона значений х, для чего установим курсор в ячейку С2 и введем формулу =0-3*1, а также верхнюю границу — в ячейку Е2 введем формулу =0+3*1.

3. Скопируем формулу из ячейки С2 в ячейку А4, полученное в ячейке А4 значение нижней границы будет началом последовательности арифметической прогрессии.

4. Создадим последовательность значений х в требуемом диапазоне, для чего установим курсор в ячейку А4 и выполним команду меню Правка/Заполнить/Прогрессия.

5. В открывшемся окне диалога Прогрессия установим переключатели арифметическая, по столбцам, в поле Шаг введем значение 0,5, а в поле Предельное значение — число, равное верхней границе диапазона.

Функция НОРМРАСПР в EXCEL

6. Щелкнем на кнопке ОК. В диапазоне А4:А16 будет сформирована последовательность значений х.

7. Установим курсор в ячейку В4 и выполним команду меню Вставка/Функция. В открывшемся окне Мастер функций выберем категорию Статистические, а в списке функций — НОРМРАСП.

8. Установим значения параметров функции НОРМРАСП: для параметра х установим ссылку на ячейку А4, для параметра Среднее — введем число 0, для параметра Стандартное_откл — число 1, для параметра Интегральное — число 0 (весовая).

Диаграмма нормального интегрального распределения в EXCEL

9. Используя маркер буксировки, скопируем полученную формулу в диапазон ячеек В5:В16.

10. Выделим диапазон полученных табличных значений функции f(х) (ВЗ:В16) и выполним команду меню Вставка/Диаграмма. В окне Мастер диаграмм во вкладке Стандартные выберем График, а в поле Вид — вид графика, щелкнем на кнопке Далее.

11. В окне Мастер диаграмм (шаг 2) выберем закладку Ряд. В поле Подписи оси х укажем ссылку на диапазон, содержащий значения х (А4:А16). Щелкнем на кнопке Далее.
В окне Мастер диаграмм (шаг 3) введем подписи: Название диаграммы, Ось х, Ось у. Щелкнем на кнопке Готово. На рабочий лист будет выведена диаграмма плотности вероятности .

НОРМРАСП (функция НОРМРАСП)

Возвращает нормальную функцию распределения для указанного среднего и стандартного отклонения. Эта функция очень широко применяется в статистике, в том числе при проверке гипотез.

Важно: Эта функция была заменена одной или несколькими новыми функциями, которые обеспечивают более высокую точность и имеют имена, лучше отражающие их назначение. Хотя эта функция все еще используется для обеспечения обратной совместимости, она может стать недоступной в последующих версиях Excel, поэтому мы рекомендуем использовать новые функции.

Дополнительные сведения о новом варианте этой функции см. в статье Функция НОРМ.РАСП.

Аргументы функции НОРМРАСП описаны ниже.

x Обязательный. Значение, для которого строится распределение.

Среднее Обязательный. Среднее арифметическое распределения.

Стандартное_откл Обязательный. Стандартное отклонение распределения.

Интегральная Обязательный. Логическое значение, определяющее форму функции. Если аргумент «интегральная» имеет значение ИСТИНА, функция НОРМРАСП возвращает интегральную функцию распределения; если этот аргумент имеет значение ЛОЖЬ, возвращается весовая функция распределения.

Если аргумент «среднее» или «стандартное_откл» не является числом, функция НОРМРАСП возвращает значение ошибки #ЗНАЧ!.

Если аргумент «стандартное_откл» меньше или равен 0, то функция НОРМРАСП возвращает значение ошибки #ЧИСЛО!.

Если среднее = 0, стандартное_откл = 1 и интегральная = ИСТИНА, то функция НОРМРАСП возвращает стандартное нормальное распределение, т. е. НОРМСТРАСП.

Уравнение для плотности нормального распределения (аргумент «интегральная» содержит значение ЛОЖЬ) имеет следующий вид:

Если аргумент «интегральная» имеет значение ИСТИНА, формула описывает интеграл с пределами от минус бесконечности до x.

Скопируйте образец данных из следующей таблицы и вставьте их в ячейку A1 нового листа Excel. Чтобы отобразить результаты формул, выделите их и нажмите клавишу F2, а затем — клавишу ВВОД. При необходимости измените ширину столбцов, чтобы видеть все данные.

Нормальное распределение. Построение графика в Excel. Концепция шести сигм

Наверное, не все знают, что в Excel есть встроенная функция для построения нормального распределения. Графики нормального распределения часто используются для демонстрации идей статистической обработки данных.

Функция НОРМРАСП имеет следующий синтаксис:

НОРМРАСП (Х; среднее; стандартное_откл; интегральная)

Х — аргумент функции; фактически НОРМРАСП можно трактовать как y=f(x); при этом функция возвращает вероятность реализации события Х

Среднее (µ) — среднее арифметическое распределения; чем дальше Х от среднего, тем ниже вероятность реализации такого события

Стандартное_откл (σ) — стандартное отклонение распределения; мера кучности; чем меньше σ, тем выше вероятность у тех Х, которые расположены ближе к среднему

Интегральная — логическое значение, определяющее форму функции. Если «интегральная» имеет значение ИСТИНА, функция НОРМРАСП возвращает интегральную функцию распределения, тот есть суммарную вероятность всех событий для аргументов от -∞ до Х; если «интегральная» имеет значение ЛОЖЬ, возвращается вероятность реализации события Х, точнее говоря, вероятность событий находящихся в некотором диапазоне вокруг Х

Например, для µ=0 имеем:

Скачать заметку в формате Word, пример в формате Excel

Здесь по оси абсцисс единица измерения – σ, или (что то же самое), можно сказать, что график построен для σ = 1. То есть, «-2» на графике означает -2σ. По оси ординат шкала убрана умышленно, так как она лишена смысла. Точнее говоря, высота кривой зависит от плотности точек на оси абсцисс, по которым мы строим график. Например, если на интервал от 0 до 1σ приходится 10 точек, то высота в максимуме составит 4%, а если 20 точек – 2%. Здесь проценты означают вероятность попадания случайной величины в узкий диапазон окрестности точки на оси абсцисс. Зато имеет смысл площадь под кривой на определенном интервале. И эта площадь не зависит от плотности точек. Так, например, площадь под кривой на интервале от 0 до 1σ составляет 34,13%. Это значение можно интерпретировать следующим образом: с вероятностью 68,26% случайная величина Х попадет в диапазон µ ± σ.

Теперь, наверное, вам будет лучше понятен смысл выражения «качество шести сигм». Оно означает, что производство налажено таким образом, что случайная величина Х (например, диаметр вала) находясь в диапазон µ ± 6σ, всё еще удовлетворяет техническим условиям (допускам). Это достигается за счет значительного уменьшения сигмы, то есть случайная величина Х очень близка к нормативному значению µ. На графике ниже представлено три ситуации, когда границы допуска остаются неизменными, а благодаря повышению качества (уменьшению вариабельности, сужению сигма) доля брака сокращается:

На первом рисунке только 1,5σ попадают в границы допуска, то есть только 86,6% деталей являются годными. На втором рисунке уже 3σ попадают в границы допуска, то есть 99,75% являются годными. Но всё еще 25 деталей из каждых 10 000 произведенных являются браком. На третьем рисунке целых 6σ попадают в границы допуска, то есть в брак попадут только две детали на миллиард изготовленных!

Вообще-то говоря, измерение качества в терминах сигм использует не совсем нормальное распределение. Вот что пишет на эту тему Википедия:

Опыт показывает, что показатели процессов имеют тенденцию изменяться с течением времени. В результате со временем в промежуток между границами поля допуска будет входить меньше, чем было установлено первоначально. Опытным путём было установлено, что изменение параметров во времени можно учесть с помощью смещения в 1,5 сигма. Другими словами, с течением времени длина промежутка между границами поля допуска под кривой нормального распределения уменьшается до 4,5 сигма вследствие того, что среднее процесса с течением времени смещается и/или среднеквадратическое отклонение увеличивается.

Широко распространённое представление о «процессе шесть сигма» заключается в том, что такой процесс позволяет получить уровень качества 3,4 дефектных единиц на миллион готовых изделий при условии, что длина под кривой слева или справа от среднего будет соответствовать 4,5 сигма (без учёта левого или правого конца кривой за границей поля допуска). Таким образом, уровень качества 3,4 дефектных единиц на миллион готовых изделий соответствует длине промежутка 4,5 сигма, получаемых разницей между 6 сигма и сдвигом в 1,5 сигма, которое было введено, чтобы учесть изменение показателей с течением времени. Такая поправка создана для того, чтобы предупредить неправильною оценку уровня дефектности, встречающееся в реальных условиях.

С моей точки зрения, не вполне внятное объяснение. Тем не менее, во всем мире принята следующая таблица соответствия числа дефектов и уровня качества в сигмах:

НОРМСТРАСП функция стандартного нормального распределения в Excel

Функция НОРМСТРАСП в Excel используется для нахождения значения статистической функции стандартного нормального распределения. Рассмотрим примеры использования данной функции и самостоятельно составим таблицу нормального закона.

Алгоритм функции нормального стандартного распределения чисел в Excel

В новых версиях Microsoft Office была введена более универсальная функция =НОРМ.СТ.РАСП(), содержащая дополнительный аргумент, который принимает два возможных значения:

  • ИСТИНА – для получения интегральной функции распределения;
  • ЛОЖЬ – для получения весовой функции распределения.

Стандартное нормальное распределение (СНР) – специальная форма распределения, используемая в качестве эталона для оценки данных любого вида. Данный тип распределения по причине неудобства использования формулы общего нормального распределения на практике.

Главные особенности функции:

  1. Площадь участка, ограниченного кривой и осью абсцисс принята за 1.
  2. Стандартное отклонение считается равным 1.
  3. Среднее арифметическое значение принято равным 0.
  4. В функцию f(x) общего теоретического нормального распределения введена переменная z (стандартная нормальная).

Переменная z рассчитывается по формуле:

  • X – значение некоторой случайной величины;
  • µ — среднее значение;
  • ó — значение стандартного отклонения.

Смысл переменной z – число стандартных отклонений, на которые отличается значение случайной величины от среднего значения.

Функция НОРМСТРАСП возвращает результат, рассчитанный на основе следующей формулы:

Именно так и выглядит алгоритм вычисления функции НОРМСТРАСП в Excel

Таблица стандартного нормального распределения в Excel

Пример 1. Найти стандартные нормальные распределения для числовых данных, указанных в таблице.

Вид таблицы данных:

Для расчетов используем следующую формулу:

  • A2:A11 – диапазон ячеек, содержащих значения переменной z.

С принципом действия функции мы ознакомились. Теперь ничто нам не мешает составить свою таблицу стандартного распределения в Excel. Для этого построим шаблон таблицы нормального закона и заполним ее ячейки формулой со смешанными ссылками:

Таким образом мы самостоятельно составили таблицу стандартного нормального распределения в Excel.

Расчет вероятности стандартным нормальным распределением в Excel

Пример 2. На заводе изготавливают лампочки. Средний период бесперебойной работы каждой лампы составляет 1000 ч. Стандартное отклонение от срока службы составляет 50 ч. Определить вероятность для каждого из указанных случаев:

  1. Купленная лампа будет работать не более 1200 ч.
  2. Срок службы составит менее 800 ч.
  3. Количество ламп в партии из 500 шт., которые проработают от 900 до 1100 часов.

Вид таблицы данных:

Для расчета вероятности срока службы менее 1200 ч используем следующую формулу:

(1200-B2)/B3 – выражение для расчета переменной z.

В результате вычислений получим следующее значение вероятности:

Аналогично рассчитаем вероятность того, что срок службы составит менее 800 часов:

Результат вычислений (получена слишком маленькая вероятность, поэтому для наглядности был установлен формат Проценты):

Нормальное распределение является симметричным относительно оси ординат, поэтому функция НОРМСТРАСП может вычислить значение даже для отрицательного z.

Для определения числа ламп, которые проработают 900-1100 часов, используем формулу:

То есть, была вычислена разность вероятностей двух событий: есть лампы, которые проработают менее 1100 часов, а также лампы, которые проработают менее 900 часов. Результат произведения полученной вероятности и общего числа ламп в партии является искомым значением.

Описание параметров функции НОРМСТРАСП в Excel

Функция НОРМСТРАСП имеет следующую синтаксическую запись:

  • z – единственный аргумент, обязательный для заполнения, принимающий числовое значение стандартной нормальной переменной.
  1. В качестве аргумента z может быть передано числовое значение, преобразуемый в число текст, логическое значение (например, результат выполнения функции =НОРМСТРАСП(ИСТИНА) будет число 0,841, поскольку данная функция выполняет промежуточное преобразование логического ИСТИНА в число 1), ссылка на ячейку с числовыми данными.
  2. Если функция НОРМСТРАСП получила в качестве аргумента текст, не преобразуемый в числовые данные, она вернет код ошибки #ЗНАЧ!.

Рассмотренные в лабораторной работе 2 распределения вероятностей СВ
опираются на знание закона распределения СВ. Для практических задач такое
знание – редкость. Здесь закон распределения обычно неизвестен, или известен с
точностью до некоторых неиз­вестных параметров. В частности, невозможно
рассчитать точное значение соот­ветствующих вероятностей, так как нельзя
определить количество общих и благо­приятных исходов. Поэтому вводится статистическое
определение вероятности
. По этому определению вероятность равна отношению
числа испытаний, в ко­торых событие произошло, к общему числу произведенных
испытаний. Такая вероятность называется статистической частотой.

Связь
между эмпирической функцией распределения и функцией распределения
(теоретической функцией распределения) такая же, как связь между частотой со­бытия
и его вероятностью.

Для
построения выборочной функции распределения весь диапазон изменения случайной
величины
X (выборки)
разбивают на ряд интервалов (карманов) одинаковой ширины. Число интервалов
обычно выбирают не менее 3 и не более 15. Затем определяют число значений
случайной величины
X, попавших
в каждый интервал (абсолютная частота, частота интервалов). 

Частота интервалов – число, показывающее сколько раз значения,
относящиеся к каждому интервалу группировки, встречаются в выборке. Поделив эти
чис­ла на общее количество наблюдений (
n), находят относительную частоту (частость) попадания
случайной величины
X в заданные
интервалы.

По
найденным относительным час­тотам строят гистограммы выборочных функций
распределения. Гистограмма распределения частот – это графическое
представление выборки, где по оси абсцисс (ОХ) отложены величины интервалов, а
по оси ординат (ОУ) – величины частот, попадающих в данный классовый интервал.
При увеличении до бесконечности размера выборки выборочные функции
распределения превращаются в теоретические: гистограмма превращается в график
плотности распределения.

Накопленная частота интервалов – это число, полученное
последовательным суммированием частот в направлении от первого интервала к
последнему, до того  интервала
включительно, для которого определяется накопленная частота.

В Excel для построения выборочных функций распределения
используются спе­
циальная функция ЧАСТОТА
и процедура Гистограмма из пакета анализа.

Функция ЧАСТОТА (массив_данных,
двоичный_массив)
вычисляет частоты появления случайной величины в интер­
валах
значений и выводит их как массив цифр, где

     
массив_данных
это массив или ссылка на
множество данных, для которых
вычисляются частоты;

     
двоичный_массив
это массив интервалов, по
ко­
торым группируются значения выборки.

Процедура
Гистограмма из Пакета анализа
выводит
результаты выборочного распределения в виде таблицы и графика.
Параметры диалогового окна Гистограмма:

     
Входной диапазон — диапазон исследуемых данных
(выборка);

     
Интервал карманов — диа­пазон ячеек или набор граничных
значений, определяющих выбранные интервалы (карманы). Эти значения должны быть
введены в воз­растающем порядке.
Если
диапазон карманов не был введен, то набор интерва­
лов, равномерно распределенных между минимальным и
максимальным зна­
чениями данных, будет создан
автоматически.

     
выходной диапазон предназначен для ввода ссылки на левую верхнюю ячейку выходного диапазона.

     
переключатель
Интегральный процент позволяет установить режим включения в
гистограмму гра­
фика интегральных
процентов.

     
переключатель
Вывод графика позволяет установить режим автоматическо­
го создания встроенной диаграммы на листе, содержащем
выходной диапа­
зон.

Пример 1. Построить эмпирическое распределение веса
студентов в килограм­
мах для следующей
выборки: 64, 57, 63, 62, 58, 61, 63, 70, 60, 61, 65, 62, 62, 40, 64, 61,
59, 59, 63, 61.

Решение

1.  В ячейку А1 введите слово Наблюдения,
а в диапазон А2:А21 — значения веса
студентов (см. рис. 1).

2.        
В
ячейку В1 введите названия интервалов Вес, кг. В диапазон В2:В8 введите
граничные значения ин­
тервалов (40, 45,
50, 55, 60, 65, 70).

3.        
Введите
заголовки создаваемой таблицы: в ячейки С1 — Абсолютные час­
тоты, в ячейки D1 — Относительные
частоты,
в ячейки
E1 — Накоплен­ные частоты.(см. рис. 1).

4.        
С
помощью функции Частота заполните столбец абсолютных частот, для этого
выделите блок ячеек С2:С8.
С
па­
нели инструментов Стандартная
вызовите Мастер функций (кнопка
fx). В появив­шемся диалоговом окне
выберите категорию Статистические и
функцию
ЧАСТОТА, после чего нажмите кнопку ОК.
Указателем мыши в рабочее поле Массив_данных
введите диапазон данных наблюдений (А2:А8). В рабочее поле Двоич
ный_массив
мышью введите диапазон интервалов (В2:В8). Слева на клавиатуре последовательно
нажмите комбинацию клавиш Ctrl+Shift+Enter. В столбце C должен появиться мас­сив абсолютных частот (см. рис.1).

5.        
В
ячейке
C9 найдите общее количество
наблюдений. Активизируйте ячейку С9, н
а
панели инструментов Стандартная нажмите кнопку Ав­
тосумма.
Убедитесь, что диапазон суммирования указан правильно
и нажмите клавишу Enter.

6.        
Заполните столбец относительных частот. В ячейку введите формулу
для
вычисления относительной частоты: =C2/$C$9.
Нажмите клавишу Enter. Протягиванием (за правый
нижний угол при нажатой левой кнопке мыши) скопи
руйте введенную формулу в диапазон и получите массив относительных частот.

7.        
Заполните
столбец накопленных частот. В ячейку
D2 скопируйте значение от­носительной
частоты из ячейки
E2. В ячейку D3 введите формулу: =E2+D3. Нажмите клавишу Enter. Протягиванием (за правый нижний угол при нажатой левой кнопке мыши) скопируйте введенную формулу
в диапазон
D3:D8. Получим массив накопленных
частот.

                     Рис. 1. Результат вычислений из
примера 1

8.   
Постройте диаграмму относительных и накопленных частот. Щелчком ука­зателя
мыши по кнопке на панели инструментов вызовите Мастер диаграмм.
В появившемся диалоговом окне выберите закладку Нестандартные
и тип диаг­раммы График/гистограмма.
После 
редактирования диаграмма будет иметь такой вид, как на
рис. 2.

Рис. 2
Диаграмма относительных и накопленных частот из примера 1

Задания для самостоятельной работы

1. Для данных из примера 1 построить выборочные функции распределения, воспользовавшись процедурой Гистограмма из пакета Анализа.

2.  Построить выборочные функции распределения
(относительные и накоплен
ные частоты) для роста
в см. 20 студентов: 181, 169, 178, 178, 171, 179,
172, 181, 179, 168, 174, 167, 169, 171, 179, 181, 181,
183, 172, 176.

3. Найдите распределение по абсолютным частотам для
следующих результатов
тестирования в
баллах: 79, 85, 78, 85, 83, 81, 95, 88, 97, 85 (используйте границы
интервалов 70, 80, 90).

4. Рассмотрим любой из критериев оценки качеств педагога-профессионала,
например, «успешное решение задач обучения и воспитания». Ответ на этот вопрос
анкеты типа «да», «нет» достаточно груб. Чтобы уменьшить относительную ошибку
такого измерения, необходимо увеличить число возможных ответов на конкретный
критериальный вопрос. В табл. 1 представлены возможные варианты ответов.

Обозначим 
этот параметр через х. Тогда в процессе ответа на вопрос величина х
примет дискретное значение х, принадлежащее определенному интервалу значений.
Поставим в соответствие каждому из ответов определенное числовое значение
параметра х (см. табл. 1).

Табл. 1 Критериальный вопрос: успешное решение задач обучения и воспитания

№ п/п

Варианты ответов

Х

1

Абсолютно неуспешно

0,1

2

Неуспешно

0,2

3

Успешно в очень
малой степени

0,3

4

В определенной
степени успешно, но еще много недостатков

0,4

5

В среднем успешно,
но недостатки имеются

0,5

6

Успешно с
некоторыми оговорками

0,6

7

Успешно, но
хотелось бы улучшить результат

0,7

8

Достаточно успешно

0,8

9

Очень успешно

0,9

10

Абсолютно успешно

1

При проведении анкетирования в каждой отдельной
анкете параметр х принимает случайное значение, но только в пределах числового
интервала от 0,1 до 1.

Тогда в результате измерений мы получаем
неранжированный ряд случайных значений (см. табл. 2).

Таблица 2.
Результаты опроса ста учителей

Сгруппируйте полученную выборку, рассчитайте среднее
значение выборки, стандартное отклонение, абсолютную и относительную частоту
появления параметра, а также постройте график плотности вероятности f(x)=

где

W(x) – относительная частота наступления события;

          — стандартное
отклонение;

          =3,14.

Постройте график функции f(x) и сравните его с
нормальным распределением Гаусса.


Решение математических задач
средствами
Excel: Практикум/ В.Я. Гельман. – СПб.: Питер, 2003 — с. 168-172

 

Добрый вечер!

Помогите пожалуйста с решением задачи:
1. есть массив данных (в столбце указаны номера, от 1 до 5000) и стоит задача распределить их в Excel по 10000 клеток в столбце в порядке возрастания; то есть 1,2,3, 4 и т.д. только чтобы между 1 и 2 например был интервал 2 клетки, а между 2 и 3 — 5 клеток, а между 3 и 4 — 1 клетка… то есть распределение рандомное.

2. в пустые клетки между первыми данными вставить второй массив данных таким же образом как и в первом случае.

У мкня есть KuTools, но он распределяет данные рандомно — проще говоря перемешивает их, а у меня стоит задача распределить 5000 данных среди 10000 клеток в рандомном порядке (случайное распределние между данными, то есть разное количество клеток), а потом второй массив данных должен заполнить «пустоты» .

Такая логика распределения связана со следующим:
1. студенты ходили в универ на кафедру 1 и каждый визит фиксировался (это исходный массив данных 5000 клеток) — ходили за 4 месяца, то есть данные о визитах за 4 месяца, то есть каждый визит привязан к дате, поэтому и порядок рандомный не подоходит (визит на кафедру 1 октября не может быть раньше визита 1 сентября)
2. оставшееся время, что не заходили на кафедру 1 они ходили на кафедру 2 и соответственно надо заполнить «пустоты» в графике и показать — вот они в эо время туда ходили.

Таких кафедр 12…

Вручную тоже можно распределить, но немного тяжко 10 000 визитов вручную рандомно рассовывать по листу в Excel + каждый визит имеет уникальный идентификатор и дату.

Результат: показать что студенты за 4 месяца студенты посетили кафедру 1, 2 и т.д. в эти данные и вот он уникальный массив данных.

Спасибо огромное заранее!!! Помогите пожалуйста, надо уже сдавать результат наблюдений, время поджимает….  

Я сделал пример как я это вижу, уникальные идентификаторы сделаю в KuTools — там есть опция генерации sequence.  

A frequency distribution table is an organized representation of the frequency of each element in a dataset/record. It helps us to visualize data in terms of class range and the number of time each element belong to that class interval. The table usually consists of two columns, the first is the class interval and the second one is the frequency itself. 

Calculate Frequency Distribution in Excel

Suppose, we want to distribute marks obtained by 40 students in a class using a frequency distribution table then a sampling frequency distribution table will look like this:

Marks

Frequency

0-20

5

21-40

7

41-60

13

61-80

9

81-100

6

In this article, we are going to see how we can calculate such a frequency distribution table inside Microsoft Excel.

Method 1: Using Pivot Table

Microsoft Excel has a powerful tool named Pivot table which helps users to analyze large amounts of data interactively by aggregating individual records of a table into different groups. A pivot table can be used to create a frequency distribution table as:

Step 1: Select the desired range of cells and then go to the Insert tab and select Pivot Table from the menu.

Selecting-pivot-table

Step 2: A Create Pivot Table dialog box will pop up on the screen. Since we want to create the pivot table in the same worksheet. We can choose the Existing Worksheet radio check box in the dialog box and select the desired cell where we want to place the table (in the image shown below cell D1 is selected).

Creating-pivot-table

Step 3: A pivot table will become visible on the screen as shown in the image given below.

Pivot-table-visible

Step 4: From the right-hand side PivotTable Fields prompt, drag the Scores field name into the Values field and the Rows field one by one.

Filling-values

Step 5: We can notice the changes made in our pivot table. Now, right-click on the Sum of Scores field inside the Values section and select the Field Settings option from the menu.

Field-settings

Step 6: A Pivot Table Field dialog box will appear on the screen. Select the Count option from the list under the Summarise by tab and click OK

Selecting-count

Step 7: After hitting the OK button, we can notice the changes made to our pivot table. Now for each element, we have its frequency inside the table. 

Frequency-present-in-table

Step 8: Under the Row Labels column inside the pivot table select any record and right-click with the mouse to open a list of options. From the options menu, select the Group option.

Selecting-group-option

Step 9:  A dialog box named Grouping will appear on the screen. Fill out the starting and ending values in the respective fields. Since we want to divide our data into intervals of 10 hence we fill 10 in the “By” field and then click OK.

Dividing-data-in-intervals

Step 10: On clicking the OK button, we can notice our data values are distributed across an interval and hence our final frequency distribution table is created.

Final-frequency-distribution-table

Method 2: Using the COUNTIFS() function

We can even use the in-built COUNTIFS() function to create a frequency distribution table.

The syntax for the COUNTIFS() function is given as:

=COUNTIFS(range1,criteria1,range2,criteria2,….)

Where range1 and range2 are the cell range of the records and criteria1 and criteria2 are the logical expressions.

Step 1: Create a class Interval column manually assigning the appropriate values as per requirement.

Creating-class-interval

Step 2: Now, click on the desired cell where you want to find out the frequency in the class interval (here, cell D2). Type the formula 

=COUNTIFS(A2:A16,”>=10″,A2:A16,”<=19″) 

And hit enter, it will generate the output 1 as only 18 is in the class range 10-19. Here, A2:A16 is the range as our data is stored in this cell we give A2:A16 as the range1 and range2 values, criteria1 is >=10 and criteria2 is <=19.

Using-countif-formula

Step 3: Similarly, we can use the same COUNTIFS() formula for the next cells. Let’s say we want to find the count of records between the interval 20-29, then the formula will be,

=COUNTIFS(A2:A16,”>=20″,A2:A16,”<=29″)

It will generate 3 as the output as three numbers 25, 27 and 29 lie within this class interval.

Outputs-generating

Step 4: We can use the same formula for finding the values for all class intervals and our values will be shown as:

Values-for-class-intervals

Понравилась статья? Поделить с друзьями:
  • Распределение количества в excel
  • Распределение инвестиций на excel
  • Распределение зарплаты в excel
  • Распределение доходов в зависимости от кту excel
  • Распределение данных по интервалам в excel