Диаграмма распределения данных excel


Гистограмма распределения — это инструмент, позволяющий визуально оценить величину и характер разброса данных. Создадим гистограмму для непрерывной случайной величины с помощью встроенных средств MS EXCEL из надстройки Пакет анализа и в ручную с помощью функции

ЧАСТОТА()

и диаграммы.

Гистограмма (frequency histogram) – это

столбиковая диаграмма MS EXCEL

, в каждый столбик представляет собой интервал значений (корзину, карман, class interval, bin, cell), а его высота пропорциональна количеству значений в ней (частоте наблюдений).

Гистограмма поможет визуально оценить распределение набора данных, если:

  • в наборе данных как минимум 50 значений;
  • ширина интервалов одинакова.

Построим гистограмму для набора данных, в котором содержатся значения

непрерывной случайной величины

. Набор данных (50 значений), а также рассмотренные примеры, можно взять на листе

Гистограмма AT

в

файле примера.

Данные содержатся в диапазоне

А8:А57

.


Примечание

: Для удобства написания формул для диапазона

А8:А57

создан

Именованный диапазон

Исходные_данные.

Построение гистограммы с помощью надстройки

Пакет анализа

Вызвав диалоговое окно

надстройки Пакет анализа

, выберите пункт

Гистограмма

и нажмите ОК.

В появившемся окне необходимо как минимум указать:

входной интервал

и левую верхнюю ячейку

выходного интервала

. После нажатия кнопки

ОК

будут:

  • автоматически рассчитаны интервалы значений (карманы);
  • подсчитано количество значений из указанного массива данных, попадающих в каждый интервал (построена таблица частот);
  • если поставлена галочка напротив пункта

    Вывод графика

    , то вместе с таблицей частот будет выведена гистограмма.


Перед тем как анализировать полученный результат —

отсортируйте исходный массив данных

.

Как видно из рисунка, первый интервал включает только одно минимальное значение 113 (точнее, включены все значения меньшие или равные минимальному). Если бы в массиве было 2 или более значения 113, то в первый интервал попало бы соответствующее количество чисел (2 или более).

Второй интервал (отмечен на картинке серым) включает значения больше 113 и меньше или равные 216,428571428571. Можно проверить, что таких значений 11. Предпоследний интервал, от 630,142857142857 (не включая) до 733,571428571429 (включая) содержит 0 значений, т.к. в этом диапазоне значений нет. Последний интервал (со странным названием

Еще

) содержит значения больше 733,571428571429 (не включая). Таких значений всего одно — максимальное значение в массиве (837).

Размеры карманов одинаковы и равны 103,428571428571. Это значение можно получить так:

=(МАКС(

Исходные_данные

)-МИН(

Исходные_данные

))/7

где

Исходные_данные –

именованный диапазон

, содержащий наши данные.

Почему 7? Дело в том, что количество интервалов гистограммы (карманов) зависит от количества данных и для его определения часто используется формула √n, где n – это количество данных в выборке. В нашем случае √n=√50=7,07 (всего 7 полноценных карманов, т.к. первый карман включает только значения равные минимальному).


Примечание

:

Похоже, что инструмент

Гистограмма

для подсчета общего количества интервалов (с учетом первого) использует формулу

=ЦЕЛОЕ(КОРЕНЬ(СЧЕТ(

Исходные_данные

)))+1

Попробуйте, например, сравнить количество интервалов для диапазонов длиной 35 и 36 значений – оно будет отличаться на 1, а у 36 и 48 – будет одинаковым, т.к. функция

ЦЕЛОЕ()

округляет до ближайшего меньшего целого

(ЦЕЛОЕ(КОРЕНЬ(35))=5

, а

ЦЕЛОЕ(КОРЕНЬ(36))=6)

.

Если установить галочку напротив поля

Парето (отсортированная гистограмма)

, то к таблице с частотами будет добавлена таблица с отсортированными по убыванию частотами.

Если установить галочку напротив поля

Интегральный процент

, то к таблице с частотами будет добавлен столбец с

нарастающим итогом

в % от общего количества значений в массиве.

Если выбор количества интервалов или их диапазонов не устраивает, то можно в диалоговом окне указать нужный массив интервалов (если интервал карманов включает текстовый заголовок, то нужно установить галочку напротив поля

Метка

).

Для нашего набора данных установим размер кармана равным 100 и первый карман возьмем равным 150.

В результате получим практически такую же по форме

гистограмму

, что и раньше, но с более красивыми границами интервалов.

Как видно из рисунков выше, надстройка

Пакет анализа

не осуществляет никакого

дополнительного форматирования диаграммы

. Соответственно, вид такой гистограммы оставляет желать лучшего (столбцы диаграммы обычно располагают вплотную для непрерывных величин, кроме того подписи интервалов не информативны). О том, как придать диаграмме более презентабельный вид, покажем в следующем разделе при построении

гистограммы

с помощью функции

ЧАСТОТА()

без использовании надстройки

Пакет анализа

.

Построение гистограммы распределения без использования надстройки Пакет анализа

Порядок действий при построении гистограммы в этом случае следующий:

  • определить количество интервалов у гистограммы;
  • определить ширину интервала (с учетом округления);
  • определить границу первого интервала;
  • сформировать таблицу интервалов и рассчитать количество значений, попадающих в каждый интервал (частоту);
  • построить гистограмму.


СОВЕТ

: Часто рекомендуют, чтобы границы интервала были на один порядок точнее самих данных и оканчивались на 5. Например, если данные в массиве определены с точностью до десятых: 1,2; 2,3; 5,0; 6,1; 2,1, …, то границы интервалов должны быть округлены до сотых: 1,25-1,35; 1,35-1,45; … Для небольших наборов данных вид гистограммы сильно зависит количества интервалов и их ширины. Это приводит к тому, что сам метод гистограмм, как инструмент

описательной статистики

, может быть применен только для наборов данных состоящих, как минимум, из 50, а лучше из 100 значений.

В наших расчетах для определения количества интервалов мы будем пользоваться формулой

=ЦЕЛОЕ(КОРЕНЬ(n))+1

.


Примечание

: Кроме использованного выше правила (число карманов = √n), используется ряд других эмпирических правил, например, правило Стёрджеса (Sturges): число карманов =1+log2(n). Это обусловлено тем, что например, для n=5000, количество интервалов по формуле √n будет равно 70, а правило Стёрджеса рекомендует более приемлемое количество — 13.

Расчет ширины интервала и таблица интервалов приведены в

файле примера на листе Гистограмма

. Для вычисления количества значений, попадающих в каждый интервал, использована

формула массива

на основе функции

ЧАСТОТА()

. О вводе этой функции см. статью

Функция ЧАСТОТА() — Подсчет ЧИСЛОвых значений в MS EXCEL

.

В MS EXCEL имеется диаграмма типа

Гистограмма с группировкой

, которая обычно используется для построения

Гистограмм распределения

.

В итоге можно добиться вот такого результата.


Примечание

: О построении и настройке макета диаграмм см. статью

Основы построения диаграмм в MS EXCEL

.

Одной из разновидностей гистограмм является

график накопленной частоты

(cumulative frequency plot).

На этом графике каждый столбец представляет собой число значений исходного массива, меньших или равных правой границе соответствующего интервала. Это очень удобно, т.к., например, из графика сразу видно, что 90% значений (45 из 50) меньше чем 495.


СОВЕТ

: О построении

двумерной гистограммы

см. статью

Двумерная гистограмма в MS EXCEL

.


Примечание

: Альтернативой

графику накопленной частоты

может служить

Кривая процентилей

, которая рассмотрена в

статье про Процентили

.


Примечание

: Когда количество значений в выборке недостаточно для построения полноценной

гистограммы

может быть полезна

Блочная диаграмма

(иногда она называется

Диаграмма размаха

или

Ящик с усами

).

Создание гистограммы в Excel

​Смотрите также​​ Оценим, какая из​ элементов, диапазонов.​ значения в первом​ в каждом сезоне,​ дополнительный столбец «Относительная​ данных, находящихся в​«Пакет анализа»​«Работа с диаграммами»​ наглядная диаграмма, с​ у вас есть​Вставка​ числовые. На гистограмме​ОК​Откройте вкладку​ превышающих значение в​ добавить на ленту​Примечание:​ причин оказывает большее​Все изменения и настройки​ наборе, то подойдут​

​ используя функцию СРЗНАЧ.​ частота». В первую​ ней.​

​устанавливаем галочку и​​можно редактировать полученный​ помощью которой можно​ подписка на Office 365,​, щелкните значок​ одинаковые категории будут​.​

​Данные​ поле справа. Чтобы​ область​ Мы стараемся как можно​ влияние на событие.​

  • ​ следует выполнять на​ типы: «Вторичная круговая»​
  • ​ На основании полученных​ ячейку введем формулу:​
  • ​Урок:​ кликаем по кнопке​
  • ​ объект:​

Создание гистограммы

  1. ​ сразу оценить общую​

    ​ убедитесь, что у​(​

    Данные, использованные для создания образца гистограммы выше

  2. ​ сгруппированы, а значения​​Если вы хотите настроить​​и выберите команду​​ изменить его, введите​​Работа с диаграммами​​ оперативнее обеспечивать вас​​Создадим в Excel таблицу​

    Команда

    ​ вкладках «Конструктор», «Макет»​ и «Вторичная гистограмма».​​ данных построим диаграмму:​​Способ второй. Вернемся к​​Условное форматирование в Excel​​«OK»​

​Изменять стили столбцов;​​ ситуацию, лишь взглянув​

  • ​ вас установлена последняя​​Статистические​​ на оси значений —​​ свой гистограммы, можно​​Анализ данных​ в поле другое​

  • ​.​ актуальными справочными материалами​ с данными. 1​ или «Формат» группы​Использовать различные макеты и​​Получили количество выпавших осадков​​ таблице с исходными​

Вкладки

Настройка интервалов гистограммы

  1. ​Мы смогли убедиться, что​.​Подписывать наименование диаграммы в​​ на неё, без​​ версия Office.​​) и в разделе​​ просуммированы.​

    Команда

  2. ​ изменить текст подписей​.​ десятичное число.​Правой кнопкой мыши щелкните​ на вашем языке.​​ столбец – причины.​​ инструментов «Работа с​

    ​ шаблоны оформления.​

    ​ в процентном выражении​

    ​ данными. Вычислим интервалы​

    ​ табличный процессор Excel​Перемещаемся во вкладку​ целом, и отдельных​ изучения числовых данных​Коснитесь данных, чтобы выделить​Гистограмма​Совет:​ и щелкните в​

    ​Выберите пункт​​Совет:​ горизонтальную ось диаграммы,​ Эта страница переведена​ 2 столбец –​ диаграммами». Группа инструментов​Сделаем, чтобы названия месяцев​ по сезонам.​​ карманов. Сначала найдем​​ предоставляет возможность использовать​

    ​«Данные»​

    ​ её осей;​ в таблице. В​ их.​выберите​

    ​ Чтобы подсчитать количество появлений​

    ​ любом месте диаграммы​Гистограмма​ Дополнительные сведения о гистограммах​ выберите​

    ​ автоматически, поэтому ее​

    ​ количество фактов, при​ появляется в заголовке​ и цифры показателей​В основе круговой диаграммы​ максимальное значение в​

    ​ такой удобный инструмент,​. Жмем на кнопку,​

    ​Изменять название и удалять​ Microsoft Excel есть​Если вы используете телефон,​Гистограмма​ текстовых строк, добавьте​ Гистограмма, чтобы в​и нажмите кнопку​ и их пользе​

    ​Формат оси​ текст может содержать​

    ​ котором были обнаружены​ окна как дополнительное​ продаж отображались непосредственно​ Excel лежат цифровые​ диапазоне температур и​ как гистограммы, совершенно​ расположенную на ленте​ легенду, и т.д.​

    Область задач

​ сразу несколько инструментов​​ коснитесь значка правки​.​ столбец и укажите​ правой части диаграммы​OK​ для визуализации статистических​, а затем щелкните​ неточности и грамматические​ данные причины (числовые​ меню при активации​ на долях.​ данные таблицы. Части​ минимальное.​

Формулы для создания гистограмм

​ в различном виде.​​«Анализ данных»​

Формула для параметра

​Урок:​ предназначенных для того,​, чтобы отобразить​Советы:​ в нем значение​ с помощью кнопок​.​

​ данных см. в​Параметры оси​​ ошибки. Для нас​

Формула для параметра ячейки

​ значения). Обязательно –​ графической области.​​Построенный график можно переместить​

Формула для параметра

  1. ​ диаграммы показывают пропорции​Чтобы найти интервал карманов,​ Применение этой интересной​.​Как сделать диаграмму в​

  2. ​ чтобы построить гистограммы​ ленту, а затем​ ​ «1», а затем​Элементы диаграммы​

    ​В разделе​ этой записи о​.​ важно, чтобы эта​ итог.​Простейший вариант изображения данных​ на отдельный лист.​ в процентах (долях).​ нужно разность максимального​

  3. ​ функции делает анализ​В открывшемся небольшом окне​ Excel​ различного типа. Давайте​ выберите вкладку​

    ​На вкладках​ отобразите гистограмму и​,​Ввод​ гисторамме, диаграммах Парето​Руководствуясь приведенной ниже таблицей,​ статья была вам​Теперь посчитаем в процентах​ в процентах:​ Нажимаем соответствующую кнопку​ В отличии от​ и минимального значений​

  4. ​ данных намного нагляднее.​​ выбираем пункт​​Гистограмма с накоплением содержит​​ взглянем на различные​​Главная​

    Кнопки

  5. ​Конструктор​​ выберите параметр​​Стили диаграмм​​выполните указанные ниже​​ и «ящик с​

    Диалоговое окно

  6. ​ вы сможете выбрать​​ полезна. Просим вас​​ воздействие каждой причины​Создаем круговую диаграмму по​

    1. ​ на вкладке «Конструктор»​​ графика диаграмма лучше​​ массива разделить на​Автор: Максим Тютюшев​«Гистограммы»​ столбцы, которые включают​

    2. ​ способы построения.​​.​​и​По категориям​и​ действия:​

      ​ усами» блога группы​ параметры, которые нужно​ уделить пару секунд​ на общую ситуацию.​

      ​ таблице с данными​​ и заполняем открывшееся​ отображает общую картину​ количество интервалов. Получим​Кнопка ​Построим диаграмму распределения в​. Жмем на кнопку​ в себя сразу​Скачать последнюю версию​Выберите элементы​Формат​.​

  7. ​Фильтры диаграммы​В поле​ разработчиков Excel. Дополнительные​ задать в области​​ и сообщить, помогла​​ Создаем третий столбец.​

  8. ​ (см. выше).​​ меню.​​ результатов анализа или​ «ширину кармана».​

    ​ Excel. А также​«OK»​ несколько значений.​ Excel​Вставка​

  9. ​можно настроить внешний​Автоматическая​

    ​.​​Формировать список по диапазону​ сведения о других​

    ​ задач​​ ли она вам,​ Вводим формулу: количество​Щелкаем левой кнопкой по​Создать круговую диаграмму в​

    ​ отчета в целом,​​Представим интервалы карманов в​ рассмотрим подробнее функции​

  10. ​.​​Перед тем, как перейти​​Урок:​

    ​ >​ вид диаграммы.​Это вариант по умолчанию​Выделите данные.​введите ссылку на​ новых типах диаграмм​Формат оси​ с помощью кнопок​​ фактов по данной​​ готовому изображению. Становится​​ Excel можно от​​ а график графически​​ виде столбца значений.​​ круговых диаграмм, их​

Создание гистограммы

  1. ​Открывается окно настройки гистограммы.​

    ​ к созданию диаграммы​Как создать гистограмму в​

    Данные, использованные для создания образца гистограммы выше

  2. ​Диаграммы​​Если они не отображаются,​​ для гистограмм.​​(Это типичный пример данных​​ ячейку с диапазоном​

    Кнопка

  3. ​ приведены в этой​​.​​ внизу страницы. Для​​ причине / общее​​ активной вкладка «Конструктор».​​ обратного порядка действий:​​ детализирует представление информации.​ Сначала ширину кармана​​ создание.​​ В поле​

​ с накоплением, нужно​​ Microsoft Word​

  • ​ >​ щелкните в любом​​Длина интервала​​ для гистограммы.)​​ данных, который содержит​​ записи блога.​Параметр​

  • ​ удобства также приводим​ количество фактов (=В3/В9).​Выбираем из предлагаемых программой​Сначала вставить на лист​Визуальное представление информации в​​ прибавляем к минимальному​​График нормального распределения имеет​

Вкладки

Настройка интервалов гистограммы

  1. ​«Входной интервал»​ удостовериться, что в​Гистограмму в Экселе можно​​Гистограмма​​ месте гистограммы, чтобы​​Введите положительное десятичное число,​​На вкладке​

    Команда

  2. ​ исходные числа.​Вариант «Автоматическая» (формула Скотта)​Описание​ ссылку на оригинал​ Нажимаем ВВОД. Устанавливаем​​ макетов варианты с​​ макет («Вставка» -​

    ​ виде круга актуально​

    ​ значению массива данных.​

    ​ форму колокола и​

    ​вводим адрес диапазона​ крайнем левом столбце​ создать тремя способами:​.​ добавить их на​ задающее количество точек​Вставка​В поле​

    ​   ​​По категориям​ (на английском языке).​ процентный формат для​ процентами.​ «Диаграммы» — «Круговая»).​ для изображения структуры​ В следующей ячейке​​ симметричен относительно среднего​​ ячеек, гистограмму которого​

    ​ в шапке отсутствует​

    ​С помощью инструмента, который​Чтобы создать гистограмму в​

    ​ ленту.​

    ​ данных в каждом​нажмите кнопку​Интервал карманов​Формула Скотта минимизирует отклонение​

    ​Выберите этот вариант, если​

    ​Гистограмма — это столбчатая диаграмма,​ данной ячейки –​Как только мы нажмем​ В результате появится​ объекта. Причем отобразить​

    ​ – к полученной​ значения. Получить такое​

    ​ хотим отобразить. Обязательно​ наименование. Если наименование​ входит в группу​ Excel, предоставляют два​Чтобы создать гистограмму в​ диапазоне.​Диаграмма​введите ссылку на​

    ​ вариационного ряда на​ категории (горизонтальная ось)​

    ​ которая показывает частоту​ Excel автоматически преобразует​ на понравившуюся картинку,​ пустое окно.​ можно только положительные​ сумме. И так​ графическое изображение можно​ внизу ставим галочку​

    Область задач

​ есть, то его​​«Диаграммы»​ типа данных —​ Excel 2011 для​Количество интервалов​.​ ячейку с диапазоном,​ гистограмме по сравнению​ текстовые, а не​ повторяемости значений.​ числовое значение в​ диаграмма поменяется.​Затем присвоить необходимые значения​ либо равные нулю​

​ далее, пока не​ только при огромном​ около пункта​

  1. ​ следует удалить, иначе​

    ​;​ данные, которые требуется​

    Данные, использованные для создания образца гистограммы выше

  2. ​ Mac, потребуется скачать​​Введите количество интервалов гистограммы​​В диалоговом окне​Значок статистической диаграммы​ который содержит числа​​ с набором данных,​​ числовые. На гистограмме​​Примечание:​​ проценты.​​Второй способ отображения данных​​ данных. Можно нажать​

​ значения, только один​​ дойдем до максимального​

  • ​ количестве измерений. В​​«Вывод графика»​​ построение диаграммы не​​С использованием условного форматирования;​​ проанализировать и количеством​ стороннюю надстройку. См.​

  • ​ (включая интервалы для​Вставка диаграммы​ интервала.​ исходя из предположения​ одинаковые категории будут​

​ В этой статье рассматривается​Отсортируем проценты в порядке​ в процентах:​ на панели инструментов​ набор (ряд) данных.​ значения.​ Excel для конечного​. В параметрах ввода​

​ получится.​При помощи надстройки Пакет​ интервалов, представляющих интервалы,​ статью Не удается​ значений, выходящих за​в разделе​Если на листе использовались​ о нормальном распределении​ сгруппированы, а значения​ только создание гистограмм.​ убывание. Выделим диапазон:​

​Щелкаем левой кнопкой по​ кнопку «Выбрать данные».​ Такая особенность диаграмм​​Для определения частоты делаем​​ числа измерений принято​ можно указать, где​Выделяем таблицу, на основании​

Кнопка

  1. ​ анализа.​ на которые вы​

    Данные, использованные для создания образца гистограммы выше

  2. ​ найти пакет анализа​ верхнюю и нижнюю​Значок правки​Все диаграммы​ подписи столбцов, можно​ данных.​​ на оси значений —​​ Сведения о диаграммах​

  3. ​ C3:C8 (кроме итога)​​ готовой круговой диаграмме.​​ А можно щелкнуть​​ одновременно является их​​ столбец рядом с​​ строить гистограмму.​​ будет выводиться гистограмма.​

    ​ которой будет строиться​Она может быть оформлена,​

    ​ хотите измерить частоту.​​ в Excel 2011​ границы).​выберите пункт​ включать их в​Вариант «Выход за верхнюю​ просуммированы.​ Парето (отсортированных гистограммах)​ – правая кнопка​
    Попробуйте поработать с Office 365 или последней версией Excel

  1. ​Переходим на вкладку «Макет».​ по макету правой​

    Данные, использованные для создания образца гистограммы выше

  2. ​ преимуществом и недостатком.​ интервалами карманов. Вводим​Значок правки​Внешне столбчатая диаграмма похожа​ По умолчанию —​ гистограмма. Во вкладке​​ как отдельным объектом,​​ Необходимо организовать данные​

  3. ​ для Mac.​​Выход за верхнюю границу​​Гистограмма​​ ссылки на ячейки.​​ границу интервала»​​Совет:​​ см. в статье​

Данные для создания гистограмм

​ мыши – сортировка​ Нам нужна кнопка​ кнопкой мыши и​ Преимущества рассмотрим более​ функцию массива:​ на график нормального​ на новом листе.​«Вставка»​ так и при​ в двух столбцов​В Excel Online можно​ интервала​, а затем нажмите​

  • ​Совет:​​   ​ Чтобы подсчитать количество появлений​ Создание диаграммы Парето.​

  • ​ – «от максимального​​ «Подписи данных».​ нажать «Выбрать данные».​ детально.​Вычислим относительные частоты (как​ распределения. Построим столбчатую​

​ Можно указать, что​кликаем по кнопке​ использовании условного форматирования,​ на листе. Эти​ просмотреть гистограмму (это​Установите этот флажок, чтобы​ кнопку​ Вместо того, чтобы вводить​Вариант «Выход за нижнюю​ текстовых строк, добавьте​Windows macOS Online​ к минимальному».​В раскрывшемся списке выбираем​В открывшемся окне «Выбор​Составим для учебных целей​ в предыдущем способе).​ диаграмму распределения осадков​

​ вывод будет осуществляться​«Гистограмма»​ являясь частью ячейки.​ столбцы должны содержать​ Столбчатая диаграмма, которая​ создать интервал для​ОК​

support.office.com

Создание гистограммы в Microsoft Excel

Гистограмма в Microsoft Excel

​ ссылки вручную,можно нажать​ границу интервала»​ столбец и укажите​ iOS Android ​Находим суммарное влияние каждой​ место для подписей.​ источника данных» заполняем​ простую табличку:​Построим столбчатую диаграмму распределения​ в Excel и​ на данном листе​. В появившемся списке​Обычную гистограмму проще всего​ следующие данные:​ показывает частоту повторяемости​ всех значений, превышающих​

​.​ кнопку​

​   ​​ в нем значение​ Какие версии или​

Построение гистограммы

​ причины и всех​Теперь на диаграмме отображаются​

  • ​ поля. Диапазон –​Нам необходимо наглядно сравнить​​ осадков в Excel​​ рассмотрим 2 способа​
  • ​ в определенных ячейках​
  • ​ диаграмм выбираем тот​ сделать, воспользовавшись функцией​

​Введенные данные.​ значений), но его​ значение в поле​Советы:​, чтобы временно​

Способ 1: создание простой гистограммы в блоке диаграмм

​Загрузите надстройку «Пакет анализа».​ «1», а затем​ продукты вы используете?​​ предыдущих. Для причины​​ числовые значения.​

  1. ​ ссылка на ячейки​ продажи какого-либо товара​ с помощью стандартного​ ее построения.​ или в новой​ тип гистограммы с​ в блоке инструментов​

    Выделение области в Microsoft Excel

  2. ​    Это данные, которые вы​​ не удается создать,​​ справа. Чтобы изменить​​ ​​ свернуть диалоговое окно​ Дополнительные сведения см.​ отобразите гистограмму и​​ ​​ 2 – причина​
  3. ​Щелкаем по любому из​ с данными, на​ за 5 месяцев.​
    • ​ инструмента «Диаграммы».​
    • ​Имеются следующие данные о​
    • ​ книге. После того,​
    • ​ накоплением, который нам​
    • ​«Диаграммы»​

    ​ хотите проанализировать с​ поскольку она требует​ его, введите в​

    ​С помощью параметров на​ для выбора диапазонов​ в статье Загрузка​

    Выбор гистограммы в Microsoft Excel

    ​ выберите параметр​Какие версии или продукты​​ 1 + причина​​ них левой кнопкой.​ основании которых будет​

    • ​ Удобнее показать разницу​
    • ​Частота распределения заданных значений:​ количестве выпавших осадков:​ как все настройки​
    • ​ требуется. Все они​.​

Редактирование гистограммы в Microsoft Excel

​ помощью мастера гистограмм.​​ пакет анализа —​ поле другое десятичное​

Способ 2: построение гистограммы с накоплением

​ вкладках​ на листе. При​ надстройки «Пакет анализа»​По категориям​

  1. ​ вы используете?​ 2.​ Потом правой. В​ строиться круговая диаграмма.​ в «частях», «долях​С помощью круговой диаграммы​Первый способ. Открываем меню​ введены, жмем кнопку​ расположены в правой​Строим таблицу, в которой​Числовые интервалы.​

    Пустая ячейка в Microsoft Excel

  2. ​ Excel, в которое​ число.​Конструктор​​ повторном нажатии этой​​ в Excel.​​.​​Excel 2016 и более​Столбец «Факты» вспомогательный. Скроем​ раскрывшемся меню выбираем​ Элементы легенды (ряды)​ целого». Поэтому выберем​ можно иллюстрировать данные,​ инструмента «Анализ данных»​

    Создание гистограммы с накоплением в Microsoft Excel

  3. ​«OK»​ части списка.​ содержатся данные, отображаемые​    Они представляют диапазоны, на​ не поддерживается в​Выход за нижнюю границу​и​ кнопки диалоговое окно​

Редактирование гистограммы с накоплением в Microsoft Excel

Способ 3: построение с использованием «Пакета анализа»

​В один столбец на​Автоматическая​ поздних версий​ его. Выделить столбец​ «Формат подписей данных».​

  1. ​ – числовые данные,​​ тип диаграммы –​​ которые находятся в​

    Переход во вкладку Файл программы Microsoft Excel

  2. ​ на вкладке «Данные»​​.​​После этих действий гистограмма​

    Переход в раздел Параметры в Microsoft Excel

  3. ​ в будущей диаграмме.​​ основании которых мастер​​ Excel Online.​

    Переход в надстройки в программе Microsoft Excel

  4. ​ интервала​​Формат​​ опять разворачивается.​ листе введите исходные​​Это вариант по умолчанию​​В приложении Excel 2007​

    Перемещение в надстройки в программе Microsoft Excel

  5. ​ – правая кнопка​Откроется окно для назначения​​ части целого. Это​​ «круговую».​ одном столбце или​​ (если у Вас​​Как видим, гистограмма сформирована​

    Активация пакета анализа в программе Microsoft Excel

  6. ​ появится на листе.​​ Выделяем мышкой те​​ гистограмм проводит оценку​Если у вас есть​​Установите этот флажок, чтобы​​настройте внешний вид​

    Переход в анализ данных в Microsoft Excel

  7. ​Если подписи столбцов были​ данные. При необходимости​​ для гистограмм. Длина​​ – 2013​​ мыши – скрыть​​ параметров подписи. Так​

    Выбор гистограммы в анализе данных в Microsoft Excel

  8. ​ поле заполнится автоматически,​Выделяем таблицу с данными.​​ одной строке. Сегмент​​ не подключен данный​ в указанном вами​ Её можно будет​ столбцы таблицы, которые​ введенных данных во​​ классическое приложение Excel,​​ создать интервал для​ диаграммы.​ включены в ссылки​ добавьте в первую​ интервала вычисляется по​Outlook, PowerPoint, Word 2016​ (или нажимаем комбинацию​ как значения нужно​ как только мы​ Переходим на вкладку​ круга – это​ аналитический инструмент, тогда​ месте.​​ отредактировать с помощью​​ будут отображены на​

Настройка гистограммы в Microsoft Excel

​ время их анализа.​ можно использовать кнопку​ всех значений, не​

Гистограмма сформирована в Microsoft Excel

Способ 4: Гистограммы при условном форматировании

​Если они не отображаются,​ на ячейки, установите​ ячейку подпись.​

  1. ​ формуле Скотта.​Выделите данные.​ горячих клавиш CTRL+0).​
  2. ​ отобразить в процентах,​​ укажем диапазон.​​ «Вставка» — «Диаграммы».​ доля каждого элемента​​ читайте как его​​Гистограммы также можно выводить​ тех же инструментов,​​ осях гистограммы.​​При использовании инструмента гистограммы​изменить в Excel​ превышающих значение в​ щелкните в любом​ флажок​Используйте количественные числовые данные,​Длина интервала​

Создание условного форматирования в Microsoft Excel

​(Это типичный пример данных​Выделяем три столбца. Переходим​ выберем доли.​Если выбор программы не​ Выбираем тип «Круговая».​ массива в сумме​ подключить в настройках​

Условное форматирование в Microsoft Excel

​ при условном форматировании​​ о которых шёл​

​Находясь во вкладке​ Excel подсчитывает количество​для открытия Excel​ поле справа. Чтобы​ месте гистограммы, чтобы​Подписи​ например, количество элементов​Введите положительное десятичное число,​ для гистограммы.)​

​ на вкладку «Диаграммы»​

lumpics.ru

Диаграмма распределения осадков в Excel

​Чтобы получить проценты с​ совпадает с задуманным​Как только мы нажимаем​ всех элементов.​ Excel):​

Как построить диаграмму распределения в Excel

​ ячеек.​ разговор при описании​«Вставка»​ точек данных в​ на рабочий стол​ изменить его, введите​ добавить на ленту​.​ или результаты тестов.​ задающее количество точек​

​Выберите​ — нажимаем «Гистограмма».​ десятичными знаками, необходимо​ нами вариантом, то​ на подходящее нам​С помощью любой круговой​Выбираем «Гистограмма»:​

​Выделяем ячейки с данными,​ первого способа построения.​

Осадки.

​кликаем по кнопке​ каждой ячейке данных.​ и Создайте гистограмму.​ в поле другое​ область​В группе​ Мастер гистограмм не​ данных в каждом​Вставка​

Анализ данных.

​Выделяем вертикальную ось левой​

Гистограмма.

​ перейти по ссылке​ выделяем элемент легенды​ изображение, появляется готовая​ диаграммы можно показать​Задаем входной интервал (столбец​ которые хотим отформатировать​Для того, чтобы воспользоваться​

Входные данные.

​«Гистограмма»​ Точки данных включается​Коснитесь данных, чтобы выделить​

Пример.

​ десятичное число.​Работа с диаграммами​Параметры вывода​ будет работать с​

​ диапазоне.​

​ >​ кнопкой мышки. Затем​ «Число», выбрать процентный​ и нажимаем «Изменить».​

​ диаграмма.​ распределение в том​ с числовыми значениями).​ в виде гистограммы.​ способом формирования гистограммы​, которая расположена на​

Частота.

​ в конкретной ячейке,​ их.​Совет:​.​выберите местоположение выходных​ такими количественными числовыми​Количество интервалов​

Минимальное значение.

​Вставить диаграмму статистики​ нажимаем правую клавишу​ формат и установить​ Откроется окно «Изменение​Одновременно становится доступной вкладка​ случае, если​

Ширина кармана.

​ Поле «Интервалы карманов»​Во вкладке​ с помощью пакета​ ленте в блоке​ если число больше,​Если вы используете телефон,​ Дополнительные сведения о гистограммах​Правой кнопкой мыши щелкните​ данных.​ данными, как идентификационные​Введите количество интервалов гистограммы​

Максимальное значение.

​ >​ и выбираем «Формат​ нужное количество цифр​ ряда», где «Имя​

Функция в массиве.

​ «Работа с диаграммами»​имеется только один ряд​

Относительные частоты.

​ оставляем пустым: Excel​«Главная»​ анализа, нужно этот​ инструментов​

Пример1.

​ чем наименьшего привязан​

Частота распределения.

Круговые диаграммы для иллюстрации распределения

​ коснитесь значка правки​ и их пользе​ горизонтальную ось диаграммы,​Гистограмму можно расположить на​ номера, введенные в​ (включая интервалы для​Гистограмма​ оси». Устанавливаем максимальное​ после запятой.​

​ ряда» и «Значения»​ — «Конструктор». Ее​ данных;​ сгенерирует автоматически. Ставим​

  • ​на ленте жмем​ пакет активировать.​
  • ​«Диаграммы»​
  • ​ и равно или​, чтобы отобразить​
  • ​ для визуализации статистических​
  • ​ выберите​ том же листе,​

​ виде текста.​ значений, выходящих за​.​

Количество осадков.

​ значение 1 (т.е.​Результат проделанной работы:​ — ссылки на​

Доли.

​ инструментарий выглядит так:​все значения положительные;​ птичку около записи​ на кнопку​Переходим во вкладку​.​ меньше, чем наибольшее​ ленту, а затем​ данных см. в​

Пример3.

​Формат оси​ новом листе в​В следующий столбец введите​

exceltable.com

Как построить диаграмму в Excel по данным таблицы

​ верхнюю и нижнюю​Гистограмму также можно создать​ 100%).​Вильфредо Парето открыл принцип​ ячейки (ставим те,​Что мы можем сделать​практически все значения выше​ «Вывод графика»:​«Условное форматирование»​«Файл»​В открывшемся списке выбираем​ присоединенной для данных​

​ откройте вкладку​ этой записи о​, а затем щелкните​ текущей книге или​ интервалы в возрастающем​ границы).​ с помощью вкладки​Добавляем для каждого ряда​ 80/20. Открытие прижилось​ которые нужны) и​ с имеющейся диаграммой:​ нуля;​После нажатия ОК получаем​

Как построить круговую диаграмму в Excel

​. В выпавшем меню​.​

Продажи по месяцам.

​ один из пяти​ ячейки. Если опустить​Главная​ гисторамме, диаграммах Парето​Параметры оси​ в новой книге.​ порядке. При необходимости​Выход за верхнюю границу​

  1. ​Все диаграммы​ подписи данных (выделить​ и стало правилом,​ жмем ОК.​Тип - круговая.
  2. ​Изменить тип. При​не более семи категорий;​ такой график с​ кликаем по пункту​

График продаж.

​Кликаем по наименованию раздела​ типов простых диаграмм:​ интервал карманов Excel​.​

Конструктор.

​ и «ящик с​.​

​Установите один или несколько​ добавьте в первую​ интервала​в разделе​ – правая кнопка​Изменение типа.

​ применимым ко многим​​

Объемная разрезная.

​ нажатии на одноименную​каждая категория соответствует сегменту​ таблицей:​«Гистограмма»​«Параметры»​гистограмма;​ создает набор равномерно​Выберите элементы​ усами» блога группы​Руководствуясь приведенной ниже таблицей,​ флажков:​ ячейку подпись.​

Для двойных наборов данных.

​Установите этот флажок, чтобы​Рекомендуемые диаграммы​

Макеты.

​ – «Добавить подписи​ областям человеческой деятельности.​Все основные моменты показаны​ кнопку раскрывается список​

Месяцы и показатели.

​ круга.​В интервалах не очень​. В появившемся перечне​.​объемная;​ распределенные интервалов между​

Диаграмма на отдельном листе.

​Вставка​ разработчиков Excel. Дополнительные​ вы сможете выбрать​

  1. ​Парето (отсортированная гистограмма)​Используйте собственные интервалы, поскольку​ создать интервал для​.​ данных»).​
  2. ​Согласно принципу 80/20, 20%​ выше. Резюмируем:​ с изображениями типов​На основании имеющихся данных​ много значений, поэтому​ гистограмм со сплошной​Переходим в подраздел​цилиндрическая;​Контекстное меню.
  3. ​ минимальные и максимальные​ >​ сведения о других​ параметры, которые нужно​. Отображает частоту данных​ они могут лучше​ всех значений, превышающих​Советы:​Выделяем ряд «Сум.влиян.» (на​ усилий дают 80%​Выделить диаграмму – перейти​ диаграмм.​ о количестве осадков​

Выбор источника данных. Изменение ряда.

​ столбики гистограммы получились​ и градиентной заливкой​«Надстройки»​коническая;​ значения входных данных.​Диаграммы​ новых типах диаграмм​ задать в области​ по убыванию.​ соответствовать целям вашего​ значение в поле​ ​

​ рис. – зеленый).​

Как изменить диаграмму в Excel

​ результата (только 20%​ на вкладку «Конструктор»,​

  1. ​Попробуем, например, объемную разрезанную​ построим круговую диаграмму.​ низкими.​ выбираем ту, которую​.​
  2. ​пирамидальная.​Результат анализа гистограммы отображается​ >​ приведены в этой​
  3. ​ задач​Суммарный процент​ анализа. Если вы​

​ справа. Чтобы изменить​На вкладках​ Правая кнопка мыши​ причин объяснят 80%​ «Макет» или «Формат»​ круговую.​Доля «каждого месяца» в​​ считаем более уместной​В блоке​

Круговая диаграмма в процентах в Excel

​Все простые диаграммы расположены​ на новом листе​

  1. ​Гистограмма​ записи блога.​Формат оси​
  2. ​   . Отображает суммарные​ не введете их,​ его, введите в​
  3. ​Конструктор​ – «Изменить тип​ проблем и т.д.).​

Макет с процентами.

​ (в зависимости от​На практике пробуйте разные​ общем количестве осадков​

Продажи в процентах.

​Теперь необходимо сделать так,​ в каждом конкретном​

  1. ​«Управление»​ с левой части​
  2. ​ (или в новой​.​Выполните следующие действия для​Подписи данных.
  3. ​.​ проценты и добавляет​Место для подписей.
  4. ​ мастер гистограмм создаст​ поле другое десятичное​Значения на диаграмме.
  5. ​и​ диаграммы для ряда».​ Диаграмма Парето отражает​ целей).​ типы и смотрите​Выделить значения.
  6. ​ за год:​ чтобы по вертикальной​ случае.​переставляем переключатель в​ списка.​Формат подписи данных.
  7. ​ книге) и содержит​При необходимости вы можете​ создания гистограммы в​Параметр​ в гистограмму строку​ равномерно распределенные интервалы,​ число.​

Процентный формат.

​Формат​

Значения отображаются в процентах.

Как построить диаграмму Парето в Excel

​ «График» — линия.​ данную зависимость в​Выделить диаграмму либо ее​ как они будут​Круговая диаграмма распределения осадков​

​ оси отображались относительные​Теперь, как видим, в​ позицию​После того, как выбор​ таблицу и гистограмму,​ настроить элементы диаграммы.​ Excel для Mac:​Описание​

​ суммарных процентов.​ используя минимальное и​Выход за нижнюю границу​можно настроить внешний​Получилась диаграмма Парето, которая​ виде гистограммы.​ часть (оси, ряды)​

  1. ​ выглядеть в презентации.​ по сезонам года​ частоты.​ каждой отформатированной ячейке​«Надстройки Excel»​ сделан, на листе​ которая отражает данные​Примечание:​Выделите данные.​Причины и факты.
  2. ​По категориям​Вывод диаграммы​ максимальное значение во​ интервала​ вид диаграммы.​ показывает: наибольшее влияние​Построим кривую Парето в​ – щелкнуть правой​ Если у Вас​ лучше смотрится, если​Найдем сумму всех абсолютных​ имеется индикатор, который​.​ Excel формируется гистограмма.​Процент воздействия.
  3. ​ этой таблицы.​ Эта функция доступна только​(Это типичный пример данных​Выберите этот вариант, если​   . Отображает встроенную​ введенном диапазоне в​Установите этот флажок, чтобы​Процент воздействия.
  4. ​Если они не отображаются,​ на результат оказали​ Excel. Существует какое-то​ кнопкой мыши.​ 2 набора данных,​ данных меньше. Найдем​Сумма влияния.
  5. ​ частот (с помощью​ в виде гистограммы​В открывшемся окне около​С помощью инструментов, расположенных​Гистограмма является отличным инструментом​ при наличии подписки​Скрытые столбцы.
  6. ​ для гистограммы.)​ категории (горизонтальная ось)​ гистограмму.​График Парето.
  7. ​ качестве начальной и​ создать интервал для​ щелкните в любом​ причина 3, 5​ событие. На него​Вкладка «Выбрать данные» -​ причем второй набор​Формат оси.
  8. ​ среднее количество осадков​ функции СУММ). Сделаем​ характеризует количественный вес​ пункта​ в группе вкладок​
  9. ​ визуализации данных. Это​ на Office 365. Если​На ленте откройте вкладку​ текстовые, а не​Нажмите кнопку​ конечной точек.​

Результат графика Парето.

​ всех значений, не​ месте гистограммы, чтобы​ и 1.​ воздействует 6 причин.​ для изменения названий​

exceltable.com

​ зависим от какого-либо​

Теперь в каждой ячейке шаг за шагом прибавляем полученное значение ширины кармана: сначала к минимальному значению нашего массива (п. 3), затем в следующей ячейке ниже — к полученной сумме и т.д. Так постепенно доходим до максимального значения. Вот мы и построили интервалы карманов в виде столбца значений. Интервалом считается следующий диапазон : (i-1; i] или iСкачать бесплатно видеокурc по Excel

как сделать график распределения в excel

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Поделиться ссылкой:

Так как я часто имею дело с большим количеством данных, у меня время от времени возникает необходимость генерировать массивы значений для проверки моделей в Excel. К примеру, если я хочу увидеть распределение веса продукта с определенным стандартным отклонением, потребуются некоторые усилия, чтобы привести результат работы формулы СЛУЧМЕЖДУ() в нормальный вид. Дело в том, что формула СЛУЧМЕЖДУ() выдает числа с единым распределением, т.е. любое число с одинаковой долей вероятности может оказаться как у нижней, так и у верхней границы запрашиваемого диапазона. Такое положение дел не соответствует действительности, так как вероятность возникновения продукта уменьшается по мере отклонения от целевого значения. Т.е. если я произвожу продукт весом 100 грамм, вероятность, что я произведу 97-ми или 103-граммовый продукт меньше, чем 100 грамм. Вес большей части произведенной продукции будет сосредоточен рядом с целевым значением. Такое распределение называется нормальным. Если построить график, где по оси Y отложить вес продукта, а по оси X – количество произведенного продукта, график будет иметь колоколообразный вид, где наивысшая точка будет соответствовать целевому значению.

Таким образом, чтобы привести массив, выданный формулой СЛУЧМЕЖДУ(), в нормальный вид, мне приходилось ручками исправлять пограничные значения на близкие к целевым. Такое положение дел меня, естественно, не устраивало, поэтому, покопавшись в интернете, открыл интересный способ создания массива данных с нормальным распределением. В сегодняшней статье описан способ генерации массива и построения графика с нормальным распределением.

Характеристики нормального распределения

Непрерывная случайная переменная, которая подчиняется нормальному распределению вероятностей, обладает некоторыми особыми свойствами. Предположим, что вся производимая продукция подчиняется нормальному распределению со средним значением 100 грамм и стандартным отклонением 3 грамма. Распределение вероятностей для такой случайной переменной представлено на рисунке.

Из этого рисунка мы можем сделать следующие наблюдения относительно нормального распределения — оно имеет форму колокола и симметрично относительно среднего значения.

Стандартное отклонение имеет немаловажную роль в форме изгиба. Если посмотреть на предыдущий рисунок, то можно заметить, что практически все измерения веса продукта попадают в интервал от 95 до 105 граммов. Давайте рассмотрим следующий рисунок, на котором представлено нормальное распределение с той же средней – 100 грамм, но со стандартным отклонением всего 1,5 грамма

Здесь вы видите, что измерения значительно плотней прилегают к среднему значению. Почти все производимые продукты попадают в интервал от 97 до 102 грамм.

Небольшое значение стандартного отклонения выражается в более «тощей и высокой кривой, плотно прижимающейся к среднему значению. Чем больше стандартное, тем «толще», ниже и растянутее получается кривая.

Создание массива с нормальным распределением

Итак, чтобы сгенерировать массив данных с нормальным распределением, нам понадобится функция НОРМ.ОБР() – это обратная функция от НОРМ.РАСП(), которая возвращает нормально распределенную переменную для заданной вероятности для определенного среднего значения и стандартного отклонения. Синтаксис формулы выглядит следующим образом:

=НОРМ.ОБР(вероятность; среднее_значение; стандартное_отклонение)

Другими словами, я прошу Excel посчитать, какая переменная будет находится в вероятностном промежутке от 0 до 1. И так как вероятность возникновения продукта с весом в 100 грамм максимальная и будет уменьшаться по мере отдаления от этого значения, то формула будет выдавать значения близких к 100 чаще, чем остальных.

Давайте попробуем разобрать на примере. Выстроим график распределения вероятностей от 0 до 1 с шагом 0,01 для среднего значения равным 100 и стандартным отклонением 1,5.

Как видим из графика точки максимально сконцентрированы у переменной 100 и вероятности 0,5.

Этот фокус мы используем для генерирования случайного массива данных с нормальным распределением. Формула будет выглядеть следующим образом:

=НОРМ.ОБР(СЛЧИС(); среднее_значение; стандартное_отклонение)

Создадим массив данных для нашего примера со средним значением 100 грамм и стандартным отклонением 1,5 грамма и протянем нашу формулу вниз.

Теперь, когда массив данных готов, мы можем выстроить график с нормальным распределением.

Построение графика нормального распределения

Прежде всего необходимо разбить наш массив на периоды. Для этого определяем минимальное и максимальное значение, размер каждого периода или шаг, с которым будет увеличиваться период.

Далее строим таблицу с категориями. Нижняя граница (B11) равняется округленному вниз ближайшему кратному числу. Остальные категории увеличиваются на значение шага. Формула в ячейке B12 и последующих будет выглядеть:

=ЕСЛИ(A12;B11+$B$6; «»)

В столбце X будет производится подсчет количества переменных в заданном промежутке. Для этого воспользуемся формулой ЧАСТОТА(), которая имеет два аргумента: массив данных и массив интервалов. Выглядеть формула будет следующим образом =ЧАСТОТА(Data!A1:A175;B11:B20). Также стоит отметить, что в таком варианте данная функция будет работать как формула массива, поэтому по окончании ввода необходимо нажать сочетание клавиш Ctrl+Shift+Enter.

Таким образом у нас получилась таблица с данными, с помощью которой мы сможем построить диаграмму с нормальным распределением. Воспользуемся диаграммой вида Гистограмма с группировкой, где по оси значений будет отложено количество переменных в данном промежутке, а по оси категорий – периоды.

Осталось отформатировать диаграмму и наш график с нормальным распределением готов.

Итак, мы познакомились с вами с нормальным распределением, узнали, что Excel позволяет генерировать массив данных с помощью формулы НОРМ.ОБР() для определенного среднего значения и стандартного отклонения и научились приводить данный массив в графический вид.

Для лучшего понимания, вы можете скачать файл с примером построения нормального распределения.

Построим диаграмму распределения в Excel. А также рассмотрим подробнее функции круговых диаграмм, их создание.

График нормального распределения имеет форму колокола и симметричен относительно среднего значения. Получить такое графическое изображение можно только при огромном количестве измерений. В Excel для конечного числа измерений принято строить гистограмму.

Внешне столбчатая диаграмма похожа на график нормального распределения. Построим столбчатую диаграмму распределения осадков в Excel и рассмотрим 2 способа ее построения.

Имеются следующие данные о количестве выпавших осадков:

Первый способ. Открываем меню инструмента «Анализ данных» на вкладке «Данные» (если у Вас не подключен данный аналитический инструмент, тогда читайте как его подключить в настройках Excel):

Выбираем «Гистограмма»:

Задаем входной интервал (столбец с числовыми значениями). Поле «Интервалы карманов» оставляем пустым: Excel сгенерирует автоматически. Ставим птичку около записи «Вывод графика»:

После нажатия ОК получаем такой график с таблицей:

В интервалах не очень много значений, поэтому столбики гистограммы получились низкими.

Теперь необходимо сделать так, чтобы по вертикальной оси отображались относительные частоты.

Найдем сумму всех абсолютных частот (с помощью функции СУММ). Сделаем дополнительный столбец «Относительная частота». В первую ячейку введем формулу:

Способ второй. Вернемся к таблице с исходными данными. Вычислим интервалы карманов. Сначала найдем максимальное значение в диапазоне температур и минимальное.

Чтобы найти интервал карманов, нужно разность максимального и минимального значений массива разделить на количество интервалов. Получим «ширину кармана».

Представим интервалы карманов в виде столбца значений. Сначала ширину кармана прибавляем к минимальному значению массива данных. В следующей ячейке – к полученной сумме. И так далее, пока не дойдем до максимального значения.

Для определения частоты делаем столбец рядом с интервалами карманов. Вводим функцию массива:

Вычислим относительные частоты (как в предыдущем способе).

Построим столбчатую диаграмму распределения осадков в Excel с помощью стандартного инструмента «Диаграммы».

Частота распределения заданных значений:

Круговые диаграммы для иллюстрации распределения

С помощью круговой диаграммы можно иллюстрировать данные, которые находятся в одном столбце или одной строке. Сегмент круга – это доля каждого элемента массива в сумме всех элементов.

С помощью любой круговой диаграммы можно показать распределение в том случае, если

  • имеется только один ряд данных;
  • все значения положительные;
  • практически все значения выше нуля;
  • не более семи категорий;
  • каждая категория соответствует сегменту круга.

На основании имеющихся данных о количестве осадков построим круговую диаграмму.

Доля «каждого месяца» в общем количестве осадков за год:

Круговая диаграмма распределения осадков по сезонам года лучше смотрится, если данных меньше. Найдем среднее количество осадков в каждом сезоне, используя функцию СРЗНАЧ. На основании полученных данных построим диаграмму:

Получили количество выпавших осадков в процентном выражении по сезонам.

В двух словах: Добавляем полосу прокрутки к гистограмме или к графику распределения частот, чтобы сделать её динамической или интерактивной.

Уровень сложности: продвинутый.

На следующем рисунке показано, как выглядит готовая динамическая гистограмма:

Что такое гистограмма или график распределения частот?

Гистограмма распределения разбивает по группам значения из набора данных и показывает количество (частоту) чисел в каждой группе. Такую гистограмму также называют графиком распределения частот, поскольку она показывает, с какой частотой представлены значения.

В нашем примере мы делим людей, которые вызвались принять участие в мероприятии, по возрастным группам. Первым делом, создадим возрастные группы, далее подсчитаем, сколько людей попадает в каждую из групп, и затем покажем все это на гистограмме.

На какие вопросы отвечает гистограмма распределения?

Гистограмма – это один из моих самых любимых типов диаграмм, поскольку она дает огромное количество информации о данных.

В данном случае мы хотим знать, как много участников окажется в возрастных группах 20-ти, 30-ти, 40-ка лет и так далее. Гистограмма наглядно покажет это, поэтому определить закономерности и отклонения будет довольно легко.

«Неужели наше мероприятие не интересно гражданам в возрасте от 20 до 29 лет?»

Возможно, мы захотим немного изменить детализацию картины и разбить население на две возрастные группы. Это покажет нам, что в мероприятии примут участие большей частью молодые люди:

Динамическая гистограмма

После построения гистограммы распределения частот иногда возникает необходимость изменить размер групп, чтобы ответить на различные возникающие вопросы. В динамической гистограмме это возможно сделать благодаря полосе прокрутки (слайдеру) под диаграммой. Пользователь может увеличивать или уменьшать размер групп, нажимая стрелки на полосе прокрутки.

Такой подход делает гистограмму интерактивной и позволяет пользователю масштабировать ее, выбирая, сколько групп должно быть показано. Это отличное дополнение к любому дашборду!

Как это работает?

Краткий ответ: Формулы, динамические именованные диапазоны, элемент управления «Полоса прокрутки» в сочетании с гистограммой.

Формулы

Чтобы всё работало, первым делом нужно при помощи формул вычислить размер группы и количество элементов в каждой группе.

Чтобы вычислить размер группы, разделим общее количество (80-10) на количество групп. Количество групп устанавливается настройками полосы прокрутки. Чуть позже разъясним это подробнее.

Далее при помощи функции ЧАСТОТА (FREQUENCY) я рассчитываю количество элементов в каждой группе в заданном столбце. В данном случае мы возвращаем частоту из столбца Age таблицы с именем tblData.

=ЧАСТОТА(tblData;C13:C22)
=FREQUENCY(tblData,C13:C22)

Функция ЧАСТОТА (FREQUENCY) вводится, как формула массива, нажатием Ctrl+Shift+Enter.

Динамический именованный диапазон

В качестве источника данных для диаграммы используется именованный диапазон, чтобы извлекать данные только из выбранных в текущий момент групп.

Когда пользователь перемещает ползунок полосы прокрутки, число строк в динамическом диапазоне изменяется так, чтобы отобразить на графике только нужные данные. В нашем примере задано два динамических именованных диапазона: один для данных — rngGroups (столбец Frequency) и второй для подписей горизонтальной оси — rngCount (столбец Bin Name).

Элемент управления «Полоса прокрутки»

Элемент управления Полоса прокрутки (Scroll Bar) может быть вставлен с вкладки Разработчик (Developer).

На рисунке ниже видно, как я настроил параметры элемента управления и привязал его к ячейке C7. Так, изменяя состояние полосы прокрутки, пользователь управляет формулами.

Гистограмма

График – это самая простая часть задачи. Создаём простую гистограмму и в качестве источника данных устанавливаем динамические именованные диапазоны.

Есть вопросы?

Что ж, это был лишь краткий обзор того, как работает динамическая гистограмма.

Да, это не самая простая диаграмма, но, полагаю, пользователям понравится с ней работать. Определённо, такой интерактивной диаграммой можно украсить любой отчёт.

Более простой вариант гистограммы можно создать, используя сводные таблицы.

Пишите в комментариях любые вопросы и предложения. Спасибо!

Урок подготовлен для Вас командой сайта office-guru.ru
Источник: /> Перевел: Антон Андронов

Правила перепечаткиЕще больше уроков по Microsoft Excel

Оцените качество статьи. Нам важно ваше мнение:

Построим диаграмму распределения в Excel. А также рассмотрим подробнее функции круговых диаграмм, их создание.

Как построить диаграмму распределения в Excel

График нормального распределения имеет форму колокола и симметричен относительно среднего значения. Получить такое графическое изображение можно только при огромном количестве измерений. В Excel для конечного числа измерений принято строить гистограмму.

Внешне столбчатая диаграмма похожа на график нормального распределения. Построим столбчатую диаграмму распределения осадков в Excel и рассмотрим 2 способа ее построения.

Имеются следующие данные о количестве выпавших осадков:

Осадки.

Первый способ. Открываем меню инструмента «Анализ данных» на вкладке «Данные» (если у Вас не подключен данный аналитический инструмент, тогда читайте как его подключить в настройках Excel):

Анализ данных.

Выбираем «Гистограмма»:

Гистограмма.

Задаем входной интервал (столбец с числовыми значениями). Поле «Интервалы карманов» оставляем пустым: Excel сгенерирует автоматически. Ставим птичку около записи «Вывод графика»:

Входные данные.

После нажатия ОК получаем такой график с таблицей:

Пример.

В интервалах не очень много значений, поэтому столбики гистограммы получились низкими.



Теперь необходимо сделать так, чтобы по вертикальной оси отображались относительные частоты.

Найдем сумму всех абсолютных частот (с помощью функции СУММ). Сделаем дополнительный столбец «Относительная частота». В первую ячейку введем формулу:

Частота.

Способ второй. Вернемся к таблице с исходными данными. Вычислим интервалы карманов. Сначала найдем максимальное значение в диапазоне температур и минимальное.

Минимальное значение.

Чтобы найти интервал карманов, нужно разность максимального и минимального значений массива разделить на количество интервалов. Получим «ширину кармана».

Ширина кармана.

Представим интервалы карманов в виде столбца значений. Сначала ширину кармана прибавляем к минимальному значению массива данных. В следующей ячейке – к полученной сумме. И так далее, пока не дойдем до максимального значения.

Максимальное значение.

Для определения частоты делаем столбец рядом с интервалами карманов. Вводим функцию массива:

Функция в массиве.

Вычислим относительные частоты (как в предыдущем способе).

Относительные частоты.

Построим столбчатую диаграмму распределения осадков в Excel с помощью стандартного инструмента «Диаграммы».

Пример1.

Частота распределения заданных значений:

Частота распределения.

Круговые диаграммы для иллюстрации распределения

С помощью круговой диаграммы можно иллюстрировать данные, которые находятся в одном столбце или одной строке. Сегмент круга – это доля каждого элемента массива в сумме всех элементов.

С помощью любой круговой диаграммы можно показать распределение в том случае, если

  • имеется только один ряд данных;
  • все значения положительные;
  • практически все значения выше нуля;
  • не более семи категорий;
  • каждая категория соответствует сегменту круга.

На основании имеющихся данных о количестве осадков построим круговую диаграмму.

Количество осадков.

Доля «каждого месяца» в общем количестве осадков за год:

Доли.

Круговая диаграмма распределения осадков по сезонам года лучше смотрится, если данных меньше. Найдем среднее количество осадков в каждом сезоне, используя функцию СРЗНАЧ. На основании полученных данных построим диаграмму:

Пример3.

Получили количество выпавших осадков в процентном выражении по сезонам.

Как построить гистограмму в Excel по данным таблицы

Порой, информация, размещенная в таблице тяжело поддается анализу. Данные становятся более наглядными, если их представить в виде графика или гистограммы. В статье ниже мы разберем как построить гистограмму в Excel по данным таблицы.

Как построить гистограмму в Excel

  • выделите область с данными таблицы, которые вы хотите отразить на гистограмме. Важно выделить все заголовки в столбцах и строках;

  • перейдите во вкладку “Вставка” на Панели инструментов, затем щелкните по пункту меню “Гистограмма”;

  • выберите тип гистограммы:

  • на листе с данными таблицы появится гистограмма:

Стиль и внешний вид гистограммы

После того, как вы создали гистограмму, вам может потребоваться внести корректировки в то, как выглядит ваш график. Для изменения дизайна и стиля используйте вкладку “Конструктор”. Эта вкладка отображается на Панели инструментов, когда вы выделяете левой клавишей мыши гистограмму. С помощью дополнительных настроек в разделе “Конструктор” вы сможете:

  • добавить заголовок и другие дополнительные данные для отображения. Для того, чтобы добавить данные на график, кликните на пункт “Добавить элемент диаграммы”, затем, выберите нужный пункт из выпадающего списка:

  • для редактирования элемента гистограммы, например заголовка – дважды кликните на него и внесите корректировки;

  • если вы не хотите добавлять элементы по отдельности, то можно воспользоваться пунктом меню “Экспресс-макет” и выбрать подготовленные системой наиболее популярные наборы элементов гистограммы;

  • в Excel также доступные несколько подготовленных стилей гистограммы, выбрать которые вы можете в разделе “Стили диаграмм” на вкладке “Конструктор”;

Вы также можете использовать кнопки быстрого доступа к редактированию элементов гистограммы, стиля и фильтров:

Как сменить строки и столбцы в гистограмме

Вам также может понадобиться изменить способ группировки ваших данных. Например, в приведенной ниже таблице данные о продажах книг сгруппированы по годам со столбцами для каждого жанра. Однако мы могли бы поменять строки и столбцы местами, чтобы гистограмма группировала данные по жанру, со столбцами для каждого года. В обоих случаях гистограмма содержит одни и те же данные – она просто организована по-разному.

Для того чтобы сменить порядок строк и столбцов в гистограмме проделайте следующие шаги:

  • Выберите гистограмму, которую вы хотите отредактировать;
  • На вкладке “Конструктор” выберите пункт “Строка/Столбец”;

  • Строки и столбцы в графике будут сменены. В нашем примере данные сгруппированы по жанрам, а столбцы по годам.

Как переместить гистограмму в Excel

Когда вы создаете гистограмму, она по умолчанию будет отображаться на одном листе с данными, на основе которых она была построена. Есть возможность полученную гистограмму переместить на другой лист. Для этого проделайте следующие шаги:

  • Выделите гистограмму, которую вы хотите переместить;
  • Нажмите на пункт “Дизайн” на Панели инструментов, затем выберите пункт “Переместить диаграмму”;

  • В диалоговом окне выберите куда вы, хотите переместить гистограмму и нажмите ОК.

  • После этого, гистограмма будет перенесена в новое место назначения. В нашем примере, это новый лист.

Создание гистограммы

Гистограмма — это столбчатая диаграмма, которая показывает частоту повторяемости значений.

Примечание: В этой статье рассматривается только создание гистограмм. Сведения о диаграммах Парето (отсортированных гистограммах) см. в статье Создание диаграммы Парето.

  • Какие версии или продукты вы используете?
  • Excel 2016 и более поздние версии
  • Excel 2007 – 2013
  • Outlook, PowerPoint, Word 2016

(Это типичный пример данных для гистограммы.)

Выберите Вставка > Вставить диаграмму статистики > Гистограмма.

Гистограмму также можно создать с помощью вкладки Все диаграммы в разделе Рекомендуемые диаграммы.

На вкладках Конструктор и Формат можно настроить внешний вид диаграммы.

Если они не отображаются, щелкните в любом месте гистограммы, чтобы добавить на ленту область Работа с диаграммами.

Правой кнопкой мыши щелкните горизонтальную ось диаграммы, выберите Формат оси, а затем щелкните Параметры оси.

Руководствуясь приведенной ниже таблицей, вы сможете выбрать параметры, которые нужно задать в области задач Формат оси.

Выберите этот вариант, если категории (горизонтальная ось) текстовые, а не числовые. На гистограмме одинаковые категории будут сгруппированы, а значения на оси значений — просуммированы.

Совет: Чтобы подсчитать количество появлений текстовых строк, добавьте столбец и укажите в нем значение «1», а затем отобразите гистограмму и выберите параметр По категориям.

Это вариант по умолчанию для гистограмм. Длина интервала вычисляется по формуле Скотта.

Введите положительное десятичное число, задающее количество точек данных в каждом диапазоне.

Введите количество интервалов гистограммы (включая интервалы для значений, выходящих за верхнюю и нижнюю границы).

Выход за верхнюю границу интервала

Установите этот флажок, чтобы создать интервал для всех значений, превышающих значение в поле справа. Чтобы изменить его, введите в поле другое десятичное число.

Выход за нижнюю границу интервала

Установите этот флажок, чтобы создать интервал для всех значений, не превышающих значение в поле справа. Чтобы изменить его, введите в поле другое десятичное число.

Совет: Дополнительные сведения о гистограммах и их пользе для визуализации статистических данных см. в этой записи о гисторамме, диаграммах Парето и «ящик с усами» блога группы разработчиков Excel. Дополнительные сведения о других новых типах диаграмм приведены в этой записи блога.

Вариант «Автоматическая» (формула Скотта)

Формула Скотта минимизирует отклонение вариационного ряда на гистограмме по сравнению с набором данных, исходя из предположения о нормальном распределении данных.

Вариант «Выход за верхнюю границу интервала»

Вариант «Выход за нижнюю границу интервала»

Загрузите надстройку «Пакет анализа». Дополнительные сведения см. в статье Загрузка надстройки «Пакет анализа» в Excel.

В один столбец на листе введите исходные данные. При необходимости добавьте в первую ячейку подпись.

Используйте количественные числовые данные, например, количество элементов или результаты тестов. Мастер гистограмм не будет работать с такими количественными числовыми данными, как идентификационные номера, введенные в виде текста.

В следующий столбец введите интервалы в возрастающем порядке. При необходимости добавьте в первую ячейку подпись.

Используйте собственные интервалы, поскольку они могут лучше соответствовать целям вашего анализа. Если вы не введете их, мастер гистограмм создаст равномерно распределенные интервалы, используя минимальное и максимальное значение во введенном диапазоне в качестве начальной и конечной точек.

Откройте вкладку Данные и выберите команду Анализ данных.

Выберите пункт Гистограмма и нажмите кнопку OK.

В разделе Ввод выполните указанные ниже действия:

В поле Формировать список по диапазону введите ссылку на ячейку с диапазоном данных, который содержит исходные числа.

В поле Интервал карманов введите ссылку на ячейку с диапазоном, который содержит числа интервала.

Если на листе использовались подписи столбцов, можно включать их в ссылки на ячейки.

Совет: Вместо того, чтобы вводить ссылки вручную,можно нажать кнопку , чтобы временно свернуть диалоговое окно для выбора диапазонов на листе. При повторном нажатии этой кнопки диалоговое окно опять разворачивается.

Если подписи столбцов были включены в ссылки на ячейки, установите флажок Подписи.

В группе Параметры вывода выберите местоположение выходных данных.

Гистограмму можно расположить на том же листе, новом листе в текущей книге или в новой книге.

Установите один или несколько флажков:

Парето (отсортированная гистограмма) . Отображает частоту данных по убыванию.

Суммарный процент . Отображает суммарные проценты и добавляет в гистограмму строку суммарных процентов.

Вывод диаграммы . Отображает встроенную гистограмму.

Нажмите кнопку ОК.

Если вы хотите настроить гистограмму, вы можете изменить текстовые метки, щелкнув в любом месте гистограммы, чтобы использовать элементы диаграммы, стили диаграмми кнопки фильтра диаграммы справа от диаграммы.

(Это типичный пример данных для гистограммы.)

На вкладке Вставка нажмите кнопку Диаграмма.

В диалоговом окне Вставка диаграммы в разделе Все диаграммы выберите пункт Гистограмма, а затем нажмите кнопку ОК.

С помощью параметров на вкладках Конструктор и Формат настройте внешний вид диаграммы.

Если они не отображаются, щелкните в любом месте гистограммы, чтобы добавить на ленту область Работа с диаграммами.

Правой кнопкой мыши щелкните горизонтальную ось диаграммы, выберите Формат оси, а затем щелкните Параметры оси.

Руководствуясь приведенной ниже таблицей, вы сможете выбрать параметры, которые нужно задать в области задач Формат оси.

Выберите этот вариант, если категории (горизонтальная ось) текстовые, а не числовые. На гистограмме одинаковые категории будут сгруппированы, а значения на оси значений — просуммированы.

Совет: Чтобы подсчитать количество появлений текстовых строк, добавьте столбец и укажите в нем значение «1», а затем отобразите гистограмму и выберите параметр По категориям.

Это вариант по умолчанию для гистограмм.

Введите положительное десятичное число, задающее количество точек данных в каждом диапазоне.

Введите количество интервалов гистограммы (включая интервалы для значений, выходящих за верхнюю и нижнюю границы).

Выход за верхнюю границу интервала

Установите этот флажок, чтобы создать интервал для всех значений, превышающих значение в поле справа. Чтобы изменить его, введите в поле другое десятичное число.

Выход за нижнюю границу интервала

Установите этот флажок, чтобы создать интервал для всех значений, не превышающих значение в поле справа. Чтобы изменить его, введите в поле другое десятичное число.

Совет: Дополнительные сведения о гистограммах и их пользе для визуализации статистических данных см. в этой записи о гисторамме, диаграммах Парето и «ящик с усами» блога группы разработчиков Excel. Дополнительные сведения о других новых типах диаграмм приведены в этой записи блога.

Чтобы создать гистограмму в Excel для Mac, выполните указанные ниже действия.

(Это типичный пример данных для гистограммы.)

На ленте откройте вкладку Вставка, щелкните значок (Статистические) и в разделе Гистограмма выберите Гистограмма.

На вкладках Конструктор и Формат можно настроить внешний вид диаграммы.

Если они не отображаются, щелкните в любом месте гистограммы, чтобы добавить их на ленту.

Чтобы создать гистограмму в Excel 2011 для Mac, вам нужно скачать надстройку стороннего поставщика. Дополнительные сведения: я не могу найти пакет анализа в Excel 2011 для Mac .

В Excel Online можно просмотреть гистограмму (гистограмма, отображающая частотные данные), но ее невозможно создать, так как для нее требуется пакет анализа, надстройка Excel, которая не поддерживается в Excel Online.

Если у вас есть классическое приложение Excel, вы можете использовать кнопку изменить в Excel , чтобы открыть Excel на рабочем столе и создать гистограмму.

Коснитесь данных, чтобы выделить их.

Если вы находитесь на телефоне, коснитесь значка редактирования , чтобы отобразить ленту. и выберите Главная.

Выберите элементы Вставка > Диаграммы > Гистограмма.

При необходимости вы можете настроить элементы диаграммы.

Примечание: Эта функция доступна только при наличии подписки на Office 365. Если у вас есть подписка на Office 365, убедитесь, что у вас установлена последняя версия Office.

Коснитесь данных, чтобы выделить их.

Если вы используете телефон, коснитесь значка правки , чтобы отобразить ленту, а затем выберите вкладку Главная.

Выберите элементы Вставка > Диаграммы > Гистограмма.

Чтобы создать гистограмму в Excel, укажите два типа данных — данные, которые вы хотите проанализировать, и номера ячеек, которые представляют интервалы, на которые нужно измерить частоту. Данные необходимо расположить в двух столбцах на листе. Ниже приведены типы данных, которые должны содержаться в этих столбцах.

Введенные данные. Это данные, которые вы хотите проанализировать с помощью мастера гистограмм.

Числовые интервалы. Они представляют диапазоны, на основании которых мастер гистограмм проводит оценку введенных данных во время их анализа.

При использовании инструмента «гистограмма» Excel считает количество точек данных в каждом из ячеек данных. Точка данных включается в определенный интервал, если соответствующее значение больше нижней границы интервала данных и меньше верхней. Если вы пропустите диапазон ячеек, Excel создаст набор равномерно распределенных ячеек между минимальным и максимальным значениями входных данных.

Результат анализа гистограммы отображается на новом листе (или в новой книге) и содержит таблицу и гистограмму, которая отражает данные этой таблицы.

Дополнительные сведения

Вы всегда можете задать вопрос специалисту Excel Tech Community, попросить помощи в сообществе Answers community, а также предложить новую функцию или улучшение на веб-сайте Excel User Voice.

Примечание: Эта страница переведена автоматически, поэтому ее текст может содержать неточности и грамматические ошибки. Для нас важно, чтобы эта статья была вам полезна. Была ли информация полезной? Для удобства также приводим ссылку на оригинал (на английском языке).

LiveInternetLiveInternet

Метки

Музыка

Конвертер видеоссылок

Подписка по e-mail

Поиск по дневнику

Интересы

Постоянные читатели

Трансляции

Статистика

Построение гистограмм распределения в Excel

В связи с написанием диплома тема подсчёта статистики для меня крайне актуальна, посему делюсь найденной крайне полезной стаейкой по построению гистограмм распределения. Точнее частью этой статьи с наипростейшим алгоритмом постороения этих гистограмм Excel. Лично я строю этим способом гистограммы распределения значений показателей психологических тестов, ну а там уж каждому по потребностям, распределение чего надо посмотреть.

В современном мире к статистике проявляется большой интерес, поскольку это отличный инструмент для анализа и принятия решений, а также это отличное средство для поиска причин нарушений процесса и их устранения. Статистический анализ применим во многих сферах, где существуют большие массивы данных: естественно, в первую очередь я скажу, что металлургии, а также в экономике, биологии, политике, социологии и. много где еще. Статья эта будет, как несложно догадаться по ее названию, про использование некоторых средств статистического анализа, а именно — гистограммам.
Ну, поехали.

Статистический анализ в Excel можно осуществлять двумя способами:
• С помощью функций
• С помощью средств надстройки «Пакет анализа». Ее, как правило, еще необходимо установить.

Чтобы установить пакет анализа в Excel, выберите вкладку «Файл» (а в Excel 2007 это круглая цветная кнопка слева сверху), далее — «Параметры», затем выберите раздел «Надстройки». Нажмите «Перейти» и поставьте галочку напротив «Пакет анализа».

А теперь — к построению гистограмм распределения по частоте и их анализу.

Речь пойдет именно о частотных гистограммах, где каждый столбец соответствует частоте появления* значения в пределах границ интервалов. Например, мы хотим посмотреть, как у нас выглядит распределение значения предела текучести стали S355J2 в прокате толщиной 20 мм за несколько месяцев. В общем, хотим посмотреть, похоже ли наше распределение на нормальное (а оно должно быть таким).

*Примечание: для металловедческих целей типа оценки размера зерна или оценки объемной доли частиц этот вид гистограмм не пойдет, т.к. там высота столбика соответствует не частоте появления частиц определенного размера, а доле объема (а в плоскости шлифа — площади), которую эти частицы занимают.

График нормального распределения выглядит следующим образом:

График функции Гаусса

Мы знаем, что реально такой график может быть получен только при бесконечно большом количестве измерений. Реально же для конечного числа измерений строят гистограмму, которая внешне похожа на график нормального распределения и при увеличении количества измерений приближается к графику нормального распределения (распределения Гаусса).

Построение гистограмм с помощью программ типа Excel является очень быстрым способом проверки стабильности работы оборудования и добросовестности коллектива: если получим «кривую» гистограмму, значит, либо прибор не исправен или мы данные неверно собрали, либо кто-то где-то преднамеренно мухлюет или же просто неверно использует оборудование.

А теперь — построение гистограмм!

Способ 1-ый. Халявный.


  1. Идем во вкладку «Анализ данных» и выбираем «Гистограмма».
  2. Выбираем входной интервал.
  3. Здесь же предлагается задать интервал карманов, т.е. те диапазоны, в пределах которых будут лежать наши значения. Чем больше значений в интервале — тем выше столбик гистограммы. Если мы оставим поле «Интервалы карманов» пустым, то программа вычислит границы интервалов за нас.
  4. Если хотим сразу же вывести график,то ставим галочку напротив «Вывод графика».
  5. Нажимаем «ОК».
  6. Вот, вроде бы, и все: гистограмма готова. Теперь нужно сделать так, чтобы по вертикальной оси отображалась не абсолютная частота, а относительная.
  7. Под появившейся таблицей со столбцами «Карман» и «Частота» под столбцом «Частота» введем формулу «=СУММ» и сложим все абсолютные частоты.
  8. К появившейся таблице со столбцами «Карман» и «Частота» добавим еще один столбец и назовем его «Относительная частота».
  9. Во всех ячейках нового столбца введем формулу, которая будет рассчитывать относительную частоту: 100 умножить на абсолютную частоту (ячейка из столбца «частота») и разделить на сумму, которую мы вычислил в п. 7.

Диаграмма распределения осадков в Excel

Построим диаграмму распределения в Excel. А также рассмотрим подробнее функции круговых диаграмм, их создание.

Как построить диаграмму распределения в Excel

График нормального распределения имеет форму колокола и симметричен относительно среднего значения. Получить такое графическое изображение можно только при огромном количестве измерений. В Excel для конечного числа измерений принято строить гистограмму.

Внешне столбчатая диаграмма похожа на график нормального распределения. Построим столбчатую диаграмму распределения осадков в Excel и рассмотрим 2 способа ее построения.

Имеются следующие данные о количестве выпавших осадков:

Первый способ. Открываем меню инструмента «Анализ данных» на вкладке «Данные» (если у Вас не подключен данный аналитический инструмент, тогда читайте как его подключить в настройках Excel):

Задаем входной интервал (столбец с числовыми значениями). Поле «Интервалы карманов» оставляем пустым: Excel сгенерирует автоматически. Ставим птичку около записи «Вывод графика»:

После нажатия ОК получаем такой график с таблицей:

В интервалах не очень много значений, поэтому столбики гистограммы получились низкими.

Теперь необходимо сделать так, чтобы по вертикальной оси отображались относительные частоты.

Найдем сумму всех абсолютных частот (с помощью функции СУММ). Сделаем дополнительный столбец «Относительная частота». В первую ячейку введем формулу:

Способ второй. Вернемся к таблице с исходными данными. Вычислим интервалы карманов. Сначала найдем максимальное значение в диапазоне температур и минимальное.

Чтобы найти интервал карманов, нужно разность максимального и минимального значений массива разделить на количество интервалов. Получим «ширину кармана».

Представим интервалы карманов в виде столбца значений. Сначала ширину кармана прибавляем к минимальному значению массива данных. В следующей ячейке – к полученной сумме. И так далее, пока не дойдем до максимального значения.

Для определения частоты делаем столбец рядом с интервалами карманов. Вводим функцию массива:

Вычислим относительные частоты (как в предыдущем способе).

Построим столбчатую диаграмму распределения осадков в Excel с помощью стандартного инструмента «Диаграммы».

Частота распределения заданных значений:

Круговые диаграммы для иллюстрации распределения

С помощью круговой диаграммы можно иллюстрировать данные, которые находятся в одном столбце или одной строке. Сегмент круга – это доля каждого элемента массива в сумме всех элементов.

С помощью любой круговой диаграммы можно показать распределение в том случае, если

  • имеется только один ряд данных;
  • все значения положительные;
  • практически все значения выше нуля;
  • не более семи категорий;
  • каждая категория соответствует сегменту круга.

На основании имеющихся данных о количестве осадков построим круговую диаграмму.

Доля «каждого месяца» в общем количестве осадков за год:

Круговая диаграмма распределения осадков по сезонам года лучше смотрится, если данных меньше. Найдем среднее количество осадков в каждом сезоне, используя функцию СРЗНАЧ. На основании полученных данных построим диаграмму:

Получили количество выпавших осадков в процентном выражении по сезонам.

Гистограмма распределения в MS EXCEL

Гистограмма распределения — это инструмент, позволяющий визуально оценить величину и характер разброса данных. Создадим гистограмму для непрерывной случайной величины с помощью встроенных средств MS EXCEL из надстройки Пакет анализа и в ручную с помощью функции ЧАСТОТА() и диаграммы.

Гистограмма (frequency histogram) – это столбиковая диаграмма MS EXCEL, в каждый столбик представляет собой интервал значений (корзину, карман, class interval, bin, cell), а его высота пропорциональна количеству значений в ней (частоте наблюдений).

Гистограмма поможет визуально оценить распределение набора данных, если:

  • в наборе данных как минимум 50 значений;
  • ширина интервалов одинакова.

Построим гистограмму для набора данных, в котором содержатся значения непрерывной случайной величины. Набор данных (50 значений), а также рассмотренные примеры, можно взять на листе Гистограмма AT в файле примера. Данные содержатся в диапазоне А8:А57.

Примечание: Для удобства написания формул для диапазона А8:А57 создан Именованный диапазон Исходные_данные.

Построение гистограммы с помощью надстройки Пакет анализа

Вызвав диалоговое окно надстройки Пакет анализа, выберите пункт Гистограмма и нажмите ОК.

В появившемся окне необходимо как минимум указать: входной интервал и левую верхнюю ячейку выходного интервала. После нажатия кнопки ОК будут:

  • автоматически рассчитаны интервалы значений (карманы);
  • подсчитано количество значений из указанного массива данных, попадающих в каждый интервал (построена таблица частот);
  • если поставлена галочка напротив пункта Вывод графика, то вместе с таблицей частот будет выведена гистограмма.


Перед тем как анализировать полученный результат — отсортируйте исходный массив данных.

Как видно из рисунка, первый интервал включает только одно минимальное значение 113 (точнее, включены все значения меньшие или равные минимальному). Если бы в массиве было 2 или более значения 113, то в первый интервал попало бы соответствующее количество чисел (2 или более).

Второй интервал (отмечен на картинке серым) включает значения больше 113 и меньше или равные 216,428571428571. Можно проверить, что таких значений 11. Предпоследний интервал, от 630,142857142857 (не включая) до 733,571428571429 (включая) содержит 0 значений, т.к. в этом диапазоне значений нет. Последний интервал (со странным названием Еще) содержит значения больше 733,571428571429 (не включая). Таких значений всего одно — максимальное значение в массиве (837).

Размеры карманов одинаковы и равны 103,428571428571. Это значение можно получить так:
=(МАКС(Исходные_данные)-МИН(Исходные_данные))/7
где Исходные_данные – именованный диапазон, содержащий наши данные.

Почему 7? Дело в том, что количество интервалов гистограммы (карманов) зависит от количества данных и для его определения часто используется формула √n, где n – это количество данных в выборке. В нашем случае √n=√50=7,07 (всего 7 полноценных карманов, т.к. первый карман включает только значения равные минимальному).

Примечание: Похоже, что инструмент Гистограмма для подсчета общего количества интервалов (с учетом первого) использует формулу
=ЦЕЛОЕ(КОРЕНЬ(СЧЕТ(Исходные_данные)))+1

Попробуйте, например, сравнить количество интервалов для диапазонов длиной 35 и 36 значений – оно будет отличаться на 1, а у 36 и 48 – будет одинаковым, т.к. функция ЦЕЛОЕ() округляет до ближайшего меньшего целого (ЦЕЛОЕ(КОРЕНЬ(35))=5 , а ЦЕЛОЕ(КОРЕНЬ(36))=6) .

Если установить галочку напротив поля Парето (отсортированная гистограмма), то к таблице с частотами будет добавлена таблица с отсортированными по убыванию частотами.

Если установить галочку напротив поля Интегральный процент, то к таблице с частотами будет добавлен столбец с нарастающим итогом в % от общего количества значений в массиве.

Если выбор количества интервалов или их диапазонов не устраивает, то можно в диалоговом окне указать нужный массив интервалов (если интервал карманов включает текстовый заголовок, то нужно установить галочку напротив поля Метка).

Для нашего набора данных установим размер кармана равным 100 и первый карман возьмем равным 150.

В результате получим практически такую же по форме гистограмму, что и раньше, но с более красивыми границами интервалов.

Как видно из рисунков выше, надстройка Пакет анализа не осуществляет никакого дополнительного форматирования диаграммы. Соответственно, вид такой гистограммы оставляет желать лучшего (столбцы диаграммы обычно располагают вплотную для непрерывных величин, кроме того подписи интервалов не информативны). О том, как придать диаграмме более презентабельный вид, покажем в следующем разделе при построении гистограммы с помощью функции ЧАСТОТА() без использовании надстройки Пакет анализа.

Построение гистограммы распределения без использования надстройки Пакет анализа

Порядок действий при построении гистограммы в этом случае следующий:

  • определить количество интервалов у гистограммы;
  • определить ширину интервала (с учетом округления);
  • определить границу первого интервала;
  • сформировать таблицу интервалов и рассчитать количество значений, попадающих в каждый интервал (частоту);
  • построить гистограмму.

СОВЕТ: Часто рекомендуют, чтобы границы интервала были на один порядок точнее самих данных и оканчивались на 5. Например, если данные в массиве определены с точностью до десятых: 1,2; 2,3; 5,0; 6,1; 2,1, …, то границы интервалов должны быть округлены до сотых: 1,25-1,35; 1,35-1,45; …
Для небольших наборов данных вид гистограммы сильно зависит количества интервалов и их ширины. Это приводит к тому, что сам метод гистограмм, как инструмент описательной статистики, может быть применен только для наборов данных состоящих, как минимум, из 50, а лучше из 100 значений.

В наших расчетах для определения количества интервалов мы будем пользоваться формулой =ЦЕЛОЕ(КОРЕНЬ(n))+1 .

Примечание: Кроме использованного выше правила (число карманов = √n), используется ряд других эмпирических правил, например, правило Стёрджеса (Sturges): число карманов =1+log2(n). Это обусловлено тем, что например, для n=5000, количество интервалов по формуле √n будет равно 70, а правило Стёрджеса рекомендует более приемлемое количество — 13.

Расчет ширины интервала и таблица интервалов приведены в файле примера на листе Гистограмма . Для вычисления количества значений, попадающих в каждый интервал, использована формула массива на основе функции ЧАСТОТА() . О вводе этой функции см. статью Функция ЧАСТОТА() — Подсчет ЧИСЛОвых значений в MS EXCEL.

В MS EXCEL имеется диаграмма типа Гистограмма с группировкой, которая обычно используется для построения Гистограмм распределения.

В итоге можно добиться вот такого результата.

Примечание: О построении и настройке макета диаграмм см. статью Основы построения диаграмм в MS EXCEL.

Одной из разновидностей гистограмм является график накопленной частоты (cumulative frequency plot).

На этом графике каждый столбец представляет собой число значений исходного массива, меньших или равных правой границе соответствующего интервала. Это очень удобно, т.к., например, из графика сразу видно, что 90% значений (45 из 50) меньше чем 495.

СОВЕТ : О построении двумерной гистограммы см. статью Двумерная гистограмма в MS EXCEL.

Примечание: Альтернативой графику накопленной частоты может служить Кривая процентилей, которая рассмотрена в статье про Процентили.

Примечание: Когда количество значений в выборке недостаточно для построения полноценной гистограммы может быть полезна Блочная диаграмма (иногда она называется Диаграмма размаха или Ящик с усами).

  • Редакция Кодкампа

17 авг. 2022 г.
читать 2 мин


Распределение частоты описывает, как часто разные значения встречаются в наборе данных. Это полезный способ понять, как значения данных распределяются в наборе данных.

К счастью, легко создать и визуализировать частотное распределение в Excel, используя следующую функцию:

=ЧАСТОТА(массив_данных,массив_бинов)

куда:

  • data_array : массив необработанных значений данных
  • bins_array: массив верхних пределов для бинов

В следующем примере показано, как использовать эту функцию на практике.

Пример: частотное распределение в Excel

Предположим, у нас есть следующий набор данных из 20 значений в Excel:

Во-первых, мы укажем Excel, какие верхние пределы мы хотели бы использовать для интервалов нашего частотного распределения. Для этого примера мы выберем 10, 20 и 30. То есть мы найдем частоты для следующих интервалов:

  • от 0 до 10
  • с 11 до 20
  • от 21 до 30
  • 30+

Далее мы будем использовать следующую функцию =FREQUENCY() для вычисления частот для каждого бина:

=ЧАСТОТА( A2:A21 , C2:C4 )

Вот результаты:

Частотное распределение в Excel

Результаты показывают, что:

  • 6 значений в наборе данных находятся в диапазоне от 0 до 10.
  • 7 значений в наборе данных находятся в диапазоне 11-20.
  • 5 значений в наборе данных находятся в диапазоне 21-30.
  • 2 значения в наборе данных больше 30.

Затем мы можем использовать следующие шаги для визуализации этого частотного распределения:

  • Выделите частоты в диапазоне D2:D5 .
  • Нажмите на вкладку « Вставка », затем нажмите на диаграмму под названием « Двухмерный столбец » в группе « Диаграммы ».

Появится следующая диаграмма, отображающая частоты для каждого бина:

Визуализация частотного распределения в Excel

Не стесняйтесь изменять метки осей и ширину полос, чтобы сделать диаграмму более эстетичной:

Частотное распределение в Excel

Вы можете найти больше учебников по Excel здесь .

Написано

Редакция Кодкампа

Замечательно! Вы успешно подписались.

Добро пожаловать обратно! Вы успешно вошли

Вы успешно подписались на кодкамп.

Срок действия вашей ссылки истек.

Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.

Успех! Ваша платежная информация обновлена.

Ваша платежная информация не была обновлена.

В статье подробно показано, что такое нормальный закон распределения случайной величины и как им пользоваться при решении практически задач.

Нормальное распределение в статистике

История закона насчитывает 300 лет. Первым открывателем стал Абрахам де Муавр, который придумал аппроксимацию биномиального распределения еще 1733 году. Через много лет Карл Фридрих Гаусс (1809 г.) и Пьер-Симон Лаплас (1812 г.) вывели математические функции.

Лаплас также обнаружил замечательную закономерность и сформулировал центральную предельную теорему (ЦПТ), согласно которой сумма большого количества малых и независимых величин имеет нормальное распределение.

Нормальный закон не является фиксированным уравнением зависимости одной переменной от другой. Фиксируется только характер этой зависимости. Конкретная форма распределения задается специальными параметрами. Например, у = аx + b – это уравнение прямой. Однако где конкретно она проходит и под каким наклоном, определяется параметрами а и b. Также и с нормальным распределением. Ясно, что это функция, которая описывает тенденцию высокой концентрации значений около центра, но ее точная форма задается специальными параметрами.

Кривая нормального распределения Гаусса имеет следующий вид.

График плотности нормального распределения

График нормального распределения напоминает колокол, поэтому можно встретить название колоколообразная кривая. У графика имеется «горб» в середине и резкое снижение плотности по краям. В этом заключается суть нормального распределения. Вероятность того, что случайная величина окажется около центра гораздо выше, чем то, что она сильно отклонится от середины.

Различные вероятности у нормально распределенных данных

На рисунке выше изображены два участка под кривой Гаусса: синий и зеленый. Основания, т.е. интервалы, у обоих участков равны. Но заметно отличаются высоты. Синий участок удален от центра, и имеет существенно меньшую высоту, чем зеленый, который находится в самом центре распределения. Следовательно, отличаются и площади, то бишь вероятности попадания в обозначенные интервалы.

Формула нормального распределения (плотности) следующая.

Функция Гаусса

Формула состоит из двух математических констант:

π – число пи 3,142;

е – основание натурального логарифма 2,718;

двух изменяемых параметров, которые задают форму конкретной кривой:

m – математическое ожидание (в различных источниках могут использоваться другие обозначения, например, µ или a);

σ2 – дисперсия;

ну и сама переменная x, для которой высчитывается плотность вероятности.

Конкретная форма нормального распределения зависит от 2-х параметров: математического ожидания (m) и дисперсии (σ2). Кратко обозначается N(m, σ2) или N(m, σ). Параметр m (матожидание) определяет центр распределения, которому соответствует максимальная высота графика. Дисперсия σ2 характеризует размах вариации, то есть «размазанность» данных.

Параметр математического ожидания смещает центр распределения вправо или влево, не влияя на саму форму кривой плотности.

Влияние матожидания на нормальное распределение

А вот дисперсия определяет остроконечность кривой. Когда данные имеют малый разброс, то вся их масса концентрируется у центра. Если же у данных большой разброс, то они «размазываются» по широкому диапазону.

Влияние сигмы на нормальное распределение

Плотность распределения не имеет прямого практического применения. Для расчета вероятностей нужно проинтегрировать функцию плотности.

Вероятность того, что случайная величина окажется меньше некоторого значения x, определяется функцией нормального распределения:

Функция нормального распределения
Используя математические свойства любого непрерывного распределения, несложно рассчитать и любые другие вероятности, так как

P(a ≤ X < b) = Ф(b) – Ф(a)

Стандартное нормальное распределение

Нормальное распределение зависит от параметров средней и дисперсии, из-за чего плохо видны его свойства. Хорошо бы иметь некоторый эталон распределения, не зависящий от масштаба данных. И он существует. Называется стандартным нормальным распределением. На самом деле это обычное нормальное нормальное распределение, только с параметрами математического ожидания 0, а дисперсией – 1, кратко записывается N(0, 1).

Любое нормальное распределение легко превращается в стандартное путем нормирования:

Нормирование

где z – новая переменная, которая используется вместо x;
m – математическое ожидание;
σ – стандартное отклонение.

Для выборочных данных берутся оценки:

Нормирование по оценкам параметров

Среднее арифметическое и дисперсия новой переменной z теперь также равны 0 и 1 соответственно. В этом легко убедиться с помощью элементарных алгебраических преобразований.

В литературе встречается название z-оценка. Это оно самое – нормированные данные. Z-оценку можно напрямую сравнивать с теоретическими вероятностями, т.к. ее масштаб совпадает с эталоном.

Посмотрим теперь, как выглядит плотность стандартного нормального распределения (для z-оценок). Напомню, что функция Гаусса имеет вид:

Функция Гаусса

Подставим вместо (x-m)/σ букву z, а вместо σ – единицу, получим функцию плотности стандартного нормального распределения:

Плотность стандартного нормального распределения

График плотности:

График плотности стандартного нормального распределения

Центр, как и ожидалось, находится в точке 0. В этой же точке функция Гаусса достигает своего максимума, что соответствует принятию случайной величиной своего среднего значения (т.е. x-m=0). Плотность в этой точке равна 0,3989, что можно посчитать даже в уме, т.к. e0=1 и остается рассчитать только соотношение 1 на корень из 2 пи.

Таким образом, по графику хорошо видно, что значения, имеющие маленькие отклонения от средней, выпадают чаще других, а те, которые сильно отдалены от центра, встречаются значительно реже. Шкала оси абсцисс измеряется в стандартных отклонениях, что позволяет отвязаться от единиц измерения и получить универсальную структуру нормального распределения. Кривая Гаусса для нормированных данных отлично демонстрирует и другие свойства нормального распределения. Например, что оно является симметричным относительно оси ординат. В пределах ±1σ от средней арифметической сконцентрирована большая часть всех значений (прикидываем пока на глазок). В пределах ±2σ находятся большинство данных. В пределах ±3σ находятся почти все данные. Последнее свойство широко известно под названием правило трех сигм для нормального распределения.

Функция стандартного нормального распределения позволяет рассчитывать вероятности.

Функция стандартного нормального распределения

Понятное дело, вручную никто не считает. Все подсчитано и размещено в специальных таблицах, которые есть в конце любого учебника по статистике.

Таблица нормального распределения

Таблицы нормального распределения встречаются двух типов:

— таблица плотности;

— таблица функции (интеграла от плотности).

Таблица плотности используется редко. Тем не менее, посмотрим, как она выглядит. Допустим, нужно получить плотность для z = 1, т.е. плотность значения, отстоящего от матожидания на 1 сигму. Ниже показан кусок таблицы. 

Таблица плотности стандартного нормального распределения

В зависимости от организации данных ищем нужное значение по названию столбца и строки. В нашем примере берем строку 1,0 и столбец 0, т.к. сотых долей нет. Искомое значение равно 0,2420 (0 перед 2420 опущен). 

Функция Гаусса симметрична относительно оси ординат. Поэтому φ(z)= φ(-z), т.е. плотность для 1 тождественна плотности для -1, что отчетливо видно на рисунке.

График функции Гаусса

Чтобы не тратить зря бумагу, таблицы печатают только для положительных значений.

На практике чаще используют значения функции стандартного нормального распределения, то есть вероятности для различных z.

В таких таблицах также содержатся только положительные значения. Поэтому для понимания и нахождения любых нужных вероятностей следует знать свойства стандартного нормального распределения.

Функция Ф(z) симметрична относительно своего значения 0,5 (а не оси ординат, как плотность). Отсюда справедливо равенство:

Свойство 1

Это факт показан на картинке:

Свойство нормального распределения 1

Значения функции Ф(-z) и Ф(z) делят график на 3 части. Причем верхняя и нижняя части равны (обозначены галочками). Для того, чтобы дополнить вероятность Ф(z) до 1, достаточно добавить недостающую величину Ф(-z). Получится равенство, указанное чуть выше.

Если нужно отыскать вероятность попадания в интервал (0; z), то есть вероятность отклонения от нуля в положительную сторону до некоторого количества стандартных отклонений, достаточно от значения функции стандартного нормального распределения отнять 0,5:

Свойство 2

Для наглядности можно взглянуть на рисунок.

Свойство нормального распределения 2

На кривой Гаусса, эта же ситуация выглядит как площадь от центра вправо до z.

Свойство нормального распределения 2 на кривой Гаусса

Довольно часто аналитика интересует вероятность отклонения в обе стороны от нуля. А так как функция симметрична относительно центра, предыдущую формулу нужно умножить на 2:

Свойство 3

Рисунок ниже.

Свойство нормального распределения 3

Под кривой Гаусса это центральная часть, ограниченная выбранным значением –z слева и z справа.

Свойство нормального распределения 3 на кривой Гаусса

Указанные свойства следует принять во внимание, т.к. табличные значения редко соответствуют интересующему интервалу.

Для облегчения задачи в учебниках обычно публикуют таблицы для функции вида:

Функция стандартного нормального распределения

Если нужна вероятность отклонения в обе стороны от нуля, то, как мы только что убедились, табличное значение для данной функции просто умножается на 2.

Теперь посмотрим на конкретные примеры. Ниже показана таблица стандартного нормального распределения. Найдем табличные значения для трех z: 1,64, 1,96 и 3.

Таблица функции Лапласа

Как понять смысл этих чисел? Начнем с z=1,64, для которого табличное значение составляет 0,4495. Проще всего пояснить смысл на рисунке.

Значение функции Лапласа для z=1,64 в правую сторону

То есть вероятность того, что стандартизованная нормально распределенная случайная величина попадет в интервал от 0 до 1,64, равна 0,4495. При решении задач обычно нужно рассчитать вероятность отклонения в обе стороны, поэтому умножим величину 0,4495 на 2 и получим примерно 0,9. Занимаемая площадь под кривой Гаусса показана ниже.

Значение функции Лапласа для z=1,64 под кривой Гаусса

Таким образом, 90% всех нормально распределенных значений попадает в интервал ±1,64σ от средней арифметической. Я не случайно выбрал значение z=1,64, т.к. окрестность вокруг средней арифметической, занимающая 90% всей площади, иногда используется для проверки статистических гипотез и расчета доверительных интервалов. Если проверяемое значение не попадает в обозначенную область, то его наступление маловероятно (всего 10%).

Для проверки гипотез, однако, чаще используется интервал, накрывающий 95% всех значений. Половина вероятности от 0,95 – это 0,4750 (см. второе выделенное в таблице значение).

Значение функции Лапласа для z=1,96 в правую сторону

Для этой вероятности z=1,96. Т.е. в пределах почти ±2σ от средней находится 95% значений. Только 5% выпадают за эти пределы.

Значение функции Лапласа для z=1,96 под кривой Гаусса

Еще одно интересное и часто используемое табличное значение соответствует z=3, оно равно по нашей таблице 0,4986. Умножим на 2 и получим 0,997. Значит, в рамках ±3σ от средней арифметической заключены почти все значения.

Значение функции Лапласа для z=3 под кривой Гаусса

Так выглядит правило 3 сигм для нормального распределения на диаграмме.

С помощью статистических таблиц можно получить любую вероятность. Однако этот метод очень медленный, неудобный и сильно устарел. Сегодня все делается на компьютере. Далее переходим к практике расчетов в Excel.

В Excel есть несколько функций для подсчета вероятностей или обратных значений нормального распределения.

Функции нормального распределения в Excel

Функция НОРМ.СТ.РАСП

Функция НОРМ.СТ.РАСП предназначена для расчета плотности ϕ(z) или вероятности Φ(z) по нормированным данным (z).

=НОРМ.СТ.РАСП(z;интегральная)

z – значение стандартизованной переменной

интегральная – если 0, то рассчитывается плотность ϕ(z), если 1 – значение функции Ф(z), т.е. вероятность P(Z<z).

Рассчитаем плотность и значение функции для различных z: -3, -2, -1, 0, 1, 2, 3 (их укажем в ячейке А2).

Для расчета плотности потребуется формула =НОРМ.СТ.РАСП(A2;0). На диаграмме ниже – это красная точка.

Для расчета значения функции =НОРМ.СТ.РАСП(A2;1). На диаграмме – закрашенная площадь под нормальной кривой.

Расчет плотности и функции нормального распределения в Excel

В реальности чаще приходится рассчитывать вероятность того, что случайная величина не выйдет за некоторые пределы от средней (в среднеквадратичных отклонениях, соответствующих переменной z), т.е. P(|Z|<z).

Вероятность отклонения при заданном z

Определим, чему равна вероятность попадания случайной величины в пределы ±1z, ±2z и ±3z от нуля. Потребуется формула 2Ф(z)-1, в Excel =2*НОРМ.СТ.РАСП(A2;1)-1.

Расчет вероятности отклонения от средней

На диаграмме отлично видны основные основные свойства нормального распределения, включая правило трех сигм. Функция НОРМ.СТ.РАСП – это автоматическая таблица значений функции нормального распределения в Excel.

Может стоять и обратная задача: по имеющейся вероятности P(Z<z) найти стандартизованную величину z ,то есть квантиль стандартного нормального распределения.

Функция НОРМ.СТ.ОБР

НОРМ.СТ.ОБР рассчитывает обратное значение функции стандартного нормального распределения. Синтаксис состоит из одного параметра:

=НОРМ.СТ.ОБР(вероятность)

вероятность – это вероятность.

Данная формула используется так же часто, как и предыдущая, ведь по тем же таблицам искать приходится не только вероятности, но и квантили.

Обратная функция стандартного нормального распределения

Например, при расчете доверительных интервалов задается доверительная вероятность, по которой нужно рассчитать величину z.

Расчет предельного отклонения при нормальном распределении

Учитывая то, что доверительный интервал состоит из верхней и нижней границы и то, что нормальное распределение симметрично относительно нуля, достаточно получить верхнюю границу (положительное отклонение). Нижняя граница берется с отрицательным знаком. Обозначим доверительную вероятность как γ (гамма), тогда верхняя граница доверительного интервала рассчитывается по следующей формуле.

Формула расчета предельного отклонения с помощью обратной функции нормального стандартного распределения

Рассчитаем в Excel значения z (что соответствует отклонению от средней в сигмах) для нескольких вероятностей, включая те, которые наизусть знает любой статистик: 90%, 95% и 99%. В ячейке B2 укажем формулу: =НОРМ.СТ.ОБР((1+A2)/2). Меняя значение переменной (вероятности в ячейке А2) получим различные границы интервалов.

Расчет предельного отклонения при заданной вероятности

Доверительный интервал для 95% равен 1,96, то есть почти 2 среднеквадратичных отклонения. Отсюда легко даже в уме оценить возможный разброс нормальной случайной величины. В общем, доверительным вероятностям 90%, 95% и 99% соответствуют доверительные интервалы ±1,64, ±1,96 и ±2,58 σ.

В целом функции НОРМ.СТ.РАСП и НОРМ.СТ.ОБР позволяют произвести любой расчет, связанный с нормальным распределением. Но, чтобы облегчить и уменьшить количество действий, в Excel есть несколько других функций. Например, для расчета доверительных интервалов средней можно использовать ДОВЕРИТ.НОРМ. Для проверки статистической гипотезы о средней арифметической есть формула Z.ТЕСТ. 

Рассмотрим еще пару полезных формул с примерами.

Функция НОРМ.РАСП

Функция НОРМ.РАСП отличается от НОРМ.СТ.РАСП лишь тем, что ее используют для обработки данных любого масштаба, а не только нормированных. Параметры нормального распределения указываются в синтаксисе.

=НОРМ.РАСП(x;среднее;стандартное_откл;интегральная)

x – значение (или ссылка на ячейку), для которого рассчитывается плотность или значение функции нормального распределения

среднее – математическое ожидание, используемое в качестве первого параметра модели нормального распределения

стандартное_откл – среднеквадратичное отклонение – второй параметр модели

интегральная – если 0, то рассчитывается плотность, если 1 – то значение функции, т.е. P(X<x).

Например, плотность для значения 15, которое извлекли из нормальной выборки с матожиданием 10, стандартным отклонением 3, рассчитывается так:

Расчет плотности для нормальных данных

Если последний параметр поставить 1, то получим вероятность того, что нормальная случайная величина окажется меньше 15 при заданных параметрах распределения. Таким образом, вероятности можно рассчитывать напрямую по исходным данным.

Функция НОРМ.ОБР

Это квантиль нормального распределения, т.е. значение обратной функции. Синтаксис следующий.

=НОРМ.ОБР(вероятность;среднее;стандартное_откл)

вероятность – вероятность

среднее – матожидание

стандартное_откл – среднеквадратичное отклонение

Назначение то же, что и у НОРМ.СТ.ОБР, только функция работает с данными любого масштаба.

Пример показан в ролике в конце статьи.

Моделирование нормального распределения

Для некоторых задач требуется генерация нормальных случайных чисел. Готовой функции для этого нет. Однако В Excel есть две функции, которые возвращают случайные числа: СЛУЧМЕЖДУ и СЛЧИС. Первая выдает случайные равномерно распределенные целые числа в указанных пределах. Вторая функция генерирует равномерно распределенные случайные числа между 0 и 1. Чтобы сделать искусственную выборку с любым заданным распределением, нужна функция СЛЧИС

Допустим, для проведения эксперимента необходимо получить выборку из нормально распределенной генеральной совокупности с матожиданием 10 и стандартным отклонением 3. Для одного случайного значения напишем формулу в Excel.

=НОРМ.ОБР(СЛЧИС();10;3)

Протянем ее на необходимое количество ячеек и нормальная выборка готова.

Для моделирования стандартизованных данных следует воспользоваться НОРМ.СТ.ОБР.

Процесс преобразования равномерных чисел в нормальные можно показать на следующей диаграмме. От равномерных вероятностей, которые генерируются формулой СЛЧИС, проведены горизонтальные линии до графика функции нормального распределения. Затем от точек пересечения вероятностей с графиком опущены проекции на горизонтальную ось.

Преобразование равномерной случайной величины в нормальную

На выходе получаются значения с характерной концентрацией около центра. Вот так обратный прогон через функцию нормального распределения превращает равномерные числа в нормальные. Excel позволяет за несколько секунд воспроизвести любое количество выборок любого размера.

Как обычно, прилагаю ролик, где все вышеописанное показывается в действии.

Скачать файл с примером.

Поделиться в социальных сетях:

Если вы выполняете статистический анализ, вам может потребоваться создать стандартную блочную диаграмму, чтобы показать распределение набора данных. На такой диаграмме числовые данные разделены на квартили, а между первым и третьим квартилем находится прямоугольник с дополнительной линией, проходящей через второй квартиль и обозначающей медиану. На некоторых блочных диаграммах минимальные и максимальные значения, которые выходят за пределы первого и третьего квартилей, представлены в виде линий, которые часто называют усами.

Различные части блочной диаграммы

Хотя в Excel 2013 нет шаблона для блочной диаграммы, вы можете создать ее, выполнив следующие действия:

  1. Рассчитайте значения квартилей на основе исходного набора данных.

  2. Вычислите разницу между квартилями.

  3. Создайте гистограмму с накоплением из диапазонов квартилей.

  4. Преобразуйте гистограмму в блочную диаграмму.

В нашем примере исходный набор источник содержит три столбца. Каждый столбец включает по 30 элементов из следующих диапазонов:

  • Столбец 1 (2013 г.): 100–200

  • Столбец 2 (2014 г.): 120–200

  • Столбец 3 (2015 г.): 100–180

Таблица исходных данных

В этой статье

  • Шаг 1. Вычисление значений квартилей

  • Шаг 2. Вычисление разницы между квартилями

  • Шаг 3. Создание гистограммы с накоплением

  • Шаг 4. Преобразование гистограммы с накоплением в блочную диаграмму

    • Скрытие нижнего ряда данных

    • Создание усов для построения блочной диаграммы

    • Закрашивание центральных областей

Шаг 1. Вычисление значений квартилей

Прежде всего необходимо рассчитать минимальное, максимальное значение и медиану, а также первый и третий квартили для набора данных.

  1. Для этого создайте вторую таблицу и заполните ее следующими формулами:

    Значение

    Формула

    Минимальное значение

    МИН(диапазон_ячеек)

    Первый квартиль

    КВАРТИЛЬ.ВКЛ (диапазон_ячеек; 1)

    Медиана

    КВАРТИЛЬ.ВКЛ (диапазон_ячеек; 2)

    Третья квартиль

    КВАРТИЛЬ.ВКЛ (диапазон_ячеек; 3)

    Максимальное значение

    МАКС(диапазон_ячеек)

  2. В результате должна получиться таблица, содержащая нужные значения. При использовании примера данных получаются следующие квартили:

    Конечная таблица и значения

К началу страницы

Шаг 2. Вычисление разницы между квартилями

Затем нужно вычислить разницу между каждой парой показателей. Необходимо рассчитать разницу между следующими значениями:

  • первым квартилем и минимальным значением;

  • медианой и первым квартилем;

  • третьим квартилем и медианой;

  • максимальным значением и третьим квартилем.

  1. Для начала создайте третью таблицу и скопируйте в нее минимальные значения из последней таблицы.

  2. Вычислите разницу между квартилями с помощью формулы вычитания Excel (ячейка1 — ячейка2) и заполните третью таблицу значениями разницы.

Для примера данных третья таблица выглядит следующим образом:

К началу страницы

Шаг 3. Создание гистограммы с накоплением

Данные в третьей таблице хорошо подходят для построения блочной диаграммы. Создадим гистограмму с накоплением, а затем изменим ее.

  1. Выделите все данные в третьей таблице и щелкните Вставка > Вставить гистограмму > Гистограмма с накоплением.

    Для начала выберите гистограмму с накоплением.

    Пока диаграмма не похожа на блочную, так как Excel по умолчанию рисует столбцы с накоплением на основе наборов данных по горизонтали, а не по вертикали.

    Диаграмма по умолчанию со столбцами с накоплением

  2. Чтобы поменять местами оси диаграммы, щелкните ее правой кнопкой мыши и выберите Выбор данных.

  3. Щелкните Строка/столбец.

    Советы: 

    • Чтобы переименовать столбцы, в области Подписи горизонтальной оси (категории) щелкните Изменить, выберите в третьей таблице диапазон ячеек с нужными именами категорий и нажмите кнопку ОК. Выделите диапазон ячеек, который нужно переименовать.

    • Для переименования записей легенды в разделе Элементы легенды (ряды) щелкните Изменить и введите нужное значение.

  4. Нажмите кнопку ОК.

График должен выглядеть так, как показано ниже. В этом примере также было изменено название диаграммы, а легенда скрыта.

Теперь ваша диаграмма должна иметь такой вид.

К началу страницы

Шаг 4. Преобразование гистограммы с накоплением в блочную диаграмму

Скрытие нижнего ряда данных

Чтобы преобразовать гистограмму с накоплением в блочную диаграмму, сначала нужно скрыть нижний ряд данных:

  1. Выберите нижнюю часть столбцов.

    Примечание: При щелчке одного из столбцов будут выбраны все вхождения того же ряда.

  2. Щелкните Формат > Текущий фрагмент > Формат выделенного фрагмента. В правой части появится панель Формат.

    Элемент "Формат выделенного" находится на вкладке "Формат".

  3. На вкладке Заливка панели Формат выберите пункт Нет заливки.

    Нижний ряд данных будет скрыт.

    На этой диаграмме данные внизу скрыты.

Создание усов для построения блочной диаграммы

Далее нужно заменить верхний и второй снизу ряды (выделены на рисунки темно-синим и оранжевым) линиями (усами).

  1. Выберите верхний ряд данных.

  2. На вкладке Заливка панели Формат выберите пункт Нет заливки.

  3. На ленте щелкните Конструктор > Добавить элемент диаграммы > Предел погрешностей > Стандартное отклонение.

    Меню "Добавить элемент диаграммы" и "Предел погрешностей"

  4. Выберите один из нарисованных пределов погрешностей.

  5. Откройте вкладку Параметры предела погрешностей и в области Формат задайте следующие параметры:

    • В разделе Направление установите переключатель Минус.

    • Для параметра Конечный стиль задайте значение Без точки.

    • Для параметра Величина погрешности укажите процент, равный 100.

      В области "Величина погрешности" в поле "Процент" должно быть указано значение 100 %.

  6. Повторите предыдущие действия для второго снизу ряда данных.

    Гистограмма с накоплением теперь должна напоминать блочную диаграмму.

    На конечной диаграмме теперь есть "усы".

Закрашивание центральных областей

Блочные диаграммы обычно отображаются с одним цветом заливки и тонкими границами. Ниже описано, как завершить их оформление.

  1. Выберите верхнюю часть блочной диаграммы.

  2. На вкладке «Заливка & линии» на панели «Формат» нажмите кнопку «Сплошная заливка».

  3. Выберите цвет заливки.

  4. Щелкните Сплошная линия на этой же вкладке.

  5. Выберите цвет контура, а также ширину штриха.

  6. Задайте те же значения для других областей блочной диаграммы.

    В результате должна получиться блочная диаграмма.

    Так должна выглядеть конечная блочная диаграмма.

К началу страницы

См. также

Типы диаграмм в Office

Диаграммы и другие элементы представления в Power View

Нужна дополнительная помощь?

Понравилась статья? Поделить с друзьями:
  • Диаграмма процентного соотношения в word
  • Диаграмма сэнки в excel
  • Диаграмма процент от числа excel
  • Диаграмма стиффа в excel
  • Диаграмма процент от целого в excel