Как построить гистограмму в excel по частотам

Excel 2016 обзавелся новыми типами графиков. Причем, это не какие-нибудь дизайнерские новшества, а самые настоящие статистические диаграммы.

Так, «ящик с усами» применяется для анализа выборки. Диаграмма Парето пригодится при анализе вклада отдельных элементов в общую сумму. В этой заметке рассмотрим еще одну новую диаграмму из Excel 2016 – гистограмму частот.

На первый взгляд и в более ранних версиях Excel можно изобразить частоты с помощью диаграмм. Можно, но для этого предварительно необходимо числовые данные сгруппировать. То есть для каждой категории (интервала, группы, года и т.д.) нужно посчитать частоту. Теперь появилась возможность изобразить распределение данных буквально в один клик без предварительных расчетов и группировок.

Строится такая диаграмма в один клик. Выделяем ряд данных и нажимаем кнопку гистограммы частот.

Значок гистограммы на ленте в Excel 2016

Собственно, все. Тут же появляется соответствующая диаграмма.

Гистограмма частот

Возникает вопрос: как Excel делит данные на интервалы? Справка Excel говорит, что с помощью формулы.

Справка об интервалах в гистограмме частот

Количество интервалов получается достаточным для того, чтобы визуально прикинуть, каков характер распределения анализируемых данных.

Интервалы легко перестроить под свои потребности. Можно, например, задать нижнюю и верхнюю границу, за пределами которых данные будут объединены в один интервал.

Настройки гистограммы частот

При выборе опции выхода за нижнюю и верхнюю границы, судя по той же справке, их значения рассчитываются, как расстояние ±3σ от средней арифметической.

Расчет верхней и нижний границы

Однако рассчитываемые автоматически значения легко изменить в окне настроек.

Это был пример, когда данные разбиваются на интервалы. Такой вариант группировки установлен по умолчанию (см. окно параметров настройки оси выше).

Распределение частот можно получить и по имеющимся категориям (должен быть указан соответствующий столбец). Выбираем в настройках «По категориям» и получаем новые частоты.

Частоты по категориям

Проведем эксперимент. С помощью функции СЛУЧМЕЖДУ смоделируем равномерно распределенную выборку в пределах, скажем, от 0 до 200. Пусть выборка состоит из 100 значений. Теперь изобразим гистограмму частот.

Гистограмма равномерного распределения

Как видно, частоты примерно одинаковы.

А теперь смоделируем нормальную выборку, со средней 100 и стандартным отклонением 30.

Гистограмма нормального распределения

Отчетлива видна характерная конфигурация нормального распределения.

Поделиться в социальных сетях:


Гистограмма распределения — это инструмент, позволяющий визуально оценить величину и характер разброса данных. Создадим гистограмму для непрерывной случайной величины с помощью встроенных средств MS EXCEL из надстройки Пакет анализа и в ручную с помощью функции

ЧАСТОТА()

и диаграммы.

Гистограмма (frequency histogram) – это

столбиковая диаграмма MS EXCEL

, в каждый столбик представляет собой интервал значений (корзину, карман, class interval, bin, cell), а его высота пропорциональна количеству значений в ней (частоте наблюдений).

Гистограмма поможет визуально оценить распределение набора данных, если:

  • в наборе данных как минимум 50 значений;
  • ширина интервалов одинакова.

Построим гистограмму для набора данных, в котором содержатся значения

непрерывной случайной величины

. Набор данных (50 значений), а также рассмотренные примеры, можно взять на листе

Гистограмма AT

в

файле примера.

Данные содержатся в диапазоне

А8:А57

.


Примечание

: Для удобства написания формул для диапазона

А8:А57

создан

Именованный диапазон

Исходные_данные.

Построение гистограммы с помощью надстройки

Пакет анализа

Вызвав диалоговое окно

надстройки Пакет анализа

, выберите пункт

Гистограмма

и нажмите ОК.

В появившемся окне необходимо как минимум указать:

входной интервал

и левую верхнюю ячейку

выходного интервала

. После нажатия кнопки

ОК

будут:

  • автоматически рассчитаны интервалы значений (карманы);
  • подсчитано количество значений из указанного массива данных, попадающих в каждый интервал (построена таблица частот);
  • если поставлена галочка напротив пункта

    Вывод графика

    , то вместе с таблицей частот будет выведена гистограмма.


Перед тем как анализировать полученный результат —

отсортируйте исходный массив данных

.

Как видно из рисунка, первый интервал включает только одно минимальное значение 113 (точнее, включены все значения меньшие или равные минимальному). Если бы в массиве было 2 или более значения 113, то в первый интервал попало бы соответствующее количество чисел (2 или более).

Второй интервал (отмечен на картинке серым) включает значения больше 113 и меньше или равные 216,428571428571. Можно проверить, что таких значений 11. Предпоследний интервал, от 630,142857142857 (не включая) до 733,571428571429 (включая) содержит 0 значений, т.к. в этом диапазоне значений нет. Последний интервал (со странным названием

Еще

) содержит значения больше 733,571428571429 (не включая). Таких значений всего одно — максимальное значение в массиве (837).

Размеры карманов одинаковы и равны 103,428571428571. Это значение можно получить так:

=(МАКС(

Исходные_данные

)-МИН(

Исходные_данные

))/7

где

Исходные_данные –

именованный диапазон

, содержащий наши данные.

Почему 7? Дело в том, что количество интервалов гистограммы (карманов) зависит от количества данных и для его определения часто используется формула √n, где n – это количество данных в выборке. В нашем случае √n=√50=7,07 (всего 7 полноценных карманов, т.к. первый карман включает только значения равные минимальному).


Примечание

:

Похоже, что инструмент

Гистограмма

для подсчета общего количества интервалов (с учетом первого) использует формулу

=ЦЕЛОЕ(КОРЕНЬ(СЧЕТ(

Исходные_данные

)))+1

Попробуйте, например, сравнить количество интервалов для диапазонов длиной 35 и 36 значений – оно будет отличаться на 1, а у 36 и 48 – будет одинаковым, т.к. функция

ЦЕЛОЕ()

округляет до ближайшего меньшего целого

(ЦЕЛОЕ(КОРЕНЬ(35))=5

, а

ЦЕЛОЕ(КОРЕНЬ(36))=6)

.

Если установить галочку напротив поля

Парето (отсортированная гистограмма)

, то к таблице с частотами будет добавлена таблица с отсортированными по убыванию частотами.

Если установить галочку напротив поля

Интегральный процент

, то к таблице с частотами будет добавлен столбец с

нарастающим итогом

в % от общего количества значений в массиве.

Если выбор количества интервалов или их диапазонов не устраивает, то можно в диалоговом окне указать нужный массив интервалов (если интервал карманов включает текстовый заголовок, то нужно установить галочку напротив поля

Метка

).

Для нашего набора данных установим размер кармана равным 100 и первый карман возьмем равным 150.

В результате получим практически такую же по форме

гистограмму

, что и раньше, но с более красивыми границами интервалов.

Как видно из рисунков выше, надстройка

Пакет анализа

не осуществляет никакого

дополнительного форматирования диаграммы

. Соответственно, вид такой гистограммы оставляет желать лучшего (столбцы диаграммы обычно располагают вплотную для непрерывных величин, кроме того подписи интервалов не информативны). О том, как придать диаграмме более презентабельный вид, покажем в следующем разделе при построении

гистограммы

с помощью функции

ЧАСТОТА()

без использовании надстройки

Пакет анализа

.

Построение гистограммы распределения без использования надстройки Пакет анализа

Порядок действий при построении гистограммы в этом случае следующий:

  • определить количество интервалов у гистограммы;
  • определить ширину интервала (с учетом округления);
  • определить границу первого интервала;
  • сформировать таблицу интервалов и рассчитать количество значений, попадающих в каждый интервал (частоту);
  • построить гистограмму.


СОВЕТ

: Часто рекомендуют, чтобы границы интервала были на один порядок точнее самих данных и оканчивались на 5. Например, если данные в массиве определены с точностью до десятых: 1,2; 2,3; 5,0; 6,1; 2,1, …, то границы интервалов должны быть округлены до сотых: 1,25-1,35; 1,35-1,45; … Для небольших наборов данных вид гистограммы сильно зависит количества интервалов и их ширины. Это приводит к тому, что сам метод гистограмм, как инструмент

описательной статистики

, может быть применен только для наборов данных состоящих, как минимум, из 50, а лучше из 100 значений.

В наших расчетах для определения количества интервалов мы будем пользоваться формулой

=ЦЕЛОЕ(КОРЕНЬ(n))+1

.


Примечание

: Кроме использованного выше правила (число карманов = √n), используется ряд других эмпирических правил, например, правило Стёрджеса (Sturges): число карманов =1+log2(n). Это обусловлено тем, что например, для n=5000, количество интервалов по формуле √n будет равно 70, а правило Стёрджеса рекомендует более приемлемое количество — 13.

Расчет ширины интервала и таблица интервалов приведены в

файле примера на листе Гистограмма

. Для вычисления количества значений, попадающих в каждый интервал, использована

формула массива

на основе функции

ЧАСТОТА()

. О вводе этой функции см. статью

Функция ЧАСТОТА() — Подсчет ЧИСЛОвых значений в MS EXCEL

.

В MS EXCEL имеется диаграмма типа

Гистограмма с группировкой

, которая обычно используется для построения

Гистограмм распределения

.

В итоге можно добиться вот такого результата.


Примечание

: О построении и настройке макета диаграмм см. статью

Основы построения диаграмм в MS EXCEL

.

Одной из разновидностей гистограмм является

график накопленной частоты

(cumulative frequency plot).

На этом графике каждый столбец представляет собой число значений исходного массива, меньших или равных правой границе соответствующего интервала. Это очень удобно, т.к., например, из графика сразу видно, что 90% значений (45 из 50) меньше чем 495.


СОВЕТ

: О построении

двумерной гистограммы

см. статью

Двумерная гистограмма в MS EXCEL

.


Примечание

: Альтернативой

графику накопленной частоты

может служить

Кривая процентилей

, которая рассмотрена в

статье про Процентили

.


Примечание

: Когда количество значений в выборке недостаточно для построения полноценной

гистограммы

может быть полезна

Блочная диаграмма

(иногда она называется

Диаграмма размаха

или

Ящик с усами

).

Гистограмма – очень полезный инструмент, с помощью которого можно сделать демонстрируемую информацию более наглядной и простой для восприятия. Это особенно актуально, когда время на изучение данных в таблице ограничено, и нужно в сжатые сроки сформировать целостное представление о них. Давайте посмотрим, каким образом можно построить гистограмму в Эксель.

Содержание

  1. Строим гистограмму
    • Метод 1: используем инструменты на ленте программы
    • Метод 2: пользуемся надстройкой “Пакета “анализа”
    • Метод 3: выполняем условное форматирование с гистограммой
  2. Редактирование гистограммы
  3. Заключение

Строим гистограмму

Для выполнения поставленной задачи в Excel можно воспользоваться разными методами:

  • использовать инструменты на ленте программы;
  • воспользоваться надстройкой “Пакет анализа”;
  • применить условное форматирование.

Ниже мы подробнее остановимся на каждом из этих пунктов.

Метод 1: используем инструменты на ленте программы

Это, пожалуй, самый простой способ. И вот, как он реализуется:

  1. Открываем (или создаем) таблицу. Выделяем любым удобным способом (например, с помощью зажатой левой кнопки мыши) ячейки, на базе которых планируется построить диаграмму.Выделение ячеек таблицы Эксель
  2. Переходим во вкладку “Вставка”, в группе инструментов “Диаграммы” жмем кнопку “Вставить гистограмму”.Вставка гистограммы в Эксель
  3. Раскроется перечень возможных вариантов:
    • гистограмма;
    • объемная гистограмма;
    • линейчатая;
    • объемная линейчатая.Выбор вида гистограммы для вставки в Excel
  4. После клика по нужному (понравившемуся) варианту, на листе появится гистограмма. В нашем случае мы выбрали самую простую. Гистограмма в Эксель

Гистограмма с накоплением
До того, как приступить к созданию гистограммы с накоплением, проверяем, чтобы самая верхняя левая ячейка таблицы была пустой.
Самая верхняя левая ячейка таблицы ЭксельЗатем делаем следующее:

  1. Выполняем выделение таблицы, на базе которой планируем построить гистограмму. Переходим во вкладку “Вставка”, нажимаем кнопку “Вставить гистограмму” (группа “Диаграммы”) и в раскрывшемся перечне останавливаем на варианте – “Гистограмма с накоплением”.Вставка гистограммы с накоплением в Эксель
  2. Гистограмма вставлена, что и требовалось.Гистограмма с накоплением в Excel

Примечание: в гистограммах с накоплением один столбец содержит сразу несколько значений. В нашем случае – это данные по всем четырем торговым точкам за конкретную дату.

Нормированная гистограмма с накоплением
В данном случае отображается (в процентном выражении) вклад каждого значения в общем количестве.

Нормированная гистограмма с накоплением в Эксель

Метод 2: пользуемся надстройкой “Пакета “анализа”

Для начала нужно включить данный пакет.

  1. Идем в меню “Файл”.Переход в меню Файл в Эксель
  2. В перечне слева в самом низу щелкаем по пункту “Параметры”.Переход в Параметры Excel
  3. В открывшемся окне выбираем “Надстройки”. В правой части окна для параметра “Управление” ставим значение “Надстройки Excel”, после чего жмем кнопку “Перейти”.Переход к надстройкам в Параметрах Excel
  4. В появившемся окошке ставим галочку напротив надстройки “Пакет анализа” и жмем OK.Выбор надстройки Пакет анализа в Эксель
  5. Перейдя во вкладку “Данные” в группе инструментов “Анализ” нажимаем кнопку “Анализ данных”. Анализ данных в Excel
  6. Откроется окошко, в котором нам нужен пункт “Гистограмма“, после выбора которого щелкаем OK.Выбор гистограммы в инструментах анализа в Эксель
  7. Перед нами появится окно, в котором нужно выполнить настройки гистограммы:
    • в поле “Входной интервал” указываем диапазон ячеек, по которым нужно построить гистограмму. Сделать это можно вручную, прописав адреса с помощью клавиш на клавиатуре. Также мы можем выделить нужный диапазон ячеек в самой таблице, предварительно установив курсор в поле для ввода информации.
    • внизу окна ставим галочку напротив параметра “Вывод графика”.
    • в группе параметров вывода можно указать, куда следует вставить созданную гистограмму. Стандартное значение – на новом листе.
    • по готовности жмем кнопку OK.Параметры гистограммы в Excel
  8. Гистограмма сформирована и добавлена на отдельном листе, как мы и хотели.Гистограмма в Эксель

Метод 3: выполняем условное форматирование с гистограммой

Получить гистограмму можно и с помощью условного форматирования ячеек. План действий следующий:

  1. Для начала нужно выделить элементы, которые нужны для гистограммы.
  2. Находясь в главной вкладке в группе “Стили” щелкаем по кнопке “Условное форматирование”. Откроется список, в котором выбираем “Гистограмму”. Раскроется еще один перечень, где нужно определиться с вариантами заливки – градиентная или сплошная.Выбор гистограммы в вариантах условного форматирования в Excel
  3. В выделенных ячейках появились гистограммы, соответствующие их значениям. В нашем случае была выбрана сплошная заливка синим цветом.Условное форматирование с гистограммами в Эксель

Редактирование гистограммы

Вставленную на лист гистограмму можно изменить:

  1. Корректируем или удаляем название. Для активации режима редактирования щелкаем по названию, после чего вокруг него появится рамка. Теперь кликаем в любом месте внутри рамки и мы можем приступать к редактированию.Редактирование названия гистограммы в Эксель
  2. Удаляем легенду (если она не нужна). Предварительно нужно ее выбрать. Первым кликом выделяем все легенды (если их несколько), вторым – конкретную легенду. Удалить легенду можно через контекстное меню, вызываемое щелчком правой кнопки мыши по ней или просто нажав клавишу Del на клавиатуре.Удаление легенды гистограммы в Excel
  3. Меняем положение названия гистограммы и легенды. Для этого кликаем по выбранному объекту, чтобы выделить его. Затем наводим указатель мыши на любую из появившихся границ, и когда появится характерный символ в виде стрелок в четыре стороны, зажав левую кнопку мыши перетаскиваем объект в новое место.Изменение положения элементов гистограммы в Эксель
  4. Меняем размер и положение гистограммы. Чтобы изменить размер гистограммы, зажав левую кнопку мыши тянем за одну из точек, расположенных на рамке вокруг нее.Изменение размеров гистограммы в ExcelДля изменения положения выполняем те же самые действия, что и в отношении названия или легенды.
  5. Для более детальных настроек щелкаем по любой свободной части в области диаграммы (белые участки) и в открывшемся контекстном меню выбираем пункт “Формат области диаграммы”.Переход к форматированию области диаграммы в ЭксельПоявится вспомогательное окно, в котором мы можем настроить:
    • заливку и границы;
    • добавить различные эффекты;
    • размеры и свойства;
    • параметры текста.Формат области диаграммы в Excel
  6. Настраиваем шкалы по осям X и Y. Щелкаем по подписям выбранной шкалы правой кнопкой мыши и в открывшемся контекстном меню выбираем “Формат оси”.Переход к форматированию оси диаграммы в ЭксельОткроется окно, в котором мы можем выполнить соответствующие настройки.Формат оси диаграммы в Excel

Помимо вышеперечисленного, на ленте программы во вкладке “Конструктор”, в которой мы окажемся автоматическим после создания гистограммы, мы можем сменить стиль, выбрать один из экспресс-макетов и т.д.

Настройка диаграммы во вкладке Конструктор в Эксель

Также, мы можем добавить новый элемент диаграммы, щелкнув на соответствующий значок в левом верхнем углу ленты и выбрав из списка нужный пункт.

Добавление нового элемента диаграммы в Эксель

Примечание: возможных настроек и параметров, которые можно задать для гистограммы достаточно много, и каждый пользователь сможет подобрать для себя оптимальный вариант. Мы описали лишь часть основных действий и инструментов, которые могут помочь в этом.

Заключение

Программа Excel позволяет построить различные гистограммы, которые помогают лучше и быстрее освоить информацию, особенно, когда ее слишком много, а времени, наоборот, мало. Выбор конкретного вида и метода построения диаграммы зависит от того, какие цели преследует пользователь, и каким он видит конечный результат.

Excel 2007-2013

Гистограмма или диаграмма Парето (отсортированная гистограмма) – это столбчатая диаграмма, которая показывает частоту повторяемости значений. Для создания гистограммы в Excel необходимо, чтобы у вас был установлен пакет анализа.

  1. Убедитесь, что пакет анализа установлен.

  2. В один столбец введите исходные данные. В следующий столбец введите интервалы в возрастающем порядке.

  3. Откройте вкладку «Данные» и щелкните «Анализ данных».

  4. Выберите пункт «Гистограмма» и нажмите «ОК».

  5. В разделе «Ввод» выберите диапазон ввода (ваши данные), а затем укажите интервал карманов.

  6. В группе «Параметры вывода» выберите расположение выходных данных и настройте другие необходимые параметры.

  7. Щелкните «ОК», чтобы закрыть диалоговое окно.

Нужна дополнительная помощь?

  • Редакция Кодкампа

17 авг. 2022 г.
читать 2 мин


Распределение частоты описывает, как часто разные значения встречаются в наборе данных. Это полезный способ понять, как значения данных распределяются в наборе данных.

К счастью, легко создать и визуализировать частотное распределение в Excel, используя следующую функцию:

=ЧАСТОТА(массив_данных,массив_бинов)

куда:

  • data_array : массив необработанных значений данных
  • bins_array: массив верхних пределов для бинов

В следующем примере показано, как использовать эту функцию на практике.

Пример: частотное распределение в Excel

Предположим, у нас есть следующий набор данных из 20 значений в Excel:

Во-первых, мы укажем Excel, какие верхние пределы мы хотели бы использовать для интервалов нашего частотного распределения. Для этого примера мы выберем 10, 20 и 30. То есть мы найдем частоты для следующих интервалов:

  • от 0 до 10
  • с 11 до 20
  • от 21 до 30
  • 30+

Далее мы будем использовать следующую функцию =FREQUENCY() для вычисления частот для каждого бина:

=ЧАСТОТА( A2:A21 , C2:C4 )

Вот результаты:

Частотное распределение в Excel

Результаты показывают, что:

  • 6 значений в наборе данных находятся в диапазоне от 0 до 10.
  • 7 значений в наборе данных находятся в диапазоне 11-20.
  • 5 значений в наборе данных находятся в диапазоне 21-30.
  • 2 значения в наборе данных больше 30.

Затем мы можем использовать следующие шаги для визуализации этого частотного распределения:

  • Выделите частоты в диапазоне D2:D5 .
  • Нажмите на вкладку « Вставка », затем нажмите на диаграмму под названием « Двухмерный столбец » в группе « Диаграммы ».

Появится следующая диаграмма, отображающая частоты для каждого бина:

Визуализация частотного распределения в Excel

Не стесняйтесь изменять метки осей и ширину полос, чтобы сделать диаграмму более эстетичной:

Частотное распределение в Excel

Вы можете найти больше учебников по Excel здесь .

Написано

Редакция Кодкампа

Замечательно! Вы успешно подписались.

Добро пожаловать обратно! Вы успешно вошли

Вы успешно подписались на кодкамп.

Срок действия вашей ссылки истек.

Ура! Проверьте свою электронную почту на наличие волшебной ссылки для входа.

Успех! Ваша платежная информация обновлена.

Ваша платежная информация не была обновлена.

Like this post? Please share to your friends:
  • Как построить гистограмму в excel по одному столбцу
  • Как построить гистограмму в excel по данным таблицы с интервалом
  • Как построить гистограмму в excel по данным таблицы с двумя столбцами
  • Как построить гистограмму в excel по данным таблицы пошагово
  • Как построить гистограмму в excel по данным таблицы в процентах