Как построить диаграмму размаха в excel

Excel 2016, как известно, обогатился новыми типами диаграмм. Одна такая, которая диаграмма Парето, уже была показана. В этот раз рассмотрим другую, чисто статистическую. Называется «ящик с усами» или «коробчатая диаграмма» (box-and-whiskers plot или boxplot).

Раньше я такие видел только в специализированных ПО, типа STATISTICA, и для того, чтобы нарисовать подобную диаграмму в Excel, нужно было изрядно потрудиться. Теперь она есть в стандартном наборе Excel.

Диаграмма ящик с усами на ленте Excel 2016

Зачем нужна такая диаграмма? Допустим, есть выборка для анализа. А еще лучше несколько выборок, которые нужно сравнить. Для этого рассчитывают различные показатели. Однако к любому расчету всегда хочется добавить наглядности, чтобы мозг перешел в режим образного представления, а не довольствовался сухими цифрами и формулами. Поэтому основные характеристики ловко изображают на рисунке. Отличным вариантом будет как раз диаграмма «ящик с усами».

Пример двух выборок на диаграмме ящик с усами

На рисунке показан формат по умолчанию. Как видно, сравниваются две выборки путем изображения двух «ящиков с усами».

Что здесь что обозначает?

Крестик посередине – это среднее арифметическое по выборке.

Линия чуть выше или ниже крестика – медиана.

Нижняя и верхняя грань прямоугольника (типа ящика) соответствует первому и третьему квартилю (значениям, отделяющим ¼ и ¾ выборки). Расстояние между 1-м и 3-м квартилем – это межквартильный размах (или расстояние).

Горизонтальные черточки на конце «усов» – максимальное и минимальное значение (без учета выбросов, см. ниже).

Отдельные точки – это выбросы, которые показываются по умолчанию. Если значение выходит за пределы 1,5 межквартильных размаха от ближайшего квартиля, то оно считается аномальным. Их можно скрыть (см. ниже настройки).

Во всей красе «ящик с усами» проявляется при сравнении выборок, в которых данные делятся на категории. Допустим, провели некоторый эксперимент среди мужчин и женщин. Есть данные до и после эксперимента по обоим полам. Для анализа потребуется вычислить различные показатели. А если к этому добавить диаграмму «ящик с усами», то результат будет весьма наглядным.

Анализ выборок с категориями на диаграмме ящик с усами

Отлично видно, что после проведения эксперимента данные по мужчинам в целом уменьшились, а данные среди женщин наоборот, увеличились. Это не значит, что выборки больше не нужно анализировать (сравнивать, проверять гипотезы и т.д.). Но наглядность сильно улучшает понимание. Перейдем к настройкам.

Настройки диаграммы «ящик с усами»

Общий вид диаграммы настраивается стандартно. Можно менять цвет, добавлять подписи и т.д. Для этого есть две контекстные вкладки на ленте (Конструктор и Формат). Но есть настройки, предназначенные специально для этой диаграммы.

Выбираем какой-либо ряд и жмем Ctrl+1. Либо два раза кликаем по какому-нибудь «ящику». Можно через правую кнопку Формат ряда данных…. Справа вылазит панель настроек.

Панель настроек для диаграммы ящик с усами

Рассмотрим по порядку.

Боковой зазор – регулирует ширину ящиков и расстояние между ними.

Показывать внутренние точки. Если поставить галочку, то на оси, где расположены «усы», точками будут показаны все значения. Так хорошо видно распределение внутри групп.

Все точки на диаграмме ящик с усами

Показывать точки выбросов – отражать экстремальные значения.

Выбросы

Выбросы – это точки, выходящие за пределы 1,5 межквартильных размаха.

Показать средние метки – среднее арифметическое (крестики). Стоят по умолчанию, но можно скрыть.

Показать среднюю линию – только для различных категорий. Показывает изменения по категориям.

Изменения в категориях

Если добавить линии, то изменения после эксперимента станут видны еще лучше. В справке написано, что соединяются медианы, но на графике почему-то соединяются средние. Чудеса.

Инклюзивная медиана или эксклюзивная медиана. Инклюзивная медиана включает в «ящик» квартильные значения , а эксклюзивная медиана не включает. При выборе «эксклюзивной медианы» верх и низ «ящика» соответствует средней между квартильным и следующим (от центра) значением. По умолчанию стоит «эксклюзивная». Пусть стоит дальше. Причем тут медиана, вообще не понял, – речь ведь про квартиль. Думал, криво перевели, но в английской версии те же названия. В общем, здесь лучше ничего не менять.

Своевременное использование диаграммы «ящик-усы» может дать весьма ценную и наглядную информацию. Аналитику, который использует специализированные программы или трудоемкие настройки Excel, будет очень приятно иметь такую диаграмму под рукой.

Как показано в ролике ниже, все делается очень быстро и просто.

Поделиться в социальных сетях:


Блочная диаграмма (диаграмма размаха, ящик с усами) является наглядным и компактным способом представить распределение данных в выборке.

Чтобы для заданной

выборки

построить в MS EXCEL классическую

блочную диаграмму

(иногда она называется

Диаграмма размаха

или

Ящик с усами,

англ

.

box plot, box-and-whiskers diagram) необходимо предварительно вычислить пять показателей:

медиану выборки

, 1-й и 3-й

квартиль

, а также

минимальное

и

максимальное

значение.


Примечание

: Определение квартилей дано в статье

Квартили и интерквартильный интервал (IQR) в MS EXCEL

. Там же показано как их вычислять в MS EXCEL.


Блочная диаграмма

используется для оценки разброса значений в небольших

выборках

или для сравнения нескольких

выборок

.


Примечание

: Характеристикой разброса значений в

выборке

является также

дисперсия и стандартное отклонение

.


Блочная диаграмма

может быть полезна, когда количества значений в

выборке

недостаточно для построения полноценной гистограммы.

Построим

блочную диаграмму

с помощью

Гистограммы с накоплением

.


СОВЕТ

: Для начинающих пользователей EXCEL советуем прочитать статью

Основы построения диаграмм в MS EXCEL

, в которой рассказывается о базовых настройках диаграмм, а также

статью об основных типах диаграмм

.


Примечание

:

Блочная диаграмма

может строиться как вертикально (см. рисунок выше), так и горизонтально (см. ниже).

Для построения

блочной диаграммы

нам потребуются 5 наборов значений в строках 45-78

файла примера

, лист Box-plot.

При вертикальном расположении нижняя сторона блока (ящика) соответствует Q1 (первому

квартилю

), а верхняя сторона – Q3 (третьему

квартилю

). Соответственно, высота блока равна

интерквартильному размаху IQR

. Линия внутри блока соответствует медиане (Q2).


Примечание

: Чтобы вычислить квартили используйте функцию

КВАРТИЛЬ.ВКЛ()

.

Если для построения самого блока используется

Гистограмма с накоплением

, то для усов используются

вертикальные планки погрешностей

. Усы сверху и снизу блока заканчиваются соответственно максимальным и минимальным значением из набора.

Чтобы построить нижний ус необходимо выделить нижнюю (невидимую) часть

гистограммы

(см. рисунок выше). Затем, во вкладке

Макет

в группе

Анализ

выбрать команду

Планки погрешностей

, и, наконец, после раскрытия подменю, пункт

Дополнительные параметры планок погрешностей

… После этого откроется диалоговое окно.

Установите направление «Минус», выберите пользовательскую величину погрешности и нажмите кнопку

Укажите значение

. В появившемся окне, в поле

Отрицательное значение ошибки,

введите ссылку на ячейки содержащие разность значений Q1 и минимальных значений для каждого набора данных.

Для верхнего уса нужно проделать подобные действия, предварительно выделив часть гистограммы соответствующую верхней части блока.

Теперь, используя блочную диаграмму, попытаемся сравнить несколько наборов данных.

Предположим, что необходимо сравнить 5 различных ресторанов по доставке пиццы. В каждом ресторане было сделано по 30-20 заказов, а срок доставки пиццы фиксировался в таблице (в минутах). Пусть наши 5 блочных диаграмм соответствуют этим 5 наборам значений.

Для примера сравним первые 2 ресторана (

выборка

№1 и №2).

Очевидно, что второй ресторан справляется гораздо лучше второго: типичное время доставки 1-го ресторана (

медиана

) чуть больше 60 минут, а у второго только 20. Кроме того,

IQR

(высота блока, соответствующая разбросу значений) у второго ресторана в несколько раз меньше, то есть его срок доставки гораздо более предсказуем, чем у первого. Очевидно, что сравнивать рестораны, используя блочные диаграммы, гораздо проще, чем анализировать данные непосредственно в таблице.

В

файле примера

также построены

Блочная диаграмма с подписями

и

Блочная диаграмма с горизонтальным размещением

.


Блочная диаграмма с подписями

построена с помощью обычной

гистограммы с группировкой

(использованы ряды с перекрытием).

Кроме того, на диаграмме в качестве целевого значения, выведена горизонтальная линия (зеленая). Это целевое значение можно использовать в качестве порога: если типичное значение выборки ниже или выше порогового значения, то соответствующий объект не соответствует некому требованию.

Горизонтальное размещение диаграмм построено на основе диаграммы

Линейчатая с группировкой

.


Примечание

: В

файле примера

для удобства написания формул использована функция

ДВССЫЛ()

. Подробнее об этой функции можно прочитать в статье

Функция ДВССЫЛ() в MS EXCEL

.

Создание диаграммы «ящик с усами»

  1. Выделите данные (один или несколько рядов).

    Значения на изображении ниже являются частью набора данных, на основе которого был создан показанный выше образец диаграммы.

    Изображение фрагмента данных, использованных для создания примера диаграммы "ящик с усами"

  2. В Excel выберите команды Вставка > Вставить диаграмму статистики > Ящик с усами, как показано на рисунке ниже.

    Важно: В Word, Outlook и PowerPoint порядок действий немного другой.

    1. На вкладке Вставка в группе Иллюстрации нажмите кнопку Диаграмма.

    2. В диалоговом окне Вставка диаграммы на вкладке Все диаграммы выберите элемент Ящик с усами.

    Тип диаграммы "ящик с усами" на вкладке "Вставка" в Office 2016 для Windows

Советы: 

  • На вкладках Конструктор и Формат можно настроить внешний вид диаграммы.

    Вкладки "Конструктор" и "Формат" в разделе "Работа с диаграммами"

  • Если они не отображаются, щелкните в любом месте диаграммы «ящик с усами», чтобы добавить на ленту область Работа с диаграммами.

Параметры диаграммы «ящик с усами»

  1. Щелкните правой кнопкой мыши одно из полей на диаграмме, чтобы выбрать его, а затем в контекстном меню выберите пункт Формат ряда данных.

  2. В области Формат ряда данных, выбрав Параметры ряда, внесите необходимые изменения.

    (Руководствуйтесь информацией в таблице под приведенным ниже рисунком.)

    Область задач "Формат ряда данных", в которой показаны параметры диаграммы "ящик с усами" в Office 2016 для Windows

    Параметр ряда

    Описание

    Ширина зазора

    Управление зазором между категориями.

    Показывать внутренние точки

    Отображение точек данных между верхней и нижней усами.
    .

    Показывать точки выбросов

    Отображает точки выбросов, которые находятся ниже линии верхней или нижней точки уса.
    .

    Показывать маркеры медиан

    Отображение маркеров медианы выбранного ряда.

    Показывать линию медиан

    Отображение линии, соединяющей медианы блоков в выбранном ряде.

    Вычисление квартилей

    Выберите метод вычисления медиан.

    • Инклюзивная медиана    Медиана включается в вычисления, если N (число значений в данных) — нечетное число.

    • Исключающая медиана    Медиана исключается из вычислений, если N (число значений в данных) — нечетное число.

Создание диаграммы «ящик с усами»

  1. Выделите данные (один или несколько рядов).

    Значения на изображении ниже являются частью набора данных, на основе которого был создан показанный выше образец диаграммы.

    Изображение фрагмента данных, использованных для создания примера диаграммы "ящик с усами"

  2. На ленте на вкладке «Вставка» щелкните Значок статистической диаграммы (значок статистической диаграммы) и выберите «Ящик с усами».

Советы: 

  • На вкладке «Конструктор диаграмм» и «Формат» можно настроить внешний вид диаграммы.

  • Если вкладки «Конструктор диаграмм» и «Формат» не вы видите, щелкните в любом месте диаграммы «ящик с усами», чтобы добавить их на ленту.

Параметры диаграммы «ящик с усами»

  1. Щелкните одно из полей на диаграмме, чтобы выбрать его, а затем на ленте нажмите кнопку «Формат».

  2. Внести нужные изменения можно с помощью инструментов на вкладке «Формат».

Диаграмма со смешным названием “Ящик с усами” используется в Excel, как правило, для проведения статистического анализа. Когда имеется массив данных для нескольких тестовых групп за различные периоды, и необходимо понять, как изменился разброс показателей — не обойтись без этой диаграммы.

Конечно, если вывести все эти показатели в таблицу — то какой-то результат тоже можно увидеть. Но визуализации в виде диаграмм всегда воспринимаются лучше, чем просто цифры (тем более, что не все руководители дружат с цифрами).

Еще несколько лет назад для построения диаграммы “Ящик с усами” нужно было пользоваться специализированным софтом (или как минимум Python) или очень сильно колдовать в excel. Но начиная с версии Excel- 2016, данный вид диаграммы входит в стандартный пакет.

В этой статье мы рассмотрим два варианта построения диаграммы Ящик с усами: простой — для счастливых обладателей Excel от  2016-й версии и моложе, и сложный — “танцы с бубном” для тех, кому с версией Excel повезло меньше.

Содержание статьи:

  • Из чего состоит диаграмма Ящик с усами
  • Диаграмма Ящик с усами встроенным инструментом Excel (для версий от 2016 и новее)
  • Диаграмма Ящик с усами при помощи гистограммы с накоплением (для версий Excel до 2016 г)

Из чего состоит диаграмма

Смысл диаграммы Ящик с усами в том, чтобы показать основные характеристики статистической выборки данных: распределение данных между квартилями, среднее значение, медиану, максимальное и минимальное значения, а также выбросы данных.

Ящик с усами - для чего нужна эта диаграмма в Excel

Думаю, понятно, что ящик — это прямоугольник с заливкой, а усы — это черточки над и под прямоугольником.

Ящик — это межквартильный размах (или расстояние) — отделяет ¼ и ¾ выборки данных. Если ящик, условно говоря, большой — больше другого ящика — это означает, что выборка относительно однородна, и большая часть данных сконцентрирована вокруг медианы.

Черточки усов — это максимальное и минимальное значение (без учета выбросов). 

Ус снизу — это разница между минимумом и 1-м квартилем.

Ус сверху — это разница между 3-м квартилем и максимумом.

Крестик посередине — среднее арифметическое значение по выборке.

Черта посередине ящика — медиана по выборке. 

Выбросы — значения, сильно отклоняющиеся от основного массива выборки (выходит за пределы 1,5 межквартильных размаха от ближайшего квартиля).

Чтобы стало еще понятнее, рассмотрим построение диаграммы Ящик с усами на примере в excel. В нашем примере есть две возрастных группы покупателей: от 18 до 30 лет и от 30 до 45 лет. По ним имеем данные о суммах в чеках, на которые они совершали покупки.

Позже была проведена маркетинговая акция, и нужно понять, что изменилось в распределении сумм покупок в каждой группе.

Диаграмма Ящик с усами встроенным инструментом Excel (для версий от 2016 и новее)

Часть выборки данных выглядит следующим образом:

Ящик с усами - для чего нужна эта диаграмма в Excel

В левом столбце показатель периода (было до акции — стало после акции). Вверху названия групп (18-30, 31-45), и в ячейках суммы, на которые совершались покупки.

Внимание: таблица не должна содержать никаких итогов!

Все, что нужно сделать — это выделить массив данных вместе с названием периода и заголовками столбцов и далее: вкладка Вставка — блок Диаграммы — кнопка Гистограммы — выбрать Ящик с усами.

Ящик с усами - для чего нужна эта диаграмма в Excel

Переименовываем диаграмму и наслаждаемся результатом.

Ящик с усами - для чего нужна эта диаграмма в Excel

Произведем некоторые настройки. 

Во-первых, выведем легенду, чтобы было понятно, где какая группа.

Ящик с усами - для чего нужна эта диаграмма в Excel

Во-вторых, добавим среднюю линию, показывающую тренд между периодами. Среднюю линию можно добавить, если есть не менее двух рядов данных.

Правой кнопкой мыши щелкнем на “ящике”, и выберем Формат ряда данных, установим “галку” Средняя линия.

Здесь же можно регулировать отображение точек выбросов на диаграмме.

Ящик с усами - для чего нужна эта диаграмма в Excel

Диаграмма готова.

Ящик с усами - для чего нужна эта диаграмма в Excel

Что можно понять из диаграммы Ящик с усами, которую мы сейчас построили:

  • В группе 18-30 лет средний чек немного вырос. Смотрим на крестик, который отображает среднее значение, и на среднюю линию, которая идет слегка вверх.
  • В группе 31-45 лет средний чек, наоборот, прилично упал. Это говорит о том, что формат акции не попал в эту целевую аудиторию.
  • Медианная сумма, на которую чаще всего совершали покупки (линия посередине ящика) также немного выросла для группы 18-30, и упала для группы 31-45, что также говорит о неудачной акции для второй группы.
  • Размер ящика для группы 18-30 увеличился, также и низ, и верх ящика заняли более высокие позиции. Снова “за” успешность акции для этой категории покупателей, они стали совершать более разнообразные покупки, и в целом тратить больше денег.
  • А группа 31-45, напротив, стала тратить меньше денег (низ и верх ящика снизили позиции на графике), и размер ящика также уменьшился, как и размер усов. Т.е.покупки стали более фиксированными (возможно, остались самые постоянные покупатели с фик
  • Присутствует также один выброс для группы 31-45 — точка на уровне 7800. Это чек, сумма которого сильно отклоняется от основной массы покупок.

Диаграмма Ящик с усами в excel при помощи гистограммы с накоплением (для версий Excel до 2016 г)

Работать будем с той же выборкой данных, только переформатируем ее так, чтобы для каждого ящика был отдельный столбец.

Ящик с усами - для чего нужна эта диаграмма в Excel

Создадим дополнительную таблицу, в которой пропишем определенные формулы. Форму таблицы и формулы смотрите на картинке:

Ящик с усами - для чего нужна эта диаграмма в Excel

Выделим заголовки и строки Низ, 2Q Коробка и 3Q Коробка (как на картинке).

Ящик с усами - для чего нужна эта диаграмма в Excel

Перейдем во вкладку Вставка — Гистограмма — Гистограмма с накоплением.

Ящик с усами - для чего нужна эта диаграмма в Excel

Теперь нужно нарисовать усы, начнем с нижних. Выделим на диаграмме ряд Низ, и перейдем на вкладку Конструктор — Макеты диаграмм — Добавить элементы диаграмм — Предел погрешностей — Дополнительные параметры погрешностей.

Ящик с усами - для чего нужна эта диаграмма в Excel

В окне Формат предела погрешностей нужно установить параметры в следующем порядке: 

  1. Вертикальный предел погрешностей — Направление — Минус
  2. Величина погрешности — Пользовательская
  3. Нажать кнопку Укажите значение
  4. Поле Положительное значение ошибки оставить без изменений. Поле Отрицательное значение ошибки активировать и выделить значения из таблицы, соответствующие строке “Усы -” (только цифры).

Ящик с усами - для чего нужна эта диаграмма в Excel

Должны появиться вот такие черточки.

Ящик с усами - для чего нужна эта диаграмма в Excel

Теперь похожим образом нужно нарисовать верхние усы. Для этого выделим ряд 3Q Коробка, и снова перейдем на вкладку Конструктор — Макеты диаграмм — Добавить элементы диаграмм — Предел погрешностей — Дополнительные параметры погрешностей.

Ящик с усами - для чего нужна эта диаграмма в Excel

Здесь нужно указать направление вертикального предела погрешностей Плюс, величина погрешности Пользовательская, нажать кнопку Укажите значения. В поле Положительное значение установить курсор и выделить значения из строки “Усы +”. Поле Отрицательное значение ошибки оставить без изменений.

Должны появиться верхние усы.

Ящик с усами - для чего нужна эта диаграмма в Excel

Осталось немного доработать внешний вид диаграммы.

Уберем заливку с ряда Низ (синий в примере). Для этого выделим его, щелкнем правой кнопкой мыши — Формат ряда данных — и в блоке Заливка укажем Нет заливки.

Ящик с усами - для чего нужна эта диаграмма в Excel

Не выходя из окна Формат ряда данных, изменим цвет для ящиков.

Ящик с усами - для чего нужна эта диаграмма в Excel

Осталось добавить среднее значение (крестик).

Для этого выделим строку Среднее (только числа) и нажмем Ctrl + С.

Ящик с усами - для чего нужна эта диаграмма в Excel

Теперь выделим диаграмму и нажмем Ctrl + V. Должно получиться что-то похожее на картинку:

Ящик с усами - для чего нужна эта диаграмма в Excel

Правой кнопкой мыши щелкаем на новом ряде данных и выбираем Изменить тип диаграммы для ряда.

Ящик с усами - для чего нужна эта диаграмма в Excel

И для нового ряда выбираем тип диаграммы Точечная.

Ящик с усами - для чего нужна эта диаграмма в Excel

Обязательно снимите “галку” Вспомогательная ось”, если она установилась.

Осталось изменить точку на крестик (по желанию). Дважды щелкаем на любой точке, и в открывшемся окне Формат ряда данных выбираем: Маркер — Встроенный — крестик в выпадающем списке.

Ящик с усами - для чего нужна эта диаграмма в Excel

Диаграмма готова.

Ящик с усами - для чего нужна эта диаграмма в Excel

Конечно, у нее есть несколько недостатков по сравнению со встроенным инструментом:

  • из диаграммы намеренно убраны точки выбросов, поскольку они существенно исказили бы результат. Точки выбросов можно нарисовать отдельно аналогично тому, как мы создавали крестики для среднего значения. Или не использовать их совсем.
  • Нет средней линии между блоками одного ряда. При желании и сильно заморочившись, их можно нарисовать при помощи графиков. Возможно, в этой статье будет продолжение, как это сделать.
  • Ряды данных не разделены визуально. Где ряд Было и Стало, видно только из названия. 

Но в целом, если нет возможности установить более новую версию Excel, то это неплохой обходной путь создать диаграмму Ящик с усами в Excel.

Вам может быть интересно:

В одном из комментариев на сайте меня попросили рассказать про ящичные диаграммы. На мой взгляд, эти диаграммы в повседневной офисной практике используются незаслуженно редко. И тому я вижу несколько объяснений:

  • в Excel эти диаграммы носят название биржевые (рис. 1), что, казалось бы, сужает область их применения до специальных сфер деятельности;
  • большинство менеджеров видят мир детерминированным, и потому использование диаграмм, отражающих вероятностный подход, даже не приходит им в голову;
  • возможности Excel в построении таких диаграмм ограничены, а установка надстроек может вызывать затруднения.

Рис. 1. Меню выбора биржевой диаграммы

Скачать заметку в формате Word, примеры в формате Excel

Дополнение от 30 ноября 2016 г. В версии Excel 2016 появилась диаграмма «ящик с усами». Подробнее см. Новые диаграммы в Excel 2016

Можно выделить следующие области применения ящичных диаграмм [1]:

  • изменение цен акций и объемов торгов;
  • анализ статистических данных; например, в метеорологии или менеджменте качества;
  • представление результатов маркетинговых исследований, социологических опросов;
  • составление прогнозов.

В Excel доступны четыре типа биржевых диаграмм (см. нумерацию на рис. 1), содержащих от 3 до 5 набора данных:

№ на рис. 1 Ряды данных в порядке их расположения
1 Максимальное значение – минимальное – закрытие
2 Открытие – максимальное – минимальное – закрытие
3 Объем – максимальное – минимальное – закрытие
4 Объем – открытие – максимальное – минимальное – закрытие

В качестве категорий (ось Х) можно использовать даты или названия (например, акций). Так на рис. 1 использован первый тип диаграммы, и данные расположены в порядке: верхняя граница – нижняя граница – прогноз поступлений. А в качестве категории используется номер недели.

При использовании четырех наборов данных (тип 2) диаграмма оправдывает свое альтернативное название, так как на ней изображаются ящички/блоки. В качестве примера я взял многолетние данные наблюдений за температурой в Москве (рис. 2). Каждый «бочонок» соответствует совокупности наблюдений за один месяц в течение многих лет (если быть точным, 133 лет).

Рис. 2. Биржевая диаграмма второго типа; статистика среднемесячных температур в Москве за период наблюдений (1879–2012 гг.); на примере декабря: низ «усика» соответствует минимальной среднемесячной температуре, низ блока соответствует значению на одно стандартное отклонение ниже среднего (μ – σ), верх блока = μ + σ, верх «усика» – максимальная среднемесячная температура; в интервал μ ± σ, то есть внутрь блока, попадает 68,3% всех наблюдений

Внимание! Excel настроен на построение именно биржевых диаграмм. Из-за этого мастер диаграмм не всегда справляется с построением диаграммы, на основе данных, содержащих отрицательные значения. Например, если на рис. 2 вы возьмете только данные за январь, февраль и март, то Excel «ругнется», что размещение данных неверное. Если ваши данные содержат отрицательные числа, а строк меньше, чем параметров (которых, напомню, используется от 3 до 5), просто продублируйте строки, чтобы их стало больше, чем параметров, постройте диаграмму, а затем уменьшите ее область построения и удалите лишние строки.

Если значение «открытие» больше значения «закрытие», на биржевой диаграмме второго типа блок будет закрашен (рис. 3).

Рис. 3. Биржевая диаграмма второго типа; динамика стоимости акций; 17 и 20 декабря цена закрытия больше цены открытия – ящички светлые, 18, 19 и 21 декабря цена закрытия меньше цены открытия – ящички темные

Третий и четвертый тип биржевой диаграммы в Excel аналогичен первому и второму типу плюс еще один параметр – объем торгов (размер выборки и т.п.). Поместите столбец с объемом сразу за столбцом категорий. Соответствующая диаграмма имеет вторую ось ординат, для отражения объема торгов или его аналога (рис. 4). Левая ось ординат для объема торгов, правая – для цены акций.

Рис. 4. Биржевая диаграмма четвертого типа; динамика торгов и стоимости акций

Использование блочных диаграмм в статистике было известно задолго до появления Excel. Английский термин – box-and-whisker diagram (диаграмма ящик с усами). Блочная диаграмма представляет собой удобное средство для изображения пяти базовых статистических показателей. Например, на рис. 5 изображена блочная диаграмма, иллюстрирующая показатели среднегодовой доходности 15 высокорисковых фондов. [2]

Рис. 5. Блочная диаграмма, иллюстрирующая показатели доходности 15 фондов с очень высоким уровнем риска; по оси Х среднегодовая доходность в процентах

Вертикальная линия, проведенная внутри прямоугольника, отмечает медиану. Левая сторона прямоугольника соответствует первому квартилю, Q1, а правая сторона — третьему квартилю, Q3. Таким образом, прямоугольник содержит средние 50% элементов выборки. Младшие 25% данных изображаются в виде линии (так называемый ус), соединяющей левую сторону прямоугольника с наименьшим выборочным значением Xmin. Следовательно, старшим 25% данных соответствует линия, соединяющая правую сторону прямоугольника с наибольшим выборочным значением Xmax.

Блочная диаграмма, представленная на рис. 5, демонстрирует, что показатели среднегодовой доходности 15 фондов с очень высоким уровнем риска имеют практически симметричное распределение, поскольку расстояние между медианой и наибольшим значением приблизительно равно расстоянию между наименьшим значением и медианой. Однако другие характеристики распределения указывают на несимметричность. Правый ус диаграммы длиннее левого, поскольку выборка содержит выброс, равный 18,5% (правая граница), а медиана расположена ближе к правой стороне диаграммы, чем к левой.

На рис. 6 изображены четыре типа распределений, а также соответствующие им блочные диаграммы.

Рис. 6. Четыре гипотетических распределения, исследованных с помощью блочной диаграммы. Область, расположенная под каждым ящиком, разбита квартилями, входящими в пятерку базовых показателей. А – колоколообразное распределение, Б – распределение с отрицательной асимметрией, В – распределение с положительной асимметрией, Г – прямоугольное распределение.

Если данные распределены совершенно симметрично, как на рис. 6А и 6Г, среднее выборочное значение и медиана совпадают. Кроме того, длина левого уса равна длине правого, а линия медианы проходит через середину прямоугольника.

Если распределение данных имеет отрицательную асимметрию, как на рис. 6Б, среднее выборочное значение смещается вдоль левого хвоста. Отрицательная асимметрия проявляется в виде высокой концентрации данных в правой половине шкалы. При этом 75% всех данных расположены между левой стороной прямоугольника (первый квартиль, Q1) и концом правого уса (наибольшее выборочное значение, Xmax). Следовательно, вдоль длинного левого уса распределены всего 25% данных. Это свидетельствует о сильной асимметрии распределения.

Если распределение данных имеет положительную асимметрию, как на рис. 6В, пик распределения смещается влево. Теперь 75% всех данных расположены между началом левого уса (наименьшее выборочное значение, Xmin) и правой стороной прямоугольника (третий квартиль, Q3). Остальные 25% данных распределены вдоль длинного правого уса.

К сожалению, стандартные средства Excel не позволяют построить блочную диаграмму с пятью базовыми показателями статистики: Xmin, Q1, медиана, Q3, Xmax. Можно воспользоваться надстройкой PHStat2 или аналогичными. Я «исхитрился» и построил такую диаграмму, правда, не идеально красивую.

В качестве исходной возьмите диаграмму, как на рис. 2. Добавьте к данным еще один ряд – средние значения μ. Чтобы сделать это, для начала выделите диаграмму и правой кнопкой мыши вызовите контекстное меню (рис. 7А).

Рис. 7А. Добавляем на стандартную биржевую диаграмму (тип 2) ряд средних значений; А – выбрать данные

В открывшемся окне «Выбор источника данных» нажмите «Добавить» (рис. 7Б).

Рис. 7Б. Добавляем на стандартную биржевую диаграмму (тип 2) ряд средних значений; Б – добавить ряд

В открывшемся окне «Изменение ряда» выберите имя ряда и значения (рис. 7В). Нажмите 2 раза Ok.

Рис. 7В. Добавляем на стандартную биржевую диаграмму (тип 2) ряд средних значений; В – выбрать имя ряда и значения

Ряд на диаграмме добавился, но он не виден. Это связано с тем, что по умолчанию на биржевой диаграмме ряды не имеют ни цвета линий, ни маркеров. Все видимые элементы диаграммы выполнены с помощью полос повышения и планок погрешности; см. вкладку Excel «Работа с диаграммами» – «Макет», область Анализ (выделено в правой верхней части рис. 7Г). Обратите также внимание, что после добавления ряда μ ящички уменьшились по высоте (сравните размер ящичков на рисунках 7А и 7Г). Это связано с еще одной особенностью биржевых диаграмм – низ ящичков всегда соответствует значениям первого ряда. Первого – в окне «Выбор источника данных». В нашем случае (см. рис. 7Б) это ряд «μ–σ». Верх ящичков соответствует значениям последнего ряда. В нашем случае сначала это был ряд «μ+σ» (см. рис. 7Б), а после добавления ряда «μ», именно он стал последним. Чтобы исправить ситуацию, надо просто изменить порядок рядов в окне «Выбор источника данных». Откройте это окно еще раз, выделите ряд «μ», и передвиньте его вверх с помощью стрелки ↑. Ящички вернуться к исходному размеру.

Теперь, чтобы отформатировать вновь созданный ряд средних, выделите диаграмму, и пройдите по меню Работа с диаграммами – Макет. В области «Текущий фрагмент» щелкните на «Область диаграммы» и выберите ряд «μ» (рис. 7Г).

Рис. 7Г. Добавляем на стандартную биржевую диаграмму (тип 2) ряд средних значений; Г – активировать новый ряд на диаграмме

Ряд «μ» выделился (рис. 7Д). Это видно, во-первых, по тому, что на диаграмме появились точечки вокруг ряда (пока невидимого), а на листе выделен диапазон Т3:Т15. Щелкните кнопку «Формат выделенного фрагмента».

Рис. 7Д. Добавляем на стандартную биржевую диаграмму (тип 2) ряд средних значений; Д –  формат выделенного фрагмента

В открывшемся окне «Формат ряда данных», установите Цвет линии маркера – Нет линий, Заливка маркера – Сплошная, цвет – черный, Параметры маркера – как на рис. 7Е

Рис. 7Е. Добавляем на стандартную биржевую диаграмму (тип 2) ряд средних значений; Е – параметры маркера

Итог усилий представлен на рис. 7. Стоит ли она затраченных усилий, решать вам.

Рис. 7. Ящичная диаграмма с пятью базовыми показателями статистики: Xmin, Q1, медиана, Q3, Xmax.

* * *

На закуску рассмотрим пример использования блочных диаграмма в практике «шесть сигм» (это одна из концепций менеджмента качества; для первого знакомства см., например,  Пит Панде, Ларри Холп. Что такое «шесть сигм»?).

Допустим, ваша задача выявить из «моря» факторов (X1, X2… Xn) тот, который оказывает наибольшее влияние на объем производства (Y). Для начала соберите все данные, относящиеся к делу (рис. 8).

Рис. 8. Форма для регистрации данных наблюдений

Чтобы узнать, влияет ли наблюдаемый входной фактор (Xm) на выходной (Y), следует создать несколько диаграмм «ящик с усами» для выходного фактора таким образом, чтобы каждая отдельная диаграмма соответствовала одному условию входной переменной.

Данные на рис. 8 — это часть большого списка данных, собранных для одного процесса. Ключевой результат (Y) показывает часовую производительность в штуках. Возможные входные факторы влияния: департамент, выполняющий транзакцию (Х1), час дня, когда транзакция была выполнена (Х2), вид использованной рабочей системы (Х3) и имя работника, выполнившего транзакцию (Х4).

Какой эффект оказывает конкретный работник (Х4) на производительность (Y)? На рис. 9 представлен набор ящичных диаграмм Y для каждого значения входного фактора Х4.

Рис. 9. Влияние каждого отдельного работника на часовую производительность

Зависит ли количество выполненных за час транзакций от того, кто делан эту работу – Боб, Джоан или Салли? Из рис. 9 ясно видно, что операторы почти не разнятся между собой по производительности. У них приблизительно один и тот же средний уровень и вариация одной и той же величины. Из этого следует вывод, что переменная Х4 (работник) не является ключевым фактором влияния на вариацию результата.

Что можно сказать о зависимости результата от того, какой департамент (Х3) выполняет транзакции? На рис. 10 изображена еще одна группа диаграмм «ящик с усами» для двух департаментов.

Рис. 10. Влияние каждого департамента на часовую производительность

Видно, что разница между центрами вариации для департаментов А и В существенна по сравнению со средней шириной вариации внутри департаментов. Вывод: от того, какой департамент выполняет транзакции, действительно зависит часовое количество последних.


[1] Чтобы разнообразить изложение, я буду употреблять все три названия диаграмм в качестве синонимов. При написании заметки использованы материалы книг: Джон Уокенбах Microsoft Office Excel 2007. Библия пользователя, стр. 391, 392, Дэвид Левин и др. Статистика для менеджеров с использованием Microsoft Excel, стр. 214–217, Крейг Джиджи и др. Шесть сигм для «чайников», стр. 158–160, а также учебные материалы Microsoft: Представление данных в биржевой диаграмме, Создание биржевой диаграммы.

[2] Из книги Д. Левин и др. Статистика для менеджеров с использованием Microsoft Excel, стр. 214.

Like this post? Please share to your friends:
  • Как построить диаграмму в microsoft word
  • Как построить диаграмму в excel стоимость
  • Как построить диаграмму в excel с помощью графика
  • Как построить диаграмму в excel с подписями
  • Как построить диаграмму в excel с несколькими графиками