Аналитическая группировка в excel



6.4. Аналитическая группировка

Данная группировка позволяет установить наличие и характер зависимости одного вариационного ряда от другого. Это может быть связь между признаками разных статистических

совокупностей или (что чаще) между признаками одной совокупности:

Пример 42

Имеются выборочные данные о выпуске продукции (млн. руб.) и прибыли (млн. руб.) по 30 предприятиям за некоторый

период:

Методом аналитической группировки установить наличие и характер зависимости между стоимостью произведенной продукции и средней прибылью предприятий. Результаты оформить в виде групповой и аналитической таблицы.  Сделать

выводы, куда ж без них.

Итак, по условию нам дано два вариационных ряда:  – выпуск продукции по предприятиям (в млн. руб.) и  – прибыль по соответствующим предприятиям (тоже в млн. руб.). При

этом очевидно, что один показатель зависит от другого – чем больше предприятие выпускает, тем, вероятно,

больше у него прибыль. Но всегда ли это так? Нет не всегда. Ведь крупное предприятие может быть и убыточным, может не продать

всю продукцию при увеличении её производства. Однако общая тенденция состоит в том, что при увеличении выпуска

продукции, увеличивается и средняя прибыль по предприятиям. Ибо масштаб имеет значение, пекарни – это пекарни, а

хлебзаводы – это заводы.

Такая нежёсткая зависимость называется корреляционной. Это зависимость, при которой изменение

одного показателя влечёт изменение СРЕДНИХ значений другого показателя. Этим корреляционная зависимость отличается от

функциональной, где изменение аргумента оказывает чёткое и безусловное влияние на изменение функции.

Показатель  (выпуск продукции)

называется факторным (причинным) или признаком-фактором. Показатель  (прибыль) называется результативным (зависимым, следственным) или

признаком-результатом.

Но не всё так просто. Дело в том, что вышесказанное является лишь нашим предположением. А вдруг в условии дано 30

каких-нибудь северокорейских заводов, где нет такой зависимости?

Именно поэтому по условию нужно установить наличие зависимости между выпуском продукции и прибылью и

определить её характер.  Под характером понимается корреляционность зависимости и её

направление, при этом возможны следующие варианты:

– прямая связь («чем больше, тем больше» – наш случай);
– обратная связь («чем больше, тем меньше»);
– отсутствие связи  («чем больше, тем так же хаотично»).

И установить всё это нужно методом аналитической группировки, которая позволяет выявить наличие (либо

отсутствие) и направление корреляционной связи между признаком-фактором  и признаком-результатом .

И мы начинаем, наконец, оформлять решение:

Прежде всего, нужно определить признак-фактор и признак-результат. Самостоятельно, на основе логических

рассуждений. Тут же высказываем предположение о наличии и направлении предполагаемой корреляционной связи. В нашей

задаче можно записать примерно следующее:

Очевидно, что средний размер прибыли по предприятиям зависит от стоимости выпущенной продукции, при этом, чем

больше выпущено продукции, тем выше может быть прибыль. Таким образом, выпуск продукции  является признаком-фактором, а прибыль предприятий  – признаком-результатом;

предполагаемая корреляционная зависимостьпрямая.

Обращаю ваше внимание, что данная часть задания является если не обязательной, то строго желательной. Часто в условии

прямо запрашивается этот пункт.

Теперь проверяем нашу гипотезу (предположение) методом аналитической группировки.
Как выполнить аналитическую группировку?

Сначала нужно упорядочить совокупность по признаку-фактору. Расположим предприятия по возрастанию выпуска

продукции (оранжевый цвет):

В Экселе эта сортировка выполняется буквально в пару щелчков, и чуть ниже будет ролик о том, как быстро решить нашу

задачу. Номера предприятий можно было опустить, но я оставил их для лучшего понимания выполненного действия. Заметьте, что

зависимый показатель является ведомым, это означает, что числа в колонке «Прибыль» переместились вслед за числами в

колонке «Выпуск продукции».

Теперь выполняем группировку совокупности – опять же по признаку-фактору

(выпуску продукции). Поскольку в условии нет никаких указаний на этот счёт, то используем стандартную равноинтервальную группировку.

Размах вариации составляет:
 млн. руб.

Оптимальное количество интервалов определим по формуле Стерджеса, для объёма совокупности  оно составляет:

 интервалов (округлили

влево).

Таким образом, длина каждого интервала:  млн. руб., в результате чего у нас получаются следующие интервалы выпуска

продукции:

41-53, 53-65, 65-77, 77-89 и 89-101 млн. руб.

Собственно, разносим предприятия по группам и начинаем заполнять групповую

таблицу. Напоминаю, что значения, попадающие на «стык» интервалов следует относить в следующий интервал:

В нижней части таблицы подсчитываем количество  предприятий по каждой группе, сумму значений (внимание!)

результативного признака (прибыли), и, наконец, средние значения  результативного признака по группам.

Основные результаты представим в виде аналитической таблицы:

Теперь смотрим короткое видео о том, как это всё быстро

подсчитать.

Сделаем краткие выводы: аналитическая группировка показала, что при увеличении стоимости выпущенной

продукции наблюдается увеличение средней прибыли по предприятиям. Таким образом, между рассмотренными факторами действительно

существует прямая корреляционная зависимость. Таким образом, наше предположение (см. начало задания) подтвердилось.

Обращаю внимание, что средние значения (правая колонка) не обязаны строго возрастать (либо убывать), и если вы

получите такой результат, то это будет нормально, ведь корреляционная зависимость не является жёсткой. ВажнА общая

тенденция увеличения (либо уменьшения) средних значений. Но может статься, что по итогу вообще не проучится

какой-то внятной закономерности. И это тоже результат исследования! С соответствующими выводами о слабой коррел. зависимости

либо отсутствии таковой.

И здесь возникает закономерный вопрос: а насколько СИЛЬНО влияет факторный признак на результат, насколько теснА

связь между факторами? На этот вопрос отвечают специальные статические показатели, о которых я

рассказал на сайте. По причине редкости этой не самой простой задачи она не вошла в эту книгу.
Следующее задание для самостоятельного решения:

Пример 43

По результатам выборочного исследования 20 банков известны процентные ставки и соответствующие суммы выданных

кредитов:

Требуется:
1) Определить факторный и результативный признак и выдвинуть предположение о наличии и направлении корреляционной связи

между показателями.
2) Методом аналитической группировки проверить наличие корреляционной связи, выборку разбить на 4 группы с равным

количеством банков в каждой. Результаты представить в виде групповой и аналитической таблицы. Сделать выводы.

Обратите внимание, что во 2-м пункте вам прямо указано, как следует выполнять группировку – в таких случаях не нужно проявлять самодеятельность – строго

следуем указаниям условия. А если решение получится не слишком удачное, то это уже проблемы автора задачи.

Все числа забиты в Эксель и вам осталось быстренько выполнить

действия. Решение для сверки в конце книги.

Что ещё можно сказать по теме?

В некоторых задачах результативных признаков может быть несколько, как правило, два, например:  – выпуск продукции,  – прибыль и  – себестоимость производства. Никаких проблем – сортируем совокупность по

признаку-фактору  (выпуску

продукции), при этом в Экселе нужно выделить не два, а уже три столбца, о чём я недавно рассказывал в видеоролике. Далее

выполняем группировку и рассчитываем средние значения прибыли и себестоимости по каждой группе. Делаем выводы.

Заметим, кстати, что корреляционная связь , вероятно, обратная, поскольку при увеличении выпуска продукции,

издержки могут падать (ввиду автоматизации процесса при массовом производстве).

И в заключение параграфа хочу сказать, что показатели вам могут быть предложены самые разные, поэтому при решении

подобных задач следует «включать голову» и элементарную логику.

6.5. Комбинационная группировка

6.3. Перегруппировка

| Оглавление |



Дисциплина:
«Анализ данных на компьютере»

Методические
указания и задания по выполнению
лабораторной работы №1
«Построение статистической группировки»

1. Ведение

Целью
выполнения лабораторных работ является
получение студентами навыков практического
применения полученных теоретических
знаний. На лабораторных занятиях студенты
производят расчеты заданий для
самостоятельной работы с использованием
ППП Excel и Statistica.

Учебным планом и
рабочей программой для всех специальностей
предусмотрено проведение лабораторных
занятий по следующим темам:

  1. выборочный метод;

  2. построение
    статистической группировки;

  3. расчет средних
    величин;

  4. расчет показателей
    вариации;

  5. дисперсионный
    анализ;

  6. корреляционно –
    регрессионный анализ;

  7. анализ динамических
    рядов;

  8. кластерный анализ;

  9. планирование
    эксперимента и

  10. статистический
    анализ качества технологического
    процесса.

Часть первая
методических указаний представляет
собой поэтапную характеристику и примеры
выполнения практических и лабораторных
работ по первым двум темам, а также
содержат варианты заданий для
самостоятельной работы студентов.

По каждой теме
студент представляет на кафедру отчет,
содержащий результаты расчетов в EXCEL
и Statistica,
распечатки графиков и анализ полученных
данных. Оформление отчетов по практическим
и лабораторным занятиям выполняются в
соответствии с ГОСТ 2.105 – 95 “Общие
требования к текстовым документам”.
Образец оформления титульного листа
приведен в приложении А.

2. Построение
статистической группировки

Цель работы:
систематизация первичных данных
(полученных в результате статистического
наблюдения) и получение на этой основе
сводной характеристики объектов в целом
при помощи обобщающих показателей.

Порядок выполнения
работы:

  1. По исходным данным
    и в зависимости от поставленной задачи
    исследования определить вид группировки.

  2. Выбрать группировочный
    признак, то есть признак, по значениям
    которого единицы совокупности
    объединяются в группы.

  3. Образовать группы
    и интервалы группировки по правильно
    выбранному группировочному признаку.

  4. Разработать
    системы общих и средних показателей,
    характеризующих объект изучения.

  5. Разработать и
    заполнить макет итоговой таблицы.

  6. Дать анализ
    результатов группировки: указать вид
    группировки, сформулировать выводы.

  7. Графическ отобразить
    полученную информацию.

2.1 Пример построения
статистической группировки

Имеются следующие
показатели, характеризующие деятельность
коммерческих банков одного из регионов
России, тыс. руб.

Таблица 1 – Исходные
данные

№ банка

Капитал

Работающие
активы

Уставный
капитал

1

20710

11706

3572

2

19942

19850

17469

3

9273

2556

4778

4

59256

43587

2100

5

24654

29007

23100

6

47719

98468

18684

7

34236

45595

11354

8

7782

6154

2950

9

48290

79794

12005

10

10276

10099

6799

11

35662

30005

13594

12

30702

21165

12430

13

8153

16663

3415

14

10215

9115

12670

15

23459

31717

7401

16

55848

54435

12239

17

25942

21430

8973

18

20651

54172

10700

19

13762

19771

12935

20

6753

10857

5265

21

22421

53445

6110

22

19148

22625

9063

23

12870

15962

9998

24

34019

47333

11940

25

42969

80229

11872

26

55076

114204

17218

27

56200

90367

20454

28

40653

81714

13072

29

14813

18245

5029

30

31514

100732

13420

Произведем анализ
деятельности коммерческих банков,
применяя метод группировок.

Ход работы:

1) На основе имеющейся
информации о деловой активности
коммерческих банков можно построить
структурную и аналитическую группировку.

Структурная
группировка
– это разделение однородной
совокупности на группы, характеризующие
ее структуру по какому-либо варьирующему
признаку. В нашем случае, варьирующий
признак – величина уставного капитала,
следовательно, анализ структуры
коммерческих банков проведем по величине
уставного капитала.

Аналитическая
группировка
позволяет выявить
взаимосвязи между изучаемым явлением
и его признаками. Таким образом, установим
взаимосвязь между уставным капиталом
и капиталом, а также работающими активами.

2) Все группировочные
признаки подразделяются на качественные
(атрибутивные) и количественные.

Так, выбор в качестве
группировочных атрибутивных признаков
сам по себе определяет решение вопроса
о числе групп. Если в основание группировки
положен количественный непрерывный
признак, как в нашем случае, то возникает
вопрос не только о числе групп, но и об
интервалах, их характере и величине.

Всю совокупность
признаков можно разделить на две группы:
факторные и результативные. Факторными
называются признаки, под воздействием
которых изменяются другие признаки –
они и образуют группу результативных.
Взаимосвязь проявляется в том, что с
возрастанием значения факторного
признака систематически возрастает
или убывает среднее значение результативного
признака. Для данного примера факторный
признак – уставный капитал банков,
результативные – сумма капитала и
работающих активов.

3) После определения
группировочного признака, рассчитаем
необходимое число групп и величину
интервала.

Для определения
числа групп используем формулу,
предложенную американским ученым
Стерджессом:

n =
1 + 3,322*lgN

где: N
– число единиц совокупности,

n
– число групп.

Для нашего примера:

n =
1 + 3,322*lg30 = 6,

что значит не более
шести групп.

Учитывая
малочисленность некоторых групп,
образуем всего четыре группы банков с
равными интервалами. Величину интервала
определим по формуле:

Обозначим границы
групп:

2100 – 7350 – первая
группа;

7350 – 12600 – вторая
группа;

12600 – 17850 – третья
группа;

17850 – 23100 – четвертая
группа.

4) После того как
определен группировочный признак –
уставный капитал, задано число групп –
4 и образованы сами группы, необходимо
отобрать показатели, которые характеризуют
группы, и определить их величины по
каждой группе. Показатели, характеризующие
коммерческие банки – сумма капитала и
работающих активов, разносятся по
указанным группам и подсчитываются
итоги по группам.

5) Результаты
группировки заносятся в таблицу и
определяются общие итоги.

Таблица 2 — Группировка
малых и средних коммерческих банков по
величине уставного капитала

Номер
группы

Группы
банков по величине уставного капитала,
тыс. руб.

Число
банков, единиц

Капитал,
тыс. руб.

Работающие
активы, тыс. руб.

Уставный
капитал, тыс. руб.

1

2100
– 7350

9

159437

173312

40018

2

7350
– 12600

11

348134

474457

117975

3

12600
– 17850

7

206824

375391

100378

4

17850
– 23100

3

128573

217842

62238

Итого

30

842968

1241002

320609

Структурная
группировка коммерческих банков по
величине уставного капитала представлена
в таблице 3.

Таблица 3 –
Структурная группировка малых и средних
коммерческих банков по величине уставного
капитала

Номер
группы

Группы
банков по величине уставного капитала,
тыс. руб.

Число
банков, %

Капитал,
% к итогу

Работающие
активы, % к итогу

Уставный
капитал, % к итогу

1

2100
– 7350

30,0

18,9

14,0

12,5

2

7350
– 12600

36,7

41,3

38,2

36,8

3

12600
– 17850

23,3

24,5

30,2

31,3

4

17850
– 23100

10,0

15,3

17,6

19,4

Итого

100,0

100,0

100,0

100,0

Более конкретный
анализ взаимосвязи показателей можно
сделать на основе аналитической
группировки.

Таблица 4 –
Аналитическая группировка малых и
средних коммерческих банков по величине
уставного капитала

Номер
группы

Группы
банков по величине уставного капитала,
тыс. руб.

Число
банков, единиц

Капитал,
тыс. руб.

Работающие
активы, тыс. руб.

всего

в
среднем на 1 банк

всего

в
среднем на 1 банк

1

2100
– 7350

9

159437

17715

173312

19257

2

7350
– 12600

11

348134

31648

474457

43132

3

12600
– 17850

7

206824

29546

375391

53627

4

17850
– 23100

3

128573

42857

217842

72614

Итого

30

842968

1241002

В
среднем на один банк

28099

41367

6) На основе
структурной группировки представленной
в таблице 3 можно сделать следующий
вывод: в рассматриваемой совокупности
в основном преобладают банки с величиной
уставного капитала от 7350 до 12600 тыс.
руб., их удельный вес в общем объеме
составляет 36,7%. На их долю приходится
41,3% всего капитала.

Аналитическая
группировка представленная в таблице
4 выявляет закономерность между величиной
капитала и величиной работающих активов.
Эта связь прямая, показывающая эффективное
управление работающими активами в
зависимости от величины капитала.

7
)
Отобразим графически полученный
интервальный вариационный ряд, то есть
построим гистограмму распределения
банков по сумме уставного капитала (на
основе данных таблицы 4).

Построим полигон
распределения банков по сумме уставного
капитала, для чего определим серединные
значения для каждого интервала.

Таблица 5 – Расчетные
данные

Номер
группы

Группы
банков по величине уставного капитала,
тыс. руб.

Число
банков, единиц

Серединные
значения интервалов

1

2100
– 7350

9

4725

2

7350
– 12600

11

9975

3

12600
– 17850

7

15225

4

17850
– 23100

3

20475

Итого

Х

30

Х

Н
а
основе структурной группировки,
представленной в таблице 3, можно сделать
следующий вывод: в рассматриваемой
совокупности в основном преобладают
банки с величиной уставного капитала
от 7350 до 12600 тыс. руб., их удельный вес в
общем объеме составляет 36,7%. На их долю
приходится 41,3% всего капитала.

Аналитическая
группировка, представленная в таблице
4, выявляет закономерность между величиной
капитала и величиной работающих активов.
Эта зависимость прямая и показывает
эффективное управление работающими
активами, в зависимости от величины
капитала.

2.2. Построение
аналитической группировки в
MS
Excel

Для построения
аналитической группировки в MS
Excel
воспользуйтесь знаниями по курсу
“Информатика” и выполните последовательно
следующие этапы:

  1. Создать файл с
    исходными данными.

2. Произвести
сортировку введенной информации по
группировочному признаку. Например,
“Уставный капитал”.

3. Определить размах
вариации (R
= Xmax
– Xmin)
путем ввода соответствующей формулы
(например, D31
– D2).

4. Определите
величину интервала (i=R/n).

5. Построить и
заполнить групповую сводную таблицу,
макет которой приведен ниже.

Номер
группы

Группы
банков по величине уставного капитала,
тыс. руб.

Число
банков, единиц

Капитал,
тыс. руб.

Работающие
активы, тыс. руб.

нижняя
граница

верхняя
граница

всего

в
среднем на 1 банк

всего

в
среднем на 1 банк

1

2

3

4

Итого

В
среднем на один банк

Соседние файлы в папке А Д

  • #

    24.03.201569.63 Кб44123.xls

  • #
  • #
  • #
  • #
  • #
  • #

    24.03.201515.36 Кб63Лабораторная 1 , Алексеева Александра.xls

  • #

    24.03.201574.75 Кб45Лист Microsoft Excel.xls

  • #
  • 02:02

    Чистая загрузка в Windows 10. Как выполнить чистый запуск.

    Чистая загрузка в Windows 10. Как выполнить чистый запуск.

    от admin
    2 года назад
    4 Просмотры

  • 5:07:40

    ЧЕЛЛЕНДЖ! ВЫПОЛНИТЬ 20 ЗАДАЧ ЗА 5.5 ЧАСОВ! ВЗВОД С Sh0tnik & __NIDIN__ Стрим World of Tanks

    ЧЕЛЛЕНДЖ! ВЫПОЛНИТЬ 20 ЗАДАЧ ЗА 5.5 ЧАСОВ! ВЗВОД С Sh0tnik & __NIDIN__ Стрим World of Tanks

    от admin
    1 год назад
    4 Просмотры

  • 1:14:16

    Вебинар: Как клинике выполнить требования по защите персональных данных пациентов

    Вебинар: Как клинике выполнить требования по защите персональных данных пациентов

    от admin
    7 месяцев назад
    0 Просмотры

  • 06:37

    2  Действие Выполнить код  Внутреннее BAS API

    2 Действие Выполнить код Внутреннее BAS API

    от admin
    1 год назад
    8 Просмотры

  • 02:07

    Как выполнить публикацию базы 1С на веб сервере

    Как выполнить публикацию базы 1С на веб сервере

    от admin
    1 год назад
    0 Просмотры

  • 05:04

    Не сохраняется история ввода команд в окне Выполнить (Win+R)

    Не сохраняется история ввода команд в окне Выполнить (Win+R)

    от admin
    2 года назад
    5 Просмотры

  • 06:22

    Как выполнить Python код с правами Администратора?!

    Как выполнить Python код с правами Администратора?!

    от admin
    11 месяцев назад
    1 Просмотры

  • 00:27

    Решение выполнить действия (z1−z2)/(ẑ1+z3) если z1=3+2i, z2=−2+4i z3=1−5i пример 8 Комплексные числа

    Решение выполнить действия (z1−z2)/(ẑ1+z3) если z1=3+2i, z2=−2+4i z3=1−5i пример 8 Комплексные числа

    от admin
    1 год назад
    0 Просмотры

  • 06:32

    WinAero Win+R Alias Manager ⚡️ Быстрый Запуск Любых Приложений на Компьютере через "Выполнить"

    WinAero Win+R Alias Manager ⚡️ Быстрый Запуск Любых Приложений на Компьютере через «Выполнить»

    от admin
    2 года назад
    1 Просмотры

  • 00:25

    Решение, выполнить действия  z1/(z2∙z3) если z1=5+2i, z2=4–3i, z3=6+3i, пример 2 Высшая математика

    Решение, выполнить действия z1/(z2∙z3) если z1=5+2i, z2=4–3i, z3=6+3i, пример 2 Высшая математика

    от admin
    1 год назад
    2 Просмотры

  • 00:37

    Решение, найти матрицу обратную данной и выполнить проверку умножением A = (6 7 3; 3 1 0; 2 2 1)

    Решение, найти матрицу обратную данной и выполнить проверку умножением A = (6 7 3; 3 1 0; 2 2 1)

    от admin
    1 год назад
    1 Просмотры

  • 00:27

    Решение, найти матрицу второго порядка обратную данной и выполнить проверку умножением A=(2 5; 6 1)

    Решение, найти матрицу второго порядка обратную данной и выполнить проверку умножением A=(2 5; 6 1)

    от admin
    1 год назад
    1 Просмотры

  • 06:49

    17 команд «Выполнить» для каждого пользователя Windows 10/8/7

    17 команд «Выполнить» для каждого пользователя Windows 10/8/7

    от admin
    2 года назад
    3 Просмотры

  • 01:41

    БЫСТРОЕ РЕШЕНИЕ Forza Horizon 4 не удалось подключиться к сесси/ TOREDO не удается выполнить оценку

    БЫСТРОЕ РЕШЕНИЕ Forza Horizon 4 не удалось подключиться к сесси/ TOREDO не удается выполнить оценку

    от admin
    1 год назад
    34 Просмотры

  • 18:02

    ВСТУПИЛ В  ЭЛИТНУЮ ГРУППИРОВКУ! LCN В UNTURNED

    ВСТУПИЛ В ЭЛИТНУЮ ГРУППИРОВКУ! LCN В UNTURNED

    от admin
    11 месяцев назад
    1 Просмотры

  • 03:32

    Как отключить группировку значков на панели задач Windows 11

    Как отключить группировку значков на панели задач Windows 11

    от admin
    1 год назад
    8 Просмотры

  • 7:13:59

    Админ. День 9. Время выполнить норму и последить за сервером!!!  Radmir RP

    Админ. День 9. Время выполнить норму и последить за сервером!!! Radmir RP

    от admin
    2 месяцев назад
    0 Просмотры

  • 02:11

    Как выполнить полный сброс на заводские установки. Samsung SGH-i320 Windows Mobile Corporation.

    Как выполнить полный сброс на заводские установки. Samsung SGH-i320 Windows Mobile Corporation.

    от admin
    1 год назад
    3 Просмотры

  • 12:38

    Список команд Выполнить для Windows 11, которые полезно знать

    Список команд Выполнить для Windows 11, которые полезно знать

    от admin
    1 год назад
    1 Просмотры

  • 01:21

    Как убрать группировку значков на панели задач Windows 10

    Как убрать группировку значков на панели задач Windows 10

    от admin
    7 месяцев назад
    1 Просмотры

  • 02:36

    7.5 Упорядоченные цифры. "Поколение Python": курс для начинающих. Курс Stepik

    7.5 Упорядоченные цифры. «Поколение Python»: курс для начинающих. Курс Stepik

    от admin
    9 месяцев назад
    2,625 Просмотры

  • Понравилась статья? Поделить с друзьями:
  • Аналитическая графика в excel
  • Аналитика с помощью excel
  • Аналитика при помощи excel
  • Аналитика подбора персонала в excel
  • Аналитика по продажам в excel