6.4. Аналитическая группировка
Данная группировка позволяет установить наличие и характер зависимости одного вариационного ряда от другого. Это может быть связь между признаками разных статистических
совокупностей или (что чаще) между признаками одной совокупности:
Пример 42
Имеются выборочные данные о выпуске продукции (млн. руб.) и прибыли (млн. руб.) по 30 предприятиям за некоторый
период:
Методом аналитической группировки установить наличие и характер зависимости между стоимостью произведенной продукции и средней прибылью предприятий. Результаты оформить в виде групповой и аналитической таблицы. Сделать
выводы, куда ж без них.
Итак, по условию нам дано два вариационных ряда: – выпуск продукции по предприятиям (в млн. руб.) и – прибыль по соответствующим предприятиям (тоже в млн. руб.). При
этом очевидно, что один показатель зависит от другого – чем больше предприятие выпускает, тем, вероятно,
больше у него прибыль. Но всегда ли это так? Нет не всегда. Ведь крупное предприятие может быть и убыточным, может не продать
всю продукцию при увеличении её производства. Однако общая тенденция состоит в том, что при увеличении выпуска
продукции, увеличивается и средняя прибыль по предприятиям. Ибо масштаб имеет значение, пекарни – это пекарни, а
хлебзаводы – это заводы.
Такая нежёсткая зависимость называется корреляционной. Это зависимость, при которой изменение
одного показателя влечёт изменение СРЕДНИХ значений другого показателя. Этим корреляционная зависимость отличается от
функциональной, где изменение аргумента оказывает чёткое и безусловное влияние на изменение функции.
Показатель (выпуск продукции)
называется факторным (причинным) или признаком-фактором. Показатель (прибыль) называется результативным (зависимым, следственным) или
признаком-результатом.
Но не всё так просто. Дело в том, что вышесказанное является лишь нашим предположением. А вдруг в условии дано 30
каких-нибудь северокорейских заводов, где нет такой зависимости?
Именно поэтому по условию нужно установить наличие зависимости между выпуском продукции и прибылью и
определить её характер. Под характером понимается корреляционность зависимости и её
направление, при этом возможны следующие варианты:
– прямая связь («чем больше, тем больше» – наш случай);
– обратная связь («чем больше, тем меньше»);
– отсутствие связи («чем больше, тем так же хаотично»).
И установить всё это нужно методом аналитической группировки, которая позволяет выявить наличие (либо
отсутствие) и направление корреляционной связи между признаком-фактором и признаком-результатом .
И мы начинаем, наконец, оформлять решение:
Прежде всего, нужно определить признак-фактор и признак-результат. Самостоятельно, на основе логических
рассуждений. Тут же высказываем предположение о наличии и направлении предполагаемой корреляционной связи. В нашей
задаче можно записать примерно следующее:
Очевидно, что средний размер прибыли по предприятиям зависит от стоимости выпущенной продукции, при этом, чем
больше выпущено продукции, тем выше может быть прибыль. Таким образом, выпуск продукции является признаком-фактором, а прибыль предприятий – признаком-результатом;
предполагаемая корреляционная зависимость – прямая.
Обращаю ваше внимание, что данная часть задания является если не обязательной, то строго желательной. Часто в условии
прямо запрашивается этот пункт.
Теперь проверяем нашу гипотезу (предположение) методом аналитической группировки.
Как выполнить аналитическую группировку?
Сначала нужно упорядочить совокупность по признаку-фактору. Расположим предприятия по возрастанию выпуска
продукции (оранжевый цвет):
В Экселе эта сортировка выполняется буквально в пару щелчков, и чуть ниже будет ролик о том, как быстро решить нашу
задачу. Номера предприятий можно было опустить, но я оставил их для лучшего понимания выполненного действия. Заметьте, что
зависимый показатель является ведомым, это означает, что числа в колонке «Прибыль» переместились вслед за числами в
колонке «Выпуск продукции».
Теперь выполняем группировку совокупности – опять же по признаку-фактору
(выпуску продукции). Поскольку в условии нет никаких указаний на этот счёт, то используем стандартную равноинтервальную группировку.
Размах вариации составляет:
млн. руб.
Оптимальное количество интервалов определим по формуле Стерджеса, для объёма совокупности оно составляет:
интервалов (округлили
влево).
Таким образом, длина каждого интервала: млн. руб., в результате чего у нас получаются следующие интервалы выпуска
продукции:
41-53, 53-65, 65-77, 77-89 и 89-101 млн. руб.
Собственно, разносим предприятия по группам и начинаем заполнять групповую
таблицу. Напоминаю, что значения, попадающие на «стык» интервалов следует относить в следующий интервал:
В нижней части таблицы подсчитываем количество предприятий по каждой группе, сумму значений (внимание!)
результативного признака (прибыли), и, наконец, средние значения результативного признака по группам.
Основные результаты представим в виде аналитической таблицы:
Теперь смотрим короткое видео о том, как это всё быстро
подсчитать.
Сделаем краткие выводы: аналитическая группировка показала, что при увеличении стоимости выпущенной
продукции наблюдается увеличение средней прибыли по предприятиям. Таким образом, между рассмотренными факторами действительно
существует прямая корреляционная зависимость. Таким образом, наше предположение (см. начало задания) подтвердилось.
Обращаю внимание, что средние значения (правая колонка) не обязаны строго возрастать (либо убывать), и если вы
получите такой результат, то это будет нормально, ведь корреляционная зависимость не является жёсткой. ВажнА общая
тенденция увеличения (либо уменьшения) средних значений. Но может статься, что по итогу вообще не проучится
какой-то внятной закономерности. И это тоже результат исследования! С соответствующими выводами о слабой коррел. зависимости
либо отсутствии таковой.
И здесь возникает закономерный вопрос: а насколько СИЛЬНО влияет факторный признак на результат, насколько теснА
связь между факторами? На этот вопрос отвечают специальные статические показатели, о которых я
рассказал на сайте. По причине редкости этой не самой простой задачи она не вошла в эту книгу.
Следующее задание для самостоятельного решения:
Пример 43
По результатам выборочного исследования 20 банков известны процентные ставки и соответствующие суммы выданных
кредитов:
Требуется:
1) Определить факторный и результативный признак и выдвинуть предположение о наличии и направлении корреляционной связи
между показателями.
2) Методом аналитической группировки проверить наличие корреляционной связи, выборку разбить на 4 группы с равным
количеством банков в каждой. Результаты представить в виде групповой и аналитической таблицы. Сделать выводы.
Обратите внимание, что во 2-м пункте вам прямо указано, как следует выполнять группировку – в таких случаях не нужно проявлять самодеятельность – строго
следуем указаниям условия. А если решение получится не слишком удачное, то это уже проблемы автора задачи.
Все числа забиты в Эксель и вам осталось быстренько выполнить
действия. Решение для сверки в конце книги.
Что ещё можно сказать по теме?
В некоторых задачах результативных признаков может быть несколько, как правило, два, например: – выпуск продукции, – прибыль и – себестоимость производства. Никаких проблем – сортируем совокупность по
признаку-фактору (выпуску
продукции), при этом в Экселе нужно выделить не два, а уже три столбца, о чём я недавно рассказывал в видеоролике. Далее
выполняем группировку и рассчитываем средние значения прибыли и себестоимости по каждой группе. Делаем выводы.
Заметим, кстати, что корреляционная связь , вероятно, обратная, поскольку при увеличении выпуска продукции,
издержки могут падать (ввиду автоматизации процесса при массовом производстве).
И в заключение параграфа хочу сказать, что показатели вам могут быть предложены самые разные, поэтому при решении
подобных задач следует «включать голову» и элементарную логику.
6.5. Комбинационная группировка
6.3. Перегруппировка
| Оглавление |
Дисциплина:
«Анализ данных на компьютере»
Методические
указания и задания по выполнению
лабораторной работы №1
«Построение статистической группировки»
1. Ведение
Целью
выполнения лабораторных работ является
получение студентами навыков практического
применения полученных теоретических
знаний. На лабораторных занятиях студенты
производят расчеты заданий для
самостоятельной работы с использованием
ППП Excel и Statistica.
Учебным планом и
рабочей программой для всех специальностей
предусмотрено проведение лабораторных
занятий по следующим темам:
-
выборочный метод;
-
построение
статистической группировки; -
расчет средних
величин; -
расчет показателей
вариации; -
дисперсионный
анализ; -
корреляционно –
регрессионный анализ; -
анализ динамических
рядов; -
кластерный анализ;
-
планирование
эксперимента и -
статистический
анализ качества технологического
процесса.
Часть первая
методических указаний представляет
собой поэтапную характеристику и примеры
выполнения практических и лабораторных
работ по первым двум темам, а также
содержат варианты заданий для
самостоятельной работы студентов.
По каждой теме
студент представляет на кафедру отчет,
содержащий результаты расчетов в EXCEL
и Statistica,
распечатки графиков и анализ полученных
данных. Оформление отчетов по практическим
и лабораторным занятиям выполняются в
соответствии с ГОСТ 2.105 – 95 “Общие
требования к текстовым документам”.
Образец оформления титульного листа
приведен в приложении А.
2. Построение
статистической группировки
Цель работы:
систематизация первичных данных
(полученных в результате статистического
наблюдения) и получение на этой основе
сводной характеристики объектов в целом
при помощи обобщающих показателей.
Порядок выполнения
работы:
-
По исходным данным
и в зависимости от поставленной задачи
исследования определить вид группировки. -
Выбрать группировочный
признак, то есть признак, по значениям
которого единицы совокупности
объединяются в группы. -
Образовать группы
и интервалы группировки по правильно
выбранному группировочному признаку. -
Разработать
системы общих и средних показателей,
характеризующих объект изучения. -
Разработать и
заполнить макет итоговой таблицы. -
Дать анализ
результатов группировки: указать вид
группировки, сформулировать выводы. -
Графическ отобразить
полученную информацию.
2.1 Пример построения
статистической группировки
Имеются следующие
показатели, характеризующие деятельность
коммерческих банков одного из регионов
России, тыс. руб.
Таблица 1 – Исходные
данные
№ банка |
Капитал |
Работающие |
Уставный |
1 |
20710 |
11706 |
3572 |
2 |
19942 |
19850 |
17469 |
3 |
9273 |
2556 |
4778 |
4 |
59256 |
43587 |
2100 |
5 |
24654 |
29007 |
23100 |
6 |
47719 |
98468 |
18684 |
7 |
34236 |
45595 |
11354 |
8 |
7782 |
6154 |
2950 |
9 |
48290 |
79794 |
12005 |
10 |
10276 |
10099 |
6799 |
11 |
35662 |
30005 |
13594 |
12 |
30702 |
21165 |
12430 |
13 |
8153 |
16663 |
3415 |
14 |
10215 |
9115 |
12670 |
15 |
23459 |
31717 |
7401 |
16 |
55848 |
54435 |
12239 |
17 |
25942 |
21430 |
8973 |
18 |
20651 |
54172 |
10700 |
19 |
13762 |
19771 |
12935 |
20 |
6753 |
10857 |
5265 |
21 |
22421 |
53445 |
6110 |
22 |
19148 |
22625 |
9063 |
23 |
12870 |
15962 |
9998 |
24 |
34019 |
47333 |
11940 |
25 |
42969 |
80229 |
11872 |
26 |
55076 |
114204 |
17218 |
27 |
56200 |
90367 |
20454 |
28 |
40653 |
81714 |
13072 |
29 |
14813 |
18245 |
5029 |
30 |
31514 |
100732 |
13420 |
Произведем анализ
деятельности коммерческих банков,
применяя метод группировок.
Ход работы:
1) На основе имеющейся
информации о деловой активности
коммерческих банков можно построить
структурную и аналитическую группировку.
Структурная
группировка – это разделение однородной
совокупности на группы, характеризующие
ее структуру по какому-либо варьирующему
признаку. В нашем случае, варьирующий
признак – величина уставного капитала,
следовательно, анализ структуры
коммерческих банков проведем по величине
уставного капитала.
Аналитическая
группировка позволяет выявить
взаимосвязи между изучаемым явлением
и его признаками. Таким образом, установим
взаимосвязь между уставным капиталом
и капиталом, а также работающими активами.
2) Все группировочные
признаки подразделяются на качественные
(атрибутивные) и количественные.
Так, выбор в качестве
группировочных атрибутивных признаков
сам по себе определяет решение вопроса
о числе групп. Если в основание группировки
положен количественный непрерывный
признак, как в нашем случае, то возникает
вопрос не только о числе групп, но и об
интервалах, их характере и величине.
Всю совокупность
признаков можно разделить на две группы:
факторные и результативные. Факторными
называются признаки, под воздействием
которых изменяются другие признаки –
они и образуют группу результативных.
Взаимосвязь проявляется в том, что с
возрастанием значения факторного
признака систематически возрастает
или убывает среднее значение результативного
признака. Для данного примера факторный
признак – уставный капитал банков,
результативные – сумма капитала и
работающих активов.
3) После определения
группировочного признака, рассчитаем
необходимое число групп и величину
интервала.
Для определения
числа групп используем формулу,
предложенную американским ученым
Стерджессом:
n =
1 + 3,322*lgN
где: N
– число единиц совокупности,
n
– число групп.
Для нашего примера:
n =
1 + 3,322*lg30 = 6,
что значит не более
шести групп.
Учитывая
малочисленность некоторых групп,
образуем всего четыре группы банков с
равными интервалами. Величину интервала
определим по формуле:
Обозначим границы
групп:
2100 – 7350 – первая
группа;
7350 – 12600 – вторая
группа;
12600 – 17850 – третья
группа;
17850 – 23100 – четвертая
группа.
4) После того как
определен группировочный признак –
уставный капитал, задано число групп –
4 и образованы сами группы, необходимо
отобрать показатели, которые характеризуют
группы, и определить их величины по
каждой группе. Показатели, характеризующие
коммерческие банки – сумма капитала и
работающих активов, разносятся по
указанным группам и подсчитываются
итоги по группам.
5) Результаты
группировки заносятся в таблицу и
определяются общие итоги.
Таблица 2 — Группировка
малых и средних коммерческих банков по
величине уставного капитала
Номер |
Группы |
Число |
Капитал, |
Работающие |
Уставный |
1 |
2100 |
9 |
159437 |
173312 |
40018 |
2 |
7350 |
11 |
348134 |
474457 |
117975 |
3 |
12600 |
7 |
206824 |
375391 |
100378 |
4 |
17850 |
3 |
128573 |
217842 |
62238 |
Итого |
30 |
842968 |
1241002 |
320609 |
Структурная
группировка коммерческих банков по
величине уставного капитала представлена
в таблице 3.
Таблица 3 –
Структурная группировка малых и средних
коммерческих банков по величине уставного
капитала
Номер |
Группы |
Число |
Капитал, |
Работающие |
Уставный |
1 |
2100 |
30,0 |
18,9 |
14,0 |
12,5 |
2 |
7350 |
36,7 |
41,3 |
38,2 |
36,8 |
3 |
12600 |
23,3 |
24,5 |
30,2 |
31,3 |
4 |
17850 |
10,0 |
15,3 |
17,6 |
19,4 |
Итого |
|
100,0 |
100,0 |
100,0 |
100,0 |
Более конкретный
анализ взаимосвязи показателей можно
сделать на основе аналитической
группировки.
Таблица 4 –
Аналитическая группировка малых и
средних коммерческих банков по величине
уставного капитала
Номер |
Группы |
Число |
Капитал, |
Работающие |
||
всего |
в |
всего |
в |
|||
1 |
2100 |
9 |
159437 |
17715 |
173312 |
19257 |
2 |
7350 |
11 |
348134 |
31648 |
474457 |
43132 |
3 |
12600 |
7 |
206824 |
29546 |
375391 |
53627 |
4 |
17850 |
3 |
128573 |
42857 |
217842 |
72614 |
Итого |
30 |
842968 |
— |
1241002 |
— |
|
В |
— |
— |
28099 |
— |
41367 |
6) На основе
структурной группировки представленной
в таблице 3 можно сделать следующий
вывод: в рассматриваемой совокупности
в основном преобладают банки с величиной
уставного капитала от 7350 до 12600 тыс.
руб., их удельный вес в общем объеме
составляет 36,7%. На их долю приходится
41,3% всего капитала.
Аналитическая
группировка представленная в таблице
4 выявляет закономерность между величиной
капитала и величиной работающих активов.
Эта связь прямая, показывающая эффективное
управление работающими активами в
зависимости от величины капитала.
7
)
Отобразим графически полученный
интервальный вариационный ряд, то есть
построим гистограмму распределения
банков по сумме уставного капитала (на
основе данных таблицы 4).
Построим полигон
распределения банков по сумме уставного
капитала, для чего определим серединные
значения для каждого интервала.
Таблица 5 – Расчетные
данные
Номер |
Группы |
Число |
Серединные |
1 |
2100 |
9 |
4725 |
2 |
7350 |
11 |
9975 |
3 |
12600 |
7 |
15225 |
4 |
17850 |
3 |
20475 |
Итого |
Х |
30 |
Х |
Н
а
основе структурной группировки,
представленной в таблице 3, можно сделать
следующий вывод: в рассматриваемой
совокупности в основном преобладают
банки с величиной уставного капитала
от 7350 до 12600 тыс. руб., их удельный вес в
общем объеме составляет 36,7%. На их долю
приходится 41,3% всего капитала.
Аналитическая
группировка, представленная в таблице
4, выявляет закономерность между величиной
капитала и величиной работающих активов.
Эта зависимость прямая и показывает
эффективное управление работающими
активами, в зависимости от величины
капитала.
2.2. Построение
аналитической группировки в MS
Excel
Для построения
аналитической группировки в MS
Excel
воспользуйтесь знаниями по курсу
“Информатика” и выполните последовательно
следующие этапы:
-
Создать файл с
исходными данными.
2. Произвести
сортировку введенной информации по
группировочному признаку. Например,
“Уставный капитал”.
3. Определить размах
вариации (R
= Xmax
– Xmin)
путем ввода соответствующей формулы
(например, D31
– D2).
4. Определите
величину интервала (i=R/n).
5. Построить и
заполнить групповую сводную таблицу,
макет которой приведен ниже.
Номер |
Группы |
Число |
Капитал, |
Работающие |
|||
нижняя |
верхняя |
всего |
в |
всего |
в |
||
1 |
|||||||
2 |
|||||||
3 |
|||||||
4 |
|||||||
Итого |
|||||||
В |
Соседние файлы в папке А Д
- #
24.03.201569.63 Кб44123.xls
- #
- #
- #
- #
- #
- #
24.03.201515.36 Кб63Лабораторная 1 , Алексеева Александра.xls
- #
24.03.201574.75 Кб45Лист Microsoft Excel.xls
- #
02:02
Чистая загрузка в Windows 10. Как выполнить чистый запуск.
от admin
2 года назад
4 Просмотры
5:07:40
ЧЕЛЛЕНДЖ! ВЫПОЛНИТЬ 20 ЗАДАЧ ЗА 5.5 ЧАСОВ! ВЗВОД С Sh0tnik & __NIDIN__ Стрим World of Tanks
от admin
1 год назад
4 Просмотры
1:14:16
Вебинар: Как клинике выполнить требования по защите персональных данных пациентов
от admin
7 месяцев назад
0 Просмотры
06:37
2 Действие Выполнить код Внутреннее BAS API
от admin
1 год назад
8 Просмотры
02:07
Как выполнить публикацию базы 1С на веб сервере
от admin
1 год назад
0 Просмотры
05:04
Не сохраняется история ввода команд в окне Выполнить (Win+R)
от admin
2 года назад
5 Просмотры
06:22
Как выполнить Python код с правами Администратора?!
от admin
11 месяцев назад
1 Просмотры
00:27
Решение выполнить действия (z1−z2)/(ẑ1+z3) если z1=3+2i, z2=−2+4i z3=1−5i пример 8 Комплексные числа
от admin
1 год назад
0 Просмотры
06:32
WinAero Win+R Alias Manager ⚡️ Быстрый Запуск Любых Приложений на Компьютере через «Выполнить»
от admin
2 года назад
1 Просмотры
00:25
Решение, выполнить действия z1/(z2∙z3) если z1=5+2i, z2=4–3i, z3=6+3i, пример 2 Высшая математика
от admin
1 год назад
2 Просмотры
00:37
Решение, найти матрицу обратную данной и выполнить проверку умножением A = (6 7 3; 3 1 0; 2 2 1)
от admin
1 год назад
1 Просмотры
00:27
Решение, найти матрицу второго порядка обратную данной и выполнить проверку умножением A=(2 5; 6 1)
от admin
1 год назад
1 Просмотры
06:49
17 команд «Выполнить» для каждого пользователя Windows 10/8/7
от admin
2 года назад
3 Просмотры
01:41
БЫСТРОЕ РЕШЕНИЕ Forza Horizon 4 не удалось подключиться к сесси/ TOREDO не удается выполнить оценку
от admin
1 год назад
34 Просмотры
18:02
ВСТУПИЛ В ЭЛИТНУЮ ГРУППИРОВКУ! LCN В UNTURNED
от admin
11 месяцев назад
1 Просмотры
03:32
Как отключить группировку значков на панели задач Windows 11
от admin
1 год назад
8 Просмотры
7:13:59
Админ. День 9. Время выполнить норму и последить за сервером!!! Radmir RP
от admin
2 месяцев назад
0 Просмотры
02:11
Как выполнить полный сброс на заводские установки. Samsung SGH-i320 Windows Mobile Corporation.
от admin
1 год назад
3 Просмотры
12:38
Список команд Выполнить для Windows 11, которые полезно знать
от admin
1 год назад
1 Просмотры
01:21
Как убрать группировку значков на панели задач Windows 10
от admin
7 месяцев назад
1 Просмотры
02:36
7.5 Упорядоченные цифры. «Поколение Python»: курс для начинающих. Курс Stepik
от admin
9 месяцев назад
2,625 Просмотры