Показательная модель в excel - Word и Excel - помощь в работе с программами

17 авг. 2022 г.
читать 2 мин

Экспоненциальная регрессия — это тип модели регрессии, который можно использовать для моделирования следующих ситуаций:

1. Экспоненциальный рост: рост начинается медленно, а затем стремительно ускоряется без ограничений.

2. Экспоненциальное затухание: затухание начинается быстро, а затем замедляется, приближаясь к нулю.

Уравнение модели экспоненциальной регрессии принимает следующий вид:

у = аб х

куда:

y: переменная ответа
x: предикторная переменная
a, b: коэффициенты регрессии, описывающие взаимосвязь между x и y .

В следующем пошаговом примере показано, как выполнить экспоненциальную регрессию в Excel.

Шаг 1: Создайте данные

Во-первых, давайте создадим поддельный набор данных, содержащий 20 наблюдений :

Шаг 2: возьмите натуральный логарифм переменной отклика

Далее нам нужно создать новый столбец, представляющий естественный журнал переменной ответа y :

Шаг 3: Подберите модель экспоненциальной регрессии

Далее мы подгоним модель экспоненциальной регрессии. Для этого щелкните вкладку « Данные » на верхней ленте, затем щелкните « Анализ данных» в группе « Анализ ».

Если вы не видите Data Analysis в качестве опции, вам нужно сначала загрузить Analysis ToolPak .

В появившемся окне нажмите Регрессия.В появившемся новом окне введите следующую информацию:

Как только вы нажмете OK , будут показаны результаты модели экспоненциальной регрессии:

Общее значение F модели составляет 204,006, а соответствующее значение p чрезвычайно мало, что указывает на то, что модель в целом полезна.

Используя коэффициенты из выходной таблицы, мы видим, что подобранное уравнение экспоненциальной регрессии:

ln(у) = 0,9817 + 0,2041(х)

Применив e к обеим частям, мы можем переписать уравнение как:

у = 2,6689 * 1,2264 х

Мы можем использовать это уравнение для прогнозирования переменной отклика y на основе значения переменной-предиктора x.Например, если x = 14, то мы можем предсказать, что y будет равно 46,47 :

у = 2,6689 * 1,2264 14 = 46,47

Бонус: не стесняйтесь использовать этот онлайн- калькулятор экспоненциальной регрессии для автоматического вычисления уравнения экспоненциальной регрессии для заданного предиктора и переменной отклика.

Дополнительные ресурсы

Как выполнить простую линейную регрессию в Excel
Как выполнить множественную линейную регрессию в Excel
Как выполнить квадратичную регрессию в Excel
Как выполнить полиномиальную регрессию в Excel

Источник

Регрессионный и корреляционный анализ – статистические методы исследования. Это наиболее распространенные способы показать зависимость какого-либо параметра от одной или нескольких независимых переменных.

Ниже на конкретных практических примерах рассмотрим эти два очень популярные в среде экономистов анализа. А также приведем пример получения результатов при их объединении.

Регрессионный анализ в Excel

Показывает влияние одних значений (самостоятельных, независимых) на зависимую переменную. К примеру, как зависит количество экономически активного населения от числа предприятий, величины заработной платы и др. параметров. Или: как влияют иностранные инвестиции, цены на энергоресурсы и др. на уровень ВВП.

Результат анализа позволяет выделять приоритеты. И основываясь на главных факторах, прогнозировать, планировать развитие приоритетных направлений, принимать управленческие решения.

Регрессия бывает:

линейной (у = а + bx);
параболической (y = a + bx + cx²);
экспоненциальной (y = a * exp(bx));
степенной (y = a*x^b);
гиперболической (y = b/x + a);
логарифмической (y = b * 1n(x) + a);
показательной (y = a * b^x).

Рассмотрим на примере построение регрессионной модели в Excel и интерпретацию результатов. Возьмем линейный тип регрессии.

Задача. На 6 предприятиях была проанализирована среднемесячная заработная плата и количество уволившихся сотрудников. Необходимо определить зависимость числа уволившихся сотрудников от средней зарплаты.

Модель линейной регрессии имеет следующий вид:

У = а₀ + а₁х₁ +…+а_кх_к.

Где а – коэффициенты регрессии, х – влияющие переменные, к – число факторов.

В нашем примере в качестве У выступает показатель уволившихся работников. Влияющий фактор – заработная плата (х).

В Excel существуют встроенные функции, с помощью которых можно рассчитать параметры модели линейной регрессии. Но быстрее это сделает надстройка «Пакет анализа».

Активируем мощный аналитический инструмент:

Нажимаем кнопку «Офис» и переходим на вкладку «Параметры Excel». «Надстройки».

Внизу, под выпадающим списком, в поле «Управление» будет надпись «Надстройки Excel» (если ее нет, нажмите на флажок справа и выберите). И кнопка «Перейти». Жмем.

Открывается список доступных надстроек. Выбираем «Пакет анализа» и нажимаем ОК.

После активации надстройка будет доступна на вкладке «Данные».

Теперь займемся непосредственно регрессионным анализом.

Открываем меню инструмента «Анализ данных». Выбираем «Регрессия».

Откроется меню для выбора входных значений и параметров вывода (где отобразить результат). В полях для исходных данных указываем диапазон описываемого параметра (У) и влияющего на него фактора (Х). Остальное можно и не заполнять.

После нажатия ОК, программа отобразит расчеты на новом листе (можно выбрать интервал для отображения на текущем листе или назначить вывод в новую книгу).

В первую очередь обращаем внимание на R-квадрат и коэффициенты.

R-квадрат – коэффициент детерминации. В нашем примере – 0,755, или 75,5%. Это означает, что расчетные параметры модели на 75,5% объясняют зависимость между изучаемыми параметрами. Чем выше коэффициент детерминации, тем качественнее модель. Хорошо – выше 0,8. Плохо – меньше 0,5 (такой анализ вряд ли можно считать резонным). В нашем примере – «неплохо».

Коэффициент 64,1428 показывает, каким будет Y, если все переменные в рассматриваемой модели будут равны 0. То есть на значение анализируемого параметра влияют и другие факторы, не описанные в модели.

Коэффициент -0,16285 показывает весомость переменной Х на Y. То есть среднемесячная заработная плата в пределах данной модели влияет на количество уволившихся с весом -0,16285 (это небольшая степень влияния). Знак «-» указывает на отрицательное влияние: чем больше зарплата, тем меньше уволившихся. Что справедливо.

Корреляционный анализ в Excel

Корреляционный анализ помогает установить, есть ли между показателями в одной или двух выборках связь. Например, между временем работы станка и стоимостью ремонта, ценой техники и продолжительностью эксплуатации, ростом и весом детей и т.д.

Если связь имеется, то влечет ли увеличение одного параметра повышение (положительная корреляция) либо уменьшение (отрицательная) другого. Корреляционный анализ помогает аналитику определиться, можно ли по величине одного показателя предсказать возможное значение другого.

Коэффициент корреляции обозначается r. Варьируется в пределах от +1 до -1. Классификация корреляционных связей для разных сфер будет отличаться. При значении коэффициента 0 линейной зависимости между выборками не существует.

Рассмотрим, как с помощью средств Excel найти коэффициент корреляции.

Для нахождения парных коэффициентов применяется функция КОРРЕЛ.

Задача: Определить, есть ли взаимосвязь между временем работы токарного станка и стоимостью его обслуживания.

Ставим курсор в любую ячейку и нажимаем кнопку fx.

В категории «Статистические» выбираем функцию КОРРЕЛ.
Аргумент «Массив 1» — первый диапазон значений – время работы станка: А2:А14.
Аргумент «Массив 2» — второй диапазон значений – стоимость ремонта: В2:В14. Жмем ОК.

Чтобы определить тип связи, нужно посмотреть абсолютное число коэффициента (для каждой сферы деятельности есть своя шкала).

Для корреляционного анализа нескольких параметров (более 2) удобнее применять «Анализ данных» (надстройка «Пакет анализа»). В списке нужно выбрать корреляцию и обозначить массив. Все.

Полученные коэффициенты отобразятся в корреляционной матрице. Наподобие такой:

Корреляционно-регрессионный анализ

На практике эти две методики часто применяются вместе.

Пример:

Строим корреляционное поле: «Вставка» — «Диаграмма» — «Точечная диаграмма» (дает сравнивать пары). Диапазон значений – все числовые данные таблицы.

Щелкаем левой кнопкой мыши по любой точке на диаграмме. Потом правой. В открывшемся меню выбираем «Добавить линию тренда».

Назначаем параметры для линии. Тип – «Линейная». Внизу – «Показать уравнение на диаграмме».

Жмем «Закрыть».

Теперь стали видны и данные регрессионного анализа.

Источник

Показательное уравнение регрессии

В случае b = e (примерное значение экспоненты e ≈ 2.718281828 ), показательное уравнение регрессии называется экспоненциальным и записывается как y=a·e x .

Здесь b — темп изменения в разах или константа тренда, которая показывает тенденцию ускоренного и все более ускоряющегося возрастания уровней.

Пример . Необходимо изучить зависимость потребительским расходами на моторное масло (у) и располагаемым личным доходом (х).

Составляем систему нормальных уравнений с помощью онлайн-калькулятора Нелинейная регрессия .

Для наших данных система уравнений имеет вид
21a + 20439.4 b = 32.32
20439.4 a + 20761197.38 b = 31007.03
Из первого уравнения выражаем а и подставим во второе уравнение:
Получаем эмпирические коэффициенты регрессии: b = -0.000515, a = 2.04
Уравнение регрессии (эмпирическое уравнение регрессии):
y = e 2.04 *e -0.000515x = 7.69529*0.99948 x
Эмпирические коэффициенты регрессии a и b являются лишь оценками теоретических коэффициентов β_i, а само уравнение отражает лишь общую тенденцию в поведении рассматриваемых переменных.
Для расчета параметров регрессии построим расчетную таблицу (табл. 1)

a•n + b∑x = ∑y a∑x + b∑x 2 = ∑y•x

log(y) 2	x·log(y)
622.9	1.59	388004.41	2.53	989.93
658	1.65	432964	2.72	1084.82
700.4	1.7	490560.16	2.91	1194.01
740.6	1.72	548488.36	2.97	1275.88
774.4	1.72	599695.36	2.97	1334.11
816.2	1.67	666182.44	2.78	1361.18
853.5	1.61	728462.25	2.59	1373.66
876.8	1.55	768778.24	2.39	1356.9
900	1.53	810000	2.33	1373.45
951.4	1.61	905161.96	2.59	1531.22
1007.9	1.69	1015862.41	2.84	1699.72
1004.8	1.44	1009623.04	2.06	1441.97
1010.8	1.44	1021716.64	2.06	1450.58
1056.2	1.53	1115558.44	2.33	1611.82
1105.4	1.48	1221909.16	2.2	1637.77
1162.3	1.55	1350941.29	2.39	1798.73
1200.7	1.55	1441680.49	2.39	1858.16
1209.5	1.36	1462890.25	1.85	1646.1
1248.6	1.28	1559001.96	1.64	1599.37
1254.4	1.28	1573519.36	1.64	1606.8
1284.6	1.39	1650197.16	1.92	1780.83
20439.4	32.32	20761197.38	50.1	31007.03

1. Параметры уравнения регрессии.
Выборочные средние.

Выборочные дисперсии:

Среднеквадратическое отклонение

Регрессионный анализ в Microsoft Excel

Регрессионный анализ является одним из самых востребованных методов статистического исследования. С его помощью можно установить степень влияния независимых величин на зависимую переменную. В функционале Microsoft Excel имеются инструменты, предназначенные для проведения подобного вида анализа. Давайте разберем, что они собой представляют и как ими пользоваться.

Подключение пакета анализа

Но, для того, чтобы использовать функцию, позволяющую провести регрессионный анализ, прежде всего, нужно активировать Пакет анализа. Только тогда необходимые для этой процедуры инструменты появятся на ленте Эксель.

«Файл»

Открывается окно параметров Excel. Переходим в подраздел «Надстройки».

В самой нижней части открывшегося окна переставляем переключатель в блоке «Управление» в позицию «Надстройки Excel», если он находится в другом положении. Жмем на кнопку «Перейти».

Теперь, когда мы перейдем во вкладку «Данные», на ленте в блоке инструментов «Анализ» мы увидим новую кнопку – «Анализ данных».

Виды регрессионного анализа

Существует несколько видов регрессий:

параболическая;
степенная;
логарифмическая;
экспоненциальная;
показательная;
гиперболическая;
линейная регрессия.

О выполнении последнего вида регрессионного анализа в Экселе мы подробнее поговорим далее.

Линейная регрессия в программе Excel

Внизу, в качестве примера, представлена таблица, в которой указана среднесуточная температура воздуха на улице, и количество покупателей магазина за соответствующий рабочий день. Давайте выясним при помощи регрессионного анализа, как именно погодные условия в виде температуры воздуха могут повлиять на посещаемость торгового заведения.

Общее уравнение регрессии линейного вида выглядит следующим образом: У = а0 + а1х1 +…+акхк . В этой формуле Y означает переменную, влияние факторов на которую мы пытаемся изучить. В нашем случае, это количество покупателей. Значение x – это различные факторы, влияющие на переменную. Параметры a являются коэффициентами регрессии. То есть, именно они определяют значимость того или иного фактора. Индекс k обозначает общее количество этих самых факторов.

Кликаем по кнопке «Анализ данных». Она размещена во вкладке «Главная» в блоке инструментов «Анализ».

Открывается небольшое окошко. В нём выбираем пункт «Регрессия». Жмем на кнопку «OK».

Открывается окно настроек регрессии. В нём обязательными для заполнения полями являются «Входной интервал Y» и «Входной интервал X». Все остальные настройки можно оставить по умолчанию.

В поле «Входной интервал Y» указываем адрес диапазона ячеек, где расположены переменные данные, влияние факторов на которые мы пытаемся установить. В нашем случае это будут ячейки столбца «Количество покупателей». Адрес можно вписать вручную с клавиатуры, а можно, просто выделить требуемый столбец. Последний вариант намного проще и удобнее.

В поле «Входной интервал X» вводим адрес диапазона ячеек, где находятся данные того фактора, влияние которого на переменную мы хотим установить. Как говорилось выше, нам нужно установить влияние температуры на количество покупателей магазина, а поэтому вводим адрес ячеек в столбце «Температура». Это можно сделать теми же способами, что и в поле «Количество покупателей».

С помощью других настроек можно установить метки, уровень надёжности, константу-ноль, отобразить график нормальной вероятности, и выполнить другие действия. Но, в большинстве случаев, эти настройки изменять не нужно. Единственное на что следует обратить внимание, так это на параметры вывода. По умолчанию вывод результатов анализа осуществляется на другом листе, но переставив переключатель, вы можете установить вывод в указанном диапазоне на том же листе, где расположена таблица с исходными данными, или в отдельной книге, то есть в новом файле.

После того, как все настройки установлены, жмем на кнопку «OK».

Разбор результатов анализа

Результаты регрессионного анализа выводятся в виде таблицы в том месте, которое указано в настройках.

Одним из основных показателей является R-квадрат. В нем указывается качество модели. В нашем случае данный коэффициент равен 0,705 или около 70,5%. Это приемлемый уровень качества. Зависимость менее 0,5 является плохой.

Ещё один важный показатель расположен в ячейке на пересечении строки «Y-пересечение» и столбца «Коэффициенты». Тут указывается какое значение будет у Y, а в нашем случае, это количество покупателей, при всех остальных факторах равных нулю. В этой таблице данное значение равно 58,04.

Значение на пересечении граф «Переменная X1» и «Коэффициенты» показывает уровень зависимости Y от X. В нашем случае — это уровень зависимости количества клиентов магазина от температуры. Коэффициент 1,31 считается довольно высоким показателем влияния.

Как видим, с помощью программы Microsoft Excel довольно просто составить таблицу регрессионного анализа. Но, работать с полученными на выходе данными, и понимать их суть, сможет только подготовленный человек.

Помимо этой статьи, на сайте еще 12704 инструкций.
Добавьте сайт Lumpics.ru в закладки (CTRL+D) и мы точно еще пригодимся вам.

Отблагодарите автора, поделитесь статьей в социальных сетях.

Показательная парная регрессия.

1.4 Гиперболическая парная регрессия рассчитывается по формуле:

Для определения параметров a и b необходимо линеаризировать предыдущую формулу. Для этого сделаем замену:

Тогда

Для определения параметров a и b используем следующие формулы:

В таблице рассчитываем средние значения величин x, x*, y, x*y, x* 2 .

n	у	х	x*=1/x	xx	x*y
11,92	18,26	0,0548	0,002999	0,652793
8,34	21,90	0,0457	0,002085	0,380822
7,08	12,12	0,0825	0,006808	0,584158
10,52	17,52	0,0571	0,003258	0,600457
18,68	26,28	0,0381	0,001448	0,710807
8,24	11,86	0,0843	0,007109	0,694772
10,50	15,08	0,0663	0,004397	0,696286
7,34	10,56	0,0947	0,008968	0,695076
7,28	10,40	0,0962	0,009246	0,7
6,72	10,78	0,0928	0,008605	0,623377
8,18	10,80	0,0926	0,008573	0,757407
9,04	13,64	0,0733	0,005375	0,662757
7,34	10,74	0,0931	0,008669	0,683426
6,56	11,78	0,0849	0,007206	0,556876
9,20	12,52	0,0799	0,00638	0,734824
7,60	10,42	0,0960	0,00921	0,729367
8,78	12,52	0,0799	0,00638	0,701278
6,88	10,42	0,0960	0,00921	0,660269
8,02	13,16	0,0760	0,005774	0,609422
10,28	14,92	0,0670	0,004492	0,689008
среднее	8,9250	13,7840	0,0775	0,0063	0,6562

Вычислим значение коэффициента регрессии b:

Вычислим значение коэффициента регрессии a:

Тогда показательное уравнение регрессии будет выглядеть следующим образом:

Гиперболическая парная регрессия.

Оцените тесноту связи с помощью показателей корреляции и детерминации.

Оценка тесноты связи с помощью показателей корреляции.

2.1.1 Показатель корреляции для линейной регрессии:

, где .

n	у	х	xx	xy	yy
11,92	18,26	333,4276	217,6592	142,0864
8,34	21,9	479,6100	182,6460	69,5556
7,08	12,12	146,8944	85,8096	50,1264
10,52	17,52	306,9504	184,3104	110,6704
18,68	26,28	690,6384	490,9104	348,9424
8,24	11,86	140,6596	97,7264	67,8976
10,5	15,08	227,4064	158,3400	110,2500
7,34	10,56	111,5136	77,5104	53,8756
7,28	10,4	108,1600	75,7120	52,9984
6,72	10,78	116,2084	72,4416	45,1584
8,18	10,8	116,6400	88,3440	66,9124
9,04	13,64	186,0496	123,3056	81,7216
7,34	10,74	115,3476	78,8316	53,8756
6,56	11,78	138,7684	77,2768	43,0336
9,2	12,52	156,7504	115,1840	84,6400
7,6	10,42	108,5764	79,1920	57,7600
8,78	12,52	156,7504	109,9256	77,0884
6,88	10,42	108,5764	71,6896	47,3344
8,02	13,16	173,1856	105,5432	64,3204
10,28	14,92	222,6064	153,3776	105,6784
среднее	8,925	13,784	207,236	132,2868	86,6963

Определим среднеквадратические отклонения:

Определим показатель корреляции: .

2.1.2 Показатель корреляции для степенной регрессии:

,где

n	у	х	x*=lg(x)	y*=lg(y)	yy	ŷ*	e=y-ŷ	ee
11,92	18,26	1,2615	1,0763	1,1584	1,0435	0,0328	0,0011
8,34	21,90	1,3404	0,9212	0,8485	1,1048	-0,1836	0,0337
7,08	12,12	1,0835	0,8500	0,7226	0,9053	-0,0553	0,0031
10,52	17,52	1,2435	1,0220	1,0445	1,0296	-0,0075	0,0001
18,68	26,28	1,4196	1,2714	1,6164	1,1663	0,1051	0,0111
8,24	11,86	1,0741	0,9159	0,8389	0,8980	0,0179	0,0003
10,50	15,08	1,1784	1,0212	1,0428	0,9790	0,0422	0,0018
7,34	10,56	1,0237	0,8657	0,7494	0,8589	0,0068	0,0000
7,28	10,40	1,0170	0,8621	0,7433	0,8537	0,0084	0,0001
6,72	10,78	1,0326	0,8274	0,6845	0,8658	-0,0385	0,0015
8,18	10,80	1,0334	0,9128	0,8331	0,8664	0,0463	0,0021
9,04	13,64	1,1348	0,9562	0,9143	0,9452	0,0110	0,0001
7,34	10,74	1,0310	0,8657	0,7494	0,8646	0,0011	0,0000
6,56	11,78	1,0711	0,8169	0,6673	0,8957	-0,0788	0,0062
9,20	12,52	1,0976	0,9638	0,9289	0,9163	0,0475	0,0023
7,60	10,42	1,0179	0,8808	0,7758	0,8544	0,0264	0,0007
8,78	12,52	1,0976	0,9435	0,8902	0,9163	0,0272	0,0007
6,88	10,42	1,0179	0,8376	0,7016	0,8544	-0,0168	0,0003
8,02	13,16	1,1193	0,9042	0,8175	0,9331	-0,0289	0,0008
10,28	14,92	1,1738	1,0120	1,0241	0,9754	0,0366	0,0013
среднее	8,9250	13,7840	1,1234	0,9363	0,8876	0,936325	0,000003	0,003364

Определим индекс корреляции:

; ;

2.1.3 Показатель корреляции для показательной регрессии:

,где

n	у	х	y*=lg(y)	yy	ŷ*	e=y-ŷ	ee
11,92	18,26	1,0763	1,1584	1,0303	0,0460	0,0021
8,34	21,90	0,9212	0,8485	1,1067	-0,1855	0,0344
7,08	12,12	0,8500	0,7226	0,9013	-0,0513	0,0026
10,52	17,52	1,0220	1,0445	1,0147	0,0073	0,0001
18,68	26,28	1,2714	1,6164	1,1987	0,0727	0,0053
8,24	11,86	0,9159	0,8389	0,8959	0,0201	0,0004
10,50	15,08	1,0212	1,0428	0,9635	0,0577	0,0033
7,34	10,56	0,8657	0,7494	0,8686	-0,0029	0,0000
7,28	10,40	0,8621	0,7433	0,8652	-0,0031	0,0000
6,72	10,78	0,8274	0,6845	0,8732	-0,0458	0,0021
8,18	10,80	0,9128	0,8331	0,8736	0,0392	0,0015
9,04	13,64	0,9562	0,9143	0,9332	0,0229	0,0005
7,34	10,74	0,8657	0,7494	0,8723	-0,0066	0,0000
6,56	11,78	0,8169	0,6673	0,8942	-0,0773	0,0060
9,20	12,52	0,9638	0,9289	0,9097	0,0541	0,0029
7,60	10,42	0,8808	0,7758	0,8656	0,0152	0,0002
8,78	12,52	0,9435	0,8902	0,9097	0,0338	0,0011
6,88	10,42	0,8376	0,7016	0,8656	-0,0280	0,0008
8,02	13,16	0,9042	0,8175	0,9232	-0,0190	0,0004
10,28	14,92	1,0120	1,0241	0,9601	0,0519	0,0027
среднее	8,9250	13,7840	0,9363	0,8876	0,9363	0,0001	0,0033

Определим индекс корреляции:

; ;

2.1.4 Показатель корреляции для гиперболической регрессии:

,где

n	у	х	x*=1/x	y*y	ŷ	e=y-ŷ	ee
11,92	18,26	0,0548	142,0864	11,6717	0,2483	0,0617
8,34	21,90	0,0457	69,5556	12,7713	-4,4313	19,6367
7,08	12,12	0,0825	50,1264	8,3200	-1,2400	1,5376
10,52	17,52	0,0571	110,6704	11,3922	-0,8722	0,7608
18,68	26,28	0,0381	348,9424	13,6907	4,9893	24,8929
8,24	11,86	0,0843	67,8976	8,1015	0,1385	0,0192
10,50	15,08	0,0663	110,2500	10,2765	0,2235	0,0499
7,34	10,56	0,0947	53,8756	6,8475	0,4925	0,2426
7,28	10,40	0,0962	52,9984	6,6715	0,6085	0,3703
6,72	10,78	0,0928	45,1584	7,0810	-0,3610	0,1303
8,18	10,80	0,0926	66,9124	7,1017	1,0783	1,1627
9,04	13,64	0,0733	81,7216	9,4308	-0,3908	0,1527
7,34	10,74	0,0931	53,8756	7,0392	0,3008	0,0905
6,56	11,78	0,0849	43,0336	8,0323	-1,4723	2,1677
9,20	12,52	0,0799	84,6400	8,6385	0,5615	0,3153
7,60	10,42	0,0960	57,7600	6,6938	0,9062	0,8212
8,78	12,52	0,0799	77,0884	8,6385	0,1415	0,0200
6,88	10,42	0,0960	47,3344	6,6938	0,1862	0,0347
8,02	13,16	0,0760	64,3204	9,1077	-1,0877	1,1831
10,28	14,92	0,0670	105,6784	10,1906	0,0894	0,0080
среднее	8,9250	13,7840	0,0775	86,6963	8,9195	0,0055	2,6829

Определим индекс корреляции:

; ;

Вывод:

Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1

источники:

http://lumpics.ru/regression-analysis-in-excel/

http://zdamsam.ru/b52151.html

Источник

Содержание

Подключение пакета анализа
Виды регрессионного анализа
Линейная регрессия в программе Excel
Разбор результатов анализа
Вопросы и ответы

Подключение пакета анализа

Перемещаемся во вкладку «Файл».

Переходим в раздел «Параметры».

Открывается окно параметров Excel. Переходим в подраздел «Надстройки».

В самой нижней части открывшегося окна переставляем переключатель в блоке «Управление» в позицию «Надстройки Excel», если он находится в другом положении. Жмем на кнопку «Перейти».

Открывается окно доступных надстроек Эксель. Ставим галочку около пункта «Пакет анализа». Жмем на кнопку «OK».

Виды регрессионного анализа

Существует несколько видов регрессий:

параболическая;
степенная;
логарифмическая;
экспоненциальная;
показательная;
гиперболическая;
линейная регрессия.

О выполнении последнего вида регрессионного анализа в Экселе мы подробнее поговорим далее.

Общее уравнение регрессии линейного вида выглядит следующим образом: У = а0 + а1х1 +…+акхк. В этой формуле Y означает переменную, влияние факторов на которую мы пытаемся изучить. В нашем случае, это количество покупателей. Значение x – это различные факторы, влияющие на переменную. Параметры a являются коэффициентами регрессии. То есть, именно они определяют значимость того или иного фактора. Индекс k обозначает общее количество этих самых факторов.

Кликаем по кнопке «Анализ данных». Она размещена во вкладке «Главная» в блоке инструментов «Анализ».

Открывается небольшое окошко. В нём выбираем пункт «Регрессия». Жмем на кнопку «OK».

Открывается окно настроек регрессии. В нём обязательными для заполнения полями являются «Входной интервал Y» и «Входной интервал X». Все остальные настройки можно оставить по умолчанию.
В поле «Входной интервал Y» указываем адрес диапазона ячеек, где расположены переменные данные, влияние факторов на которые мы пытаемся установить. В нашем случае это будут ячейки столбца «Количество покупателей». Адрес можно вписать вручную с клавиатуры, а можно, просто выделить требуемый столбец. Последний вариант намного проще и удобнее.

В поле «Входной интервал X» вводим адрес диапазона ячеек, где находятся данные того фактора, влияние которого на переменную мы хотим установить. Как говорилось выше, нам нужно установить влияние температуры на количество покупателей магазина, а поэтому вводим адрес ячеек в столбце «Температура». Это можно сделать теми же способами, что и в поле «Количество покупателей».

С помощью других настроек можно установить метки, уровень надёжности, константу-ноль, отобразить график нормальной вероятности, и выполнить другие действия. Но, в большинстве случаев, эти настройки изменять не нужно. Единственное на что следует обратить внимание, так это на параметры вывода. По умолчанию вывод результатов анализа осуществляется на другом листе, но переставив переключатель, вы можете установить вывод в указанном диапазоне на том же листе, где расположена таблица с исходными данными, или в отдельной книге, то есть в новом файле.

После того, как все настройки установлены, жмем на кнопку «OK».

Разбор результатов анализа

Результаты регрессионного анализа выводятся в виде таблицы в том месте, которое указано в настройках.

Источник

Подключение пакета анализа

«Файл»

Открывается окно параметров Excel. Переходим в подраздел «Надстройки».

Виды регрессионного анализа

Существует несколько видов регрессий:

параболическая;
степенная;
логарифмическая;
экспоненциальная;
показательная;
гиперболическая;
линейная регрессия.

О выполнении последнего вида регрессионного анализа в Экселе мы подробнее поговорим далее.

Линейная регрессия в программе Excel

«Анализ данных»

«Главная»

«Анализ»

Открывается небольшое окошко. В нём выбираем пункт «Регрессия». Жмем на кнопку «OK».

После того, как все настройки установлены, жмем на кнопку «OK».

Разбор результатов анализа

Результаты регрессионного анализа выводятся в виде таблицы в том месте, которое указано в настройках.

Отблагодарите автора, поделитесь статьей в социальных сетях.

Регрессионный анализ в Excel

линейной (у = а + bx);
параболической (y = a + bx + cx 2 );
экспоненциальной (y = a * exp(bx));
степенной (y = a*x^b);
гиперболической (y = b/x + a);
логарифмической (y = b * 1n(x) + a);
показательной (y = a * b^x).

Модель линейной регрессии имеет следующий вид:

Где а – коэффициенты регрессии, х – влияющие переменные, к – число факторов.

Активируем мощный аналитический инструмент:

Нажимаем кнопку «Офис» и переходим на вкладку «Параметры Excel». «Надстройки».
Внизу, под выпадающим списком, в поле «Управление» будет надпись «Надстройки Excel» (если ее нет, нажмите на флажок справа и выберите). И кнопка «Перейти». Жмем.
Открывается список доступных надстроек. Выбираем «Пакет анализа» и нажимаем ОК.

После активации надстройка будет доступна на вкладке «Данные».

Теперь займемся непосредственно регрессионным анализом.

Открываем меню инструмента «Анализ данных». Выбираем «Регрессия».
Откроется меню для выбора входных значений и параметров вывода (где отобразить результат). В полях для исходных данных указываем диапазон описываемого параметра (У) и влияющего на него фактора (Х). Остальное можно и не заполнять.
После нажатия ОК, программа отобразит расчеты на новом листе (можно выбрать интервал для отображения на текущем листе или назначить вывод в новую книгу).

В первую очередь обращаем внимание на R-квадрат и коэффициенты.

Корреляционный анализ в Excel

Рассмотрим, как с помощью средств Excel найти коэффициент корреляции.

Для нахождения парных коэффициентов применяется функция КОРРЕЛ.

Ставим курсор в любую ячейку и нажимаем кнопку fx.

В категории «Статистические» выбираем функцию КОРРЕЛ.
Аргумент «Массив 1» — первый диапазон значений – время работы станка: А2:А14.
Аргумент «Массив 2» — второй диапазон значений – стоимость ремонта: В2:В14. Жмем ОК.

Полученные коэффициенты отобразятся в корреляционной матрице. Наподобие такой:

Корреляционно-регрессионный анализ

На практике эти две методики часто применяются вместе.

Строим корреляционное поле: «Вставка» — «Диаграмма» — «Точечная диаграмма» (дает сравнивать пары). Диапазон значений – все числовые данные таблицы.
Щелкаем левой кнопкой мыши по любой точке на диаграмме. Потом правой. В открывшемся меню выбираем «Добавить линию тренда».
Назначаем параметры для линии. Тип – «Линейная». Внизу – «Показать уравнение на диаграмме».
Жмем «Закрыть».

Теперь стали видны и данные регрессионного анализа.

Регрессионный анализ — это статистический метод исследования, позволяющий показать зависимость того или иного параметра от одной либо нескольких независимых переменных. В докомпьютерную эру его применение было достаточно затруднительно, особенно если речь шла о больших объемах данных. Сегодня, узнав как построить регрессию в Excel, можно решать сложные статистические задачи буквально за пару минут. Ниже представлены конкретные примеры из области экономики.

Виды регрессии

Само это понятие было введено в математику Фрэнсисом Гальтоном в 1886 году. Регрессия бывает:

линейной;
параболической;
степенной;
экспоненциальной;
гиперболической;
показательной;
логарифмической.

Пример 1

Рассмотрим задачу определения зависимости количества уволившихся членов коллектива от средней зарплаты на 6 промышленных предприятиях.

Задача. На шести предприятиях проанализировали среднемесячную заработную плату и количество сотрудников, которые уволились по собственному желанию. В табличной форме имеем:

Для задачи определения зависимости количества уволившихся работников от средней зарплаты на 6 предприятиях модель регрессии имеет вид уравнения Y = а + а₁x₁ +…+а_kx_k, где х_i — влияющие переменные, a_i — коэффициенты регрессии, a k — число факторов.

Для данной задачи Y — это показатель уволившихся сотрудников, а влияющий фактор — зарплата, которую обозначаем X.

Использование возможностей табличного процессора «Эксель»

Анализу регрессии в Excel должно предшествовать применение к имеющимся табличным данным встроенных функций. Однако для этих целей лучше воспользоваться очень полезной надстройкой «Пакет анализа». Для его активации нужно:

с вкладки «Файл» перейти в раздел «Параметры»;
в открывшемся окне выбрать строку «Надстройки»;
щелкнуть по кнопке «Перейти», расположенной внизу, справа от строки «Управление»;
поставить галочку рядом с названием «Пакет анализа» и подтвердить свои действия, нажав «Ок».

Если все сделано правильно, в правой части вкладки «Данные», расположенном над рабочим листом «Эксель», появится нужная кнопка.

Линейная регрессия в Excel

Теперь, когда под рукой есть все необходимые виртуальные инструменты для осуществления эконометрических расчетов, можем приступить к решению нашей задачи. Для этого:

щелкаем по кнопке «Анализ данных»;
в открывшемся окне нажимаем на кнопку «Регрессия»;
в появившуюся вкладку вводим диапазон значений для Y (количество уволившихся работников) и для X (их зарплаты);
подтверждаем свои действия нажатием кнопки «Ok».

В результате программа автоматически заполнит новый лист табличного процессора данными анализа регрессии. Обратите внимание! В Excel есть возможность самостоятельно задать место, которое вы предпочитаете для этой цели. Например, это может быть тот же лист, где находятся значения Y и X, или даже новая книга, специально предназначенная для хранения подобных данных.

Анализ результатов регрессии для R-квадрата

В Excel данные полученные в ходе обработки данных рассматриваемого примера имеют вид:

Прежде всего, следует обратить внимание на значение R-квадрата. Он представляет собой коэффициент детерминации. В данном примере R-квадрат = 0,755 (75,5%), т. е. расчетные параметры модели объясняют зависимость между рассматриваемыми параметрами на 75,5 %. Чем выше значение коэффициента детерминации, тем выбранная модель считается более применимой для конкретной задачи. Считается, что она корректно описывает реальную ситуацию при значении R-квадрата выше 0,8. Если R-квадрата 2 (RI) представляет собой числовую характеристику доли общего разброса и показывает, разброс какой части экспериментальных данных, т.е. значений зависимой переменной соответствует уравнению линейной регрессии. В рассматриваемой задаче эта величина равна 84,8%, т. е. статистические данные с высокой степенью точности описываются полученным УР.

F-статистика, называемая также критерием Фишера, используется для оценки значимости линейной зависимости, опровергая или подтверждая гипотезу о ее существовании.

Значение t-статистики (критерий Стьюдента) помогает оценивать значимость коэффициента при неизвестной либо свободного члена линейной зависимости. Если значение t-критерия > t_кр, то гипотеза о незначимости свободного члена линейного уравнения отвергается.

В рассматриваемой задаче для свободного члена посредством инструментов «Эксель» было получено, что t=169,20903, а p=2,89Е-12, т. е. имеем нулевую вероятность того, что будет отвергнута верная гипотеза о незначимости свободного члена. Для коэффициента при неизвестной t=5,79405, а p=0,001158. Иными словами вероятность того, что будет отвергнута верная гипотеза о незначимости коэффициента при неизвестной, равна 0,12%.

Таким образом, можно утверждать, что полученное уравнение линейной регрессии адекватно.

Задача о целесообразности покупки пакета акций

Множественная регрессия в Excel выполняется с использованием все того же инструмента «Анализ данных». Рассмотрим конкретную прикладную задачу.

Руководство компания «NNN» должно принять решение о целесообразности покупки 20 % пакета акций АО «MMM». Стоимость пакета (СП) составляет 70 млн американских долларов. Специалистами «NNN» собраны данные об аналогичных сделках. Было принято решение оценивать стоимость пакета акций по таким параметрам, выраженным в миллионах американских долларов, как:

кредиторская задолженность (VK);
объем годового оборота (VO);
дебиторская задолженность (VD);
стоимость основных фондов (СОФ).

Кроме того, используется параметр задолженность предприятия по зарплате (V3 П) в тысячах американских долларов.

Решение средствами табличного процессора Excel

Прежде всего, необходимо составить таблицу исходных данных. Она имеет следующий вид:

вызывают окно «Анализ данных»;
выбирают раздел «Регрессия»;
в окошко «Входной интервал Y» вводят диапазон значений зависимых переменных из столбца G;
щелкают по иконке с красной стрелкой справа от окна «Входной интервал X» и выделяют на листе диапазон всех значений из столбцов B,C, D, F.

Отмечают пункт «Новый рабочий лист» и нажимают «Ok».

Получают анализ регрессии для данной задачи.

Изучение результатов и выводы

«Собираем» из округленных данных, представленных выше на листе табличного процессора Excel, уравнение регрессии:

СП = 0,103*СОФ + 0,541*VO – 0,031*VK +0,405*VD +0,691*VZP – 265,844.

В более привычном математическом виде его можно записать, как:

y = 0,103*x1 + 0,541*x2 – 0,031*x3 +0,405*x4 +0,691*x5 – 265,844

Данные для АО «MMM» представлены в таблице:

Источник