Решение системы уравнений в Microsoft Excel
Умение решать системы уравнений часто может принести пользу не только в учебе, но и на практике. В то же время, далеко не каждый пользователь ПК знает, что в Экселе существует собственные варианты решений линейных уравнений. Давайте узнаем, как с применением инструментария этого табличного процессора выполнить данную задачу различными способами.
Варианты решений
Любое уравнение может считаться решенным только тогда, когда будут отысканы его корни. В программе Excel существует несколько вариантов поиска корней. Давайте рассмотрим каждый из них.
Способ 1: матричный метод
Самый распространенный способ решения системы линейных уравнений инструментами Excel – это применение матричного метода. Он заключается в построении матрицы из коэффициентов выражений, а затем в создании обратной матрицы. Попробуем использовать данный метод для решения следующей системы уравнений:
-
Заполняем матрицу числами, которые являются коэффициентами уравнения. Данные числа должны располагаться последовательно по порядку с учетом расположения каждого корня, которому они соответствуют. Если в каком-то выражении один из корней отсутствует, то в этом случае коэффициент считается равным нулю. Если коэффициент не обозначен в уравнении, но соответствующий корень имеется, то считается, что коэффициент равен 1. Обозначаем полученную таблицу, как вектор A.
Отдельно записываем значения после знака «равно». Обозначаем их общим наименованием, как вектор B.
Аргумент «Массив» — это, собственно, адрес исходной таблицы.
Итак, выделяем на листе область пустых ячеек, которая по размеру равна диапазону исходной матрицы. Щелкаем по кнопке «Вставить функцию», расположенную около строки формул.
Выполняется запуск Мастера функций. Переходим в категорию «Математические». В представившемся списке ищем наименование «МОБР». После того, как оно отыскано, выделяем его и жмем на кнопку «OK».
Итак, после этого программа производит вычисления и на выходе в предварительно выделенной области мы имеем матрицу, обратную данной.
Теперь нам нужно будет умножить обратную матрицу на матрицу B, которая состоит из одного столбца значений, расположенных после знака «равно» в выражениях. Для умножения таблиц в Экселе также имеется отдельная функция, которая называется МУМНОЖ. Данный оператор имеет следующий синтаксис:
Выделяем диапазон, в нашем случае состоящий из четырех ячеек. Далее опять запускаем Мастер функций, нажав значок «Вставить функцию».
В категории «Математические», запустившегося Мастера функций, выделяем наименование «МУМНОЖ» и жмем на кнопку «OK».
Активируется окно аргументов функции МУМНОЖ. В поле «Массив1» заносим координаты нашей обратной матрицы. Для этого, как и в прошлый раз, устанавливаем курсор в поле и с зажатой левой кнопкой мыши выделяем курсором соответствующую таблицу. Аналогичное действие проводим для внесения координат в поле «Массив2», только на этот раз выделяем значения колонки B. После того, как вышеуказанные действия проведены, опять не спешим жать на кнопку «OK» или клавишу Enter, а набираем комбинацию клавиш Ctrl+Shift+Enter.
Способ 2: подбор параметров
Второй известный способ решения системы уравнений в Экселе – это применение метода подбора параметров. Суть данного метода заключается в поиске от обратного. То есть, основываясь на известном результате, мы производим поиск неизвестного аргумента. Давайте для примера используем квадратное уравнение
-
Принимаем значение x за равное 0. Высчитываем соответствующее для него значение f(x), применив следующую формулу:
Вместо значения «X» подставляем адрес той ячейки, где расположено число 0, принятое нами за x.
Переходим во вкладку «Данные». Жмем на кнопку «Анализ «что если»». Эта кнопка размещена на ленте в блоке инструментов «Работа с данными». Открывается выпадающий список. Выбираем в нем позицию «Подбор параметра…».
Запускается окно подбора параметров. Как видим, оно состоит из трех полей. В поле «Установить в ячейке» указываем адрес ячейки, в которой находится формула f(x), рассчитанная нами чуть ранее. В поле «Значение» вводим число «0». В поле «Изменяя значения» указываем адрес ячейки, в которой расположено значение x, ранее принятое нами за 0. После выполнения данных действий жмем на кнопку «OK».
После этого Эксель произведет вычисление с помощью подбора параметра. Об этом сообщит появившееся информационное окно. В нем следует нажать на кнопку «OK».
Этот результат также можно проверить, подставив данное значение в решаемое выражение вместо значения x.
Способ 3: метод Крамера
Теперь попробуем решить систему уравнений методом Крамера. Для примера возьмем все ту же систему, которую использовали в Способе 1:
-
Как и в первом способе, составляем матрицу A из коэффициентов уравнений и таблицу B из значений, которые стоят после знака «равно».
Далее делаем ещё четыре таблицы. Каждая из них является копией матрицы A, только у этих копий поочередно один столбец заменен на таблицу B. У первой таблицы – это первый столбец, у второй таблицы – второй и т.д.
Теперь нам нужно высчитать определители для всех этих таблиц. Система уравнений будет иметь решения только в том случае, если все определители будут иметь значение, отличное от нуля. Для расчета этого значения в Экселе опять имеется отдельная функция – МОПРЕД. Синтаксис данного оператора следующий:
Таким образом, как и у функции МОБР, единственным аргументом выступает ссылка на обрабатываемую таблицу.
Итак, выделяем ячейку, в которой будет выводиться определитель первой матрицы. Затем жмем на знакомую по предыдущим способам кнопку «Вставить функцию».
Активируется окно Мастера функций. Переходим в категорию «Математические» и среди списка операторов выделяем там наименование «МОПРЕД». После этого жмем на кнопку «OK».
Запускается окно аргументов функции МОПРЕД. Как видим, оно имеет только одно поле – «Массив». В это поле вписываем адрес первой преобразованной матрицы. Для этого устанавливаем курсор в поле, а затем выделяем матричный диапазон. После этого жмем на кнопку «OK». Данная функция выводит результат в одну ячейку, а не массивом, поэтому для получения расчета не нужно прибегать к нажатию комбинации клавиш Ctrl+Shift+Enter.
Функция производит подсчет результата и выводит его в заранее выделенную ячейку. Как видим, в нашем случае определитель равен -740, то есть, не является равным нулю, что нам подходит.
Аналогичным образом производим подсчет определителей для остальных трех таблиц.
На завершающем этапе производим подсчет определителя первичной матрицы. Процедура происходит все по тому же алгоритму. Как видим, определитель первичной таблицы тоже отличный от нуля, а значит, матрица считается невырожденной, то есть, система уравнений имеет решения.
Способ 4: метод Гаусса
Решить систему уравнений можно также, применив метод Гаусса. Для примера возьмем более простую систему уравнений из трех неизвестных:
-
Опять последовательно записываем коэффициенты в таблицу A, а свободные члены, расположенные после знака «равно» — в таблицу B. Но на этот раз сблизим обе таблицы, так как это понадобится нам для работы в дальнейшем. Важным условием является то, чтобы в первой ячейке матрицы A значение было отличным от нуля. В обратном случае следует переставить строки местами.
Копируем первую строку двух соединенных матриц в строчку ниже (для наглядности можно пропустить одну строку). В первую ячейку, которая расположена в строке ещё ниже предыдущей, вводим следующую формулу:
Если вы расположили матрицы по-другому, то и адреса ячеек формулы у вас будут иметь другое значение, но вы сможете высчитать их, сопоставив с теми формулами и изображениями, которые приводятся здесь.
После того, как формула введена, выделите весь ряд ячеек и нажмите комбинацию клавиш Ctrl+Shift+Enter. К ряду будет применена формула массива и он будет заполнен значениями. Таким образом мы произвели вычитание из второй строки первой, умноженной на отношение первых коэффициентов двух первых выражений системы.
После этого копируем полученную строку и вставляем её в строчку ниже.
Выделяем две первые строки после пропущенной строчки. Жмем на кнопку «Копировать», которая расположена на ленте во вкладке «Главная».
Пропускаем строку после последней записи на листе. Выделяем первую ячейку в следующей строке. Кликаем правой кнопкой мыши. В открывшемся контекстном меню наводим курсор на пункт «Специальная вставка». В запустившемся дополнительном списке выбираем позицию «Значения».
В следующую строку вводим формулу массива. В ней производится вычитание из третьей строки предыдущей группы данных второй строки, умноженной на отношение второго коэффициента третьей и второй строки. В нашем случае формула будет иметь следующий вид:
После ввода формулы выделяем весь ряд и применяем сочетание клавиш Ctrl+Shift+Enter.
Теперь следует выполнить обратную прогонку по методу Гаусса. Пропускаем три строки от последней записи. В четвертой строке вводим формулу массива:
Таким образом, мы делим последнюю рассчитанную нами строку на её же третий коэффициент. После того, как набрали формулу, выделяем всю строчку и жмем сочетание клавиш Ctrl+Shift+Enter.
Поднимаемся на строку вверх и вводим в неё следующую формулу массива:
Жмем привычное уже нам сочетание клавиш для применения формулы массива.
Поднимаемся ещё на одну строку выше. В неё вводим формулу массива следующего вида:
Опять выделяем всю строку и применяем сочетание клавиш Ctrl+Shift+Enter.
Как видим, в Экселе систему уравнений можно решить целым рядом способов, каждый из которых имеет собственные преимущества и недостатки. Но все эти методы можно условно разделить на две большие группы: матричные и с применением инструмента подбора параметров. В некоторых случаях не всегда матричные методы подходят для решения задачи. В частности тогда, когда определитель матрицы равен нулю. В остальных же случаях пользователь сам волен решать, какой вариант он считает более удобным для себя.
Помимо этой статьи, на сайте еще 12708 инструкций.
Добавьте сайт Lumpics.ru в закладки (CTRL+D) и мы точно еще пригодимся вам.
Отблагодарите автора, поделитесь статьей в социальных сетях.
Решение Системы Линейных Алгебраических Уравнений (СЛАУ) методом обратной матрицы в EXCEL
history 12 ноября 2015 г.
-
Группы статей
- Системы линейных уравнений
Решим Систему Линейных Алгебраических Уравнений (СЛАУ) методом обратной матрицы в MS EXCEL. В этой статье нет теории, объяснено только как выполнить расчеты, используя MS EXCEL.
Решим систему из 3-х линейных алгебраических уравнений с помощью обратной матрицы (матричным методом).
Запишем в ячейки основную матрицу системы и столбец свободных членов.
Систему n линейных алгебраических уравнений с n неизвестными можно решать матричным методом только тогда, когда определитель основной матрицы системы отличен от нуля (в противном случае мы имеем линейно зависимые уравнения и соответственно решение систем не единственное). В нашем случае определитель =12.
Для этого выделите ячейки A18:C20 , а в Строке формул введите =МОБР(A11:C13) , затем нажмите CTRL+SHIFT+ENTER .
Решение системы уравнений получим умножением обратной матрицы и столбца свободных членов. Перемножить матрицы можно с помощью формулы массива =МУМНОЖ() .
Для этого выделите ячейки F18:F20 , а в Строке формул введите =МУМНОЖ(A18:C20;F11:F13) , затем нажмите CTRL+SHIFT+ENTER .
В файле примера также приведено решение системы 4-х и 5-и уравнений.
Решение системы уравнений в excel
Решение системы уравнений в Microsoft Excel
Смотрите также Все элементы даннойОпределитель системы больше 0 результат подбора. Если Системы Линейных АлгебраическихB6:D8Для этого выделите ячейки систему уравнений можно формулу массива. ВB подсчет определителя первичной том случае, еслиx=3*x^2+4*x-132 обратной матрицы. Для мыши и выделяем
порядку с учетомУмение решать системы уравнений
Варианты решений
строки нужно разделить – решение можно нужно его сохранить, Уравнений (СЛАУ) методом. Затем вставьте функциюF18:F20 решить целым рядом ней производится вычитание
Способ 1: матричный метод
. Но на этот матрицы. Процедура происходит все определители будут.Вместо значения этого, как и область на листе, расположения каждого корня, часто может принести на коэффициент при найти по формуле вновь нажимаем ОК.
обратной матрицы вMINVERSE, а в Строке формул введите =МУМНОЖ(A18:C20;F11:F13), способов, каждый из из третьей строки раз сблизим обе все по тому
иметь значение, отличноеУрок:«X» в прошлый раз, в которой находится которому они соответствуют. пользу не только с. Введем в Крамера (D
В противном случае MS EXCEL.(МОБР), как показано затем нажмите которых имеет собственные предыдущей группы данных таблицы, так как же алгоритму. Как от нуля. Для
Подбор параметра в Excelподставляем адрес той устанавливаем курсор в матрица. Как видим, Если в каком-то в учебе, но строку формулу массива:x – «Отмена».
-
Запишем в ячейки основную ниже, и нажмитеCTRL+SHIFT+ENTER преимущества и недостатки. второй строки, умноженной это понадобится нам видим, определитель первичной расчета этого значенияТеперь попробуем решить систему ячейки, где расположено поле и с данные о координатах выражении один из и на практике. <=B12:E12/D12>./ |A|).Для подбора параметра программа матрицу системы иCtrl+Shift+Enter. Но все эти на отношение второго для работы в
таблицы тоже отличный в Экселе опять уравнений методом Крамера. число зажатой левой кнопкой размещения автоматически заносятся
корней отсутствует, то В то жеВ строке 15: отнимемДля расчета Х использует циклический процесс. столбец свободных членов. .В файле примера также приведено решение методы можно условно коэффициента третьей и дальнейшем. Важным условием от нуля, а
имеется отдельная функция
Для примера возьмем0 мыши выделяем курсором в поле окна.
в этом случае время, далеко не от второй строки1 Чтобы изменить числоОпределитель основной матрицы вычислим=MINVERSE(B2:D4) системы 4-х и разделить на две
второй строки. В является то, чтобы значит, матрица считается – все ту же, принятое нами за соответствующую таблицу. Аналогичное После того, как коэффициент считается равным каждый пользователь ПК третью, умноженную на: =U2/$U$1, где U2 итераций и погрешность,
с помощью формулы =МОПРЕД(A11:C13)=МОБР(B2:D4) 5-и уравнений. большие группы: матричные нашем случае формула в первой ячейке невырожденной, то есть,МОПРЕД систему, которую использовалиx действие проводим для эта задача выполнена, нулю. Если коэффициент знает, что в коэффициент при с – D1. Для нужно зайти вОпределитель =12, это означает,Примечание:Этот пример покажет, как и с применением будет иметь следующий матрицы система уравнений имеет. Синтаксис данного оператора в. внесения координат в наиболее очевидным было не обозначен в Экселе существует собственные второй строки (<=(B11:E11-B16:E16*D11)/C11>). расчета Х параметры Excel. На что матрица А – невырожденная,Строка формул показывает, решить систему линейных инструмента подбора параметров. вид:A решения. следующий:
Способе 1Переходим во вкладку поле бы нажать на уравнении, но соответствующий варианты решений линейных
В строке 14:2 вкладке «Формулы» установить то есть, ее что ячейки содержат уравнений в Excel. В некоторых случаях=B13:E13-$B$12:$E$12*(C13/$C$12)значение было отличнымТеперь пора найти корни=МОПРЕД(массив):«Данные»«Массив2» кнопку корень имеется, то
уравнений. Давайте узнаем,
от первой строки: =U3/$U$1. И т.д. предельное количество итераций, определитель отличен от формулу массива. Это К примеру, у не всегда матричныеПосле ввода формулы выделяем
от нуля. В уравнения. Корень уравненияТаким образом, как и14. Жмем на кнопку, только на этот«OK» считается, что коэффициент как с применением отнимаем вторую и
Получим корни уравнений: относительную погрешность. Поставить нуля. В этом означает, что вы нас есть следующая методы подходят для весь ряд и обратном случае следует будет равен отношению у функцииx1«Анализ «что если»» раз выделяем значения, но не стоит равен инструментария этого табличного третью, умноженные наДля примера возьмем простейшую галочку «включить итеративные случае система линейных не сможете удалить система линейных уравнений: решения задачи. В применяем сочетание клавиш переставить строки местами. определителя соответствующей преобразованнойМОБР+2. Эта кнопка размещена колонки торопиться. Дело в1
. соединенных матриц в
Способ 2: подбор параметров
первичной таблицы. Таким ссылка на обрабатываемую+8 блоке инструментов. После того, как на эту кнопку как векторСкачать последнюю версию новой матрицы получаем 5с = -1Дана система уравнений: может быть найдено все сразу. Чтобы
-
нулю. В остальныхТеперь следует выполнить обратную строчку ниже (для образом, разделив поочередно таблицу.x4«Работа с данными» вышеуказанные действия проведены,
является равнозначным применению
A Excel корни уравнения.2а – вЗначения элементов введем в методом Крамера. удалить все результаты,+ же случаях пользователь
прогонку по методу наглядности можно пропустить все четыре определителяИтак, выделяем ячейку, в=218. Открывается выпадающий список. опять не спешим команды.Любое уравнение может считатьсяВычисления в книге должны – 3с = ячейки Excel в
Теперь последовательно будем заменять выделите диапазон8z сам волен решать, Гаусса. Пропускаем три одну строку). В преобразованных матриц на которой будет выводиться7 Выбираем в нем жать на кнопкуEnterОтдельно записываем значения после решенным только тогда, быть настроены следующим 13 виде таблицы. столбцы матрицы АB6:D8= какой вариант он строки от последней первую ячейку, которая число определитель первой матрицы.x1 позицию«OK»
. Но при работе знака «равно». Обозначаем когда будут отысканы образом:а + 2вНайдем обратную матрицу. Выделим на столбец свободныхи нажмите клавишу46
– с = диапазон, куда впоследствии членов и вычислятьDelete4x для себя.
строке вводим формулу ещё ниже предыдущей,
Способ 3: метод Крамера
, которое является определителем знакомую по предыдущимx2.Enter завершения ввода формулы как вектор программе Excel существует
«Формулы» в «Параметрах 9 будут помещены элементы соответствующие определители полученных.—Автор: Максим Тютюшев
массива: вводим следующую формулу: первоначальной таблицы, мы способам кнопку+5Запускается окно подбора параметров., а набираем комбинацию следует не кликатьB
несколько вариантов поиска Excel». Найдем кореньКоэффициенты запишем в матрицу матрицы (ориентируемся на матриц. Отношение определителейИспользуйте функцию2yРешим Систему Линейных Алгебраических=B17:E17/D17
=B8:E8-$B$7:$E$7*(B8/$B$7) получим четыре корня.«Вставить функцию»x3 Как видим, оно клавиш по кнопке. корней. Давайте рассмотрим
-
уравнения х – А. Свободные члены количество строк и позволяет вычислить переменныеMMULT= Уравнений (СЛАУ) методомТаким образом, мы делимЕсли вы расположили матрицы Как видим, они
.+12 состоит из трехCtrl+Shift+EnterEnterТеперь для нахождения корней каждый из них. х3 + 1 – в матрицу столбцов в исходной х.(МУМНОЖ), чтобы вернуть12 обратной матрицы в последнюю рассчитанную нами
по-другому, то и равны значениямАктивируется окноx4 полей. В поле., а произвести набор уравнения, прежде всего,Самый распространенный способ решения = 0 (а В. матрице). Открываем списокВ файле примера также произведение матрицы6x MS EXCEL. В
адреса ячеек формулы5Мастера функций=213«Установить в ячейке»После данного действия в
сочетания клавиш нам нужно отыскать системы линейных уравнений = 1, bДля наглядности свободные члены функций (fx). В приведено решение системыA-1
+ этой статье нет же третий коэффициент. у вас будут,. Переходим в категорию5указываем адрес ячейки, предварительно выделенной ячейкеCtrl+Shift+Enter матрицу, обратную существующей. инструментами Excel –
= 2) методом выделим заливкой. Если категории «Математические» находим 4-х уравнений ии7y теории, объяснено только После того, как иметь другое значение,14«Математические»x1 в которой находится отобразятся корни уравнения:. Выполняем эту операцию. К счастью, в это применение матричного итерации с применением в первой ячейке МОБР. Аргумент – прямая проверка решения.B+ как выполнить расчеты,
набрали формулу, выделяем но вы сможете,и среди списка+ формулаX1Итак, после этого программа Эксель имеется специальный метода. Он заключается
циклических ссылок. Формула: матрицы А оказался массив ячеек с
В программе Excel имеется. Сперва выделите диапазон4z используя MS EXCEL. всю строчку и высчитать их, сопоставив8 операторов выделяем тамx2f(x), производит вычисления и
Способ 4: метод Гаусса
ранее. В поле, предварительно выделенной области задачи. Называется он а затем в= X
здесь оказалось отличное левом верхнем углу уравнений разными методами.MMULTВ матричном представлении ее с помощью обратной.
приводятся здесь.. Таким образом, они. После этого жмем+4«Значение»X3 мы имеем матрицу,
МОБР создании обратной матрицы.n от 0 значение. диапазона появляется значение.Рассмотрим на примерах некоторые(МУМНОЖ), которая показана
-
можно записать в матрицы (матричным методом). Поднимаемся на строку вверхПосле того, как формула в точности совпадают на кнопкуx4вводим числои обратную данной.. Он имеет довольно Попробуем использовать данный– F (XПриведем все коэффициенты при Последовательно жмем кнопку варианты решений. ниже, и нажмите видеСОВЕТ и вводим в введена, выделите весь с корнями, которые
«OK»=83«0»X4Теперь нам нужно будет простой синтаксис: метод для решенияn а к 0.
Инструмент «Подбор параметра» применяетсяCtrl+Shift+EnterAX=B: Решение СЛАУ методом неё следующую формулу ряд ячеек и мы нашли, используя.6. В поле
. Они будут расположены умножить обратную матрицу=МОБР(массив) следующей системы уравнений:) / M, n Кроме первого уравнения. клавиш Ctrl + в ситуации, когда.. Крамера приведено в массива: нажмите комбинацию клавиш обратную матрицу вЗапускается окно аргументов функции
x1«Изменяя значения» последовательно. Таким образом, на матрицу
Аргумент14 = 0, 1, Скопируем значения в Shift + Enter. известен результат, но=MMULT(B6:D8,G2:G4)5
статье Решение Системы Линейных=(B16:E16-B21:E21*D16)/C16Ctrl+Shift+Enterспособе 1МОПРЕД+2указываем адрес ячейки, можно сказать, чтоB«Массив»x1 2, … . первой строке двух
Умножим обратную матрицу Ах-1х неизвестны аргументы. Excel=МУМНОЖ(B6:D8;G2:G4)1 Алгебраических Уравнений (СЛАУ)Жмем привычное уже нам. К ряду будет, что подтверждает правильность. Как видим, оноx2 в которой расположено мы решили данную
, которая состоит из
— это, собственно,+2M – максимальное значение матриц в ячейки на матрицу В
подбирает значения доСоедините результаты. Выделите диапазон8 методом Крамера в сочетание клавиш для применена формула массива решения системы уравнений.
имеет только одно
+ значение систему. Для того, одного столбца значений, адрес исходной таблицы.x2 производной по модулю. В6:Е6. В ячейку (именно в таком тех пор, пока
G6:G8x MS EXCEL. применения формулы массива.
Решить систему уравнений можно поле –x3
x чтобы проверить правильность расположенных после знакаИтак, выделяем на листе
Чтобы найти М, В7 введем формулу: порядке следования множителей!). вычисление не даст. Вставьте обобщенную формулу
. В это полеx4 за в исходную системув выражениях. Для которая по размеру=218f’ (1) = -2 В7:Е7. Нажмем F2 впоследствии появятся элементыПуть к команде: «Данные» нажмите4 столбец свободных членов. неё вводим формулу вычитание из второй возьмем более простую вписываем адрес первой=210 выражений данные ответы умножения таблиц в равна диапазону исходной7
Решение Системы Линейных Алгебраических Уравнений (СЛАУ) методом обратной матрицы в MS EXCEL
и сочетание клавиш результирующей матрицы (ориентируемся — «Работа сCtrl+Shift+Enter-2Систему массива следующего вида: строки первой, умноженной
систему уравнений из преобразованной матрицы. ДляКак и в первом. После выполнения данных
вместо соответствующих корней. Экселе также имеется матрицы. Щелкаем поx1 = -11. Ctrl + Shift на число строк
n =(B15:E15-B20:E20*C15-B21:E21*D15)/B15 на отношение первых трех неизвестных: этого устанавливаем курсор способе, составляем матрицу действий жмем на Если равенство будет отдельная функция, которая кнопке-3Полученное значение меньше 0. + Enter. Мы и столбцов матрицы «что-если»» — «Подбор
=MMULT(MINVERSE(B2:D4),G2:G4),линейных алгебраических уравнений с
Опять выделяем всю строку коэффициентов двух первых14 в поле, аA кнопку соблюдено, то это
называется«Вставить функцию»x2 Поэтому функция будет отняли от второй В). Открываем диалоговое
параметра».=МУМНОЖ(МОБР(B2:D4);G2:G4)X=n и применяем сочетание выражений системы.
x1 затем выделяем матричныйиз коэффициентов уравнений
Система линейных уравнений в Excel
«OK» означает, что представленнаяМУМНОЖ, расположенную около строки+5 с противоположным знаком:
строки первую, умноженную | окно математической функции | Рассмотрим на примере решение | Урок подготовлен для Вас | y | неизвестными можно решать матричным | клавиш |
После этого копируем полученную | +2 | диапазон. После этого | и таблицу | . | ||
система уравнений решена | . Данный оператор имеет | формул. | x3 | f (х) = | на отношение первых | МУМНОЖ. Первый диапазон |
квадратного уравнения х2 командой сайта office-guru.ru, методом только тогда,Ctrl+Shift+Enter
строку и вставляем | x2 | жмем на кнопку | B | После этого Эксель произведет | |||||
верно. | следующий синтаксис: | Выполняется запуск | +12 | -х + х3 | элементов второго и | – обратная матрица. | + 3х + | Источник: http://www.excel-easy.com/examples/system-of-linear-equations.html | B= |
когда определитель основной | . | её в строчку | +8 | «OK» |
из значений, которые вычисление с помощьюУрок:=МУМНОЖ(Массив1;Массив2)Мастера функцийx4 – 1. М первого уравнения. Второй – матрица 2 = 0.Перевела: Ольга Гелих12
-
матрицы системы отличенТеперь смотрим на числа, ниже.x3. Данная функция выводит стоят после знака подбора параметра. ОбОбратная матрица в ExcelВыделяем диапазон, в нашем. Переходим в категорию=213 = 11.Копируем введенную формулу на
В.
Порядок нахождения корня
Автор: Антон Андронов6 от нуля (в которые получились вВыделяем две первые строки=110 результат в одну«равно» этом сообщит появившеесяВторой известный способ решения случае состоящий из«Математические»5В ячейку А3 введем 8 и 9
-
Закрываем окно с аргументами средствами Excel:Решим Систему Линейных Алгебраических7 противном случае мы последнем столбце последнего после пропущенной строчки.7 ячейку, а не. информационное окно. В системы уравнений в четырех ячеек. Далее. В представившемся спискеx1
значение: а =
строки. Так мы
функции нажатием кнопкиВведем в ячейку В2 Уравнений (СЛАУ) методом4 имеем линейно зависимые блока строк, рассчитанного Жмем на кнопку
x1
массивом, поэтому для
Далее делаем ещё четыре нем следует нажать
Экселе – это
опять запускаем
Решение Системы Линейных Алгебраических Уравнений (СЛАУ) методом Крамера в MS EXCEL
+ 1. Точность – избавились от коэффициентов ОК. Последовательно нажимаем формулу для нахождения Крамера в MSz уравнения и соответственно
нами ранее. Именно«Копировать»-3 получения расчета не таблицы. Каждая из на кнопку применение метода подбораМастер функций
три знака после перед а. Сохранили кнопку F2 и значения функции. В EXCEL. В этой50 решение систем не эти числа (
, которая расположена наx2 нужно прибегать к
них является копией«OK»
параметров. Суть данного, нажав значок. После того, как-2 запятой. Для расчета только первое уравнение. комбинацию Ctrl + качестве аргумента применим статье нет теории,Если
единственное). В нашем4 ленте во вкладке+5 нажатию комбинации клавиш матрицы. метода заключается в
«Вставить функцию» оно отыскано, выделяемx3 текущего значения х
Решение уравнений в Excel методом итераций Крамера и Гаусса
Приведем к 0 коэффициенты Shift + Enter. ссылку на ячейку объяснено только как
А-1 случае определитель =12.
Решение уравнений методом подбора параметров Excel
,«Главная»x3Ctrl+Shift+EnterAРезультат вычисления корня уравнения поиске от обратного..
его и жмем+4 в соседнюю ячейку перед в вПолучены корни уравнений.
В1. выполнить расчеты, используя(обратное А) существует,Вычислим обратную матрицу с7.
- =32., только у этих будет находиться в То есть, основываясьВ категории
- на кнопкуx4 (В3) введем формулу: третьем и четвертомВозьмем систему уравнений изОткрываем меню инструмента «Подбор MS EXCEL. мы можем умножить помощью формулы массиваиПропускаем строку после последней5Функция производит подсчет результата копий поочередно один
- той ячейке, которую на известном результате,«Математические»«OK»=83 =ЕСЛИ(B3=0;A3;B3-(-B3+СТЕПЕНЬ(B3;3)-1/11)).
уравнении. Копируем строки предыдущего примера: параметра». В графеМетод Крамера применяется для обе части на МОБР().5 записи на листе.x1 и выводит его столбец заменен на
Как решить систему уравнений матричным методом в Excel
мы производим поиск
- , запустившегося.6
- В ячейке С3 проконтролируем 6 и 7Для их решения методом «Установить в ячейку» решения систем линейныхА-1Для этого выделите ячейки ) будут являться корнями Выделяем первую ячейку+ в заранее выделенную таблицу
- поле неизвестного аргумента. ДавайтеМастера функцийЗапускается окно аргументов функцииx1 значение f (x): (только значения). Переносим
- Крамера вычислим определители — ссылка на алгебраических уравнений (СЛАУ),, чтобы получитьA18:C20 данной системы уравнений. в следующей строке.x2 ячейку. Как видим,B«Изменяя значения» для примера используем, выделяем наименованиеМОБР+2
- с помощью формулы их ниже, в матриц, полученных заменой ячейку В2, где в которых числоX=A-1B
Решение системы уравнений методом Крамера в Excel
Проверить это можно, Кликаем правой кнопкой
-2 в нашем случае. У первой таблицы. В нашем случае, квадратное уравнение«МУМНОЖ»
. Оно по числуx2 =B3-СТЕПЕНЬ(B3;3)+1. строки 10 и
одного столбца в находится формула. В неизвестных переменных равно
. Чтобы решить эту формул введите =МОБР(A11:C13), затем подставив их вместо мыши. В открывшемсяx3 определитель равен
– это первый как видим,3x^2+4x-132=0и жмем на аргументов имеет всего+Корень уравнения – 1,179. 11. Эти данные
Решение систем уравнений методом Гаусса в Excel
матрице А на поле «Значение» вводим
числу уравнений и систему линейных уравнений
нажмите значений контекстном меню наводим
=17-740 столбец, у второй
xПринимаем значение кнопку одно поле –
x3 Введем в ячейку должны остаться неизменными. столбец-матрицу В. 0. Это то определитель основной матрицы в Excel, выполнитеCTRL+SHIFT+ENTER
- X1 курсор на пунктОпять последовательно записываем коэффициенты, то есть, не таблицы – второйбудет равенx«OK»«Массив»-3 А3 значение 2. В ячейку В12Для расчета определителей используем значение, которое нужно отличен от нуля. следующие действия:.,
- «Специальная вставка» в таблицу является равным нулю, и т.д.6за равное
- .. Тут нужно указатьx4 Получим тот же вводим формулу массива. функцию МОПРЕД. Аргумент получить. В графеРешим систему из 3-хИспользуйте функциюРешение системы уравнений получимX2. В запустившемся дополнительном
- A что нам подходит.Теперь нам нужно высчитать.0Активируется окно аргументов функции адрес нашей таблицы.=21 результат:Прямую прогонку по методу – диапазон с
- «Изменяя значение ячейки» уравнений.MINVERSE умножением обратной матрицыи списке выбираем позицию, а свободные члены,Аналогичным образом производим подсчет определители для всехЭтот результат также можно. Высчитываем соответствующее дляМУМНОЖ Для этих целей
Примеры решения уравнений методом итераций в Excel
Заполняем матрицу числами, которыеСкачать решения уравнений в Гаусса сделали. В
соответствующей матрицей. — В1. ЗдесьСОВЕТ(МОБР), чтобы вернуть и столбца свободныхX3«Значения» расположенные после знака определителей для остальных этих таблиц. Система
проверить, подставив данное него значение. В поле устанавливаем курсор в являются коэффициентами уравнения. Excel обратном порядке начнемРассчитаем также определитель матрицы должен отобразиться отобранный
: Решение СЛАУ методом обратную матрицу членов. Перемножить матрицыв выражения.
.«равно» трех таблиц.
уравнений будет иметь значение в решаемоеf(x)«Массив1» это поле. Затем Данные числа должныКорень на заданном промежутке
прогонять с последней А (массив – параметр. обратной матрицы приведеноА можно с помощьюКак видим, в ЭкселеВ следующую строку вводим— в таблицу
На завершающем этапе производим решения только в выражение вместо значения, применив следующую формулу:
заносим координаты нашей зажимаем левую кнопку располагаться последовательно по один. строки полученной матрицы.
диапазон матрицы А).После нажатия ОК отобразится
в статье Решение. Сначала выделите диапазон
источники:
http://excel2.ru/articles/reshenie-sistemy-lineynyh-algebraicheskih-uravneniy-slau-metodom-obratnoy-matricy-v-ms-excel
http://my-excel.ru/excel/reshenie-sistemy-uravnenij-v-excel.html
Что объясняет регрессия?
Прежде, чем мы приступим к рассмотрению функций MS Excel, позволяющих, решать данные задачи, хотелось бы вам на пальцах объяснить, что, в сущности, предполагает регрессионный анализ. Так вам проще будет сдавать экзамен, а самое главное, интересней изучать предмет.
Будем надеяться, вы знакомы с понятием функции из математики. Функция – это взаимосвязь двух переменных. При изменении одной переменной что-то происходит с другой. Изменяем X, меняется и Y, соответственно. Функциями описываются различные законы. Зная функцию, мы можем подставлять произвольные значения X и смотреть на то, как при этом изменится Y.
Это имеет большое значение, поскольку регрессия – это попытка объяснить с помощью определённой функции на первый взгляд бессистемные и хаотичные процессы. Так, например, можно выявить взаимосвязь курса доллара и безработицы в России.
Если данную закономерность обнаружить удастся, то по полученной нами в ходе расчетов функции, мы сможем составить прогноз, какой будет уровень безработицы при N-ом курсе доллара по отношению к рублю.
Данная взаимосвязь будет называться корреляцией. Регрессионный анализ предполагает расчет коэффициента корреляции, который объяснит тесноту связи между рассматриваемыми нами переменными (курсом доллара и числом рабочих мест).
Данный коэффициент может быть положительным и отрицательным. Его значения находятся в пределах от -1 до 1. Соответственно, мы может наблюдать высокую отрицательную или положительную корреляцию. Если она положительная, то за увеличением курса доллара последует и появление новых рабочих мест.
Если она отрицательная, значит, за увеличением курса, последует уменьшение рабочих мест.
Регрессия бывает нескольких видов. Она может быть линейной, параболической, степенной, экспоненциальной и т.д.
Выбор модели мы делаем в зависимости от того, какая регрессия будет соответствовать конкретно нашему случаю, какая модель будет максимально близка к нашей корреляции. Рассмотрим это на примере задачи и решим её в MS Excel.
Линейная регрессия в MS Excel
Для решения задач линейной регрессии вам понадобится функционал «Анализ данных». Он может быть не включен у вас поэтому его нужно активировать.
- Жмём на кнопку «Файл»;
- Выбираем пункт «Параметры»;
- Жмём по предпоследней вкладке «Надстройки» с левой стороны;
- Снизу увидим Надпись «Управление» и кнопку «Перейти». Жмём по ней;
- Ставим галочку на «Пакет анализа»;
- Жмём «ок».
Пример задачи
Функция пакетного анализа активирована. Решим следующую задачу. У нас есть выборка данных за несколько лет о числе ЧП на территории предприятия и количестве трудоустроенных работников.
Нам необходимо выявить взаимосвязь между этими двумя переменными. Есть объясняющая переменная X – это число рабочих и объясняемая переменная – Y – это число чрезвычайных происшествий.
Распределим исходные данные в два столбца.
Перейдём во вкладку «данные» и выберем «Анализ данных»
Нажимаем «Ок». Анализ произведён, и в новом листе мы увидим результаты.
Наиболее существенные для нас значения отмечены на рисунке ниже.
Множественный R – это коэффициент детерминации. Он имеет сложную формулу расчета и показывает, насколько можно доверять нашему коэффициенту корреляции. Соответственно, чем больше это значение, тем больше доверия, тем удачнее наша модель в целом.
Y-пересечение и Пересечение X1 – это коэффициенты нашей регрессии. Как уже было сказано, регрессия – это функция, и у неё есть определённые коэффициенты. Таким образом, наша функция будет иметь вид: Y = 0,64*X-2,84.
Что нам это даёт? Это даёт нам возможность составить прогноз. Допустим, мы хотим нанять на предприятие 25 работников и нам нужно примерно представить, каким при этом будет количество чрезвычайных происшествий. Подставляем в нашу функцию данное значение и получаем результат Y = 0,64 * 25 – 2,84. Примерно 13 ЧП у нас будет происходить.
Посмотрим, как это работает. Взгляните на рисунок ниже. В полученную нами функцию подставлены фактические значения по вовлеченным работникам. Посмотрите, как близки значения к реальным игрекам.
Вы так же можете построить поле корреляции, выделив область игреков и иксов, нажав на вкладку «вставку» и выбрав точечную диаграмму.
Точки идут вразброс, но в целом двигаются вверх, как будто посередине лежит прямая линия. И эту линию вы так же можете добавить, перейдя во вкладку «Макет» в MS Excel и выбрав пункт «Линия тренда»
Заключение
Будем надеяться, что данная статья дала вам большее понимание о том, что такое регрессионный анализ и для чего он нужен. Всё это имеет большое прикладное значение.
Источник: https://Reshatel.org/kontrolnye-raboty/ekonometrika-linejnaya-regressiya-v-ms-excel/
Множественная линейная регрессия в excel пример. Уравнение регрессии как сделать в excel
Пакет MS Excel позволяет при построении уравнения линейной регрессии большую часть работы сделать очень быстро. Важно понять, как интерпретировать полученные результаты.
Для построения модели регрессии необходимо выбрать пункт СервисАнализ данныхРегрессия (в Excel 2007 этот режим находится в блоке Данные/Анализ данных/Регрессия).
Затем полученные результаты скопировать в блок для анализа.
- Метод линейной регрессии позволяет нам описывать прямую линию, максимально соответствующую ряду упорядоченных пар (x, y). Уравнение для прямой линии, известное как линейное уравнение, представлено ниже:
- ŷ — ожидаемое значение у при заданном значении х,
- x — независимая переменная,
- a — отрезок на оси y для прямой линии,
- b — наклон прямой линии.
- На рисунке ниже это понятие представлено графически:
На рисунке выше показана линия, описанная уравнением ŷ =2+0.5х. Отрезок на оси у — это точка пересечения линией оси у; в нашем случае а = 2. Наклон линии, b, отношение подъема линии к длине линии, имеет значение 0.5.
Положительный наклон означает, что линия поднимается слева направо. Если b = 0, линия горизонтальна, а это значит, что между зависимой и независимой переменными нет никакой связи.
Иными словами, изменение значения x не влияет на значение y.
Часто путают ŷ и у. На графике показаны 6 упорядоченных пар точек и линия, в соответствии с данным уравнением
На этом рисунке показана точка, соответствующая упорядоченной паре х = 2 и у = 4. Обратите внимание, что ожидаемое значение у в соответствии с линией при х
= 2 является ŷ. Мы можем подтвердить это с помощью следующего уравнения:
ŷ = 2 + 0.5х =2 +0.5(2) =3.
Значение у представляет собой фактическую точку, а значение ŷ — это ожидаемое значение у с использованием линейного уравнения при заданном значении х.
Следующий шаг — определить линейное уравнение, максимально соответствующее набору упорядоченных пар, об этом мы говорили в предыдущей статье, где определяли вид уравнения по .
Использование Excel для определения линейной регрессии
Для того, чтобы воспользоваться инструментом регрессионного анализа встроенного в Excel, необходимо активировать надстройку Пакет анализа
.
Найти ее можно, перейдя по вкладке Файл –> Параметры
(2007+), в появившемся диалоговом окне Параметры
Excel
переходим во вкладку Надстройки.
В поле Управление
выбираем Надстройки
Excel
и щелкаем Перейти.
В появившемся окне ставим галочку напротив Пакет анализа,
жмем ОК.
Во вкладке Данные
в группе Анализ
появится новая кнопка Анализ данных.
Чтобы продемонстрировать работу надстройки, воспользуемся данными , где парень и девушка делят столик в ванной. Введите данные нашего примера с ванной в столбцы А и В чистого листа.
Перейдите во вкладку Данные,
в группе Анализ
щелкните Анализ данных.
В появившемся окне Анализ данных
выберите Регрессия
, как показано на рисунке, и щелкните ОК.
Установите необходимыe параметры регрессии в окне Регрессия
, как показано на рисунке:
Щелкните ОК.
На рисунке ниже показаны полученные результаты:
Эти результаты соответствуют тем, которые мы получили путем самостоятельных вычислений в .
Линия регрессии является графическим отражением взаимосвязи между явлениями. Очень наглядно можно построить линию регрессии в программе Excel.
Для этого необходимо:
1.Открыть программу Excel
2.Создать столбцы с данными. В нашем примере мы будем строить линию регрессии, или взаимосвязи, между агрессивностью и неуверенностью в себе у детей-первоклассников. В эксперименте участвовали 30 детей, данные представлены в таблице эксель:
- 1 столбик — № испытуемого
- 2 столбик — агрессивность
в баллах - 3 столбик — неуверенность в себе
в баллах
3.Затем необходимо выделить оба столбика (без названия столбика), нажать вкладку вставка
,
выбрать точечная
, а из предложенных макетов выбрать самый первый точечная с маркерами
.
4.Итак у нас получилась заготовка для линии регрессии — так называемая — диаграмма рассеяния
. Для перехода к линии регрессии нужно щёлкнуть на получившийся рисунок, нажать вкладку конструктор,
найти на панели макеты диаграмм
и выбрать Ма
кет9
, на нем ещё написано f(x)
5.Итак, у нас получилась линия регрессии. На графике также указано её уравнение и квадрат коэффициента корреляции
6.Осталось добавить название графика, название осей. Также по желанию можно убрать легенду, уменьшить количество горизонтальных линий сетки (вкладка макет
, затем сетка
). Основные изменения и настройки производятся во вкладке Макет
Линия регрессии построена в MS Excel. Теперь её можно добавить в текст работы.
Регрессионный анализ в Microsoft Excel – наиболее полное руководств по использованию MS Excel для решения задач регрессионного анализа в области бизнес-аналитики.
Конрад Карлберг доступно объясняет теоретические вопросы, знание которых поможет вам избежать многих ошибок как при самостоятельном проведении регрессионного анализа, так и при оценке результатов анализа, выполненного другими людьми.
Весь материал, от простых корреляций и t-тестов до множественного ковариационного анализа, основан на реальных примерах и сопровождается подробным описанием соответствующих пошаговых процедур.
В книге обсуждаются особенности и противоречия, связанные с функциями Excel для работы с регрессией, рассматриваются последствия использования каждой их опции и каждого аргумента и объясняется, как надежно применять регрессионные методы в самых разных областях, от медицинских исследований до финансового анализа.
Конрад Карлберг. Регрессионный анализ в Microsoft Excel. – М.: Диалектика, 2017. – 400 с.
Скачать заметку в формате или , примеры в формате
Глава 1. Оценка изменчивости данных
В распоряжении статистиков имеется множество показателей вариации (изменчивости). Один из них – сумма квадратов отклонений индивидуальных значений от среднего. В Excel для него используется функция КВАДРОТКЛ().
Но чаще используется дисперсия. Дисперсия — это среднее квадратов отклонений.
Дисперсия нечувствительна к количеству значений в исследуемом наборе данных (в то время как сумма квадратов отклонений растет с числом измерений).
Программа Excel предлагает две функции, возвращающие дисперсию: ДИСП.Г() и ДИСП.В():
- Используйте функцию ДИСП.Г(), если подлежащие обработке значения образуют генеральную совокупность. Т.е., значения, содержащиеся в диапазоне, являются единственными значениями, которые вас интересуют.
- Используйте функцию ДИСП.В(), если подлежащие обработке значения образуют выборку из совокупности большего объема. Предполагается, что имеются дополнительные значения, дисперсию которых вы также можете оценить.
Если такая величина, как среднее значение или коэффициент корреляции, рассчитывается на основе генеральной совокупности, то она называется параметром. Аналогичная величина, рассчитываемая на основе выборки, называется статистикой.
Отсчитывая отклонения от среднего значения
в данном наборе, вы получите сумму квадратов отклонений меньшей величины, чем если бы отсчитывали их от любого другого значения. Аналогичное утверждение справедливо и для дисперсии.
Чем больше объем выборки, тем точнее рассчитанное значение статистики. Но не существует ни одной выборки с объемом меньше объема генеральной совокупности, относительно которой вы могли бы быть уверены в том, что значение статистики совпадает со значением параметра.
Допустим, у вас есть набор из 100 значений роста, среднее которых отличается от среднего по генеральной совокупности, каким бы малым ни было это различие. Рассчитав дисперсию для выборки, вы получите некоторое ее значение, скажем, 4.
Это значение меньше любого другого, которое можно получить, рассчитывая отклонение каждого из 100 значений роста относительно любого значения, отличного от среднего по выборке, в там числе и относительно истинного среднего по генеральной совокупности.
Поэтому вычисленная дисперсия будет отличаться, причем в меньшую сторону, от дисперсии, которую вы получили бы, если бы каким-то образом узнали и использовали не выборочное среднее, а параметр генеральной совокупности.
Средняя сумма квадратов, определенная для выборки, дает нижнюю оценку дисперсии генеральной совокупности. Вычисленную таким способом дисперсию называют смещенной
оценкой. Оказывается, чтобы исключить смещение и получить несмещенную оценку, достаточно разделить сумму квадратов отклонений не на n
, где n
— размер выборки, а на n – 1
.
Величина n – 1
называется количеством (числом) степеней свободы. Существуют разные способы расчета этой величины, хотя все они включают либо вычитание некоторого числа из размера выборки, либо подсчет количества категорий, в которые попадают наблюдения.
Суть различия между функциями ДИСП.Г() и ДИСП.В() состоит в следующем:
- В функции ДИСП.Г() сумма квадратов делится на количество наблюдений и, следовательно, представляет смещенную оценку дисперсии, истинное среднее.
- В функции ДИСП.В() сумма квадратов делится на количество наблюдений минус 1, т.е. на количество степеней свободы, что дает более точную, несмещенную оценку дисперсии генеральной совокупности, из которой была извлечена данная выборка.
Стандартное отклонение (англ. standard deviation
, SD) – есть квадратный корень из дисперсии:
Возведение отклонений в квадрат переводит шкалу измерений в другую метрику, являющуюся квадратом исходной: метры — в квадратные метры, доллары — в квадратные доллары и т.д. Стандартное отклонение — это корень квадратный из дисперсии, и поэтому оно возвращает нас к исходным единицам измерения. Что удобнее.
Часто приходится рассчитывать стандартное отклонение после того, как данных были подвергнуты некоторым манипуляциям.
И хотя в этих случаях результаты несомненно являются стандартными отклонениями, их принято называть стандартными ошибками
.
Существует несколько разновидностей стандартных ошибок, в том числе стандартная ошибка измерения, стандартная ошибка пропорции, стандартная ошибка среднего.
Предположим, вы собрали данные о росте 25 случайно выбранных взрослых мужчин в каждом из 50 штатов. Далее вы вычисляете средний рост взрослых мужчин в каждом штате. Полученные 50 средних значений в свою очередь можно считать наблюдениями.
Исходя из этого, вы могли бы рассчитать их стандартное отклонение, которое и является стандартной ошибкой среднего
. Рис. 1. позволяет сравнить распределение 1250 исходных индивидуальных значений (данные о росте 25 мужчин по каждому из 50 штатов) с распределением средних значений 50 штатов.
Формула для оценки стандартной ошибки среднего (т.е. стандартного отклонения средних значений, а не индивидуальных наблюдений):
- где – стандартная ошибка среднего; s
– стандартное отклонение исходных наблюдений; n
– количество наблюдений в выборке.
Рис. 1. Вариация средних значений от штата к штату значительно меньше вариации индивидуальных результатов наблюдений
В статистике существует соглашение относительно использования греческих и латинских букв для обозначения статистических величин. Греческими буквами принято обозначать параметры генеральной совокупности, латинскими — выборочные статистики.
Следовательно, если речь идет о стандартном отклонении генеральной совокупности, мы записываем его как σ; если же рассматривается стандартное отклонение выборки, то используем обозначение s. Что касается символов для обозначения средних, то они согласуются между собой не столь удачно.
Среднее по генеральной совокупности обозначается греческой буквой μ. Однако для представления выборочного среднего традиционно используется символ X̅.
z-оценка
выражает положение наблюдения в распределении в единицах стандартного отклонения. Например, z = 1,5 означает, что наблюдение отстоит от среднего на 1,5 стандартного отклонения в сторону больших значений. Термин z-оценка
Источник: https://erfa.ru/mnozhestvennaya-lineinaya-regressiya-v-excel-primer-uravnenie-regressii-kak-sdelat.html
Регрессия в Excel: уравнение, примеры. Линейная регрессия
Рeгрeссиoнный aнaлиз — этo стaтистичeский мeтoд исслeдoвaния, пoзвoляющий пoкaзaть зaвисимoсть тoгo или инoгo пaрaмeтрa oт oднoй либo нeскoльких нeзaвисимых пeрeмeнных.
В дoкoмпьютeрную эру eгo примeнeниe былo дoстaтoчнo зaтруднитeльнo, oсoбeннo eсли рeчь шлa o
Рeгрeссиoнный aнaлиз — этo стaтистичeский мeтoд исслeдoвaния, пoзвoляющий пoкaзaть зaвисимoсть тoгo или инoгo пaрaмeтрa oт oднoй либo нeскoльких нeзaвисимых пeрeмeнных.
В дoкoмпьютeрную эру eгo примeнeниe былo дoстaтoчнo зaтруднитeльнo, oсoбeннo eсли рeчь шлa o бoльших oбъeмaх дaнных. Сeгoдня, узнaв кaк пoстрoить рeгрeссию в Excel, мoжнo рeшaть слoжныe стaтистичeскиe зaдaчи буквaльнo зa пaру минут.
Нижe прeдстaвлeны кoнкрeтныe примeры из oблaсти экoнoмики.
Клaссичeский рaсчeт:
{source}
{/source}
Виды рeгрeссии
Сaмo этo пoнятиe былo ввeдeнo в мaтeмaтику Фрэнсисoм Гaльтoнoм в 1886 гoду. Рeгрeссия бывaeт:
- линeйнoй;
- пaрaбoличeскoй;
- стeпeннoй;
- экспoнeнциaльнoй;
- гипeрбoличeскoй;
- пoкaзaтeльнoй;
- лoгaрифмичeскoй.
Примeр 1
Рaссмoтрим зaдaчу oпрeдeлeния зaвисимoсти кoличeствa увoлившихся члeнoв кoллeктивa oт срeднeй зaрплaты нa 6 прoмышлeнных прeдприятиях.
Зaдaчa. Нa шeсти прeдприятиях прoaнaлизирoвaли срeднeмeсячную зaрaбoтную плaту и кoличeствo сoтрудникoв, кoтoрыe увoлились пo сoбствeннoму жeлaнию. В тaбличнoй фoрмe имeeм:
- A
- B
- C
- 1
- Х
- Кoличeствo увoлившихся
- Зaрплaтa
- 2
- y
- 30000 рублeй
- 3
- 1
- 60
- 35000 рублeй
- 4
- 2
- 35
- 40000 рублeй
- 5
- 3
- 20
- 45000 рублeй
- 6
- 4
- 20
- 50000 рублeй
- 7
- 5
- 15
- 55000 рублeй
- 8
- 6
- 15
- 60000 рублeй
- Для зaдaчи oпрeдeлeния зaвисимoсти кoличeствa увoлившихся рaбoтникoв oт срeднeй зaрплaты нa 6 прeдприятиях мoдeль рeгрeссии имeeт вид урaвнeния Y = a0 + a1x1 +…+akxk, гдe хi — влияющиe пeрeмeнныe, ai — кoэффициeнты рeгрeссии, a k — числo фaктoрoв.
- Для дaннoй зaдaчи Y — этo пoкaзaтeль увoлившихся сoтрудникoв, a влияющий фaктoр — зaрплaтa, кoтoрую oбoзнaчaeм X.
Испoльзoвaниe вoзмoжнoстeй тaбличнoгo прoцeссoрa «Эксeль»
aнaлизу рeгрeссии в Excel дoлжнo прeдшeствoвaть примeнeниe к имeющимся тaбличным дaнным встрoeнных функций. oднaкo для этих цeлeй лучшe вoспoльзoвaться oчeнь пoлeзнoй нaдстрoйкoй «Пaкeт aнaлизa». Для eгo aктивaции нужнo:
- с вклaдки «Фaйл» пeрeйти в рaздeл «Пaрaмeтры»;
- в oткрывшeмся oкнe выбрaть стрoку «Нaдстрoйки»;
- щeлкнуть пo кнoпкe «Пeрeйти», рaспoлoжeннoй внизу, спрaвa oт стрoки «Упрaвлeниe»;
- пoстaвить гaлoчку рядoм с нaзвaниeм «Пaкeт aнaлизa» и пoдтвeрдить свoи дeйствия, нaжaв «oк».
eсли всe сдeлaнo прaвильнo, в прaвoй чaсти вклaдки «Дaнныe», рaспoлoжeннoм нaд рaбoчим листoм «Эксeль», пoявится нужнaя кнoпкa.
Линeйнaя рeгрeссия в Excel
Тeпeрь, кoгдa пoд рукoй eсть всe нeoбхoдимыe виртуaльныe инструмeнты для oсущeствлeния экoнoмeтричeских рaсчeтoв, мoжeм приступить к рeшeнию нaшeй зaдaчи. Для этoгo:
- щeлкaeм пo кнoпкe «aнaлиз дaнных»;
- в oткрывшeмся oкнe нaжимaeм нa кнoпку «Рeгрeссия»;
- в пoявившуюся вклaдку ввoдим диaпaзoн знaчeний для Y (кoличeствo увoлившихся рaбoтникoв) и для X (их зaрплaты);
- пoдтвeрждaeм свoи дeйствия нaжaтиeм кнoпки «Ok».
В рeзультaтe прoгрaммa aвтoмaтичeски зaпoлнит нoвый лист тaбличнoгo прoцeссoрa дaнными aнaлизa рeгрeссии. oбрaтитe внимaниe! В Excel eсть вoзмoжнoсть сaмoстoятeльнo зaдaть мeстo, кoтoрoe вы прeдпoчитaeтe для этoй цeли. Нaпримeр, этo мoжeт быть тoт жe лист, гдe нaхoдятся знaчeния Y и X, или дaжe нoвaя книгa, спeциaльнo прeднaзнaчeннaя для хрaнeния пoдoбных дaнных.
aнaлиз рeзультaтoв рeгрeссии для R-квaдрaтa
В Excel дaнныe пoлучeнныe в хoдe oбрaбoтки дaнных рaссмaтривaeмoгo примeрa имeют вид:
Прeждe всeгo, слeдуeт oбрaтить внимaниe нa знaчeниe R-квaдрaтa. oн прeдстaвляeт сoбoй кoэффициeнт дeтeрминaции. В дaннoм примeрe R-квaдрaт = 0,755 (75,5%), т. e. рaсчeтныe пaрaмeтры мoдeли oбъясняют зaвисимoсть мeжду рaссмaтривaeмыми пaрaмeтрaми нa 75,5 %.
Чeм вышe знaчeниe кoэффициeнтa дeтeрминaции, тeм выбрaннaя мoдeль считaeтся бoлee примeнимoй для кoнкрeтнoй зaдaчи. Считaeтся, чтo oнa кoррeктнo oписывaeт рeaльную ситуaцию при знaчeнии R-квaдрaтa вышe 0,8.
eсли R-квaдрaтa tкр, тo гипoтeзa o нeзнaчимoсти свoбoднoгo члeнa линeйнoгo урaвнeния oтвeргaeтся.
В рaссмaтривaeмoй зaдaчe для свoбoднoгo члeнa пoсрeдствoм инструмeнтoв «Эксeль» былo пoлучeнo, чтo t=169,20903, a p=2,89e-12, т. e.
имeeм нулeвую вeрoятнoсть тoгo, чтo будeт oтвeргнутa вeрнaя гипoтeзa o нeзнaчимoсти свoбoднoгo члeнa. Для кoэффициeнтa при нeизвeстнoй t=5,79405, a p=0,001158.
Иными слoвaми вeрoятнoсть тoгo, чтo будeт oтвeргнутa вeрнaя гипoтeзa o нeзнaчимoсти кoэффициeнтa при нeизвeстнoй, рaвнa 0,12%.
Тaким oбрaзoм, мoжнo утвeрждaть, чтo пoлучeннoe урaвнeниe линeйнoй рeгрeссии aдeквaтнo.
Зaдaчa o цeлeсooбрaзнoсти пoкупки пaкeтa aкций
Мнoжeствeннaя рeгрeссия в Excel выпoлняeтся с испoльзoвaниeм всe тoгo жe инструмeнтa «aнaлиз дaнных». Рaссмoтрим кoнкрeтную приклaдную зaдaчу.
Рукoвoдствo кoмпaния «NNN» дoлжнo принять рeшeниe o цeлeсooбрaзнoсти пoкупки 20 % пaкeтa aкций ao «MMM». Стoимoсть пaкeтa (СП) сoстaвляeт 70 млн aмeрикaнских дoллaрoв. Спeциaлистaми «NNN» сoбрaны дaнныe oб aнaлoгичных сдeлкaх. Былo принятo рeшeниe oцeнивaть стoимoсть пaкeтa aкций пo тaким пaрaмeтрaм, вырaжeнным в миллиoнaх aмeрикaнских дoллaрoв, кaк:
- крeдитoрскaя зaдoлжeннoсть (VK);
- oбъeм гoдoвoгo oбoрoтa (VO);
- дeбитoрскaя зaдoлжeннoсть (VD);
- стoимoсть oснoвных фoндoв (СoФ).
Крoмe тoгo, испoльзуeтся пaрaмeтр зaдoлжeннoсть прeдприятия пo зaрплaтe (V3 П) в тысячaх aмeрикaнских дoллaрoв.
Рeшeниe срeдствaми тaбличнoгo прoцeссoрa Excel
Прeждe всeгo, нeoбхoдимo сoстaвить тaблицу исхoдных дaнных. oнa имeeт слeдующий вид:
Дaлee:
- вызывaют oкнo «aнaлиз дaнных»;
- выбирaют рaздeл «Рeгрeссия»;
- в oкoшкo «Вхoднoй интeрвaл Y» ввoдят диaпaзoн знaчeний зaвисимых пeрeмeнных из стoлбцa G;
- щeлкaют пo икoнкe с крaснoй стрeлкoй спрaвa oт oкнa «Вхoднoй интeрвaл X» и выдeляют нa листe диaпaзoн всeх знaчeний из стoлбцoв B,C, D, F.
oтмeчaют пункт «Нoвый рaбoчий лист» и нaжимaют «Ok».
Пoлучaют aнaлиз рeгрeссии для дaннoй зaдaчи.
Изучeниe рeзультaтoв и вывoды
- «Сoбирaeм» из oкруглeнных дaнных, прeдстaвлeнных вышe нa листe тaбличнoгo прoцeссoрa Excel, урaвнeниe рeгрeссии:
- СП = 0,103*СoФ + 0,541*VO – 0,031*VK +0,405*VD +0,691*VZP – 265,844.
- В бoлee привычнoм мaтeмaтичeскoм видe eгo мoжнo зaписaть, кaк:
- y = 0,103*x1 + 0,541*x2 – 0,031*x3 +0,405*x4 +0,691*x5 – 265,844
- Дaнныe для ao «MMM» прeдстaвлeны в тaблицe:
- СoФ, USD
- VO, USD
- VK, USD
- VD, USD
- VZP, USD
- СП, USD
- 102,5
- 535,5
- 45,2
- 41,5
- 21,55
- 64,72
Пoдстaвив их в урaвнeниe рeгрeссии, пoлучaют цифру в 64,72 млн aмeрикaнских дoллaрoв. Этo знaчит, чтo aкции ao «MMM» нe стoит приoбрeтaть, тaк кaк их стoимoсть в 70 млн aмeрикaнских дoллaрoв дoстaтoчнo зaвышeнa.
Кaк видим, испoльзoвaниe тaбличнoгo прoцeссoрa «Эксeль» и урaвнeния рeгрeссии пoзвoлилo принять oбoснoвaннoe рeшeниe oтнoситeльнo цeлeсooбрaзнoсти впoлнe кoнкрeтнoй сдeлки.
Тeпeрь вы знaeтe, чтo тaкoe рeгрeссия. Примeры в Excel, рaссмoтрeнныe вышe, пoмoгут вaм в рeшeниe прaктичeских зaдaч из oблaсти экoнoмeтрики.
Источник: https://xroom.su/regressiia-v-excel-yravnenie-primery-lineinaia-regressiia/
Регрессия в Excel: уравнение, примеры. Линейная регрессия
Регрессионный анализ — это статистический метод исследования, позволяющий показать зависимость того или иного параметра от одной либо нескольких независимых переменных.
В докомпьютерную эру его применение было достаточно затруднительно, особенно если речь шла о больших объемах данных. Сегодня, узнав как построить регрессию в Excel, можно решать сложные статистические задачи буквально за пару минут.
Ниже представлены конкретные примеры из области экономики.
Рассмотрим задачу определения зависимости количества уволившихся членов коллектива от средней зарплаты на 6 промышленных предприятиях.
- B
- C
- 1
- Х
- Количество уволившихся
- Зарплата
- 2
- y
- 30000 рублей
- 3
- 1
- 60
- 35000 рублей
- 4
- 2
- 35
- 40000 рублей
- 5
- 3
- 20
- 45000 рублей
- 6
- 4
- 20
- 50000 рублей
- 7
- 5
- 15
- 55000 рублей
- 8
- 6
- 15
- 60000 рублей
- Для задачи определения зависимости количества уволившихся работников от средней зарплаты на 6 предприятиях модель регрессии имеет вид уравнения Y = а0 + а1×1 +…+аkxk, где хi — влияющие переменные, ai — коэффициенты регрессии, a k — число факторов.
- Для данной задачи Y — это показатель уволившихся сотрудников, а влияющий фактор — зарплата, которую обозначаем X.
Использование возможностей табличного процессора «Эксель»
Анализу регрессии в Excel должно предшествовать применение к имеющимся табличным данным встроенных функций. Однако для этих целей лучше воспользоваться очень полезной надстройкой «Пакет анализа». Для его активации нужно:
- с вкладки «Файл» перейти в раздел «Параметры»;
- в открывшемся окне выбрать строку «Надстройки»;
- щелкнуть по кнопке «Перейти», расположенной внизу, справа от строки «Управление»;
- поставить галочку рядом с названием «Пакет анализа» и подтвердить свои действия, нажав «Ок».
Если все сделано правильно, в правой части вкладки «Данные», расположенном над рабочим листом «Эксель», появится нужная кнопка.
Линейная регрессия в Excel
Теперь, когда под рукой есть все необходимые виртуальные инструменты для осуществления эконометрических расчетов, можем приступить к решению нашей задачи. Для этого:
- щелкаем по кнопке «Анализ данных»;
- в открывшемся окне нажимаем на кнопку «Регрессия»;
- в появившуюся вкладку вводим диапазон значений для Y (количество уволившихся работников) и для X (их зарплаты);
- подтверждаем свои действия нажатием кнопки «Ok».
В результате программа автоматически заполнит новый лист табличного процессора данными анализа регрессии. Обратите внимание! В Excel есть возможность самостоятельно задать место, которое вы предпочитаете для этой цели. Например, это может быть тот же лист, где находятся значения Y и X, или даже новая книга, специально предназначенная для хранения подобных данных.
Анализ результатов регрессии для R-квадрата
В Excel данные полученные в ходе обработки данных рассматриваемого примера имеют вид:
Прежде всего, следует обратить внимание на значение R-квадрата. Он представляет собой коэффициент детерминации. В данном примере R-квадрат = 0,755 (75,5%), т. е. расчетные параметры модели объясняют зависимость между рассматриваемыми параметрами на 75,5 %.
Чем выше значение коэффициента детерминации, тем выбранная модель считается более применимой для конкретной задачи. Считается, что она корректно описывает реальную ситуацию при значении R-квадрата выше 0,8.
Если R-квадрата tкр, то гипотеза о незначимости свободного члена линейного уравнения отвергается.
В рассматриваемой задаче для свободного члена посредством инструментов «Эксель» было получено, что t=169,20903, а p=2,89Е-12, т. е.
имеем нулевую вероятность того, что будет отвергнута верная гипотеза о незначимости свободного члена. Для коэффициента при неизвестной t=5,79405, а p=0,001158.
Иными словами вероятность того, что будет отвергнута верная гипотеза о незначимости коэффициента при неизвестной, равна 0,12%.
Таким образом, можно утверждать, что полученное уравнение линейной регрессии адекватно.
Задача о целесообразности покупки пакета акций
Множественная регрессия в Excel выполняется с использованием все того же инструмента «Анализ данных». Рассмотрим конкретную прикладную задачу.
Руководство компания «NNN» должно принять решение о целесообразности покупки 20 % пакета акций АО «MMM». Стоимость пакета (СП) составляет 70 млн американских долларов. Специалистами «NNN» собраны данные об аналогичных сделках. Было принято решение оценивать стоимость пакета акций по таким параметрам, выраженным в миллионах американских долларов, как:
- кредиторская задолженность (VK);
- объем годового оборота (VO);
- дебиторская задолженность (VD);
- стоимость основных фондов (СОФ).
Кроме того, используется параметр задолженность предприятия по зарплате (V3 П) в тысячах американских долларов.
Решение средствами табличного процессора Excel
Прежде всего, необходимо составить таблицу исходных данных. Она имеет следующий вид:
Далее:
- вызывают окно «Анализ данных»;
- выбирают раздел «Регрессия»;
- в окошко «Входной интервал Y» вводят диапазон значений зависимых переменных из столбца G;
- щелкают по иконке с красной стрелкой справа от окна «Входной интервал X» и выделяют на листе диапазон всех значений из столбцов B,C, D, F.
Отмечают пункт «Новый рабочий лист» и нажимают «Ok».
Получают анализ регрессии для данной задачи.
Изучение результатов и выводы
- «Собираем» из округленных данных, представленных выше на листе табличного процессора Excel, уравнение регрессии:
- СП = 0,103*СОФ + 0,541*VO – 0,031*VK +0,40 VD +0,691*VZP – 265,844.
- В более привычном математическом виде его можно записать, как:
- y = 0,103*x1 + 0,541*x2 – 0,031*x3 +0,40 x4 +0,691*x5 – 265,844
- Данные для АО «MMM» представлены в таблице:
СОФ, USD | VO, USD | VK, USD | VD, USD | VZP, USD | СП, USD |
102,5 | 535,5 | 45,2 | 41,5 | 21,55 | 64,72 |
Подставив их в уравнение регрессии, получают цифру в 64,72 млн американских долларов. Это значит, что акции АО «MMM» не стоит приобретать, так как их стоимость в 70 млн американских долларов достаточно завышена.
Как видим, использование табличного процессора «Эксель» и уравнения регрессии позволило принять обоснованное решение относительно целесообразности вполне конкретной сделки.
Теперь вы знаете, что такое регрессия. Примеры в Excel, рассмотренные выше, помогут вам в решение практических задач из области эконометрики.
Источник: https://autogear.ru/article/322/644/regressiya-v-excel-uravnenie-primeryi-lineynaya-regressiya/
Построение регрессии в excel. Уравнение регрессии как сделать в excel
Регрессионный анализ в Microsoft Excel – наиболее полное руководств по использованию MS Excel для решения задач регрессионного анализа в области бизнес-аналитики.
Конрад Карлберг доступно объясняет теоретические вопросы, знание которых поможет вам избежать многих ошибок как при самостоятельном проведении регрессионного анализа, так и при оценке результатов анализа, выполненного другими людьми.
Весь материал, от простых корреляций и t-тестов до множественного ковариационного анализа, основан на реальных примерах и сопровождается подробным описанием соответствующих пошаговых процедур.
В книге обсуждаются особенности и противоречия, связанные с функциями Excel для работы с регрессией, рассматриваются последствия использования каждой их опции и каждого аргумента и объясняется, как надежно применять регрессионные методы в самых разных областях, от медицинских исследований до финансового анализа.
Конрад Карлберг. Регрессионный анализ в Microsoft Excel. – М.: Диалектика, 2017. – 400 с.
Скачать заметку в формате или , примеры в формате
Глава 1. Оценка изменчивости данных
В распоряжении статистиков имеется множество показателей вариации (изменчивости). Один из них – сумма квадратов отклонений индивидуальных значений от среднего. В Excel для него используется функция КВАДРОТКЛ().
Но чаще используется дисперсия. Дисперсия — это среднее квадратов отклонений.
Дисперсия нечувствительна к количеству значений в исследуемом наборе данных (в то время как сумма квадратов отклонений растет с числом измерений).
Программа Excel предлагает две функции, возвращающие дисперсию: ДИСП.Г() и ДИСП.В():
- Используйте функцию ДИСП.Г(), если подлежащие обработке значения образуют генеральную совокупность. Т.е., значения, содержащиеся в диапазоне, являются единственными значениями, которые вас интересуют.
- Используйте функцию ДИСП.В(), если подлежащие обработке значения образуют выборку из совокупности большего объема. Предполагается, что имеются дополнительные значения, дисперсию которых вы также можете оценить.
Если такая величина, как среднее значение или коэффициент корреляции, рассчитывается на основе генеральной совокупности, то она называется параметром. Аналогичная величина, рассчитываемая на основе выборки, называется статистикой.
Отсчитывая отклонения от среднего значения
в данном наборе, вы получите сумму квадратов отклонений меньшей величины, чем если бы отсчитывали их от любого другого значения. Аналогичное утверждение справедливо и для дисперсии.
Чем больше объем выборки, тем точнее рассчитанное значение статистики. Но не существует ни одной выборки с объемом меньше объема генеральной совокупности, относительно которой вы могли бы быть уверены в том, что значение статистики совпадает со значением параметра.
Допустим, у вас есть набор из 100 значений роста, среднее которых отличается от среднего по генеральной совокупности, каким бы малым ни было это различие. Рассчитав дисперсию для выборки, вы получите некоторое ее значение, скажем, 4.
Это значение меньше любого другого, которое можно получить, рассчитывая отклонение каждого из 100 значений роста относительно любого значения, отличного от среднего по выборке, в там числе и относительно истинного среднего по генеральной совокупности.
Поэтому вычисленная дисперсия будет отличаться, причем в меньшую сторону, от дисперсии, которую вы получили бы, если бы каким-то образом узнали и использовали не выборочное среднее, а параметр генеральной совокупности.
Средняя сумма квадратов, определенная для выборки, дает нижнюю оценку дисперсии генеральной совокупности. Вычисленную таким способом дисперсию называют смещенной
оценкой. Оказывается, чтобы исключить смещение и получить несмещенную оценку, достаточно разделить сумму квадратов отклонений не на n
, где n
— размер выборки, а на n – 1
.
Величина n – 1
называется количеством (числом) степеней свободы. Существуют разные способы расчета этой величины, хотя все они включают либо вычитание некоторого числа из размера выборки, либо подсчет количества категорий, в которые попадают наблюдения.
Суть различия между функциями ДИСП.Г() и ДИСП.В() состоит в следующем:
- В функции ДИСП.Г() сумма квадратов делится на количество наблюдений и, следовательно, представляет смещенную оценку дисперсии, истинное среднее.
- В функции ДИСП.В() сумма квадратов делится на количество наблюдений минус 1, т.е. на количество степеней свободы, что дает более точную, несмещенную оценку дисперсии генеральной совокупности, из которой была извлечена данная выборка.
Стандартное отклонение (англ. standard deviation
, SD) – есть квадратный корень из дисперсии:
Возведение отклонений в квадрат переводит шкалу измерений в другую метрику, являющуюся квадратом исходной: метры — в квадратные метры, доллары — в квадратные доллары и т.д. Стандартное отклонение — это корень квадратный из дисперсии, и поэтому оно возвращает нас к исходным единицам измерения. Что удобнее.
Часто приходится рассчитывать стандартное отклонение после того, как данных были подвергнуты некоторым манипуляциям.
И хотя в этих случаях результаты несомненно являются стандартными отклонениями, их принято называть стандартными ошибками
.
Существует несколько разновидностей стандартных ошибок, в том числе стандартная ошибка измерения, стандартная ошибка пропорции, стандартная ошибка среднего.
Предположим, вы собрали данные о росте 25 случайно выбранных взрослых мужчин в каждом из 50 штатов. Далее вы вычисляете средний рост взрослых мужчин в каждом штате. Полученные 50 средних значений в свою очередь можно считать наблюдениями.
Исходя из этого, вы могли бы рассчитать их стандартное отклонение, которое и является стандартной ошибкой среднего
. Рис. 1. позволяет сравнить распределение 1250 исходных индивидуальных значений (данные о росте 25 мужчин по каждому из 50 штатов) с распределением средних значений 50 штатов.
Формула для оценки стандартной ошибки среднего (т.е. стандартного отклонения средних значений, а не индивидуальных наблюдений):
где – стандартная ошибка среднего; s
– стандартное отклонение исходных наблюдений; n
– количество наблюдений в выборке.
Рис. 1. Вариация средних значений от штата к штату значительно меньше вариации индивидуальных результатов наблюдений
В статистике существует соглашение относительно использования греческих и латинских букв для обозначения статистических величин. Греческими буквами принято обозначать параметры генеральной совокупности, латинскими — выборочные статистики.
Следовательно, если речь идет о стандартном отклонении генеральной совокупности, мы записываем его как σ; если же рассматривается стандартное отклонение выборки, то используем обозначение s. Что касается символов для обозначения средних, то они согласуются между собой не столь удачно.
Среднее по генеральной совокупности обозначается греческой буквой μ. Однако для представления выборочного среднего традиционно используется символ X̅.
z-оценка
выражает положение наблюдения в распределении в единицах стандартного отклонения. Например, z = 1,5 означает, что наблюдение отстоит от среднего на 1,5 стандартного отклонения в сторону больших значений. Термин z-оценка
Источник: https://nc1.ru/vitamins-and-dietary-supplements/postroenie-regressii-v-excel-uravnenie-regressii-kak-sdelat-v-excel/
Содержание
- 1 Подключение пакета анализа
- 2 Виды регрессионного анализа
- 3 Линейная регрессия в программе Excel
- 4 Разбор результатов анализа
- 4.1 Помогла ли вам эта статья?
- 5 Использование Excel для определения линейной регрессии
- 6 Виды регрессии
- 7 Пример 1
- 8 Использование возможностей табличного процессора «Эксель»
- 9 Линейная регрессия в Excel
- 10 Анализ результатов регрессии для R-квадрата
- 11 Задача о целесообразности покупки пакета акций
- 12 Решение средствами табличного процессора Excel
- 13 Изучение результатов и выводы
Регрессионный анализ является одним из самых востребованных методов статистического исследования. С его помощью можно установить степень влияния независимых величин на зависимую переменную. В функционале Microsoft Excel имеются инструменты, предназначенные для проведения подобного вида анализа. Давайте разберем, что они собой представляют и как ими пользоваться.
Подключение пакета анализа
Но, для того, чтобы использовать функцию, позволяющую провести регрессионный анализ, прежде всего, нужно активировать Пакет анализа. Только тогда необходимые для этой процедуры инструменты появятся на ленте Эксель.
- Перемещаемся во вкладку «Файл».
- Переходим в раздел «Параметры».
- Открывается окно параметров Excel. Переходим в подраздел «Надстройки».
- В самой нижней части открывшегося окна переставляем переключатель в блоке «Управление» в позицию «Надстройки Excel», если он находится в другом положении. Жмем на кнопку «Перейти».
- Открывается окно доступных надстроек Эксель. Ставим галочку около пункта «Пакет анализа». Жмем на кнопку «OK».
Теперь, когда мы перейдем во вкладку «Данные», на ленте в блоке инструментов «Анализ» мы увидим новую кнопку – «Анализ данных».
Виды регрессионного анализа
Существует несколько видов регрессий:
- параболическая;
- степенная;
- логарифмическая;
- экспоненциальная;
- показательная;
- гиперболическая;
- линейная регрессия.
О выполнении последнего вида регрессионного анализа в Экселе мы подробнее поговорим далее.
Внизу, в качестве примера, представлена таблица, в которой указана среднесуточная температура воздуха на улице, и количество покупателей магазина за соответствующий рабочий день. Давайте выясним при помощи регрессионного анализа, как именно погодные условия в виде температуры воздуха могут повлиять на посещаемость торгового заведения.
Общее уравнение регрессии линейного вида выглядит следующим образом: У = а0 + а1х1 +…+акхк
. В этой формуле Y означает переменную, влияние факторов на которую мы пытаемся изучить. В нашем случае, это количество покупателей. Значение x – это различные факторы, влияющие на переменную. Параметры a являются коэффициентами регрессии. То есть, именно они определяют значимость того или иного фактора. Индекс k обозначает общее количество этих самых факторов.
- Кликаем по кнопке «Анализ данных». Она размещена во вкладке «Главная» в блоке инструментов «Анализ».
- Открывается небольшое окошко. В нём выбираем пункт «Регрессия». Жмем на кнопку «OK».
- Открывается окно настроек регрессии. В нём обязательными для заполнения полями являются «Входной интервал Y» и «Входной интервал X». Все остальные настройки можно оставить по умолчанию.
В поле «Входной интервал Y» указываем адрес диапазона ячеек, где расположены переменные данные, влияние факторов на которые мы пытаемся установить. В нашем случае это будут ячейки столбца «Количество покупателей». Адрес можно вписать вручную с клавиатуры, а можно, просто выделить требуемый столбец. Последний вариант намного проще и удобнее.
В поле «Входной интервал X» вводим адрес диапазона ячеек, где находятся данные того фактора, влияние которого на переменную мы хотим установить. Как говорилось выше, нам нужно установить влияние температуры на количество покупателей магазина, а поэтому вводим адрес ячеек в столбце «Температура». Это можно сделать теми же способами, что и в поле «Количество покупателей».
С помощью других настроек можно установить метки, уровень надёжности, константу-ноль, отобразить график нормальной вероятности, и выполнить другие действия. Но, в большинстве случаев, эти настройки изменять не нужно. Единственное на что следует обратить внимание, так это на параметры вывода. По умолчанию вывод результатов анализа осуществляется на другом листе, но переставив переключатель, вы можете установить вывод в указанном диапазоне на том же листе, где расположена таблица с исходными данными, или в отдельной книге, то есть в новом файле.
После того, как все настройки установлены, жмем на кнопку «OK».
Разбор результатов анализа
Результаты регрессионного анализа выводятся в виде таблицы в том месте, которое указано в настройках.
Одним из основных показателей является R-квадрат. В нем указывается качество модели. В нашем случае данный коэффициент равен 0,705 или около 70,5%. Это приемлемый уровень качества. Зависимость менее 0,5 является плохой.
Ещё один важный показатель расположен в ячейке на пересечении строки «Y-пересечение» и столбца «Коэффициенты». Тут указывается какое значение будет у Y, а в нашем случае, это количество покупателей, при всех остальных факторах равных нулю. В этой таблице данное значение равно 58,04.
Значение на пересечении граф «Переменная X1» и «Коэффициенты» показывает уровень зависимости Y от X. В нашем случае — это уровень зависимости количества клиентов магазина от температуры. Коэффициент 1,31 считается довольно высоким показателем влияния.
Как видим, с помощью программы Microsoft Excel довольно просто составить таблицу регрессионного анализа. Но, работать с полученными на выходе данными, и понимать их суть, сможет только подготовленный человек.
Мы рады, что смогли помочь Вам в решении проблемы.
Задайте свой вопрос в комментариях, подробно расписав суть проблемы. Наши специалисты постараются ответить максимально быстро.
Помогла ли вам эта статья?
Да Нет
Метод линейной регрессии позволяет нам описывать прямую линию, максимально соответствующую ряду упорядоченных пар (x, y). Уравнение для прямой линии, известное как линейное уравнение, представлено ниже:
ŷ = a + bx
где:
ŷ — ожидаемое значение у при заданном значении х,
x — независимая переменная,
a — отрезок на оси y для прямой линии,
b — наклон прямой линии.
На рисунке ниже это понятие представлено графически:
На рисунке выше показана линия, описанная уравнением ŷ =2+0.5х. Отрезок на оси у — это точка пересечения линией оси у; в нашем случае а = 2. Наклон линии, b, отношение подъема линии к длине линии, имеет значение 0.5. Положительный наклон означает, что линия поднимается слева направо. Если b = 0, линия горизонтальна, а это значит, что между зависимой и независимой переменными нет никакой связи. Иными словами, изменение значения x не влияет на значение y.
Часто путают ŷ и у. На графике показаны 6 упорядоченных пар точек и линия, в соответствии с данным уравнением
ŷ = 2 + 0.5x
На этом рисунке показана точка, соответствующая упорядоченной паре х = 2 и у = 4. Обратите внимание, что ожидаемое значение у в соответствии с линией при х = 2 является ŷ. Мы можем подтвердить это с помощью следующего уравнения:
ŷ = 2 + 0.5х =2 +0.5(2) =3.
Значение у представляет собой фактическую точку, а значение ŷ — это ожидаемое значение у с использованием линейного уравнения при заданном значении х.
Следующий шаг — определить линейное уравнение, максимально соответствующее набору упорядоченных пар, об этом мы говорили в предыдущей статье, где определяли вид уравнения по методу наименьших квадратов.
Использование Excel для определения линейной регрессии
Для того, чтобы воспользоваться инструментом регрессионного анализа встроенного в Excel, необходимо активировать надстройку Пакет анализа. Найти ее можно, перейдя по вкладке Файл –> Параметры (2007+), в появившемся диалоговом окне Параметры Excel переходим во вкладку Надстройки. В поле Управление выбираем Надстройки Excel и щелкаем Перейти. В появившемся окне ставим галочку напротив Пакет анализа, жмем ОК.
Во вкладке Данные в группе Анализ появится новая кнопка Анализ данных.
Чтобы продемонстрировать работу надстройки, воспользуемся данными с предыдущей статьи, где парень и девушка делят столик в ванной. Введите данные нашего примера с ванной в столбцы А и В чистого листа.
Перейдите во вкладку Данные, в группе Анализ щелкните Анализ данных. В появившемся окне Анализ данных выберите Регрессия, как показано на рисунке, и щелкните ОК.
Установите необходимыe параметры регрессии в окне Регрессия, как показано на рисунке:
Щелкните ОК. На рисунке ниже показаны полученные результаты:
Эти результаты соответствуют тем, которые мы получили путем самостоятельных вычислений в предыдущей статье.
Регрессионный анализ — это статистический метод исследования, позволяющий показать зависимость того или иного параметра от одной либо нескольких независимых переменных. В докомпьютерную эру его применение было достаточно затруднительно, особенно если речь шла о больших объемах данных. Сегодня, узнав как построить регрессию в Excel, можно решать сложные статистические задачи буквально за пару минут. Ниже представлены конкретные примеры из области экономики.
Виды регрессии
Само это понятие было введено в математику Фрэнсисом Гальтоном в 1886 году. Регрессия бывает:
- линейной;
- параболической;
- степенной;
- экспоненциальной;
- гиперболической;
- показательной;
- логарифмической.
Пример 1
Рассмотрим задачу определения зависимости количества уволившихся членов коллектива от средней зарплаты на 6 промышленных предприятиях.
Задача. На шести предприятиях проанализировали среднемесячную заработную плату и количество сотрудников, которые уволились по собственному желанию. В табличной форме имеем:
A |
B |
C |
|
Х |
Количество уволившихся |
Зарплата |
|
y |
30000 рублей |
||
35000 рублей |
|||
40000 рублей |
|||
45000 рублей |
|||
50000 рублей |
|||
55000 рублей |
|||
60000 рублей |
Для задачи определения зависимости количества уволившихся работников от средней зарплаты на 6 предприятиях модель регрессии имеет вид уравнения Y = а0 + а1×1 +…+аkxk, где хi — влияющие переменные, ai — коэффициенты регрессии, a k — число факторов.
Для данной задачи Y — это показатель уволившихся сотрудников, а влияющий фактор — зарплата, которую обозначаем X.
Использование возможностей табличного процессора «Эксель»
Анализу регрессии в Excel должно предшествовать применение к имеющимся табличным данным встроенных функций. Однако для этих целей лучше воспользоваться очень полезной надстройкой «Пакет анализа». Для его активации нужно:
- с вкладки «Файл» перейти в раздел «Параметры»;
- в открывшемся окне выбрать строку «Надстройки»;
- щелкнуть по кнопке «Перейти», расположенной внизу, справа от строки «Управление»;
- поставить галочку рядом с названием «Пакет анализа» и подтвердить свои действия, нажав «Ок».
Если все сделано правильно, в правой части вкладки «Данные», расположенном над рабочим листом «Эксель», появится нужная кнопка.
Линейная регрессия в Excel
Теперь, когда под рукой есть все необходимые виртуальные инструменты для осуществления эконометрических расчетов, можем приступить к решению нашей задачи. Для этого:
- щелкаем по кнопке «Анализ данных»;
- в открывшемся окне нажимаем на кнопку «Регрессия»;
- в появившуюся вкладку вводим диапазон значений для Y (количество уволившихся работников) и для X (их зарплаты);
- подтверждаем свои действия нажатием кнопки «Ok».
В результате программа автоматически заполнит новый лист табличного процессора данными анализа регрессии. Обратите внимание! В Excel есть возможность самостоятельно задать место, которое вы предпочитаете для этой цели. Например, это может быть тот же лист, где находятся значения Y и X, или даже новая книга, специально предназначенная для хранения подобных данных.
Анализ результатов регрессии для R-квадрата
В Excel данные полученные в ходе обработки данных рассматриваемого примера имеют вид:
Прежде всего, следует обратить внимание на значение R-квадрата. Он представляет собой коэффициент детерминации. В данном примере R-квадрат = 0,755 (75,5%), т. е. расчетные параметры модели объясняют зависимость между рассматриваемыми параметрами на 75,5 %. Чем выше значение коэффициента детерминации, тем выбранная модель считается более применимой для конкретной задачи. Считается, что она корректно описывает реальную ситуацию при значении R-квадрата выше 0,8. Если R-квадрата tкр, то гипотеза о незначимости свободного члена линейного уравнения отвергается.
В рассматриваемой задаче для свободного члена посредством инструментов «Эксель» было получено, что t=169,20903, а p=2,89Е-12, т. е. имеем нулевую вероятность того, что будет отвергнута верная гипотеза о незначимости свободного члена. Для коэффициента при неизвестной t=5,79405, а p=0,001158. Иными словами вероятность того, что будет отвергнута верная гипотеза о незначимости коэффициента при неизвестной, равна 0,12%.
Таким образом, можно утверждать, что полученное уравнение линейной регрессии адекватно.
Задача о целесообразности покупки пакета акций
Множественная регрессия в Excel выполняется с использованием все того же инструмента «Анализ данных». Рассмотрим конкретную прикладную задачу.
Руководство компания «NNN» должно принять решение о целесообразности покупки 20 % пакета акций АО «MMM». Стоимость пакета (СП) составляет 70 млн американских долларов. Специалистами «NNN» собраны данные об аналогичных сделках. Было принято решение оценивать стоимость пакета акций по таким параметрам, выраженным в миллионах американских долларов, как:
- кредиторская задолженность (VK);
- объем годового оборота (VO);
- дебиторская задолженность (VD);
- стоимость основных фондов (СОФ).
Кроме того, используется параметр задолженность предприятия по зарплате (V3 П) в тысячах американских долларов.
Решение средствами табличного процессора Excel
Прежде всего, необходимо составить таблицу исходных данных. Она имеет следующий вид:
Далее:
- вызывают окно «Анализ данных»;
- выбирают раздел «Регрессия»;
- в окошко «Входной интервал Y» вводят диапазон значений зависимых переменных из столбца G;
- щелкают по иконке с красной стрелкой справа от окна «Входной интервал X» и выделяют на листе диапазон всех значений из столбцов B,C, D, F.
Отмечают пункт «Новый рабочий лист» и нажимают «Ok».
Получают анализ регрессии для данной задачи.
Изучение результатов и выводы
«Собираем» из округленных данных, представленных выше на листе табличного процессора Excel, уравнение регрессии:
СП = 0,103*СОФ + 0,541*VO – 0,031*VK +0,405*VD +0,691*VZP – 265,844.
В более привычном математическом виде его можно записать, как:
y = 0,103*x1 + 0,541*x2 – 0,031*x3 +0,405*x4 +0,691*x5 – 265,844
Данные для АО «MMM» представлены в таблице:
СОФ, USD |
VO, USD |
VK, USD |
VD, USD |
VZP, USD |
СП, USD |
Подставив их в уравнение регрессии, получают цифру в 64,72 млн американских долларов. Это значит, что акции АО «MMM» не стоит приобретать, так как их стоимость в 70 млн американских долларов достаточно завышена.
Как видим, использование табличного процессора «Эксель» и уравнения регрессии позволило принять обоснованное решение относительно целесообразности вполне конкретной сделки.
Теперь вы знаете, что такое регрессия. Примеры в Excel, рассмотренные выше, помогут вам в решение практических задач из области эконометрики.
По территориям региона приводятся данные за 200Х г.
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного, руб., х | Среднедневная заработная плата, руб., у |
---|---|---|
1 | 78 | 133 |
2 | 82 | 148 |
3 | 87 | 134 |
4 | 79 | 154 |
5 | 89 | 162 |
6 | 106 | 195 |
7 | 67 | 139 |
8 | 88 | 158 |
9 | 73 | 152 |
10 | 87 | 162 |
11 | 76 | 159 |
12 | 115 | 173 |
Задание:
1. Постройте поле корреляции и сформулируйте гипотезу о форме связи.
2. Рассчитайте параметры уравнения линейной регрессии
.
3. Оцените тесноту связи с помощью показателей корреляции и детерминации.
4. Дайте с помощью среднего (общего) коэффициента эластичности сравнительную оценку силы связи фактора с результатом.
5. Оцените с помощью средней ошибки аппроксимации качество уравнений.
6. Оцените с помощью F-критерия Фишера статистическую надёжность результатов регрессионного моделирования.
7. Рассчитайте прогнозное значение результата, если прогнозное значение фактора увеличится на 10% от его среднего уровня. Определите доверительный интервал прогноза для уровня значимости .
8. Оцените полученные результаты, выводы оформите в аналитической записке.
Решение:
Решим данную задачу с помощью Excel.
1. Сопоставив имеющиеся данные х и у, например, ранжировав их в порядке возрастания фактора х, можно наблюдать наличие прямой зависимости между признаками, когда увеличение среднедушевого прожиточного минимума увеличивает среднедневную заработную плату. Исходя из этого, можно сделать предположение, что связь между признаками прямая и её можно описать уравнением прямой. Этот же вывод подтверждается и на основе графического анализа.
Чтобы построить поле корреляции можно воспользоваться ППП Excel. Введите исходные данные в последовательности: сначала х, затем у.
Выделите область ячеек, содержащую данные.
Затем выберете: Вставка / Точечная диаграмма / Точечная с маркерами как показано на рисунке 1.
Рисунок 1 Построение поля корреляции
Анализ поля корреляции показывает наличие близкой к прямолинейной зависимости, так как точки расположены практически по прямой линии.
2. Для расчёта параметров уравнения линейной регрессии
воспользуемся встроенной статистической функцией ЛИНЕЙН.
Для этого:
1) Откройте существующий файл, содержащий анализируемые данные;
2) Выделите область пустых ячеек 5×2 (5 строк, 2 столбца) для вывода результатов регрессионной статистики.
3) Активизируйте Мастер функций: в главном меню выберете Формулы / Вставить функцию.
4) В окне Категория выберете Статистические, в окне функция – ЛИНЕЙН. Щёлкните по кнопке ОК как показано на Рисунке 2;
Рисунок 2 Диалоговое окно «Мастер функций»
5) Заполните аргументы функции:
Известные значения у – диапазон, содержащий данные результативного признака;
Известные значения х – диапазон, содержащий данные факторного признака;
Константа – логическое значение, которое указывает на наличие или на отсутствие свободного члена в уравнении; если Константа = 1, то свободный член рассчитывается обычным образом, если Константа = 0, то свободный член равен 0;
Статистика – логическое значение, которое указывает, выводить дополнительную информацию по регрессионному анализу или нет. Если Статистика = 1, то дополнительная информация выводится, если Статистика = 0, то выводятся только оценки параметров уравнения.
Щёлкните по кнопке ОК;
Рисунок 3 Диалоговое окно аргументов функции ЛИНЕЙН
6) В левой верхней ячейке выделенной области появится первый элемент итоговой таблицы. Чтобы раскрыть всю таблицу, нажмите на клавишу <F2>, а затем на комбинацию клавиш <Ctrl>+<Shift>+<Enter>.
Дополнительная регрессионная статистика будет выводиться в порядке, указанном в следующей схеме:
Значение коэффициента b | Значение коэффициента a |
Стандартная ошибка b | Стандартная ошибка a |
Коэффициент детерминации R2 | Стандартная ошибка y |
F-статистика | Число степеней свободы df |
Регрессионная сумма квадратов | Остаточная сумма квадратов |
Рисунок 4 Результат вычисления функции ЛИНЕЙН
Получили уровнение регрессии:
Делаем вывод: С увеличением среднедушевого прожиточного минимума на 1 руб. среднедневная заработная плата возрастает в среднем на 0,92 руб.
3. Коэффициент детерминации означает, что 52% вариации заработной платы (у) объясняется вариацией фактора х – среднедушевого прожиточного минимума, а 48% — действием других факторов, не включённых в модель.
По вычисленному коэффициенту детерминации можно рассчитать коэффициент корреляции: .
Связь оценивается как тесная.
4. С помощью среднего (общего) коэффициента эластичности определим силу влияния фактора на результат.
Для уравнения прямой средний (общий) коэффициент эластичности определим по формуле:
Средние значения найдём, выделив область ячеек со значениями х, и выберем Формулы / Автосумма / Среднее, и то же самое произведём со значениями у.
Рисунок 5 Расчёт средних значений функции и аргумент
Таким образом, при изменении среднедушевого прожиточного минимума на 1% от своего среднего значения среднедневная заработная плата изменится в среднем на 0,51%.
С помощью инструмента анализа данных Регрессия можно получить:
— результаты регрессионной статистики,
— результаты дисперсионного анализа,
— результаты доверительных интервалов,
— остатки и графики подбора линии регрессии,
— остатки и нормальную вероятность.
Порядок действий следующий:
1) проверьте доступ к Пакету анализа. В главном меню последовательно выберите: Файл/Параметры/Надстройки.
2) В раскрывающемся списке Управление выберите пункт Надстройки Excel и нажмите кнопку Перейти.
3) В окне Надстройки установите флажок Пакет анализа, а затем нажмите кнопку ОК.
• Если Пакет анализа отсутствует в списке поля Доступные надстройки, нажмите кнопку Обзор, чтобы выполнить поиск.
• Если выводится сообщение о том, что пакет анализа не установлен на компьютере, нажмите кнопку Да, чтобы установить его.
4) В главном меню последовательно выберите: Данные / Анализ данных / Инструменты анализа / Регрессия, а затем нажмите кнопку ОК.
5) Заполните диалоговое окно ввода данных и параметров вывода:
Входной интервал Y – диапазон, содержащий данные результативного признака;
Входной интервал X – диапазон, содержащий данные факторного признака;
Метки – флажок, который указывает, содержит ли первая строка названия столбцов или нет;
Константа – ноль – флажок, указывающий на наличие или отсутствие свободного члена в уравнении;
Выходной интервал – достаточно указать левую верхнюю ячейку будущего диапазона;
6) Новый рабочий лист – можно задать произвольное имя нового листа.
Затем нажмите кнопку ОК.
Рисунок 6 Диалоговое окно ввода параметров инструмента Регрессия
Результаты регрессионного анализа для данных задачи представлены на рисунке 7.
Рисунок 7 Результат применения инструмента регрессия
5. Оценим с помощью средней ошибки аппроксимации качество уравнений. Воспользуемся результатами регрессионного анализа представленного на Рисунке 8.
Рисунок 8 Результат применения инструмента регрессия «Вывод остатка»
Составим новую таблицу как показано на рисунке 9. В графе С рассчитаем относительную ошибку аппроксимации по формуле:
Рисунок 9 Расчёт средней ошибки аппроксимации
Средняя ошибка аппроксимации рассчитывается по формуле:
Качество построенной модели оценивается как хорошее, так как не превышает 8 – 10%.
6. Из таблицы с регрессионной статистикой (Рисунок 4) выпишем фактическое значение F-критерия Фишера:
Поскольку при 5%-ном уровне значимости, то можно сделать вывод о значимости уравнения регрессии (связь доказана).
8. Оценку статистической значимости параметров регрессии проведём с помощью t-статистики Стьюдента и путём расчёта доверительного интервала каждого из показателей.
Выдвигаем гипотезу Н0 о статистически незначимом отличии показателей от нуля:
.
для числа степеней свободы
На рисунке 7 имеются фактические значения t-статистики:
t-критерий для коэффициента корреляции можно рассчитать двумя способами:
I способ:
где – случайная ошибка коэффициента корреляции.
Данные для расчёта возьмём из таблицы на Рисунке 7.
II способ:
Фактические значения t-статистики превосходят табличные значения:
Поэтому гипотеза Н0 отклоняется, то есть параметры регрессии и коэффициент корреляции не случайно отличаются от нуля, а статистически значимы.
Доверительный интервал для параметра a определяется как
Для параметра a 95%-ные границы как показано на рисунке 7 составили:
Доверительный интервал для коэффициента регрессии определяется как
Для коэффициента регрессии b 95%-ные границы как показано на рисунке 7 составили:
Анализ верхней и нижней границ доверительных интервалов приводит к выводу о том, что с вероятностью параметры a и b, находясь в указанных границах, не принимают нулевых значений, т.е. не являются статистически незначимыми и существенно отличны от нуля.
7. Полученные оценки уравнения регрессии позволяют использовать его для прогноза. Если прогнозное значение прожиточного минимума составит:
Тогда прогнозное значение прожиточного минимума составит:
Ошибку прогноза рассчитаем по формуле:
где
Дисперсию посчитаем также с помощью ППП Excel. Для этого:
1) Активизируйте Мастер функций: в главном меню выберете Формулы / Вставить функцию.
2) В окне Категория выберете Статистические, в окне функция – ДИСП.Г. Щёлкните по кнопке ОК.
3) Заполните диапазон, содержащий числовые данные факторного признака. Нажмите ОК.
Рисунок 10 Расчёт дисперсии
Получили значение дисперсии
Для подсчёта остаточной дисперсии на одну степень свободы воспользуемся результатами дисперсионного анализа как показано на Рисунке 7.
Доверительные интервалы прогноза индивидуальных значений у при с вероятностью 0,95 определяются выражением:
Интервал достаточно широк, прежде всего, за счёт малого объёма наблюдений. В целом выполненный прогноз среднемесячной заработной платы оказался надёжным.
Условие задачи взято из: Практикум по эконометрике: Учеб. пособие / И.И. Елисеева, С.В. Курышева, Н.М. Гордеенко и др.; Под ред. И.И. Елисеевой. – М.: Финансы и статистика, 2003. – 192 с.: ил.
КУРС
EXCEL ACADEMY
Научитесь использовать все прикладные инструменты из функционала MS Excel.
Любому бизнесу интересно заглянуть в будущее и правильно ответить на вопрос: «А сколько денег мы заработаем за следующий период?» Ответить на такого рода вопросы позволяют различные методики прогнозирования. В данной статье мы с вами рассмотрим несколько таких методик и произведем все необходимые расчеты в Excel. Еще больше про анализ данных в Excel мы рассказываем на нашем открытом курсе «Аналитика в Excel».
Постановка задачи
Исходные данные
Для начала, давайте определимся, какие у нас есть исходные данные и что нам нужно получить на выходе. Фактически, все что у нас есть, это некоторые исторические данные. Если мы говорим о прогнозировании продаж, то историческими данными будут продажи за предыдущие периоды.
Примечание. Собранные в разные моменты времени значения одной и той же величины образуют временной ряд. Каждое значение такого временного ряда называется измерением. Например: данные о продажах за последние 5 лет по месяцам — временной ряд; продажи за январь прошлого года — измерение.
Составляющие прогноза
Следующий шаг: давайте определимся, что нам нужно учесть при построении прогноза. Когда мы исследуем наши данные, нам необходимо учесть следующие факторы:
- Изменение нашей пронозируемой величины (например, продаж) подчиняется некоторому закону. Другими словами, в временном ряде можно проследить некую тенденцию. В математике такая тенденция называется трендом.
- Изменение значений в временном ряде может зависить от промежутка времени. Другими словами, при построении модели необходимо будет учесть коэффициент сезонности. Например, продажи арбузов в январе и августе не могут быть одинаковыми, т.к. это сезонный продукт и летом продажи значительно выше.
- Изменение значений в временном ряде периодически повторяется, т.е. наблюдается некоторая цикличность.
Эти три пункта в совокупность образуют регулярную составляющую временного ряда.
Примечание. Не обязательно все три элемента регулярной составляющей должны присутствовать в временном ряде.
Однако, помимо регулярной составляющей, в временном ряде присутствует еще некоторое случайное отклонение. Интуитивно это понятно – продажи могут зависеть от многих факторов, некоторые из которых могут быть случайными.
Вывод. Чтобы комплексно описать временной ряд, необходимо учесть 2 главных компонента: регулярную составляющую (тренд + сезонность + цикличность) и случайную составляющую.
Виды моделей
Следующий вопрос, на который нужно ответить при построении прогноза: “А какие модели временного ряда бывают?”
Обычно выделяют два основных вида:
- Аддитивная модель: Уровень временного ряда = Тренд + Сезонность + Случайные отклонения
- Мультипликативная модель: Уровень временного ряда = Тренд X Сезонность X Случайные отклонения
Иногда также выделают смешанную модель в отдельную группу:
- Смешанная модель: Уровень временного ряда = Тренд X Сезонность + Случайные отклонения
С моделями мы определились, но теперь возникает еще один вопрос: «А когда какую модель лучше использовать?»
Классический вариант такой:
— Аддитивная модель используется, если амплитуда колебаний более-менее постоянная;
— Мультипликативная – если амплитуда колебаний зависит от значения сезонной компоненты.
Пример:
Решение задачи с помощью Excel
Итак, необходимые теоретические знания мы с вами получили, пришло время применить их на практике. Мы будем с вами использовать классическую аддитивную модель для построения прогноза. Однако, мы построим с вами два прогноза:
- с использованием линейного тренда
- с использованием полиномиального тренда
Во всех руководствах, как правило, разбирается только линейный тренд, поэтому полиномиальная модель будет крайне полезна для вас и вашей работы!
КУРС
EXCEL ACADEMY
Научитесь использовать все прикладные инструменты из функционала MS Excel.
Модель с линейным трендом
Пусть у нас есть исходная информация по продажам за 2 года:
Учитывая, что мы используем линейный тренд, то нам необходимо найти коэффициенты уравнения
y = ax + b
где:
- y – значения продаж
- x – номер периода
- a – коэффициент наклона прямой тренда
- b – свободный член тренда
Рассчитать коэффициенты данного уравнения можно с помощью формулы массива и функции ЛИНЕЙН. Нам необходимо будет сделать следующую последовательность действий:
- Выделяем две ячейки рядом
- Ставим курсор в поле формул и вводим формулу =ЛИНЕЙН(C4:C27;B4:B27)
- Нажимаем Ctrl+Shift+Enter, чтобы активировать формулу массива
На выходе мы получили 2 числа: первое — коэффициент a, второе – свободный член b.
Теперь нам нужно рассчитать для каждого периода значение линейного тренда. Сделать это крайне просто — достаточно в полученное уравнение подставить известные номера периодов. Например, в нашем случае, мы прописываем формулу =B4*$F$4+$G$4 в ячейке I4 и протягиваем ее вниз по всем периодам.
Нам осталось рассчитать коэффициент сезонности для каждого периода. Учитывая, что у нас есть исторические данные за два года, разумно будет учесть это при расчете. Можем сделать следующим образом: в ячейке J4 прописываем формулу =(C4+C16)/СРЗНАЧ($C$4:$C$27)/2 и протягиваем вниз на 12 месяцев (т.е. до J15).
Что нам это дало? Мы посчитали, сколько суммарно продавалось каждый январь/каждый февраль и так далее, а потом разделили это на среднее значение продаж за все два периода.
То есть мы выяснили, как продажи двух январей отклонялись от средних продаж за два года, как продажи двух февралей отклонялись и так далее. Это и дает нам коэффициент сезонности. В конце формулы делим на 2, т.к. в расчете фигурировало 2 периода.
Примечание. Рассчитали только 12 коэффициентов, т.к. один коэффициент учитывает продажи сразу за 2 аналогичных периода.
Итак, теперь мы на финишной прямой. Нам осталось рассчитать тренд для будущих периодов и учесть коэффициент сезонности для них. Давайте амбициозно построим прогноз на год вперед.
Сначала создаем столбец, в котором прописываем номера будущих периодов. В нашем случае нумерация начинается с 25 периода.
Далее, для расчета значения тренда просто прописываем уже известную нам формулу =L4*$F$4+$G$4 и протягиваем вниз на все 12 прогнозируемых периодов.
И последний штрих — умножаем полученное значение на коэффициент сезонности. Вуаля, это и есть итоговый ответ в данной модели!
Модель с полиномиальным трендом
Конструкция, которую мы только что с вами построили, достаточно проста. Но у нее есть один большой минус — далеко не всегда она дает достоверные результаты.
Посмотрите сами, какая модель более точно аппроксимирует наши точки — линейный тренд (прямая зеленая линия) или полиномиальный тренд (красная кривая)? Ответ очевиден. Поэтому сейчас мы с вами и разберем, как построить полиномиальную модель в Excel.
Пусть все исходные данные у нас будут такими же. Для простоты модели будем учитывать только тренд, без сезонной составляющей.
Для начала давайте определимся, чем полиномиальный тренд отличается от обычного линейного. Правильно — формой уравнения. У линейного тренда мы разбирали обычный график прямой:
У полиномиального тренда же уравнение выглядит иначе:
где конечная степень определяется степенью полинома.
Т.е. для полинома 4 степени необходимо найти коэффициенты уравнения:
Согласитесь, выглядит немного страшно. Однако, ничего страшного нет, и мы с легкостью можем решить эту задачку с помощью уже известных нам методов.
- Ставим в ячейку F4 курсор и вводим формулу =ИНДЕКС(ЛИНЕЙН($C$4:$C$27;$B$4:$B$27^{1;2;3;4});1;1). Функция ЛИНЕЙН позволяет произвести расчет коэффициентов, а с помощью функции ИНДЕКС мы вытаскиваем нужный нам коэффициент. В данном случае за выбор коэффициента отвечает самый последний аргумент. У нас стоит 1 — это коэффициент при самой высокой степени (т.е. при 4 степени, коэффициент). Кстати, узнать о самых полезных математических формулах Excel можно в нашем бесплатном гайде «Математические функции Excel».
- Аналогично прописываем формулу =ИНДЕКС(ЛИНЕЙН($C$4:$C$27;$B$4:$B$27^{1;2;3;4});1;2) в ячейке ниже.
- Делаем такие же действия, пока не найдем все коэффициенты.
Кстати говоря, мы можем легко сами себя проверить. Давайте построим график наших продаж и добавим к нему полиномиальный тренд.
- Выделяем столбец с продажами
- Выбираем «Вставка» → «График» → «Точечный» → «Точечная диаграмма»
- Нажимаем на любую точку графика правой кнопкой мыши и выбираем «Добавить линию тренда»
- В открывшемся справа меню выбираем «Полиномиальная модель», меняем степень на 4 и ставим галочку на «Показывать уравнение на диаграмме»
Теперь вы наглядно можете видеть, как рассчитанный тренд аппроксимирует исходные данные и как выглядит само уравнение. Можно сравнить уравнение на графике с вашими коэффициентами. Сходится? Значит сделали все верно!
Помимо всего прочего, вы можете сразу оценить точность аппроксимации (не полностью, но хотя бы первично). Это делается с помощью коэффициента R^2. Тут у вас снова есть два пути:
- Вы можете вывести коэффициент на график, поставив галочку «Поместить на диаграмму величину достоверности аппроксимации»
- Вы можете рассчитать коэффициент R^2 самостоятельно по формуле =ИНДЕКС(ЛИНЕЙН($C$4:$C$27;$B$4:$B$27^{1;2;3;4};;1);3;1)
Заключение
Мы с вами подробно разобрали вопрос прогнозирования — изучили необходимые термины и виды моделей, построили аддитивную модель в Excel с использованием линейного и полиномиального тренда, а также научились отображать результаты своих вычислений на графиках. Все это позволит вам эффективно внедрять полученные знания на работе, усложнять существующие модели и уточнять прогнозы. Чем большим количеством методов и инструментов вы будете владеть, тем выше будет ваш профессиональный уровень и статус на рынке труда.
Если вас интересуют еще какие-то модели прогнозирования — напишите нам об этом, и мы постараемся осветить эти темы в дальнейших своих статьях! Или запишитесь на курс «Excel Academy» от SF Education, где мы рассказываем про возможности Excel, необходимые для анализа.
Автор: Алексанян Андрон, эксперт SF Education
КУРС
EXCEL ACADEMY
Научитесь использовать все прикладные инструменты из функционала MS Excel.
Блог SF Education
Data Science
5 примеров экономии времени в Excel
Что для работодателя главное в сотруднике? Добросовестность, ответственность, профессионализм и, конечно же, умение пользоваться отведенным временем! Предлагаем познакомиться с очень нужными, на наш взгляд,…