Метод наименьших квадратов примеры с решениями excel


Метод наименьших квадратов (МНК) основан на минимизации суммы квадратов отклонений выбранной функции от исследуемых данных. В этой статье аппроксимируем имеющиеся данные с помощью линейной функции

y

=

a

x

+

b

.


Метод наименьших квадратов

(англ.

Ordinary

Least

Squares

,

OLS

) является одним из базовых методов регрессионного анализа в части оценки неизвестных параметров

регрессионных моделей

по выборочным данным.

Рассмотрим приближение функциями, зависящими только от одной переменной:

  • Линейная: y=ax+b (эта статья)
  • Логарифмическая

    : y=a*Ln(x)+b

  • Степенная

    : y=a*x

    m

  • Экспоненциальная

    : y=a*EXP(b*x)+с

  • Квадратичная

    : y=ax

    2

    +bx+c


Примечание

: Случаи приближения полиномом с 3-й до 6-й степени рассмотрены в этой статье. Приближение тригонометрическим полиномом рассмотрено здесь.

Линейная зависимость

Нас интересует связь 2-х переменных

х

и

y

. Имеется предположение, что

y

зависит от

х

по линейному закону

y

=

ax

+

b

. Чтобы определить параметры этой взаимосвязи исследователь провел наблюдения: для каждого значения х

i

произведено измерение y

i

(см.

файл примера

). Соответственно, пусть имеется 20 пар значений (х

i

; y

i

).

Для наглядности рекомендуется построить диаграмму рассеяния.


Примечание:

Если шаг изменения по

х

постоянен, то для построения

диаграммы рассеяния

можно использовать

тип График

, если нет, то необходимо использовать тип диаграммы

Точечная

.

Из диаграммы очевидно, что связь между переменными близка к линейной. Чтобы понять какая из множества прямых линий наиболее «правильно» описывает зависимость между переменными, необходимо определить критерий, по которому будут сравниваться линии.

В качестве такого критерия используем выражение:

где

ŷ

i

=

a

*

x

i

+

b

;

n – число пар значений (в нашем случае n=20)

Вышеуказанное выражение представляет собой сумму квадратов расстояний между наблюденными значениями y

i

и ŷ

i

и часто обозначается как SSE (

Sum

of

Squared

Errors

(

Residuals

), сумма квадратов ошибок (остатков)

)

.


Метод наименьших квадратов

заключается в подборе такой линии

ŷ

=

ax

+

b

, для которой вышеуказанное выражение принимает минимальное значение.


Примечание:

Любая линия в двухмерном пространстве однозначно определяется значениями 2-х параметров:

a

(наклон) и

b

(сдвиг).

Считается, что чем меньше сумма квадратов расстояний, тем соответствующая линия лучше аппроксимирует имеющиеся данные и может быть в дальнейшем использована для прогнозирования значений y от переменной х. Понятно, что даже если в действительности никакой взаимосвязи между переменными нет или связь нелинейная, то МНК все равно подберет «наилучшую» линию. Таким образом, МНК ничего не говорит о наличии реальной взаимосвязи переменных, метод просто позволяет подобрать такие параметры функции

a

и

b

, для которых вышеуказанное выражение минимально.

Проделав не очень сложные математические операции (подробнее см.

статью про квадратичную зависимость

), можно вычислить параметры

a

и

b

:

Как видно из формулы, параметр

a

представляет собой отношение ковариации и

дисперсии

, поэтому в MS EXCEL для вычисления параметра

а

можно использовать следующие формулы (см.

файл примера лист Линейная

):

=

КОВАР(B26:B45;C26:C45)/ ДИСП.Г(B26:B45)

или

=

КОВАРИАЦИЯ.В(B26:B45;C26:C45)/ДИСП.В(B26:B45)

Также для вычисления параметра

а

можно использовать формулу =

НАКЛОН(C26:C45;B26:B45)

. Для параметра

b

используйте формулу =

ОТРЕЗОК(C26:C45;B26:B45)

.

И наконец, функция

ЛИНЕЙН()

позволяет вычислить сразу оба параметра. Для ввода формулы

ЛИНЕЙН(C26:C45;B26:B45)

необходимо выделить в строке 2 ячейки и нажать

CTRL

+

SHIFT

+

ENTER

(см. статью про

формулы массива, возвращающими несколько значений

). В левой ячейке будет возвращено значение

а

, в правой –

b

.


Примечание

: Чтобы не связываться с вводом

формул массива

потребуется дополнительно использовать функцию

ИНДЕКС()

. Формула =

ИНДЕКС(ЛИНЕЙН(C26:C45;B26:B45);1)

или просто =

ЛИНЕЙН(C26:C45;B26:B45)

вернет параметр, отвечающий за наклон линии, т.е.

а

. Формула =

ИНДЕКС(ЛИНЕЙН(C26:C45;B26:B45);2)

вернет параметр, отвечающий за пересечение линии с осью Y, т.е.

b

.

Вычислив параметры, на

диаграмме рассеяния

можно построить соответствующую линию.

Инструмент диаграммы Линия тренда

Еще одним способом построения прямой линии по методу наименьших квадратов является инструмент диаграммы

Линия тренда

. Для этого выделите диаграмму, в меню выберите

вкладку Макет

, в

группе Анализ

нажмите

Линия тренда

, затем

Линейное приближение

.

Поставив в диалоговом окне галочку в поле «показывать уравнение на диаграмме» можно убедиться, что найденные выше параметры совпадают со значениями на диаграмме.


Примечание

: Для того, чтобы параметры совпадали необходимо, чтобы тип у диаграммы был

Точечная, а не График

. Дело в том, что при построении диаграммы

График

значения по оси Х не могут быть заданы пользователем (пользователь может указать только подписи, которые не влияют на расположение точек). Вместо значений Х используется последовательность 1; 2; 3; … (для нумерации категорий). Поэтому, если строить

линию тренда

на диаграмме типа

График

, то вместо фактических значений Х будут использованы значения этой последовательности, что приведет к неверному результату (если, конечно, фактические значения Х не совпадают с последовательностью 1; 2; 3; …).


СОВЕТ

: Подробнее о построении диаграмм см. статьи

Основы построения диаграмм

и

Основные типы диаграмм

.

Программа Excel – мощный табличный редактор, позволяющий выполнять огромное количество различных операций и задач. В данной статье мы разберем, как можно применить метод наименьших квадратов (МНК), который используется для решения различных задач с минимизацией суммы квадратов отклонений некоторых функций от искомых переменных.

Содержание

  • Подготовительный этап: активируем надстройку “Поиск Решения”
  • Этап 1: исходные данные
  • Этап 2: решаем задачу с применением МНК
  • Заключение

Подготовительный этап: активируем надстройку “Поиск Решения”

Прежде, чем приступить к решению основной задачи, потребуется активировать надстройку “Поиск решения” в программе.

  1. Идем в меню “Файл”.Переход в меню Файл в Эксель
  2. В перечне слева выбираем пункт “Параметры”.Переход к параметрам Excel
  3. В правой части подраздела “Надстройки” выбираем для параметра “Управление” вариант “Надстройки Excel” и жмем “Перейти”.Переход к управлению надстройками в Эксель
  4. Появится окно для выбора нужных надстроек. Устанавливаем галочку напротив пункта “Поиск решения” и щелкаем OK.Включение надстройки Поиск решения в Excel

Этап 1: исходные данные

Давайте разберем применение метода наименьших квадратов, решив конкретный пример. Допустим, у нас есть два ряда числовых значений – X и Y.

Исходная таблица с рядами X и Y в Эксель

Данная зависимость может быть описана уравнением ниже:

Y=A+NX

Также, мы знаем, что если X=0, то и Y=0. А значит, данное уравнение можно записать так:

Y=NX

Приступим к выполнению нашей задачи, которая заключается в нахождении суммы квадратов разности.

Этап 2: решаем задачу с применением МНК

  1. Столбцу, находящемся слева от X, задаем имя N пишем число “1” (примерное значение первого коэф. N) напротив первого значения ряда X.Заполнение столбца в Эксель
  2. Столбцу с правой стороны от Y задаем название NX. Затем в самой верхней ячейке (напротив первых значений рядов X и Y) пишем формулу произведения коэф. N на соответствующее ему значение из столбца X. При этом адрес ячейки с коэффициентом нужно сделать абсолютным, чтобы он не менялся при копировании формулы. По готовности жмем Enter.Заполнение столбца в Excel
  3. Наводим указатель мыши на ячейку с полученным результатом. Как только появится черный плюсик (маркер заполнения), зажав левую кнопку мыши тянем его вниз до последней строки таблицы.Копирование формулы с помощью маркера заполнения в Эксель
  4. Получаем результаты расчетов в каждой ячейке столбца NX.Результат копирования формулы с помощью маркера заполнения в Excel
  5. Теперь нужно посчитать сумму разностей квадратов значений Y и NX. Встаем в самую верхнюю ячейку столбца справа от NX (не считая шапки таблицы) и щелкаем по значку “Вставить функцию” (fx).Вставка функции в ячейку таблицы Эксель
  6. В окне вставки функции выбираем категорию “Математические”, находим оператор “СУММКВРАЗН” и щелкаем OK.Выбор оператора СУММКВРАЗН для вставки в ячейку таблицы Excel
  7. Теперь нужно заполнить аргументы функции:
    • в поле “Массив_x”  указываем координаты диапазона ячеек столбца Y (без шапки). Адреса ячеек можно указать как вручную, напечатав их с клавиатуры, так и путем выделения с помощью зажатой левой кнопки мыши в самой таблице.
    • в поле “Массив_y” указываем диапазон ячеек столбца NX.
    • жмем Enter, когда все готово.Заполнение аргументов функции СУММКВРАЗН в Эксель
  8. Переключаемся во вкладку “Данные”. В группе “Анализ” щелкаем по функции “Поиск решения”.Активация функции Поиск решения в Эксель
  9. Нам предстоит заполнить параметры поиска решения:
    • в поле “Оптимизировать целевую функцию” следует указать ссылку на ячейку с функцией “СУММКВРАЗН”. Сделать это можно вручную или выбрав элемент в таблице.
    • для опции “До” выбираем вариант – “Минимум”.
    • в поле “Изменяя ячейки переменных” нужно указать координаты ячейки, в которой находится соответствующее значение коэф. N.
    • по готовности нажимаем “Найти решение”.Заполнение параметров Поиска решения в Excel
  10. После выполнения функции появится окно с результатами поиска решения и произойдет замена значения в столбце N. Найденная величина является наименьшим квадратом функции. Нажимаем OK, если полученный результат удовлетворителен.Результаты поиска решения в Эксель

Заключение

Итак, мы только что разобрали на практическом примере, каким образом можно применить метод наименьших квадратов в Эксель. На практике могут встречаться более сложные задачи, однако, в целом логика действий схожа с той, что мы описали.

На чтение 5 мин Опубликовано 27.12.2020

Табличный процессор Эксель способен реализовывать большое число математических операций. Из статьи вы узнаете, как используется метод наименьших квадратов, который применяется для осуществления решения разнообразных задач.

Содержание

  1. Первоначальные настройки: включение параметра «Поиск решения»
  2. Что такое метод наименьших квадратов
  3. Шаг первый: исходные данные решаемой задачи
  4. Шаг второй: решение задачки с использованием МНК
  5. Заключение

Первоначальные настройки: включение параметра «Поиск решения»

Изначально необходимо включить «Поиск решения», так как по умолчанию он находится в выключенном состоянии. Пошаговое руководство выглядит следующим образом:

  1. Переходим в раздел «Файл», который находится в левом верхнем углу интерфейса табличного процессора.

metod-naimenshih-kvadratov-v-excel

1
  1. На экране отобразилось новое окошко. Здесь, в левой колонке, необходимо кликнуть на элемент «Параметры».

metod-naimenshih-kvadratov-v-excel

2
  1. В появившемся окне выбираем раздел «Надстройки». В правой части окошка находим надпись «Управление:» и раскрываем список. В списке выбираем пункт «Надстройки Excel». Щёлкаем кнопку «ОК».

metod-naimenshih-kvadratov-v-excel

3
  1. Появилось еще одно окошко с названием «Надстройки». Около элемента «Поиск решения» ставим галочку. После проведения всех манипуляций кликаем «ОК».

metod-naimenshih-kvadratov-v-excel

4
  1. Готово! Параметр включился, и теперь мы можем приступить к разбору метода наименьших квадратов.

Что такое метод наименьших квадратов

Для начала вспомним, что метод наименьших квадратов — математический метод, используемый для решения задач, основанный на минимизации суммы квадратов отклонений некоторых функций от изначальных значений.

Он может применяться для «решения» переопределенных систем уравнений (когда число уравнений больше числа неизвестных), для поиска решения в случае стандартных (не переопределенных) нелинейных систем уравнений, для аппроксимации точечных значений некоторой функции.

Шаг первый: исходные данные решаемой задачи

На конкретном примере начнем разбор метода наименьших квадратов. К примеру, у нас есть 2 колонки – X и Y:

metod-naimenshih-kvadratov-v-excel

5

Эта зависимость описывается уравнением: Y=A+NX.

Мы прекрасно знаем, что если Х равен нулю, то и Y равен нулю. Следовательно, это уравнение можно привести к следующему виду: Y=NX. Начнём реализацию этой задачи. Нам нужно найти сумму квадратов разности.

Шаг второй: решение задачки с использованием МНК

Пошаговое руководство выглядит следующим образом:

  1. Столбику, который располагается левее показателя Х, даем название N и прописываем единицу рядом с 1-м показателем колонки Х. Единица – это примерное значение 1-го коэффициента N.

metod-naimenshih-kvadratov-v-excel

6
  1. Столбику, который располагается правее показателя Y, даем наименование NX.
  2. В ячейку D1, находящуюся около первых показателей X и Y, прописываем специальную формулу произведения коэффициента N на показатель из столбика Х. Сама формула выглядит следующим образом: =$А$2*В2. Стоит заметить, что адрес ячейки с коэффициентом необходимо привести к абсолютному типу. Абсолютный тип в табличном процессоре позволяет зафиксировать строчку или столбик (или все вместе одновременно). Иными словами, при копировании значений в другие ячейки абсолютные ссылки не будут меняться. После проведения всех манипуляций жмем клавишу «Enter».

metod-naimenshih-kvadratov-v-excel

7
  1. Перемещаем курсор мышки на сектор с выведенным результатом. Наведя указатель в правый верхний уголок, он превратится в маленький плюсик темного цвета, который называется маркером заполнения. Зажимаем ЛКМ и перетягиваем маркер в самый низ до крайней строчки табличных данных.

metod-naimenshih-kvadratov-v-excel

8
  1. После проведения этих манипуляций мы получили результаты вычислений во всех секторах колонки NX.

metod-naimenshih-kvadratov-v-excel

9
  1. Далее переходим к подсчету суммы разностей квадратов показателей Y и NX. Перемещаемся в ячейку E1, располагающуюся правее от показателя NX, нажимаем на элемент «Вставить функцию», который находится рядом со строкой для ввода формул, и имеет внешний вид «fx».

metod-naimenshih-kvadratov-v-excel

10
  1. Первым делом, находим надпись «Категории:» и раскрываем список, находящийся рядом. В обширном списке выбираем элемент «Математические». В блоке «Выберите функцию:» отыскиваем функцию «СУММКВРАЗН» и выбираем ее. После проведения всех манипуляций жмем на кнопку «ОК».

metod-naimenshih-kvadratov-v-excel

11
  1. Открылось небольшое окошко «Аргументы функции». Для дальнейшей работы необходимо заполнить все строки формы. В строчку «Массив_х» вводим адрес диапазона ячеек столбика Y. Координаты можно вписать самостоятельно ручным вводом, используя клавиатуру, или же путем их выбора в самих табличных данных.
  2. В строчку «Массив_у» вводим адрес диапазона ячеек столбика NX. После проведения всех манипуляций щёлкаем клавишу «Enter».

metod-naimenshih-kvadratov-v-excel

12
  1. Перемещаемся в раздел «Данные», который находится в верхней части интерфейса табличного процессора. Находим блок команд под названием «Анализ» и выбираем элемент «Поиск решения».

metod-naimenshih-kvadratov-v-excel

13
  1. На экране отобразилось окошко с огромным количеством настроек, которые необходимо заполнить. В строчку «Оптимизировать целевую функцию» вводим ссылку на ячейку с оператором «СУММКВРАЗН». Реализовать это действие можно самостоятельно ручным вводом, используя клавиатуру, или же выбрав сектор в самой табличке. Ставим отметку около надписи «Минимум», которая располагается в блоке «До:». В строчку «Изменяя ячейки переменных» вбиваем адрес сектора, в котором располагается показатель коэффициента N – $A$2. После проведения всех манипуляций щелкаем на «Найти решение».

metod-naimenshih-kvadratov-v-excel

14
  1. После того, как «Поиск решения» будет выполнен, на экране компьютера отобразится окошко с выведенными результатами поиска решения, а затем реализуется замена числовых значений в столбике N. Отображенный результат – это наименьший квадрат функции. Если выведенный результат удовлетворяет тому, что нужно было найти, то нажимаем «ОК».

metod-naimenshih-kvadratov-v-excel

15

Заключение

Таким образом, мы на конкретном примере рассмотрели способ использования метода наименьших квадратов в табличном процессоре Microsoft Excel и ознакомились со стандартным алгоритмом действий при решении похожих задач.

Оцените качество статьи. Нам важно ваше мнение:

Содержание

  • Использование метода в Экселе
    • Включение надстройки «Поиск решения»
    • Условия задачи
    • Решение
  • Вопросы и ответы

Метод наименьших квадратов в Microsoft Excel

Метод наименьших квадратов представляет собой математическую процедуру построения линейного уравнения, которое бы наиболее точно соответствовало набору двух рядов чисел. Целью применения данного способа является минимизация общей квадратичной ошибки. В программе Excel имеются инструменты, с помощью которых можно применять данный метод при вычислениях. Давайте разберемся, как это делается.

Использование метода в Экселе

Метод наименьших квадратов (МНК) является математическим описанием зависимости одной переменной от второй. Его можно использовать при прогнозировании.

Включение надстройки «Поиск решения»

Для того, чтобы использовать МНК в Экселе, нужно включить надстройку «Поиск решения», которая по умолчанию отключена.

  1. Переходим во вкладку «Файл».
  2. Переход во вкладку Файл в Microsoft Excel

  3. Кликаем по наименованию раздела «Параметры».
  4. Переход в раздел параметры в Microsoft Excel

  5. В открывшемся окне останавливаем выбор на подразделе «Надстройки».
  6. Переход в подраздел надстройки в Microsoft Excel

  7. В блоке «Управление», который расположен в нижней части окна, устанавливаем переключатель в позицию «Надстройки Excel» (если в нём выставлено другое значение) и жмем на кнопку «Перейти…».
  8. Переход к надстройкам Excel в Microsoft Excel

  9. Открывается небольшое окошко. Ставим в нём галочку около параметра «Поиск решения». Жмем на кнопку «OK».

Включение поиска решения в Microsoft Excel

Теперь функция Поиск решения в Excel активирована, а её инструменты появились на ленте.

Урок: Поиск решения в Экселе

Условия задачи

Опишем применение МНК на конкретном примере. Имеем два ряда чисел x и y, последовательность которых представлена на изображении ниже.

Переменные числа в Microsoft Excel

Наиболее точно данную зависимость может описать функция:

y=a+nx

Lumpics.ru

При этом, известно что при x=0 y тоже равно 0. Поэтому данное уравнение можно описать зависимостью y=nx.

Нам предстоит найти минимальную сумму квадратов разности.

Решение

Перейдем к описанию непосредственного применения метода.

  1. Слева от первого значения x ставим цифру 1. Это будет приближенная величина первого значения коэффициента n.
  2. Значение  коэффициента n в Microsoft Excel

  3. Справа от столбца y добавляем ещё одну колонку – nx. В первую ячейку данного столбца записываем формулу умножения коэффициента n на ячейку первой переменной x. При этом, ссылку на поле с коэффициентом делаем абсолютной, так как это значение меняться не будет. Кликаем по кнопке Enter.
  4. Значение nx в Microsoft Excel

  5. Используя маркер заполнения, копируем данную формулу на весь диапазон таблицы в столбце ниже.
  6. Копирование формулы в Microsoft Excel

  7. В отдельной ячейке высчитываем сумму разностей квадратов значений y и nx. Для этого кликаем по кнопке «Вставить функцию».
  8. Переход в мастер функций в Microsoft Excel

  9. В открывшемся «Мастере функций» ищем запись «СУММКВРАЗН». Выбираем её и жмем на кнопку «OK».
  10. Мастер функций в Microsoft Excel

  11. Открывается окно аргументов. В поле «Массив_x» вводим диапазон ячеек столбца y. В поле «Массив_y» вводим диапазон ячеек столбца nx. Для того, чтобы ввести значения, просто устанавливаем курсор в поле и выделяем соответствующий диапазон на листе. После ввода жмем на кнопку «OK».
  12. Ввод аргументов функции в Microsoft Excel

  13. Переходим во вкладку «Данные». На ленте в блоке инструментов «Анализ» жмем на кнопку «Поиск решения».
  14. Переход в поиск решения в Microsoft Excel

  15. Открывается окно параметров данного инструмента. В поле «Оптимизировать целевую функцию» указываем адрес ячейки с формулой «СУММКВРАЗН». В параметре «До» обязательно выставляем переключатель в позицию «Минимум». В поле «Изменяя ячейки» указываем адрес со значением коэффициента n. Жмем на кнопку «Найти решение».
  16. Поиск решения методом наименьшего квадрата в Microsoft Excel

  17. Решение будет отображаться в ячейке коэффициента n. Именно это значение будет являться наименьшим квадратом функции. Если результат удовлетворяет пользователя, то следует нажать на кнопку «OK» в дополнительном окне.

Подтверждение результата в Microsoft Excel

Как видим, применение метода наименьших квадратов довольно сложная математическая процедура. Мы показали её в действии на простейшем примере, а существуют гораздо более сложные случаи. Впрочем, инструментарий Microsoft Excel призван максимально упростить производимые вычисления.

Еще статьи по данной теме:

Помогла ли Вам статья?

  • Редакция Кодкампа

17 авг. 2022 г.
читать 2 мин


Метод наименьших квадратов — это метод, который мы можем использовать для поиска линии регрессии, которая лучше всего соответствует заданному набору данных.

В следующем видео представлено краткое объяснение этого метода:

Чтобы использовать метод наименьших квадратов для подбора линии регрессии в Excel, мы можем использовать функцию =ЛИНЕЙН() .

В следующем пошаговом примере показано, как использовать эту функцию на практике.

Шаг 1: Создайте набор данных

Во-первых, давайте создадим следующий набор данных в Excel:

Шаг 2: Используйте метод наименьших квадратов для подбора линии регрессии

Мы можем использовать функцию =LINEST(known_ys, known_xs) , чтобы использовать метод наименьших квадратов, чтобы подобрать линию регрессии к этому набору данных:

Как только мы нажмем ENTER , появятся коэффициенты регрессионной модели:

Шаг 3: интерпретируйте результаты

Используя коэффициенты из функции =LINEST() , мы можем написать следующую подобранную линию регрессии:

у = 11,55211 + 1,07949(х)

Мы можем использовать это уравнение для оценки значения y на основе значения x.

Например, если x = 10, то мы оценили бы, что y будет равно 22,347 :

у = 11,55211 + 1,07949(10) = 22,347

Шаг 4: Нанесите результаты на график

Наконец, мы можем использовать следующие шаги для построения набора данных вместе с подобранной линией регрессии:

  • Выделите ячейки A2:B16 .
  • Щелкните вкладку « Вставка » на верхней ленте. Затем щелкните первый параметр диаграммы под названием « Вставить точечную (X, Y)» или «Пузырьковую диаграмму » в группе «Диаграммы».
  • После того, как диаграмма появится, нажмите знак плюс «+» в правом верхнем углу. В раскрывающемся меню установите флажок рядом с линией тренда , чтобы добавить на график подобранную линию регрессии.

Дополнительные ресурсы

Как выполнить множественную линейную регрессию в Excel
Как выполнить квадратичную регрессию в Excel
Как выполнить полиномиальную регрессию в Excel
Подбор кривой в Excel (с примерами)

Like this post? Please share to your friends:
  • Метод наименьших квадратов пример решения в excel
  • Метод наименьших квадратов онлайн excel
  • Метод наименьших квадратов в excel это
  • Метод наименьших квадратов в excel поиск решения
  • Метод наименьших квадратов в excel множественная регрессия