Когда научный руководитель сказал мне о необходимости указать на графике R² (р квадрат), я растерялся. В тот момент я не знал о трендах в диаграммах и графиках Excel. Этот материал поможет сориентироваться начинающим.
Что такое R² в Экселе
Для примера возьмем данные о продажах умных часов по брендам. Саму таблицу и график можно найти по этой ссылке на сайте CounterPointResearch. Там много подобной информации.
Выделяем диапазон данных и добавляем диаграмму. Теперь наводим мышь на столбцы бренда Others — «остальные», нажимаем правую клавишу мыши. Выбираем пункт Добавить линию тренда.
По умолчанию тренд линейный. Чуть позднее расскажу, как выбрать иную функцию, и стоит ли это делать. Теперь подводим курсор мыши к тренду и снова нажимаем правую кнопку.
Добавляем на график R².
Как видим из названия пункта, это величина достоверности апроксимации. Максимальное значение параметра Р-квадрат единица. Но получить ее можно только на специально подогнанных данных в реальной жизни приемлемое значение 0,8-0,9. В нашем случае — 0,78, что неплохо.
Стоит ли добиваться максимального значения R²
Улучшить достоверность апроксимации можно меняя вид кривой. Это можно сделать в открывающемся справа окошке Формат линии тренда.
Если использовать полиноминальную функцию, то апроксимацию можно улучшить значительно. Но вот смысла это не имеет. Экономические показатели обычно укладываются в линейный (рост/падение) или экспоненциальный тренд. Экспоненциально, например, растет число клиентов быстрорастущей фирмы.
Выбор полиноминальной функции может и улучшит показатель достоверности, а вот прогноз сделает менее точным.
Как использовать тренд для прогноза
Кроме определения общего положения дел (рост/снижение), тренд может предсказать значения показателей в будущем. Это делается в окошке Формата линии тренда.
Попробуем предсказать продажи умных часов в первом квартале 2021 году и сравним их с фактом. Добавим два линейных тренда для Apple и Остальных.
Как видим, по яблочным часа прогноз построен верно, по остальным функция прогнозирует значение около 35%, а в реальности 46%. Возможно, это связано с выходом новых игроков на рынок или снижением доли Huawei. Мы имеем дело с относительными показателями (доля), а не с натуральными. Кстати, полиноминальный прогноз для категории Остальные дал бы еще менее точный прогноз, хотя R² и выше, что подтверждает необходимость осторожно выбирать функцию.
Почитайте и другие статьи про работу с таблицами Excel на нашем сайте. Например, у нас есть полезный материал об условном оформлении ячеек в таблице.
Понравилась статья? Поделитесь!
Содержание
- Выполнение аппроксимации
- Способ 1: линейное сглаживание
- Способ 2: экспоненциальная аппроксимация
- Способ 3: логарифмическое сглаживание
- Способ 4: полиномиальное сглаживание
- Способ 5: степенное сглаживание
- Вопросы и ответы
Среди различных методов прогнозирования нельзя не выделить аппроксимацию. С её помощью можно производить приблизительные подсчеты и вычислять планируемые показатели, путем замены исходных объектов на более простые. В Экселе тоже существует возможность использования данного метода для прогнозирования и анализа. Давайте рассмотрим, как этот метод можно применить в указанной программе встроенными инструментами.
Выполнение аппроксимации
Наименование данного метода происходит от латинского слова proxima – «ближайшая» Именно приближение путем упрощения и сглаживания известных показателей, выстраивание их в тенденцию и является его основой. Но данный метод можно использовать не только для прогнозирования, но и для исследования уже имеющихся результатов. Ведь аппроксимация является, по сути, упрощением исходных данных, а упрощенный вариант исследовать легче.
Главный инструмент, с помощью которого проводится сглаживания в Excel – это построение линии тренда. Суть состоит в том, что на основе уже имеющихся показателей достраивается график функции на будущие периоды. Основное предназначение линии тренда, как не трудно догадаться, это составление прогнозов или выявление общей тенденции.
Но она может быть построена с применением одного из пяти видов аппроксимации:
- Линейной;
- Экспоненциальной;
- Логарифмической;
- Полиномиальной;
- Степенной.
Рассмотрим каждый из вариантов более подробно в отдельности.
Урок: Как построить линию тренда в Excel
Способ 1: линейное сглаживание
Прежде всего, давайте рассмотрим самый простой вариант аппроксимации, а именно с помощью линейной функции. На нем мы остановимся подробнее всего, так как изложим общие моменты характерные и для других способов, а именно построение графика и некоторые другие нюансы, на которых при рассмотрении последующих вариантов уже останавливаться не будем.
Прежде всего, построим график, на основании которого будем проводить процедуру сглаживания. Для построения графика возьмем таблицу, в которой помесячно указана себестоимость единицы продукции, производимой предприятием, и соответствующая прибыль в данном периоде. Графическая функция, которую мы построим, будет отображать зависимость увеличения прибыли от уменьшения себестоимости продукции.
- Для построения графика, прежде всего, выделяем столбцы «Себестоимость единицы продукции» и «Прибыль». После этого перемещаемся во вкладку «Вставка». Далее на ленте в блоке инструментов «Диаграммы» щелкаем по кнопке «Точечная». В открывшемся списке выбираем наименование «Точечная с гладкими кривыми и маркерами». Именно данный вид диаграмм наиболее подходит для работы с линией тренда, а значит, и для применения метода аппроксимации в Excel.
- График построен.
- Для добавления линии тренда выделяем его кликом правой кнопки мыши. Появляется контекстное меню. Выбираем в нем пункт «Добавить линию тренда…».
Существует ещё один вариант её добавления. В дополнительной группе вкладок на ленте «Работа с диаграммами» перемещаемся во вкладку «Макет». Далее в блоке инструментов «Анализ» щелкаем по кнопке «Линия тренда». Открывается список. Так как нам нужно применить линейную аппроксимацию, то из представленных позиций выбираем «Линейное приближение».
- Если же вы выбрали все-таки первый вариант действий с добавлением через контекстное меню, то откроется окно формата.
В блоке параметров «Построение линии тренда (аппроксимация и сглаживание)» устанавливаем переключатель в позицию «Линейная».
При желании можно установить галочку около позиции «Показывать уравнение на диаграмме». После этого на диаграмме будет отображаться уравнение сглаживающей функции.Также в нашем случае для сравнения различных вариантов аппроксимации важно установить галочку около пункта «Поместить на диаграмму величину достоверной аппроксимации (R^2)». Данный показатель может варьироваться от 0 до 1. Чем он выше, тем аппроксимация качественнее (достовернее). Считается, что при величине данного показателя 0,85 и выше сглаживание можно считать достоверным, а если показатель ниже, то – нет.
После того, как провели все вышеуказанные настройки. Жмем на кнопку «Закрыть», размещенную в нижней части окна.
- Как видим, на графике линия тренда построена. При линейной аппроксимации она обозначается черной прямой полосой. Указанный вид сглаживания можно применять в наиболее простых случаях, когда данные изменяются довольно быстро и зависимость значения функции от аргумента очевидна.
Сглаживание, которое используется в данном случае, описывается следующей формулой:
y=ax+b
В конкретно нашем случае формула принимает такой вид:
y=-0,1156x+72,255
Величина достоверности аппроксимации у нас равна 0,9418, что является довольно приемлемым итогом, характеризующим сглаживание, как достоверное.
Способ 2: экспоненциальная аппроксимация
Теперь давайте рассмотрим экспоненциальный тип аппроксимации в Эксель.
- Для того, чтобы изменить тип линии тренда, выделяем её кликом правой кнопки мыши и в раскрывшемся меню выбираем пункт «Формат линии тренда…».
- После этого запускается уже знакомое нам окно формата. В блоке выбора типа аппроксимации устанавливаем переключатель в положение «Экспоненциальная». Остальные настройки оставим такими же, как и в первом случае. Щелкаем по кнопке «Закрыть».
- После этого линия тренда будет построена на графике. Как видим, при использовании данного метода она имеет несколько изогнутую форму. При этом уровень достоверности равен 0,9592, что выше, чем при использовании линейной аппроксимации. Экспоненциальный метод лучше всего использовать в том случае, когда сначала значения быстро изменяются, а потом принимают сбалансированную форму.
Общий вид функции сглаживания при этом такой:
y=be^x
где e – это основание натурального логарифма.
В конкретно нашем случае формула приняла следующую форму:
y=6282,7*e^(-0,012*x)
Способ 3: логарифмическое сглаживание
Теперь настала очередь рассмотреть метод логарифмической аппроксимации.
- Тем же способом, что и в предыдущий раз через контекстное меню запускаем окно формата линии тренда. Устанавливаем переключатель в позицию «Логарифмическая» и жмем на кнопку «Закрыть».
- Происходит процедура построения линии тренда с логарифмической аппроксимацией. Как и в предыдущем случае, такой вариант лучше использовать тогда, когда изначально данные быстро изменяются, а потом принимают сбалансированный вид. Как видим, уровень достоверности равен 0,946. Это выше, чем при использовании линейного метода, но ниже, чем качество линии тренда при экспоненциальном сглаживании.
В общем виде формула сглаживания выглядит так:
y=a*ln(x)+b
где ln – это величина натурального логарифма. Отсюда и наименование метода.
В нашем случае формула принимает следующий вид:
y=-62,81ln(x)+404,96
Способ 4: полиномиальное сглаживание
Настал черед рассмотреть метод полиномиального сглаживания.
- Переходим в окно формата линии тренда, как уже делали не раз. В блоке «Построение линии тренда» устанавливаем переключатель в позицию «Полиномиальная». Справа от данного пункта расположено поле «Степень». При выборе значения «Полиномиальная» оно становится активным. Здесь можно указать любое степенное значение от 2 (установлено по умолчанию) до 6. Данный показатель определяет число максимумов и минимумов функции. При установке полинома второй степени описывается только один максимум, а при установке полинома шестой степени может быть описано до пяти максимумов. Для начала оставим настройки по умолчанию, то есть, укажем вторую степень. Остальные настройки оставляем такими же, какими мы выставляли их в предыдущих способах. Жмем на кнопку «Закрыть».
- Линия тренда с использованием данного метода построена. Как видим, она ещё более изогнута, чем при использовании экспоненциальной аппроксимации. Уровень достоверности выше, чем при любом из использованных ранее способов, и составляет 0,9724.
Данный метод наиболее успешно можно применять в том случае, если данные носят постоянно изменчивый характер. Функция, описывающая данный вид сглаживания, выглядит таким образом:
y=a1+a1*x+a2*x^2+…+an*x^n
В нашем случае формула приняла такой вид:
y=0,0015*x^2-1,7202*x+507,01
- Теперь давайте изменим степень полиномов, чтобы увидеть, будет ли отличаться результат. Возвращаемся в окно формата. Тип аппроксимации оставляем полиномиальным, но напротив него в окне степени устанавливаем максимально возможное значение – 6.
- Как видим, после этого наша линия тренда приняла форму ярко выраженной кривой, у которой число максимумов равно шести. Уровень достоверности повысился ещё больше, составив 0,9844.
Формула, которая описывает данный тип сглаживания, приняла следующий вид:
y=8E-08x^6-0,0003x^5+0,3725x^4-269,33x^3+109525x^2-2E+07x+2E+09
Способ 5: степенное сглаживание
В завершении рассмотрим метод степенной аппроксимации в Excel.
- Перемещаемся в окно «Формат линии тренда». Устанавливаем переключатель вида сглаживания в позицию «Степенная». Показ уравнения и уровня достоверности, как всегда, оставляем включенными. Жмем на кнопку «Закрыть».
- Программа формирует линию тренда. Как видим, в нашем случае она представляет собой линию с небольшим изгибом. Уровень достоверности равен 0,9618, что является довольно высоким показателем. Из всех вышеописанных способов уровень достоверности был выше только при использовании полиномиального метода.
Данный способ эффективно используется в случаях интенсивного изменения данных функции. Важно учесть, что этот вариант применим только при условии, что функция и аргумент не принимают отрицательных или нулевых значений.
Общая формула, описывающая данный метод имеет такой вид:
y=bx^n
В конкретно нашем случае она выглядит так:
y = 6E+18x^(-6,512)
Как видим, при использовании конкретных данных, которые мы применяли для примера, наибольший уровень достоверности показал метод полиномиальной аппроксимации с полиномом в шестой степени (0,9844), наименьший уровень достоверности у линейного метода (0,9418). Но это совсем не значит, что такая же тенденция будет при использовании других примеров. Нет, уровень эффективности у приведенных выше методов может значительно отличаться, в зависимости от конкретного вида функции, для которой будет строиться линия тренда. Поэтому, если для этой функции выбранный метод наиболее эффективен, то это совсем не означает, что он также будет оптимальным и в другой ситуации.
Если вы пока не можете сразу определить, основываясь на вышеприведенных рекомендациях, какой вид аппроксимации подойдет конкретно в вашем случае, то есть смысл попробовать все методы. После построения линии тренда и просмотра её уровня достоверности можно будет выбрать оптимальный вариант.
Опубликовано 05 Янв 2014
Рубрика: Справочник Excel | 19 комментариев
(Обратите внимание на дополнительный раздел от 04.06.2017 в конце статьи.)
Учет и контроль! Те, кому за 40 должны хорошо помнить этот лозунг из эпохи построения социализма и коммунизма в нашей стране.
Но без хорошо налаженного учета невозможно эффективное функционирование ни страны, ни области, ни предприятия, ни домашнего хозяйства при любой общественно-экономической формации общества! Для составления прогнозов и планов деятельности и развития необходимы исходные данные. Где их брать? Только один достоверный источник – это ваши статистические учетные данные предыдущих периодов времени.
Учитывать результаты своей деятельности, собирать и записывать информацию, обрабатывать и анализировать данные, применять результаты анализа для принятия правильных решений в будущем должен, в моем понимании, каждый здравомыслящий человек. Это есть ничто иное, как накопление и рациональное использование своего жизненного опыта. Если не вести учет важных данных, то вы через определенный период времени их забудете и, начав заниматься этими вопросами вновь, вы опять наделаете те же ошибки, что делали, когда впервые этим занимались.
«Мы, помню, 5 лет назад изготавливали до 1000 штук таких изделий в месяц, а сейчас и 700 еле-еле собираем!». Открываем статистику и видим, что 5 лет назад и 500 штук не изготавливали…
«Во сколько обходится километр пробега твоего автомобиля с учетом всех затрат?» Открываем статистику – 6 руб./км. Поездка на работу – 107 рублей. Дешевле, чем на такси (180 рублей) более чем в полтора раза. А бывали времена, когда на такси было дешевле…
«Сколько времени требуется для изготовления металлоконструкций уголковой башни связи высотой 50 м?» Открываем статистику – и через 5 минут готов ответ…
«Сколько будет стоить ремонт комнаты в квартире?» Поднимаем старые записи, делаем поправку на инфляцию за прошедшие годы, учитываем, что в прошлый раз купили материалы на 10% дешевле рыночной цены и – ориентировочную стоимость мы уже знаем…
Ведя учет своей профессиональной деятельности, вы всегда будете готовы ответить на вопрос начальника: «Когда!!!???». Ведя учет домашнего хозяйства, легче спланировать расходы на крупные покупки, отдых и прочие расходы в будущем, приняв соответствующие меры по дополнительному заработку или по сокращению необязательных расходов сегодня.
В этой статье я на простом примере покажу, как можно обрабатывать собранные статистические данные в Excel для возможности дальнейшего использования при прогнозировании будущих периодов.
Аппроксимация в Excel статистических данных аналитической функцией.
Производственный участок изготавливает строительные металлоконструкции из листового и профильного металлопроката. Участок работает стабильно, заказы однотипные, численность рабочих колеблется незначительно. Есть данные о выпуске продукции за предыдущие 12 месяцев и о количестве переработанного в эти периоды времени металлопроката по группам: листы, двутавры, швеллеры, уголки, трубы круглые, профили прямоугольного сечения, круглый прокат. После предварительного анализа исходных данных возникло предположение, что суммарный месячный выпуск металлоконструкций существенно зависит от количества уголков в заказах. Проверим это предположение.
Прежде всего, несколько слов об аппроксимации. Мы будем искать закон – аналитическую функцию, то есть функцию, заданную уравнением, которое лучше других описывает зависимость общего выпуска металлоконструкций от количества уголкового проката в выполненных заказах. Это и есть аппроксимация, а найденное уравнение называется аппроксимирующей функцией для исходной функции, заданной в виде таблицы.
1. Включаем Excel и помещаем на лист таблицу с данными статистики.
2. Далее строим и форматируем точечную диаграмму, в которой по оси X задаем значения аргумента – количество переработанных уголков в тоннах. По оси Y откладываем значения исходной функции – общий выпуск металлоконструкций в месяц, заданные таблицей.
О том, как построить подобную диаграмму, подробно рассказано в статье «Как строить графики в Excel?».
3. «Наводим» мышь на любую из точек на графике и щелчком правой кнопки вызываем контекстное меню (как говорит один мой хороший товарищ — работая в незнакомой программе, когда не знаешь, что делать, чаще щелкай правой кнопкой мыши…). В выпавшем меню выбираем «Добавить линию тренда…».
4. В появившемся окне «Линия тренда» на вкладке «Тип» выбираем «Линейная».
5. Далее на вкладке «Параметры» ставим 2 галочки и нажимаем «ОК».
6. На графике появилась прямая линия, аппроксимирующая нашу табличную зависимость.
Мы видим кроме самой линии уравнение этой линии и, главное, мы видим значение параметра R2 – величины достоверности аппроксимации! Чем ближе его значение к 1, тем наиболее точно выбранная функция аппроксимирует табличные данные!
7. Строим линии тренда, используя степенную, логарифмическую, экспоненциальную и полиномиальную аппроксимации по аналогии с тем, как мы строили линейную линию тренда.
Лучше всех из выбранных функций аппроксимирует наши данные полином второй степени, у него максимальный коэффициент достоверности R2.
Однако хочу вас предостеречь! Если вы возьмете полиномы более высоких степеней, то, возможно, получите еще лучшие результаты, но кривые будут иметь замысловатый вид…. Здесь важно понимать, что мы ищем функцию, которая имеет физический смысл. Что это означает? Это означает, что нам нужна аппроксимирующая функция, которая будет выдавать адекватные результаты не только внутри рассматриваемого диапазона значений X, но и за его пределами, то есть ответит на вопрос: «Какой будет выпуск металлоконструкций при количестве переработанных за месяц уголков меньше 45 и больше 168 тонн!» Поэтому я не рекомендую увлекаться полиномами высоких степеней, да и параболу (полином второй степени) выбирать осторожно!
Итак, нам необходимо выбрать функцию, которая не только хорошо интерполирует табличные данные в пределах диапазона значений X=45…168, но и допускает адекватную экстраполяцию за пределами этого диапазона. Я выбираю в данном случае логарифмическую функцию, хотя можно выбрать и линейную, как наиболее простую. В рассматриваемом примере при выборе линейной аппроксимации в excel ошибки будут больше, чем при выборе логарифмической, но не на много.
8. Удаляем все линии тренда с поля диаграммы, кроме логарифмической функции. Для этого щелкаем правой кнопкой мыши по ненужным линиям и в выпавшем контекстном меню выбираем «Очистить».
9. В завершении добавим к точкам табличных данных планки погрешностей. Для этого правой кнопкой мыши щелкаем на любой из точек на графике и в контекстном меню выбираем «Формат рядов данных…» и настраиваем данные на вкладке «Y-погрешности» так, как на рисунке ниже.
10. Затем щелкаем по любой из линий диапазонов погрешностей правой кнопкой мыши, выбираем в контекстном меню «Формат полос погрешностей…» и в окне «Формат планок погрешностей» на вкладке «Вид» настраиваем цвет и толщину линий.
Аналогичным образом форматируются любые другие объекты диаграммы в Excel!
Окончательный результат диаграммы представлен на следующем снимке экрана.
Итоги.
Результатом всех предыдущих действий стала полученная формула аппроксимирующей функции y=-172,01*ln (x)+1188,2. Зная ее, и количество уголков в месячном наборе работ, можно с высокой степенью вероятности (±4% — смотри планки погрешностей) спрогнозировать общий выпуск металлоконструкций за месяц! Например, если в плане на месяц 140 тонн уголков, то общий выпуск, скорее всего, при прочих равных составит 338±14 тонн.
Для повышения достоверности аппроксимации статистических данных должно быть много. Двенадцать пар значений – это маловато.
Из практики скажу, что хорошим результатом следует считать нахождение аппроксимирующей функции с коэффициентом достоверности R2>0,87. Отличный результат – при R2>0,94.
На практике бывает трудно выделить один самый главный определяющий фактор (в нашем примере – масса переработанных за месяц уголков), но если постараться, то в каждой конкретной задаче его всегда можно найти! Конечно, общий выпуск продукции за месяц реально зависит от сотни факторов, для учета которых необходимы существенные трудозатраты нормировщиков и других специалистов. Только результат все равно будет приблизительным! Так стоит ли нести затраты, если есть гораздо более дешевое математическое моделирование!
В этой статье я лишь прикоснулся к верхушке айсберга под названием сбор, обработка и практическое использование статистических данных. О том удалось, или нет, мне расшевелить ваш интерес к этой теме, надеюсь узнать из комментариев и рейтинга статьи в поисковиках.
Затронутый вопрос аппроксимации функции одной переменной имеет широкое практическое применение в разных сферах жизни. Но гораздо большее применение имеет решение задачи аппроксимации функции нескольких независимых переменных…. Об этом и не только читайте в следующих статьях на блоге.
С интересом прочту Ваши комментарии, уважаемые читатели! Пишите!
P.S. (04.06.2017)
Высокоточная красивая замена табличных данных простым уравнением.
Вас не устраивают полученные точность аппроксимации (R2<0,95) или вид и набор функций, предлагаемые MS Excel?
Размеры выражения и форма линии аппроксимирующего полинома высокой степени не радует глаз?
Обращайтесь через страницу «Обратная связь» для получения более точного и компактного результата аппроксимации ваших табличных данных и для того, чтобы узнать простую методику решения задач высокоточной аппроксимации функцией одной переменной.
Далее на скриншоте в качестве сравнения представлены результаты поиска аппроксимирующей функции при помощи Excel и при помощи предлагаемой методики.
При использовании предлагаемого алгоритма действий найдена весьма компактная функция, обеспечивающая высочайшую точность аппроксимации: R2=0,9963!!!
Другие статьи автора блога
На главную
Статьи с близкой тематикой
Отзывы
Решение задач аппроксимации средствами Excel
доктор физ.– мат. наук, профессор Гавриленко В.В. ассистент Парохненко Л.М.
(Национальный транспортный университет)
Теоретическая справка. На практике при моделировании различных про-
цессов, в частности, экономических, физических, технических, социальных,
широко используются те или иные способы вычисления приближенных значе-
ний функций по известным их значениям в некоторых фиксированных точках.
Такого рода задачи приближения функций часто возникают:
∙при построении приближенных формул для вычисления значений характер-
ных величин исследуемого процесса по данным таблиц, полученным в ре-
зультате физического или вычислительного эксперимента;
∙при численном интегрировании, численном дифференцировании, числен-
ном решении дифференциальных уравнений и т.д.;
∙при необходимости вычисления значений функций в промежуточных точ-
ках рассматриваемого интервала;
∙при определении значений характерных величин процесса за пределами рас-
сматриваемого интервала, в частности, при необходимости заглянуть в
“ прошлое”), то есть при определении значений показателей процесса до на-
чала наблюдения;
∙в прогнозировании, то есть при получении предварительных оценок буду-
щих значений интересуемых показателей процесса (возможность заглянуть
в“ будущее”).
Если для моделирования некоторого процесса, заданного таблицей, по-
строить приближенно описывающую данный процесс функцию на основе ме-
тода наименьших квадратов, то она называется аппроксимирующей функцией
(регрессией), а сама задача построения аппроксимирующих функций называет-
ся задачей аппроксимации.
В данной статье рассмотрены возможности пакета Excel [1–3] при реше-
нии задач аппроксимации, а именно, приведены методы и приемы построения
(создания) регрессий для таблично заданных функций, что является основой регрессионного анализа.
ВExcel для построения регрессий имеются такие возможности, как:
1)добавление выбранных регрессий (линий тренда) в диаграмму, построенную на основе таблицы данных для исследуемой характеристики процесса (этим инструментом можно воспользоваться лишь при наличии построенной диа-
граммы);
2)использование встроенных статистических функций рабочего листа Excel,
позволяющих получать регрессии (линии тренда) на основе таблицы исход-
ных данных (использование данного инструмента предварительно не связы-
вается с наличием соответствующей диаграммы).
Добавление линий тренда в диаграмму
Для таблицы данных, описывающих некоторый процесс и представленных диаграммой, в Excel имеется эффективный инструмент регрессионного анали-
за, позволяющий:
∙ строить на основе метода наименьших квадратов и добавлять в диаграмму пять типов регрессий (линий тренда), которые с той или иной степенью точно-
сти моделируют исследуемый процесс;
∙добавлять к диаграмме уравнение построенной регрессии;
∙определять степень соответствия выбранной регрессии отображаемым на диаграмме данным.
Построенные модели процесса – линии тренда (trendlines) показывают
тенденцию изменения данных, дают возможность определять значения иссле-
дуемой характеристики в промежуточных точках, прогнозировать поведение данного процесса в будущем (задача экстраполяции), а также заглянуть в его прошлое.
На основе данных диаграммы Excel позволяет получать такие типы регрес-
сий или линий тренда, как линейный, полиномиальный, логарифмический, сте-
пенной, экспоненциальный, которые задаются уравнением y = y(x) , где x – неза-
висимая переменная, которая часто принимает значения последовательности натурального ряда чисел (1; 2; 3; …) и производит, например, отсчет времени протекания исследуемого процесса.
1. Линейная регрессия хороша при моделировании характеристик, значения которых увеличиваются или убывают с постоянной скоростью. Это наиболее простая в построении, но наименее точная модель исследуемого процесса.
Строится в соответствии с уравнением
y = m x + b ,
где m – угол наклона линейной регрессии к оси абсцисс; b – координата точки пересечения линейной регрессии с осью ординат.
2. Полиномиальная линия тренда полезна для описания характеристик,
имеющих несколько ярко выраженных экстремумов (максимумов и миниму-
мов). Выбор степени полиномиальной линии тренда (полинома) определяется количеством экстремумов исследуемой характеристики. Так, полином второй степени может хорошо описать характеристику, имеющую только один макси-
мум или минимум; полином третьей степени – не более двух экстремумов; по-
лином четвертой степени – не более трех экстремумов и т.д.
Строится в соответствии с уравнением
y = c0 + c1 x + c2 x2 + c3 x3 + c4 x4 + c5 x5 + c6 x6 ,
где коэффициенты c0 , c1, c2 ,…c6 – константы.
3. Логарифмическая линия тренда с успехом применяется при моделирова-
нии характеристик, значения которых вначале быстро растут или убывают по величине, а затем постепенно стабилизируются.
Строится в соответствии с уравнением
y = c × ln(x) + b ,
где коэффициенты b, с – константы.
4. Степенная линия тренда дает хорошие результаты, если значения иссле-
дуемой зависимости характеризуются постоянным изменением скорости роста.
Примером такой зависимости может служить график равноускоренного движе-
ния автомобиля. При наличии в данных нулевых или отрицательных значений использовать степенную линию тренда нельзя.
Строится в соответствии с уравнением
y = c × x b ,
где коэффициенты b, с – константы.
5. Экспоненциальная линия тренда следует использовать в том случае, если скорость изменения данных непрерывно возрастает. Для данных, содержащих нулевые или отрицательные значения, этот вид приближения неприменим.
Строится в соответствии с уравнением
y = c × eb×x ,
где коэффициенты b, с – константы.
При подборе линии тренда Excel автоматически рассчитывает значение величины R2, которая характеризует достоверность аппроксимации: чем ближе значение R2 к единице, тем надежнее линия тренда аппроксимирует исследуе-
мый процесс. При необходимости значение R2 всегда можно отобразить на
диаграмме.
Определяется по формуле
R 2 = 1 — |
Σ1 |
Σ1 = ∑(y j − Yj )2 |
S2 = ∑Yj2 — |
1 |
× (∑Yj )2 |
||||
S2 |
, где |
; |
. |
||||||
j |
j |
n j |
Для добавления линии тренда к ряду данных следует:
1. Активизировать построенную на основе ряда данных диаграмму, т.е. щелк-
нуть в пределах области диаграммы. В главном меню появится пункт Диа—
грамма.
2. После щелчка на этом пункте на экране появится меню, в котором следует выбрать команду Добавить линию тренда.
Пункты 1–2 легко реализуются также следующим приемом: направить ука-
затель мыши к графику, построенного на ряде данных, и щелкнуть правой кла-
вишей мыши, и в появившемся контекстном меню выбрать команду Добавить
линию тренда. На экране появится диалоговое окно Линия тренда с раскры-
той вкладкой Тип (рис.1).
Рис.1. Вкладка Тип диалогового окна Формат линии тренда
3. Выбрать на вкладке Тип необходимый тип линии тренда (по умолчанию выбирается тип Линейный). Для типа Полиномиальная в поле Степень сле-
дует задать степень выбранного полинома.
4. В поле Построен на ряде перечислены все ряды данных рассматриваемой диаграммы. Для добавления линии тренда к конкретному ряду данных следует в поле Построен на ряде выбрать его имя.
5. При необходимости, перейдя на вкладку Параметры (рис.2), можно для ли-
нии тренда задать следующие параметры:
∙ Изменить название линии тренда в поле Название аппроксимирующей
(сглаженной) кривой;
∙ Задать количество периодов (вперед или назад) для прогноза в поле Про—
гноз.
∙ Вывести в область диаграммы уравнение линии тренда, для чего следует ус-
тановить флажок для опции «показать уравнение на диаграмме».
∙ Вывести в область диаграммы значение достоверности аппроксимации R2,
для чего следует установить флажок для опции «поместить на диаграмму ве—
личину достоверности аппроксимации (R^2)».
∙ Задать точку пересечения линии тренда с осью Y, для чего следует устано-
вить флажок для опции «пересечение кривой с осью Y в точке:». 6. Нажать клавишу OK.
Рис.2. Вкладка Параметры диалогового окна Линия тренда
Для редактирования уже построенной линии тренда следует:
1. Щелкнуть левой клавишей мыши по той линии тренда, которую требуется
изменить.
2. Нажать в главном меню клавишу Формат, а появившемся контекстном ме-
ню выбрать команду Выделенная линия тренда.
Пункты 1–2 легко реализуются также следующим приемом: направить ука-
затель мыши к графику линии тренда, щелкнуть правой клавишей мыши, и в появившемся контекстном меню выбрать команду Формат линии тренда.
Еще легче реализуются пункты 1–2: двойным щелчком левой клавишей мыши по графику линии тренда.
3. На экране появится диалоговое окно Формат линии тренда (рис.3), содер-
жащее три вкладки: Вид, Тип, Параметры, причем содержимое вкладок Тип,
Параметры полностью совпадает с аналогичными вкладками диалогового ок-
на Линия тренда (рис.1–2).
4.При необходимости, перейдя на вкладку Вид (рис.3), можно для линии тренда задать тип линии, ее цвет и толщину.
5.Нажать клавишу OK.
Для удаления уже построенной линии тренда следует выбрать удаляемую линию тренда и нажать клавишу Delete.
Достоинствами этого инструмента регрессионного анализа являются:
∙ относительная легкость построения на диаграммах линии тренда без созда-
ния для нее таблицы данных;
∙достаточно широкий перечень типов предложенных линий трендов, причем в этот перечень входят наиболее часто используемые регрессии;
∙возможность прогнозирования поведения исследуемого процесса на произ-
вольное (в пределах здравого смысла) количество шагов вперед, а также назад;
∙возможность получения уравнения линии тренда в аналитическом виде;
∙возможность, при необходимости, получения оценки достоверности прове-
денной аппроксимации.
Кнедостаткам можно отнести следующие моменты:
∙построение линии тренда осуществляется лишь при наличии построенной на ряде данных диаграммы;
∙несколько загроможден процесс формирования рядов данных для исследуе-
мой характеристики на основании полученных для нее уравнений линий трен-
да, так как коэффициенты этих уравнений при каждом изменении значений ря-
да данных пересчитываются, но лишь в пределах области диаграммы;
∙ в отчетах сводных диаграмм при изменении представления диаграммы или связанного отчета сводной таблицы имеющиеся линии тренда не сохраняются,
то есть до проведения линий тренда или другого форматирования отчета свод-
ных диаграмм следует убедиться, что макет отчета удовлетворяет необходи-
мым требованиям.
Рис.3. Вкладка Вид диалогового окна Формат линии тренда
Линиями тренда можно дополнить ряды данных, представленные на гра-
фиках, гистограммах, плоских ненормированных диаграммах с областями, ли-
нейчатых, точечных, пузырьковых и биржевых диаграммах.
Нельзя дополнить линиями тренда ряды данных на объемных, нормиро-
ванных, лепестковых, круговых и кольцевых диаграммах. При замене типа диа-
граммы на один из вышеперечисленных, а также при изменении представления отчета сводной диаграммы или связанного отчета сводной таблицы соответст-
вующие данным линии тренда будут утеряны.
Использование встроенных функций Excel
ВExcel имеется также инструмент регрессионного анализа для построения линий тренда вне области диаграммы. Для этой цели можно использовать ряд статистических функций рабочего листа, однако все они позволяют строить лишь линейные или экспоненциальные регрессии.
ВExcel имеется несколько вариантов построения линейной регрессии (ли-
нейного тренда), в частности:
∙с помощью функции ТЕНДЕНЦИЯ;
∙с помощью функции ЛИНЕЙН;
∙с помощью функций НАКЛОН и ОТРЕЗОК.
ВExcel имеется также несколько вариантов построения экспоненциальной линии тренда, в частности:
∙с помощью функции РОСТ;
∙с помощью функции ЛГРФПРИБЛ.
Следует отметить, что приемы построения регрессий с помощью функций
ТЕНДЕНЦИЯ и РОСТ практически совпадают. То же самое можно сказать и о паре функций ЛИНЕЙН и ЛГРФПРИБЛ. Для всех этих четырех функций при создании таблицы значений используются такие возможности Excel, как формулы массивов, что несколько загромождает процесс построения регрес-
сий. Заметим также, что построение (создание) линейной регрессии, на наш взгляд, легче всего осуществить с помощью функций НАКЛОН и ОТРЕЗОК,
где первая из них определяет угловой коэффициент линейной регрессии, а вто-
рая – отрезок, отсекаемый регрессией на оси ординат.
Достоинствами данного инструмента регрессионного анализа являются:
∙ достаточно простой однотипный процесс формирования рядов данных ис-
следуемой характеристики для всех встроенных статистических функций, за-
дающих линии тренда;
∙ стандартная методика построения линий тренда на основе сформированных рядов данных;
∙ возможность прогнозирования поведения исследуемого процесса на необ-
ходимое количество шагов вперед или назад.
К недостаткам данного инструмента можно отнести то, что в Excel нет встроенных функций для создания других (кроме линейного и экспоненциаль-
ного) типов линий тренда. Это обстоятельство часто не позволяет подобрать с помощью выше перечисленных встроенных функций достаточно точную мо-
дель исследуемого процесса, а также получать близкие к реальности прогнозы.
Кроме того, при использовании функций ТЕНДЕНЦИЯ и РОСТ не известны уравнения линий тренда.
Следует отметить, что в этой статье авторы не ставили целью излагать курс регрессионного анализа с той или иной степенью полноты. Основная цель ста-
тьи – на конкретных примерах показать возможности пакета Excel при реше-
нии задач аппроксимации; продемонстрировать, каким эффективными инстру-
ментами для построения регрессий и прогнозирования обладает Excel; проил-
люстрировать, как относительно легко такие задачи могут быть решены даже пользователем, не владеющим глубокими знаниями регрессионного анализа.
Предложенная в статье методика по овладению навыков решения средства-
ми Excel такого рода задач (см. также [4 – 7], где приведены методики решения в Excel систем линейных алгебраических уравнений, нелинейных уравнений,
задач оптимизации, транспортных задач) может быть полезна и интересна пользователям. Это связано с тем, что пакет Excel установлен практически на каждом современном компьютере, в то время как такие известные специализи-
рованные математические пакеты, как Mathematica, Maple, Matlab, Mathcad,
обладающие более мощными возможностями для построения регрессий и про-
гнозирования, используются значительно меньшей пользовательской аудито-
рией.
Ниже приводятся решения конкретных задач с помощью перечисленных инструментов пакета Excel.
Задача 1. Для таблицы данных о прибыли автотранспортного предприятия за 1995–2002 г.г. необходимо выполнить следующие действия:
Как поступить в случае, если для определенных объемов/размеров продукции хронометражные замеры отсутствуют? Или число замеров недостаточно, а дополнительные наблюдения в ближайшее время осуществить невозможно? Наилучший способ решения данной проблемы – построение расчетных зависимостей (уравнений регрессии) с помощью линий тренда в MS Excel.
Рассмотрим реальную ситуацию: на складе с целью установления величины трудовых затрат по коробочной отборке заказа были проведены хронометражные наблюдения. Результаты этих наблюдений представлены в таблице 1 ниже.
Впоследствии возникла необходимость определения затрат времени на отборку 0,6 и 0,9 м3 товара/заказа. В связи с невозможностью проведения дополнительных хронометражных исследований затраты времени на отборку данных объемов заказа были рассчитаны с помощью уравнений регрессии в MS Excel. Для этого таблица 1 была преобразована в таблицу 2.
Далее на вкладке «Вставка» в группе «Диаграммы» была выбрана «точечная с гладкими кривыми и маркерами» (рис.1).
Выбор точечной диаграммы, рис. 1
Следующий шаг: курсор мыши был установлен на одной из точек графика и с помощью правой кнопки мыши было вызвано контекстное меню, в котором был выбран пункт: «добавить линию тренда» (рис.2).
Добавление линии тренда, рис. 2
В появившемся окне настройки формата линии тренда (рис. 3) были последовательно выбраны: тип линии линейная/степенная и установлены флажки на следующие пункты: «показать уравнение на диаграмме» и «поместить на диаграмме величину достоверности аппроксимации (R^2)» (коэффициент детерминации).
Формат линии тренда, рис. 3
В результате были получены графики, представленные на рис. 4 и 5.
Линейная расчетная зависимость, рис. 4
Степенная расчетная зависимость, рис. 5
Наглядный анализ графиков однозначно свидетельствует о близости полученных зависимостей. Кроме того, величина достоверности аппроксимации (R^2), которую также называют коэффициентом детерминации, в случае обеих зависимостей составляет одну и ту же величину 0,97. Известно, что чем ближе коэффициент детерминации к 1, тем больше линия тренда соответствует действительности. Также можно констатировать, что изменение затрат времени на обработку заказа на 97% объясняется изменением количества товара. Поэтому в данном случае не принципиально: какую расчетную зависимость выбрать в качестве основной для последующего расчета временных затрат.
Примем за основную — линейную расчетную зависимость. Тогда значения затрат времени в зависимости от количества товара будут определяться по формуле: y = 54,511x + 0,1489. Результаты этих расчетов для количества товара, по которому ранее были проведены хронометражные наблюдения, представлены в таблице 3 ниже.
Определим среднее отклонение затрат времени, рассчитанных по уравнению регрессии от затрат времени, рассчитанных по данным хронометражных наблюдений: (-0,05+0,10-0,05+0,01)/4=0,0019. Таким образом, затраты времени, рассчитанные по уравнению регрессии отличаются от затрат времени, рассчитанных по данным хронометражных наблюдений всего на 0,19%. Расхождение данных ничтожно мало.
По формуле: y = 54,511x + 0,1489 установим затраты времени для количества товара, по которому ранее не были проведены хронометражные наблюдения (таблица 4).
Таким образом, построение расчетных зависимостей с помощью линий тренда в MS Excel – это отличный способ установления затрат времени по операциям, которые в силу различных причин не были охвачены хронометражными наблюдениями.
Инструменты прогнозирования в Microsoft Excel
Смотрите также примера. известные_значения_x, не должна прогнозов были более скачать данный пример:Рассчитаем прогноз по продажамДиапазон временной шкалыЛист прогноза имеющихся данных. Функции или стабилизацию) продемонстрирует(вкладка серии научных экспериментов, линейного приближения, в на монитор в того, у прогноз прибыли на.Прогнозирование – это оченьНа график, отображающий фактические равняться 0 (нулю), точными.Функция ПРЕДСКАЗ в Excel
с учетом ростаЗдесь можно изменить диапазон,
Процедура прогнозирования
. ЛИНЕЙН и ЛГРФПРИБЛ предполагаемую тенденцию наГлавная можно использовать Microsoft 2019 году составит указанной ранее ячейке.
Способ 1: линия тренда
ТЕНДЕНЦИЯ 2018 год.Линия тренда построена и важный элемент практически объемы реализации продукции,
иначе функция ПРЕДСКАЗРассчитаем значения логарифмического тренда позволяет с некоторой и сезонности. Проанализируем используемый для временнойВ диалоговом окне
- возвращают различные данные ближайшие месяцы., группа Office Excel для 4614,9 тыс. рублей. Как видим, наимеется дополнительный аргументВыделяем незаполненную ячейку на по ней мы любой сферы деятельности, добавим линию тренда вернет код ошибки с помощью функции степенью точности предсказать продажи за 12 шкалы. Этот диапазонСоздание листа прогноза регрессионного анализа, включаяЭта процедура предполагает, чтоРедактирование автоматической генерации будущихПоследний инструмент, который мы этот раз результат«Константа» листе, куда планируется можем определить примерную начиная от экономики
- (правая кнопка по #ДЕЛ/0!. ПРЕДСКАЗ следующим способом: будущие значения на месяцев предыдущего года должен соответствовать параметрувыберите график или наклон и точку диаграмма, основанная на, кнопка
- значений, которые будут рассмотрим, будет составляет 4682,1 тыс., но он не выводить результат обработки.
- величину прибыли через и заканчивая инженерией.
- графику – «ДобавитьРассматриваемая функция игнорирует ячейки
- Как видно, в качестве основе существующих числовых
- и построим прогнозДиапазон значений
- гистограмму для визуального пересечения линии с
- существующих данных, ужеЗаполнить
базироваться на существующихЛГРФПРИБЛ
рублей. Отличия от является обязательным и Жмем на кнопку три года. Как Существует большое количество линию тренда»). с нечисловыми данными, первого аргумента представлен значений, и возвращает на 3 месяца. представления прогноза. осью. создана. Если это). данных или для. Этот оператор производит результатов обработки данных используется только при«Вставить функцию» видим, к тому программного обеспечения, специализирующегосяНастраиваем параметры линии тренда:
- содержащиеся в диапазонах, массив натуральных логарифмов соответствующие величины. Например, следующего года сДиапазон значенийВ полеСледующая таблица содержит ссылки еще не сделано,С помощью команды автоматического вычисления экстраполированных расчеты на основе оператором наличии постоянных факторов.. времени она должна именно на этомВыбираем полиномиальный тренд, что которые переданы в последующих номеров дней. некоторый объект характеризуется помощью линейного тренда.Здесь можно изменить диапазон,Завершение прогноза на дополнительные сведения просмотрите раздел СозданиеПрогрессия значений, базирующихся на метода экспоненциального приближения.ТЕНДЕНЦИЯ
- Данный оператор наиболее эффективноОткрывается перевалить за 4500 направлении. К сожалению, максимально сократить ошибку качестве второго и Таким образом получаем свойством, значение которого Каждый месяц это используемый для рядов
выберите дату окончания, об этих функциях. диаграмм.можно вручную управлять вычислениях по линейной Его синтаксис имеетнезначительны, но они используется при наличииМастер функций тыс. рублей. Коэффициент далеко не все прогнозной модели. третьего аргументов. функцию логарифмического тренда, изменяется с течением для нашего прогноза значений. Этот диапазон а затем нажмитеФункцияЩелкните диаграмму. созданием линейной или или экспоненциальной зависимости. следующую структуру:
имеются. Это связано линейной зависимости функции.. В категории
Способ 2: оператор ПРЕДСКАЗ
R2 пользователи знают, чтоR2 = 0,9567, чтоФункция ПРЕДСКАЗ была заменена которая записывается как времени. Такие изменения 1 период (y). должен совпадать со
кнопку
ОписаниеВыберите ряд данных, к экспоненциальной зависимости, аВ Microsoft Excel можно= ЛГРФПРИБЛ (Известные значения_y;известные с тем, чтоПосмотрим, как этот инструмент«Статистические», как уже было
обычный табличный процессор означает: данное отношение функцией ПРЕДСКАЗ.ЛИНЕЙН в y=aln(x)+b. могут быть зафиксированыУравнение линейного тренда: значением параметра
СоздатьПРЕДСКАЗ которому нужно добавить также вводить значения заполнить ячейки рядом значения_x; новые_значения_x;[конст];[статистика]) данные инструменты применяют будет работать всевыделяем наименование сказано выше, отображает
Excel имеет в объясняет 95,67% изменений Excel версии 2016,Результат расчетов: опытным путем, вy = bxДиапазон временной шкалы.Прогнозирование значений
линия тренда или с клавиатуры. значений, соответствующих простому
Как видим, все аргументы разные методы расчета: с тем же«ПРЕДСКАЗ» качество линии тренда. своем арсенале инструменты объемов продаж с но была оставленаДля сравнения, произведем расчет
- результате чего будет + a.В Excel будет создантенденция скользящее среднее.
- Для получения линейного тренда линейному или экспоненциальному полностью повторяют соответствующие метод линейной зависимости массивом данных. Чтобы, а затем щелкаем В нашем случае для выполнения прогнозирования, течением времени. для обеспечения совместимости
- с использованием функции составлена таблица известныхy — объемы продаж;Заполнить отсутствующие точки с новый лист сПрогнозирование линейной зависимости.На вкладке к начальным значениям тренду, с помощью элементы предыдущей функции. и метод экспоненциальной сравнить полученные результаты, по кнопке величина которые по своейУравнение тренда – это с Excel 2013 линейного тренда: значений x иx — номер периода; помощью
таблицей, содержащей статистическиеРОСТМакет применяется метод наименьших маркер заполнения или Алгоритм расчета прогноза зависимости. точкой прогнозирования определим«OK»R2 эффективности мало чем
модель формулы для и более старымиИ для визуального сравнительного соответствующих им значенийa — точка пересеченияДля обработки отсутствующих точек
и предсказанные значения,Прогнозирование экспоненциальной зависимости.в группе квадратов (y=mx+b). команды
- немного изменится. ФункцияОператор 2019 год..составляет уступают профессиональным программам. расчета прогнозных значений. версиями. анализа построим простой y, где x с осью y Excel использует интерполяцию. и диаграммой, на
- линейнАнализДля получения экспоненциального трендаПрогрессия рассчитает экспоненциальный тренд,ЛИНЕЙНПроизводим обозначение ячейки дляЗапускается окно аргументов. В0,89 Давайте выясним, что
Большинство авторов для прогнозированияДля предсказания только одного график. – единица измерения на графике (минимальный Это означает, что которой они отражены.Построение линейного приближения.нажмите кнопку
к начальным значениям. Для экстраполяции сложных
Способ 3: оператор ТЕНДЕНЦИЯ
который покажет, вопри вычислении использует вывода результата и поле. Чем выше коэффициент, это за инструменты, продаж советуют использовать будущего значения наПолученные результаты: времени, а y порог); отсутствующая точка вычисляется
Этот лист будет находиться
лгрфприблЛиния тренда применяется алгоритм расчета и нелинейных данных сколько раз поменяется метод линейного приближения. запускаем«X» тем выше достоверность и как сделать линейную линию тренда. основании известного значенияКак видно, функцию линейной – количественная характеристикаb — увеличение последующих как взвешенное среднее слева от листа,Построение экспоненциального приближения.и выберите нужный экспоненциальной кривой (y=b*m^x).
можно применять функции сумма выручки за Его не стоит
Мастер функцийуказываем величину аргумента, линии. Максимальная величина прогноз на практике. Чтобы на графике независимой переменной функция регрессии следует использовать
- свойства. С помощью значений временного ряда. соседних точек, если на котором выПри необходимости выполнить более тип регрессионной линииВ обоих случаях не или средство регрессионный один период, то путать с методомобычным способом. В к которому нужно его может быть
- Скачать последнюю версию увидеть прогноз, в ПРЕДСКАЗ используется как в тех случаях, функции ПРЕДСКАЗ можноДопустим у нас имеются отсутствует менее 30 % ввели ряды данных сложный регрессионный анализ — тренда или скользящего учитывается шаг прогрессии. анализ из надстройки есть, за год. линейной зависимости, используемым категории отыскать значение функции. равной Excel параметрах необходимо установить обычная формула. Если когда наблюдается постоянный предположить последующие значения следующие статистические данные точек. Чтобы вместо (то есть перед включая вычисление и
- среднего. При создании этих «Пакет анализа». Нам нужно будет инструментом«Статистические» В нашем случаем1Целью любого прогнозирования является количество периодов.
Способ 4: оператор РОСТ
требуется предсказать сразу рост какой-либо величины. y для новых по продажам за этого заполнять отсутствующие ним). отображение остатков — можноДля определения параметров и прогрессий получаются теВ арифметической прогрессии шаг найти разницу вТЕНДЕНЦИЯнаходим и выделяем это 2018 год.
. Принято считать, что
выявление текущей тенденции,Получаем достаточно оптимистичный результат: несколько значений, в В данном случае значений x. прошлый год. точки нулями, выберитеЕсли вы хотите изменить использовать средство регрессионного форматирования регрессионной линии же значения, которые или различие между
- прибыли между последним. Его синтаксис имеет наименование Поэтому вносим запись при коэффициенте свыше и определение предполагаемогоВ нашем примере все-таки качестве первого аргумента функция логарифмического трендаФункция ПРЕДСКАЗ использует методРассчитаем значение линейного тренда.
- в списке пункт дополнительные параметры прогноза, анализа в надстройке тренда или скользящего вычисляются с помощью начальным и следующим фактическим периодом и такой вид:«ТЕНДЕНЦИЯ»«2018»0,85 результата в отношении экспоненциальная зависимость. Поэтому следует передать массив
- позволяет получить более линейной регрессии, а Определим коэффициенты уравненияНули нажмите кнопку «Пакет анализа». Дополнительные среднего щелкните линию функций ТЕНДЕНЦИЯ и значением в ряде первым плановым, умножить=ЛИНЕЙН(Известные значения_y;известные значения_x; новые_значения_x;[конст];[статистика]). Жмем на кнопку. Но лучше указатьлиния тренда является изучаемого объекта на при построении линейного или ссылку на правдоподобные данные (более
Способ 5: оператор ЛИНЕЙН
ее уравнение имеет y = bx.Параметры сведения см. в тренда правой клавишей РОСТ. добавляется к каждому её на числоПоследние два аргумента являются«OK»
этот показатель в
достоверной. определенный момент времени тренда больше ошибок диапазон ячеек со наглядно при большем вид y=ax+b, где: + a. ВОбъединить дубликаты с помощью. статье Загрузка пакета мыши и выберитеДля заполнения значений вручную следующему члену прогрессии. плановых периодов необязательными. С первыми. ячейке на листе,Если же вас не в будущем. и неточностей. значениями независимой переменной, количестве данных).Коэффициент a рассчитывается как ячейке D15 ИспользуемЕсли данные содержат несколько
- Вы найдете сведения о статистического анализа. пункт выполните следующие действия.Начальное значение(3) же двумя мыОткрывается окно аргументов оператора а в поле устраивает уровень достоверности,Одним из самых популярныхДля прогнозирования экспоненциальной зависимости
- а функцию ПРЕДСКАЗПример 3. В таблице Yср.-bXср. (Yср. и функцию ЛИНЕЙН: значений с одной каждом из параметровПримечание:Формат линии трендаВыделите ячейку, в которойПродолжение ряда (арифметическая прогрессия)и прибавить к знакомы по предыдущимТЕНДЕНЦИЯ«X»
- то можно вернуться видов графического прогнозирования в Excel можно
- использовать в качестве Excel указаны значения Xср. – среднееВыделяем ячейку с формулой меткой времени, Excel в приведенной ниже Мы стараемся как можно. находится первое значение1, 2 результату сумму последнего способам. Но вы,. В полепросто дать ссылку в окно формата в Экселе является использовать также функцию формулы массива. независимой и зависимой арифметическое чисел из D15 и соседнюю, находит их среднее. таблице. оперативнее обеспечивать васВыберите параметры линии тренда, создаваемой прогрессии.3, 4, 5… фактического периода. наверное, заметили, что«Известные значения y» на него. Это линии тренда и экстраполяция выполненная построением РОСТ.Анализ временных рядов позволяет
переменных. Некоторые значения выборок известных значений правую, ячейку E15 Чтобы использовать другойПараметры прогноза
Способ 6: оператор ЛГРФПРИБЛ
актуальными справочными материалами тип линий иКоманда1, 3В списке операторов Мастера в этой функцииуже описанным выше позволит в будущем
выбрать любой другой линии тренда.
Для линейной зависимости – изучить показатели во зависимой переменной указаны y и x так чтобы активной метод вычисления, напримерОписание на вашем языке. эффекты.Прогрессия5, 7, 9 функций выделяем наименование отсутствует аргумент, указывающий способом заносим координаты автоматизировать вычисления и тип аппроксимации. МожноПопробуем предсказать сумму прибыли ТЕНДЕНЦИЯ. времени. Временной ряд в виде отрицательных соответственно). оставалась D15. Нажимаем
- МедианаНачало прогноза Эта страница переведенаПри выборе типаудаляет из ячеек100, 95«ЛГРФПРИБЛ»
- на новые значения. колонки при надобности легко перепробовать все доступные предприятия через 3При составлении прогнозов нельзя – это числовые чисел. Спрогнозировать несколькоКоэффициент b определяется по
- кнопку F2. Затем, выберите его вВыбор даты для прогноза
- автоматически, поэтому ееПолиномиальная прежние данные, заменяя90, 85. Делаем щелчок по Дело в том,«Прибыль предприятия» изменять год. варианты, чтобы найти года на основе использовать какой-то один значения статистического показателя, последующих значений зависимой формуле: Ctrl + Shift списке. для начала. При текст может содержатьвведите в поле их новыми. ЕслиДля прогнозирования линейной зависимости кнопке что данный инструмент. В полеВ поле наиболее точный. данных по этому метод: велика вероятность
расположенные в хронологическом переменной, исключив изПример 1. В таблице + Enter (чтобыВключить статистические данные прогноза выборе даты до неточности и грамматическиеСтепень необходимо сохранить прежние
выполните следующие действия.«OK» определяет только изменение
«Известные значения x»«Известные значения y»Нужно заметить, что эффективным показателю за предыдущие больших отклонений и порядке. расчетов отрицательные числа. приведены данные о ввести массив функцийУстановите этот флажок, если конца статистических данных ошибки. Для наснаибольшую степень для данные, скопируйте ихУкажите не менее двух. величины выручки завводим адрес столбцауказываем координаты столбца прогноз с помощью 12 лет. неточностей.
Подобные данные распространены в
lumpics.ru
Прогнозирование значений в рядах
Вид таблицы данных: ценах на бензин для обеих ячеек). вы хотите дополнительные используются только данные важно, чтобы эта независимой переменной. в другую строку ячеек, содержащих начальныеЗапускается окно аргументов. В единицу периода, который«Год»«Прибыль предприятия» экстраполяции через линию
Строим график зависимости наУмение строить прогнозы, предсказывая самых разных сферахДля расчета будущих значений за 23 дня Таким образом получаем статистические сведения о от даты начала статья была вамПри выборе типа или другой столбец, значения. нем вносим данные в нашем случае
Автоматическое заполнение ряда на основе арифметической прогрессии
. В поле. Это можно сделать, тренда может быть, основе табличных данных, (хотя бы примерно!) человеческой деятельности: ежедневные
Y без учета |
текущего месяца. Согласно |
сразу 2 значения |
включенных на новый |
предсказанного (это иногда |
полезна. Просим вас |
Скользящее среднее |
а затем приступайте |
Если требуется повысить точность точно так, как
-
равен одному году,«Новые значения x» установив курсор в
если период прогнозирования состоящих из аргументов будущее развитие событий
-
цены акций, курсов отрицательных значений (-5, прогнозам специалистов, средняя коефициентов для (a)
лист прогноза. В называется «ретроспективный анализ»). уделить пару секундвведите в поле к созданию прогрессии. прогноза, укажите дополнительные это делали, применяя
а вот общийзаносим ссылку на поле, а затем, не превышает 30% и значений функции. — неотъемлемая и валют, ежеквартальные, годовые -20 и -35) стоимость 1 л и (b). результате добавит таблицуСоветы: и сообщить, помоглаПериод
Автоматическое заполнение ряда на основе геометрической прогрессии
На вкладке начальные значения. функцию итог нам предстоит ячейку, где находится зажав левую кнопку от анализируемой базы Для этого выделяем
очень важная часть |
объемы продаж, производства |
используем формулу: |
бензина в текущем |
Рассчитаем для каждого периода |
статистики, созданной с |
|
ли она вам, |
число периодов, используемыхГлавная
-
Перетащите маркер заполнения вЛИНЕЙН подсчитать отдельно, прибавив
номер года, на мыши и выделив периодов. То есть,
-
табличную область, а любого современного бизнеса. и т.д. Типичный0;B2:B11;0);ЕСЛИ(B2:B11>0;A2:A11;0))’ class=’formula’> месяце не превысит у-значение линейного тренда. помощью ПРОГНОЗА. ETS.Запуск прогноза до последней с помощью кнопок для расчета скользящего
в группе нужном направлении, чтобы. Щелкаем по кнопке к последнему фактическому который нужно указать соответствующий столбец на при анализе периода
затем, находясь во Само-собой, это отдельная временной ряд вC помощью функций ЕСЛИ 41,5 рубля. Спрогнозировать Для этого в СТАТИСТИКА функциями, а точке статистических дает внизу страницы. Для среднего.Правка заполнить ячейки возрастающими«OK» значению прибыли результат
Ручное прогнозирование линейной или экспоненциальной зависимости
прогноз. В нашем листе. в 12 лет вкладке весьма сложная наука метеорологии, например, ежемесячный выполняется перебор элементов
-
стоимость бензина на известное уравнение подставим также меры, например представление точности прогноза
-
удобства также приводимПримечания:нажмите кнопку или убывающими значениями.
. вычисления оператора случае это 2019Аналогичным образом в поле мы не можем«Вставка» с кучей методов объем осадков.
диапазона B2:B11 и оставшиеся дни месяца,
-
рассчитанные коэффициенты (х сглаживания коэффициенты (альфа, как можно сравнивать
ссылку на оригинал ЗаполнитьНапример, если ячейки C1:E1Результат экспоненциального тренда подсчитанЛИНЕЙН год. Поле«Известные значения x» составить эффективный прогноз, кликаем по значку и подходов, но
-
Если фиксировать значения какого-то отброс отрицательных чисел. сравнить рассчитанное среднее – номер периода). бета-версии, гамма) и прогнозируемое ряд фактические (на английском языке).В полеи выберите пункт
-
содержат начальные значения и выведен в
-
, умноженный на количество«Константа»вносим адрес столбца более чем на нужного вида диаграммы,
-
часто для грубой процесса через определенные Так, получаем прогнозные значение с предсказаннымЧтобы определить коэффициенты сезонности,
-
-
метрик ошибки (MASE, данные. Тем неЕсли у вас естьПостроен на рядеПрогрессия
3, 5 и |
обозначенную ячейку. |
лет. |
оставляем пустым. Щелкаем«Год» 3-4 года. Но |
который находится в |
повседневной оценки ситуации промежутки времени, то данные на основании специалистами. сначала найдем отклонение |
-
SMAPE, обеспечения, RMSE). менее при запуске статистические данные сперечислены все ряды. 8, то приСтавим знак
-
Производим выделение ячейки, в по кнопкес данными за даже в этом блоке
достаточно простых техник. получатся элементы временного значений в строкахВид исходной таблицы данных: фактических данных отПри использовании формулы для прогноз слишком рано, зависимостью от времени, данных диаграммы, поддерживающих
Вычисление трендов с помощью добавления линии тренда на диаграмму
Выполните одно из указанных протаскивании вправо значения«=» которой будет производиться«OK» прошедший период. случае он будет«Диаграммы» Одна из них ряда. Их изменчивость с номерами 2,3,5,6,8-10.Чтобы определить предполагаемую стоимость значений тренда («продажи создания прогноза возвращаются созданный прогноз не вы можете создать линии тренда. Для ниже действий.
будут возрастать, влево —в пустую ячейку. вычисление и запускаем.После того, как вся относительно достоверным, если. Затем выбираем подходящий
-
— это функция
-
пытаются разделить на Для детального анализа бензина на оставшиеся за год» /
-
таблица со статистическими обязательно прогноз, что прогноз на их добавления линии трендаЕсли необходимо заполнить значениями убывать. Открываем скобки и Мастер функций. ВыделяемОператор обрабатывает данные и информация внесена, жмем
-
за это время для конкретной ситуацииПРЕДСКАЗ (FORECAST) закономерную и случайную формулы выберите инструмент дни используем следующую «линейный тренд»). и предсказанными данными вам будет использовать
-
основе. При этом к другим рядам ряда часть столбца,
-
Совет: выделяем ячейку, которая наименование выводит результат на на кнопку не будет никаких
-
тип. Лучше всего, которая умеет считать составляющие. Закономерные изменения «ФОРМУЛЫ»-«Зависимости формул»-«Вычислить формулу». функцию (как формулуРассчитаем средние продажи за и диаграмма. Прогноз
-
статистических данных. Использование в Excel создается
-
выберите нужное имя выберите вариант Чтобы управлять созданием ряда содержит значение выручки«ЛИНЕЙН» экран. Как видим,«OK» форс-мажоров или наоборот выбрать точечную диаграмму. прогноз по линейному членов ряда, как
-
Один из этапов массива): год. С помощью предсказывает будущие значения всех статистических данных новый лист с в поле, апо столбцам вручную или заполнять за последний фактическийв категории
Прогнозирование значений с помощью функции
сумма прогнозируемой прибыли. чрезвычайно благоприятных обстоятельств, Можно выбрать и тренду. правило, предсказуемы. вычислений формулы:Описание аргументов: формулы СРЗНАЧ. на основе имеющихся дает более точные таблицей, содержащей статистические затем выберите нужные. ряд значений с период. Ставим знак«Статистические»
на 2019 год,Оператор производит расчет на которых не было другой вид, ноПринцип работы этой функцииСделаем анализ временных рядовПолученные результаты:A26:A33 – диапазон ячеекОпределим индекс сезонности для данных, зависящих от прогноза. и предсказанные значения, параметры.Если необходимо заполнить значениями помощью клавиатуры, воспользуйтесь«*»и жмем на рассчитанная методом линейной основании введенных данных в предыдущих периодах. тогда, чтобы данные несложен: мы предполагаем, в Excel. Пример:Функция имеет следующую синтаксическую
с номерами дней каждого месяца (отношение времени, и алгоритмаЕсли в ваших данных и диаграммой, наЕсли к двумерной диаграмме ряда часть строки, командойи выделяем ячейку, кнопку зависимости, составит, как и выводит результатУрок:
отображались корректно, придется что исходные данные торговая сеть анализирует
запись: |
месяца, для которых |
продаж месяца к |
экспоненциального сглаживания (ETS) |
прослеживаются сезонные тенденции, |
которой они отражены. |
(диаграмме распределения) добавляется |
выберите вариант |
Прогрессия |
содержащую экспоненциальный тренд. |
«OK» |
и при предыдущем |
Выполнение регрессионного анализа с надстройкой «Пакет анализа»
на экран. НаКак построить линию тренда выполнить редактирование, в можно интерполировать (сгладить) данные о продажах=ПРЕДСКАЗ(x;известные_значения_y;известные_значения_x) данные о стоимости средней величине). Фактически версии AAA. то рекомендуется начинать
support.office.com
Создание прогноза в Excel для Windows
С помощью прогноза скользящее среднее, топо строкам(вкладка Ставим знак минус. методе расчета, 4637,8 2018 год планируется в Excel частности убрать линию некой прямой с товаров магазинами, находящимисяОписание аргументов: бензина еще не нужно каждый объемТаблицы могут содержать следующие прогнозирование с даты, вы можете предсказывать это скользящее среднее.Главная
и снова кликаемВ поле тыс. рублей. прибыль в районеЭкстраполяцию для табличных данных аргумента и выбрать классическим линейным уравнением в городах сx – обязательный для определены; продаж за месяц столбцы, три из предшествующей последней точке такие показатели, как базируется на порядкеВ поле, группа по элементу, в«Известные значения y»
Ещё одной функцией, с 4564,7 тыс. рублей. можно произвести через другую шкалу горизонтальной y=kx+b:
Создание прогноза
-
населением менее 50 заполнения аргумент, характеризующийB3:B25 – диапазон ячеек,
-
разделить на средний которых являются вычисляемыми: статистических данных.
-
будущий объем продаж,
расположения значений XШагРедактирование
котором находится величина, открывшегося окна аргументов, помощью которой можно На основе полученной стандартную функцию Эксель оси.Построив эту прямую и 000 человек. Период одно или несколько содержащих данные о объем продаж застолбец статистических значений времениДоверительный интервал потребность в складских в диаграмме. Длявведите число, которое, кнопка выручки за последний вводим координаты столбца производить прогнозирование в таблицы мы можемПРЕДСКАЗТеперь нам нужно построить
-
-
продлив ее вправо
– 2012-2015 гг. новых значений независимой стоимости бензина за год. (ваш ряд данных,
-
Установите или снимите флажок запасах или потребительские получения нужного результата определит значение шагаЗаполнить период. Закрываем скобку«Прибыль предприятия»
-
Экселе, является оператор построить график при. Этот аргумент относится линию тренда. Делаем за пределы известного
-
Задача – выявить переменной, для которых последние 23 дня;В ячейке H2 найдем содержащий значения времени);доверительный интервал тенденции.
перед добавлением скользящего прогрессии.). и вбиваем символы. В поле РОСТ. Он тоже
помощи инструментов создания к категории статистических щелчок правой кнопкой временного диапазона - основную тенденцию развития. требуется предсказать значения
Настройка прогноза
A3:A25 – диапазон ячеек общий индекс сезонностистолбец статистических значений (ряд, чтобы показать илиСведения о том, как
среднего, возможно, потребуетсяТип прогрессииВ экспоненциальных рядах начальное«*3+»
«Известные значения x» |
относится к статистической |
диаграммы, о которых |
инструментов и имеет мыши по любой получим искомый прогноз.Внесем данные о реализации y (зависимой переменной). с номерами дней, через функцию: =СРЗНАЧ(G2:G13). данных, содержащий соответствующие скрыть ее. Доверительный вычисляется прогноз и
|
«Год» |
в отличие отЕсли поменять год в=ПРЕДСКАЗ(X;известные_значения_y;известные значения_x) В активировавшемся контекстном Excel использует известныйНа вкладке «Данные» нажимаем значение, массив чисел, известна стоимость бензина. объема и сезонность.столбец прогнозируемых значений (вычисленных вокруг каждого предполагаемые изменить, приведены ниже . Функция ПРЕДСКАЗ вычисляетШаг — это число, добавляемое следующего значения в же ячейке, которую. Остальные поля оставляем предыдущих, при расчете ячейке, которая использовалась«X» меню останавливаем выбор |
метод наименьших квадратов |
кнопку «Анализ данных». ссылку на однуРезультат расчетов: На 3 месяца с помощью функции значения, в котором в этой статье. или предсказывает будущее к каждому следующему ряде. Получившийся результат выделяли в последний пустыми. Затем жмем применяет не метод для ввода аргумента,– это аргумент, на пункте. Если коротко, то Если она не ячейку или диапазон;Рассчитаем среднюю стоимость 1 вперед. Продлеваем номера ПРЕДСКАЗ.ЕTS); 95% точек будущихНа листе введите два значение по существующим члену прогрессии. и каждый последующий раз. Для проведения на кнопку |
линейной зависимости, а |
то соответственно изменится значение функции для«Добавить линию тренда» суть этого метода видна, заходим визвестные_значения_y – обязательный аргумент, |
л бензина на |
периодов временного рядаДва столбца, представляющее доверительный ожидается, находится в ряда данных, которые значениям. Предсказываемое значение —Геометрическая результат умножаются на |
расчета жмем на«OK» |
экспоненциальной. Синтаксис этого результат, а также которого нужно определить.. в том, что меню. «Параметры Excel» характеризующий уже известные основании имеющихся и на 3 значения интервал (вычисленных с интервале, на основе соответствуют друг другу: это y-значение, соответствующее |
Начальное значение умножается на |
шаг. кнопку. инструмента выглядит таким автоматически обновится график. В нашем случаеОткрывается окно форматирования линии наклон и положение — «Надстройки». Внизу |
числовые значения зависимой |
расчетных данных с в столбце I: помощью функции ПРОГНОЗА. прогноза (с нормальнымряд значений даты или заданному x-значению. Известные шаг. Получившийся результатНачальное значениеEnterПрограмма рассчитывает и выводит образом: Например, по прогнозам в качестве аргумента тренда. В нем |
Формулы, используемые при прогнозировании
линии тренда подбирается нажимаем «Перейти» к переменной y. Может помощью функции:Рассчитаем значения тренда для ETS. CONFINT). Эти распределением). Доверительный интервал времени для временной значения — это существующие и каждый последующийПродолжение ряда (геометрическая прогрессия)
. в выбранную ячейку=РОСТ(Известные значения_y;известные значения_x; новые_значения_x;[конст])
-
в 2019 году будет выступать год, можно выбрать один
-
так, чтобы сумма «Надстройкам Excel» и быть указан в
-
=СРЗНАЧ(B3:B33) будущих периодов: изменим столбцы отображаются только
-
помогут вам понять, шкалы; x- и y-значения; результат умножаются на1, 2Прогнозируемая сумма прибыли в значение линейного тренда.Как видим, аргументы у сумма прибыли составит на который следует из шести видов
Скачайте пример книги.
квадратов отклонений исходных выбираем «Пакет анализа». виде массива чиселРезультат: в уравнении линейной
См. также:
в том случае,
support.office.com
Прогнозирование продаж в Excel и алгоритм анализа временного ряда
точности прогноза. Меньшийряд соответствующих значений показателя. новое значение предсказывается шаг.
4, 8, 16 2019 году, котораяТеперь нам предстоит выяснить данной функции в 4637,8 тыс. рублей. произвести прогнозирование.
аппроксимации: данных от построеннойПодключение настройки «Анализ данных» или ссылки на
Можно сделать вывод о функции значение х. если установлен флажок интервал подразумевает болееЭти значения будут предсказаны с использованием линейнойВ разделе1, 3 была рассчитана методом величину прогнозируемой прибыли точности повторяют аргументыНо не стоит забывать,
Пример прогнозирования продаж в Excel
«Известные значения y»Линейная линии тренда была детально описано здесь. диапазон ячеек с том, что если Для этого можнодоверительный интервал уверенно предсказанного для для дат в регрессии. Этой функциейТип
9, 27, 81
экспоненциального приближения, составит на 2019 год.
- оператора
- что, как и
- — база известных; минимальной, т.е. линияНужная кнопка появится на
- числами; тенденция изменения цен
просто скопировать формулув разделе определенный момент. Уровня будущем.
- можно воспользоваться длявыберите тип прогрессии:2, 3 4639,2 тыс. рублей, Устанавливаем знакТЕНДЕНЦИЯ
- при построении линии значений функции. ВЛогарифмическая тренда наилучшим образом ленте.известные_значения_x – обязательный аргумент, на бензин сохранится, из D2 вПараметры достоверности 95% поПримечание: прогнозирования будущих продаж,арифметическая4.5, 6.75, 10.125
- что опять не«=», так что второй тренда, отрезок времени нашем случае в;
- сглаживала фактические данные.Из предлагаемого списка инструментов который характеризует уже предсказания специалистов относительно J2, J3, J4.окна…
- умолчанию могут быть Для временной шкалы требуются потребностей в складских
- илиДля прогнозирования экспоненциальной зависимости сильно отличается отв любую пустую раз на их до прогнозируемого периода её роли выступаетЭкспоненциальнаяExcel позволяет легко построить
- для статистического анализа известные значения независимой средней стоимости сбудутся.
- На основе полученных данныхЩелкните эту ссылку, чтобы изменены с помощью одинаковые интервалы между запасах или тенденцийгеометрическая выполните следующие действия.
- результатов, полученных при ячейку на листе. описании останавливаться не не должен превышать величина прибыли за; линию тренда прямо выбираем «Экспоненциальное сглаживание».
- переменной x, для составляем прогноз по загрузить книгу с вверх или вниз. точками данных. Например,
потребления..
Укажите не менее двух
вычислении предыдущими способами.
Кликаем по ячейке,
Алгоритм анализа временного ряда и прогнозирования
будем, а сразу 30% от всего предыдущие периоды.Степенная на диаграмме щелчком
- Этот метод выравнивания которой определены значения
- Пример 2. Компания недавно продажам на следующие
- помощью Excel ПРОГНОЗА.Сезонность
это могут бытьИспользование функций ТЕНДЕНЦИЯ иВ поле ячеек, содержащих начальныеУрок: в которой содержится
- перейдем к применению
срока, за который«Известные значения x»; правой по ряду
exceltable.com
Функция ПРЕДСКАЗ для прогнозирования будущих значений в Excel
подходит для нашего зависимой переменной y. представила новый продукт. 3 месяца (следующего Примеры использования функцииСезонности — это число месячные интервалы со РОСТПредельное значение значения.Другие статистические функции в фактическая величина прибыли этого инструмента на накапливалась база данных.— это аргументы,Полиномиальная — Добавить линию динамического ряда, значенияПримечания: С момента вывода года) с учетом ETS в течение (количество значениями на первое . Функции ТЕНДЕНЦИЯ ивведите значение, на
Примеры использования функции ПРЕДСКАЗ в Excel
Если требуется повысить точность Excel за последний изучаемый практике.
- Урок: которым соответствуют известные; тренда (Add Trendline), которого сильно колеблются.Второй и третий аргументы на рынок ежедневно
- сезонности:Функции прогнозирования
точек) сезонного узора число каждого месяца, РОСТ позволяют экстраполировать котором нужно остановить прогноза, укажите дополнительныеМы выяснили, какими способами год (2016 г.).Выделяем ячейку вывода результатаЭкстраполяция в Excel значения функции. ВЛинейная фильтрация но часто дляЗаполняем диалоговое окно. Входной рассматриваемой функции должны ведется учет количества
Общая картина составленного прогноза
Прогнозирование продаж в Excel и определяется автоматически. годичные или числовые будущие прогрессию.
начальные значения.
- можно произвести прогнозирование Ставим знак и уже привычнымДля прогнозирования можно использовать их роли у.
- расчетов нам нужна интервал – диапазон принимать ссылки на клиентов, купивших этот
- выглядит следующим образом: не сложно составить Например годового цикла интервалы. Если на
y
Примечание:Удерживая правую кнопку мыши, в программе Эксель.«+» путем вызываем
ещё одну функцию
нас выступает нумерация
Давайте для начала выберем не линия, а со значениями продаж. непустые диапазоны ячеек продукт. Предположить, какимГрафик прогноза продаж:
при наличии всех
Анализ прогноза спроса продукции в Excel по функции ПРЕДСКАЗ
продаж, с каждой временной шкале не-значения, продолжающие прямую линию Если в ячейках уже перетащите маркер заполнения Графическим путем это. Далее кликаем поМастер функций – годов, за которые
линейную аппроксимацию.
числовые значения прогноза, Фактор затухания – или такие диапазоны, будет спрос наГрафик сезонности: необходимых финансовых показателей. точки, представляющий месяц, хватает до 30 % или экспоненциальную кривую, содержатся первые члены в нужном направлении можно сделать через ячейке, в которой. В списке статистическихТЕНДЕНЦИЯ была собрана информацияВ блоке настроек которые ей соответствуют. коэффициент экспоненциального сглаживания в которых число протяжении 5 последующих
В данном примере будем сезонности равно 12.
точек данных или наилучшим образом описывающую прогрессии и требуется, для заполнения ячеек применение линии тренда, содержится рассчитанный ранее операторов ищем пункт. Она также относится
о прибыли предыдущих
«Прогноз» Вот, как раз, (по умолчанию –
ячеек совпадает. Иначе дней.Алгоритм анализа временного ряда
использовать линейный тренд
Автоматическое обнаружение можно есть несколько чисел существующие данные. Эти чтобы приложение Microsoft возрастающими или убывающими а аналитическим – линейный тренд. Ставим«РОСТ» к категории статистических лет.в поле
Прогнозирование будущих значений в Excel по условию
их и вычисляет 0,3). Выходной интервал функция ПРЕДСКАЗ вернетВид исходной таблицы данных: для прогнозирования продаж для составления прогноза переопределить, выбрав с одной и функции могут возвращать Excel создало прогрессию
значениями, отпустите правую
используя целый ряд знак, выделяем его и операторов. Её синтаксисЕстественно, что в качестве
«Вперед на»
функция – ссылка на код ошибки #Н/Д.Как видно, в первые в Excel можно по продажам наЗадание вручную той же меткойy автоматически, установите флажок кнопку, а затем встроенных статистических функций.«*»
щелкаем по кнопке
Особенности использования функции ПРЕДСКАЗ в Excel
во многом напоминает аргумента не обязательно
устанавливаем число
ПРЕДСКАЗ (FORECAST)
- верхнюю левую ячейкуЕсли одна или несколько дни спрос был построить в три бушующие периоды си затем выбрав времени, это нормально.-значения, соответствующие заданнымАвтоматическое определение шага щелкните В результате обработки
- . Так как между«OK» синтаксис инструмента должен выступать временной«3,0». выходного диапазона. Сюда ячеек из диапазона, небольшим, затем он
- шага: учетом сезонности. числа. Прогноз все равноx.
Экспоненциальное приближение
- идентичных данных этими последним годом изучаемого.ПРЕДСКАЗ отрезок. Например, им, так как намСинтаксис функции следующий программа поместит сглаженные ссылка на который
- рос достаточно большимиВыделяем трендовую составляющую, используяЛинейный тренд хорошо подходитПримечание: будет точным. Но-значениям, на базе линейнойЕсли имеются существующие данные,в контекстное меню. операторами может получиться периода (2016 г.)Происходит активация окна аргументови выглядит следующим может являться температура,
- нужно составить прогноз=ПРЕДСКАЗ(X; Известные_значения_Y; Известные_значения_X) уровни и размер передана в качестве темпами, а на функцию регрессии. для формирования плана Если вы хотите задать для повышения точности или экспоненциальной зависимости.
- для которых следуетНапример, если ячейки C1:E1 разный итог. Но и годом на указанной выше функции. образом:
- а значением функции на три годагде определит самостоятельно. Ставим аргумента x, содержит протяжении последних трехОпределяем сезонную составляющую в по продажам для
- сезонность вручную, не прогноза желательно перед Используя существующие спрогнозировать тренд, можно содержат начальные значения это не удивительно, который нужно сделать Вводим в поля=ТЕНДЕНЦИЯ(Известные значения_y;известные значения_x; новые_значения_x;[конст]) может выступать уровень вперед. Кроме того,Х галочки «Вывод графика», нечисловые данные или дней изменялся незначительно. виде коэффициентов.
exceltable.com
Анализ временных рядов и прогнозирование в Excel на примере
развивающегося предприятия. используйте значения, которые его созданием обобщитьx создать на диаграмме 3, 5 и так как все
прогноз (2019 г.) этого окна данныеКак видим, аргументы расширения воды при можно установить галочки- точка во «Стандартные погрешности». текстовую строку, которая Это свидетельствует оВычисляем прогнозные значения на
Временные ряды в Excel
Excel – это лучший меньше двух циклов данные.-значения и линия тренда. Например, 8, то при они используют разные лежит срок в полностью аналогично тому,«Известные значения y»
нагревании. около настроек времени, для которойЗакрываем диалоговое окно нажатием не может быть том, что основным определенный период. в мире универсальный статистических данных. ПриВыделите оба ряда данных.y
если имеется созданная протаскивании вправо значения
методы расчета. Если три года, то как мы ихиПри вычислении данным способом«Показывать уравнение на диаграмме» мы делаем прогноз ОК. Результаты анализа: преобразована в число,
фактором роста продажНужно понимать, что точный
аналитический инструмент, который таких значениях этого
Совет:-значения, возвращаемые этими функциями, в Excel диаграмма, будут возрастать, влево — колебание небольшое, то устанавливаем в ячейке вводили в окне
«Известные значения x» используется метод линейнойиИзвестные_значения_YДля расчета стандартных погрешностей результатом выполнения функции на данный момент прогноз возможен только позволяет не только параметра приложению Excel Если выделить ячейку в можно построить прямую на которой приведены убывать. все эти варианты,
число аргументов оператора
полностью соответствуют аналогичным регрессии.«Поместить на диаграмме величину- известные нам Excel использует формулу: ПРЕДСКАЗ для данных
является не расширение
Прогнозирование временного ряда в Excel
при индивидуализации модели обрабатывать статистические данные, не удастся определить
одном из рядов, или кривую, описывающую данные о продажахСовет: применимые к конкретному«3»
ТЕНДЕНЦИЯ
элементам оператораДавайте разберем нюансы применения достоверности аппроксимации (R^2)»
значения зависимой переменной =КОРЕНЬ(СУММКВРАЗН(‘диапазон фактических значений’; значений x будет базы клиентов, а прогнозирования. Ведь разные
но и составлять сезонные компоненты. Если Excel автоматически выделит
существующие данные. за первые несколько Чтобы управлять созданием ряда случаю, можно считать. Чтобы произвести расчет. После того, какПРЕДСКАЗ
оператора
. Последний показатель отображает (прибыль) ‘диапазон прогнозных значений’)/ код ошибки #ЗНАЧ!. развитие продаж с
временные ряды имеют прогнозы с высокой же сезонные колебания остальные данные.
Использование функций ЛИНЕЙН и месяцев года, можно
вручную или заполнять относительно достоверными. кликаем по кнопке информация внесена, жмем, а аргумент
exceltable.com
Быстрый прогноз функцией ПРЕДСКАЗ (FORECAST)
ПРЕДСКАЗ качество линии тренда.Известные_значения_X ‘размер окна сглаживания’).Статистическая дисперсия величин (можно постоянными клиентами. В разные характеристики. точностью. Для того недостаточно велики иНа вкладке ЛГРФПРИБЛ добавить к ней ряд значений сАвтор: Максим ТютюшевEnter на кнопку«Новые значения x»на конкретном примере. После того, как
- известные нам Например, =КОРЕНЬ(СУММКВРАЗН(C3:C5;D3:D5)/3). рассчитать с помощью таких случаях рекомендуютбланк прогноза деятельности предприятия чтобы оценить некоторые алгоритму не удается
Данные . Функции ЛИНЕЙН и линию тренда, которая помощью клавиатуры, воспользуйтесьКогда необходимо оценить затраты
.«OK»соответствует аргументу Возьмем всю ту настройки произведены, жмем значения независимой переменной формул ДИСП.Г, ДИСП.В использовать не линейнуюЧтобы посмотреть общую картину возможности Excel в их выявить, прогнозв группе ЛГРФПРИБЛ позволяют вычислить представит общие тенденции
командой следующего года илиКак видим, прогнозируемая величина.«X» же таблицу. Нам на кнопку (даты или номераСоставим прогноз продаж, используя и др.), передаваемых регрессию, а логарифмический с графиками выше области прогнозирования продаж, примет вид линейногоПрогноз прямую линию или
продаж (рост, снижение
Прогрессия
предсказать ожидаемые результаты
- прибыли, рассчитанная методомРезультат обработки данных выводитсяпредыдущего инструмента. Кроме нужно будет узнать
- «Закрыть» периодов) данные из предыдущего в качестве аргумента
- тренд, чтобы результаты описанного прогноза рекомендуем разберем практический пример. тренда.нажмите кнопку
planetaexcel.ru
экспоненциальную кривую для
Содержание
- 1 Выполнение аппроксимации
- 1.1 Способ 1: линейное сглаживание
- 1.2 Способ 2: экспоненциальная аппроксимация
- 1.3 Способ 3: логарифмическое сглаживание
- 1.4 Способ 4: полиномиальное сглаживание
- 1.5 Способ 5: степенное сглаживание
- 1.6 Помогла ли вам эта статья?
- 2 Аппроксимация в Excel статистических данных аналитической функцией.
- 3 Итоги.
- 4 P.S. (04.06.2017)
- 5 Высокоточная красивая замена табличных данных простым уравнением.
Среди различных методов прогнозирования нельзя не выделить аппроксимацию. С её помощью можно производить приблизительные подсчеты и вычислять планируемые показатели, путем замены исходных объектов на более простые. В Экселе тоже существует возможность использования данного метода для прогнозирования и анализа. Давайте рассмотрим, как этот метод можно применить в указанной программе встроенными инструментами.
Выполнение аппроксимации
Наименование данного метода происходит от латинского слова proxima – «ближайшая» Именно приближение путем упрощения и сглаживания известных показателей, выстраивание их в тенденцию и является его основой. Но данный метод можно использовать не только для прогнозирования, но и для исследования уже имеющихся результатов. Ведь аппроксимация является, по сути, упрощением исходных данных, а упрощенный вариант исследовать легче.
Главный инструмент, с помощью которого проводится сглаживания в Excel – это построение линии тренда. Суть состоит в том, что на основе уже имеющихся показателей достраивается график функции на будущие периоды. Основное предназначение линии тренда, как не трудно догадаться, это составление прогнозов или выявление общей тенденции.
Но она может быть построена с применением одного из пяти видов аппроксимации:
- Линейной;
- Экспоненциальной;
- Логарифмической;
- Полиномиальной;
- Степенной.
Рассмотрим каждый из вариантов более подробно в отдельности.
Урок: Как построить линию тренда в Excel
Способ 1: линейное сглаживание
Прежде всего, давайте рассмотрим самый простой вариант аппроксимации, а именно с помощью линейной функции. На нем мы остановимся подробнее всего, так как изложим общие моменты характерные и для других способов, а именно построение графика и некоторые другие нюансы, на которых при рассмотрении последующих вариантов уже останавливаться не будем.
Прежде всего, построим график, на основании которого будем проводить процедуру сглаживания. Для построения графика возьмем таблицу, в которой помесячно указана себестоимость единицы продукции, производимой предприятием, и соответствующая прибыль в данном периоде. Графическая функция, которую мы построим, будет отображать зависимость увеличения прибыли от уменьшения себестоимости продукции.
- Для построения графика, прежде всего, выделяем столбцы «Себестоимость единицы продукции» и «Прибыль». После этого перемещаемся во вкладку «Вставка». Далее на ленте в блоке инструментов «Диаграммы» щелкаем по кнопке «Точечная». В открывшемся списке выбираем наименование «Точечная с гладкими кривыми и маркерами». Именно данный вид диаграмм наиболее подходит для работы с линией тренда, а значит, и для применения метода аппроксимации в Excel.
- График построен.
- Для добавления линии тренда выделяем его кликом правой кнопки мыши. Появляется контекстное меню. Выбираем в нем пункт «Добавить линию тренда…».
Существует ещё один вариант её добавления. В дополнительной группе вкладок на ленте «Работа с диаграммами» перемещаемся во вкладку «Макет». Далее в блоке инструментов «Анализ» щелкаем по кнопке «Линия тренда». Открывается список. Так как нам нужно применить линейную аппроксимацию, то из представленных позиций выбираем «Линейное приближение».
- Если же вы выбрали все-таки первый вариант действий с добавлением через контекстное меню, то откроется окно формата.
В блоке параметров «Построение линии тренда (аппроксимация и сглаживание)» устанавливаем переключатель в позицию «Линейная».
При желании можно установить галочку около позиции «Показывать уравнение на диаграмме». После этого на диаграмме будет отображаться уравнение сглаживающей функции.Также в нашем случае для сравнения различных вариантов аппроксимации важно установить галочку около пункта «Поместить на диаграмму величину достоверной аппроксимации (R^2)». Данный показатель может варьироваться от 0 до 1. Чем он выше, тем аппроксимация качественнее (достовернее). Считается, что при величине данного показателя 0,85 и выше сглаживание можно считать достоверным, а если показатель ниже, то – нет.
После того, как провели все вышеуказанные настройки. Жмем на кнопку «Закрыть», размещенную в нижней части окна.
- Как видим, на графике линия тренда построена. При линейной аппроксимации она обозначается черной прямой полосой. Указанный вид сглаживания можно применять в наиболее простых случаях, когда данные изменяются довольно быстро и зависимость значения функции от аргумента очевидна.
Сглаживание, которое используется в данном случае, описывается следующей формулой:
y=ax+b
В конкретно нашем случае формула принимает такой вид:
y=-0,1156x+72,255
Величина достоверности аппроксимации у нас равна 0,9418, что является довольно приемлемым итогом, характеризующим сглаживание, как достоверное.
Способ 2: экспоненциальная аппроксимация
Теперь давайте рассмотрим экспоненциальный тип аппроксимации в Эксель.
- Для того, чтобы изменить тип линии тренда, выделяем её кликом правой кнопки мыши и в раскрывшемся меню выбираем пункт «Формат линии тренда…».
- После этого запускается уже знакомое нам окно формата. В блоке выбора типа аппроксимации устанавливаем переключатель в положение «Экспоненциальная». Остальные настройки оставим такими же, как и в первом случае. Щелкаем по кнопке «Закрыть».
- После этого линия тренда будет построена на графике. Как видим, при использовании данного метода она имеет несколько изогнутую форму. При этом уровень достоверности равен 0,9592, что выше, чем при использовании линейной аппроксимации. Экспоненциальный метод лучше всего использовать в том случае, когда сначала значения быстро изменяются, а потом принимают сбалансированную форму.
Общий вид функции сглаживания при этом такой:
y=be^x
где e – это основание натурального логарифма.
В конкретно нашем случае формула приняла следующую форму:
y=6282,7*e^(-0,012*x)
Способ 3: логарифмическое сглаживание
Теперь настала очередь рассмотреть метод логарифмической аппроксимации.
- Тем же способом, что и в предыдущий раз через контекстное меню запускаем окно формата линии тренда. Устанавливаем переключатель в позицию «Логарифмическая» и жмем на кнопку «Закрыть».
- Происходит процедура построения линии тренда с логарифмической аппроксимацией. Как и в предыдущем случае, такой вариант лучше использовать тогда, когда изначально данные быстро изменяются, а потом принимают сбалансированный вид. Как видим, уровень достоверности равен 0,946. Это выше, чем при использовании линейного метода, но ниже, чем качество линии тренда при экспоненциальном сглаживании.
В общем виде формула сглаживания выглядит так:
y=a*ln(x)+b
где ln – это величина натурального логарифма. Отсюда и наименование метода.
В нашем случае формула принимает следующий вид:
y=-62,81ln(x)+404,96
Способ 4: полиномиальное сглаживание
Настал черед рассмотреть метод полиномиального сглаживания.
- Переходим в окно формата линии тренда, как уже делали не раз. В блоке «Построение линии тренда» устанавливаем переключатель в позицию «Полиномиальная». Справа от данного пункта расположено поле «Степень». При выборе значения «Полиномиальная» оно становится активным. Здесь можно указать любое степенное значение от 2 (установлено по умолчанию) до 6. Данный показатель определяет число максимумов и минимумов функции. При установке полинома второй степени описывается только один максимум, а при установке полинома шестой степени может быть описано до пяти максимумов. Для начала оставим настройки по умолчанию, то есть, укажем вторую степень. Остальные настройки оставляем такими же, какими мы выставляли их в предыдущих способах. Жмем на кнопку «Закрыть».
- Линия тренда с использованием данного метода построена. Как видим, она ещё более изогнута, чем при использовании экспоненциальной аппроксимации. Уровень достоверности выше, чем при любом из использованных ранее способов, и составляет 0,9724.
Данный метод наиболее успешно можно применять в том случае, если данные носят постоянно изменчивый характер. Функция, описывающая данный вид сглаживания, выглядит таким образом:
y=a1+a1*x+a2*x^2+…+an*x^n
В нашем случае формула приняла такой вид:
y=0,0015*x^2-1,7202*x+507,01
- Теперь давайте изменим степень полиномов, чтобы увидеть, будет ли отличаться результат. Возвращаемся в окно формата. Тип аппроксимации оставляем полиномиальным, но напротив него в окне степени устанавливаем максимально возможное значение – 6.
- Как видим, после этого наша линия тренда приняла форму ярко выраженной кривой, у которой число максимумов равно шести. Уровень достоверности повысился ещё больше, составив 0,9844.
Формула, которая описывает данный тип сглаживания, приняла следующий вид:
y=8E-08x^6-0,0003x^5+0,3725x^4-269,33x^3+109525x^2-2E+07x+2E+09
Способ 5: степенное сглаживание
В завершении рассмотрим метод степенной аппроксимации в Excel.
- Перемещаемся в окно «Формат линии тренда». Устанавливаем переключатель вида сглаживания в позицию «Степенная». Показ уравнения и уровня достоверности, как всегда, оставляем включенными. Жмем на кнопку «Закрыть».
- Программа формирует линию тренда. Как видим, в нашем случае она представляет собой линию с небольшим изгибом. Уровень достоверности равен 0,9618, что является довольно высоким показателем. Из всех вышеописанных способов уровень достоверности был выше только при использовании полиномиального метода.
Данный способ эффективно используется в случаях интенсивного изменения данных функции. Важно учесть, что этот вариант применим только при условии, что функция и аргумент не принимают отрицательных или нулевых значений.
Общая формула, описывающая данный метод имеет такой вид:
y=bx^n
В конкретно нашем случае она выглядит так:
y = 6E+18x^(-6,512)
Как видим, при использовании конкретных данных, которые мы применяли для примера, наибольший уровень достоверности показал метод полиномиальной аппроксимации с полиномом в шестой степени (0,9844), наименьший уровень достоверности у линейного метода (0,9418). Но это совсем не значит, что такая же тенденция будет при использовании других примеров. Нет, уровень эффективности у приведенных выше методов может значительно отличаться, в зависимости от конкретного вида функции, для которой будет строиться линия тренда. Поэтому, если для этой функции выбранный метод наиболее эффективен, то это совсем не означает, что он также будет оптимальным и в другой ситуации.
Если вы пока не можете сразу определить, основываясь на вышеприведенных рекомендациях, какой вид аппроксимации подойдет конкретно в вашем случае, то есть смысл попробовать все методы. После построения линии тренда и просмотра её уровня достоверности можно будет выбрать оптимальный вариант.
Мы рады, что смогли помочь Вам в решении проблемы.
Задайте свой вопрос в комментариях, подробно расписав суть проблемы. Наши специалисты постараются ответить максимально быстро.
Помогла ли вам эта статья?
Да Нет
Опубликовано 05 Янв 2014
Рубрика: Справочник Excel | 18 комментариев
(Обратите внимание на дополнительный раздел от 04.06.2017 в конце статьи.)
Учет и контроль! Те, кому за 40 должны хорошо помнить этот лозунг из эпохи построения социализма и коммунизма в нашей стране.
Но без хорошо налаженного учета невозможно эффективное функционирование ни страны, ни области, ни предприятия, ни домашнего хозяйства при любой общественно-экономической формации общества! Для составления прогнозов и планов деятельности и развития необходимы исходные данные. Где их брать? Только один достоверный источник – это ваши статистические учетные данные предыдущих периодов времени.
Учитывать результаты своей деятельности, собирать и записывать информацию, обрабатывать и анализировать данные, применять результаты анализа для принятия правильных решений в будущем должен, в моем понимании, каждый здравомыслящий человек. Это есть ничто иное, как накопление и рациональное использование своего жизненного опыта. Если не вести учет важных данных, то вы через определенный период времени их забудете и, начав заниматься этими вопросами вновь, вы опять наделаете те же ошибки, что делали, когда впервые этим занимались.
«Мы, помню, 5 лет назад изготавливали до 1000 штук таких изделий в месяц, а сейчас и 700 еле-еле собираем!». Открываем статистику и видим, что 5 лет назад и 500 штук не изготавливали…
«Во сколько обходится километр пробега твоего автомобиля с учетом всех затрат?» Открываем статистику – 6 руб./км. Поездка на работу – 107 рублей. Дешевле, чем на такси (180 рублей) более чем в полтора раза. А бывали времена, когда на такси было дешевле…
«Сколько времени требуется для изготовления металлоконструкций уголковой башни связи высотой 50 м?» Открываем статистику – и через 5 минут готов ответ…
«Сколько будет стоить ремонт комнаты в квартире?» Поднимаем старые записи, делаем поправку на инфляцию за прошедшие годы, учитываем, что в прошлый раз купили материалы на 10% дешевле рыночной цены и – ориентировочную стоимость мы уже знаем…
Ведя учет своей профессиональной деятельности, вы всегда будете готовы ответить на вопрос начальника: «Когда!!!???». Ведя учет домашнего хозяйства, легче спланировать расходы на крупные покупки, отдых и прочие расходы в будущем, приняв соответствующие меры по дополнительному заработку или по сокращению необязательных расходов сегодня.
В этой статье я на простом примере покажу, как можно обрабатывать собранные статистические данные в Excel для возможности дальнейшего использования при прогнозировании будущих периодов.
Производственный участок изготавливает строительные металлоконструкции из листового и профильного металлопроката. Участок работает стабильно, заказы однотипные, численность рабочих колеблется незначительно. Есть данные о выпуске продукции за предыдущие 12 месяцев и о количестве переработанного в эти периоды времени металлопроката по группам: листы, двутавры, швеллеры, уголки, трубы круглые, профили прямоугольного сечения, круглый прокат. После предварительного анализа исходных данных возникло предположение, что суммарный месячный выпуск металлоконструкций существенно зависит от количества уголков в заказах. Проверим это предположение.
Прежде всего, несколько слов об аппроксимации. Мы будем искать закон – аналитическую функцию, то есть функцию, заданную уравнением, которое лучше других описывает зависимость общего выпуска металлоконструкций от количества уголкового проката в выполненных заказах. Это и есть аппроксимация, а найденное уравнение называется аппроксимирующей функцией для исходной функции, заданной в виде таблицы.
1. Включаем Excel и помещаем на лист таблицу с данными статистики.
2. Далее строим и форматируем точечную диаграмму, в которой по оси X задаем значения аргумента – количество переработанных уголков в тоннах. По оси Y откладываем значения исходной функции – общий выпуск металлоконструкций в месяц, заданные таблицей.
О том, как построить подобную диаграмму, подробно рассказано в статье «Как строить графики в Excel?».
3. «Наводим» мышь на любую из точек на графике и щелчком правой кнопки вызываем контекстное меню (как говорит один мой хороший товарищ — работая в незнакомой программе, когда не знаешь, что делать, чаще щелкай правой кнопкой мыши…). В выпавшем меню выбираем «Добавить линию тренда…».
4. В появившемся окне «Линия тренда» на вкладке «Тип» выбираем «Линейная».
5. Далее на вкладке «Параметры» ставим 2 галочки и нажимаем «ОК».
6. На графике появилась прямая линия, аппроксимирующая нашу табличную зависимость.
Мы видим кроме самой линии уравнение этой линии и, главное, мы видим значение параметра R2 – величины достоверности аппроксимации! Чем ближе его значение к 1, тем наиболее точно выбранная функция аппроксимирует табличные данные!
7. Строим линии тренда, используя степенную, логарифмическую, экспоненциальную и полиномиальную аппроксимации по аналогии с тем, как мы строили линейную линию тренда.
Лучше всех из выбранных функций аппроксимирует наши данные полином второй степени, у него максимальный коэффициент достоверности R2.
Однако хочу вас предостеречь! Если вы возьмете полиномы более высоких степеней, то, возможно, получите еще лучшие результаты, но кривые будут иметь замысловатый вид…. Здесь важно понимать, что мы ищем функцию, которая имеет физический смысл. Что это означает? Это означает, что нам нужна аппроксимирующая функция, которая будет выдавать адекватные результаты не только внутри рассматриваемого диапазона значений X, но и за его пределами, то есть ответит на вопрос: «Какой будет выпуск металлоконструкций при количестве переработанных за месяц уголков меньше 45 и больше 168 тонн!» Поэтому я не рекомендую увлекаться полиномами высоких степеней, да и параболу (полином второй степени) выбирать осторожно!
Итак, нам необходимо выбрать функцию, которая не только хорошо интерполирует табличные данные в пределах диапазона значений X=45…168, но и допускает адекватную экстраполяцию за пределами этого диапазона. Я выбираю в данном случае логарифмическую функцию, хотя можно выбрать и линейную, как наиболее простую. В рассматриваемом примере при выборе линейной аппроксимации в excel ошибки будут больше, чем при выборе логарифмической, но не на много.
8. Удаляем все линии тренда с поля диаграммы, кроме логарифмической функции. Для этого щелкаем правой кнопкой мыши по ненужным линиям и в выпавшем контекстном меню выбираем «Очистить».
9. В завершении добавим к точкам табличных данных планки погрешностей. Для этого правой кнопкой мыши щелкаем на любой из точек на графике и в контекстном меню выбираем «Формат рядов данных…» и настраиваем данные на вкладке «Y-погрешности» так, как на рисунке ниже.
10. Затем щелкаем по любой из линий диапазонов погрешностей правой кнопкой мыши, выбираем в контекстном меню «Формат полос погрешностей…» и в окне «Формат планок погрешностей» на вкладке «Вид» настраиваем цвет и толщину линий.
Аналогичным образом форматируются любые другие объекты диаграммы в Excel!
Окончательный результат диаграммы представлен на следующем снимке экрана.
Итоги.
Результатом всех предыдущих действий стала полученная формула аппроксимирующей функции y=-172,01*ln (x)+1188,2. Зная ее, и количество уголков в месячном наборе работ, можно с высокой степенью вероятности (±4% — смотри планки погрешностей) спрогнозировать общий выпуск металлоконструкций за месяц! Например, если в плане на месяц 140 тонн уголков, то общий выпуск, скорее всего, при прочих равных составит 338±14 тонн.
Для повышения достоверности аппроксимации статистических данных должно быть много. Двенадцать пар значений – это маловато.
Из практики скажу, что хорошим результатом следует считать нахождение аппроксимирующей функции с коэффициентом достоверности R2>0,87. Отличный результат – при R2>0,94.
На практике бывает трудно выделить один самый главный определяющий фактор (в нашем примере – масса переработанных за месяц уголков), но если постараться, то в каждой конкретной задаче его всегда можно найти! Конечно, общий выпуск продукции за месяц реально зависит от сотни факторов, для учета которых необходимы существенные трудозатраты нормировщиков и других специалистов. Только результат все равно будет приблизительным! Так стоит ли нести затраты, если есть гораздо более дешевое математическое моделирование!
В этой статье я лишь прикоснулся к верхушке айсберга под названием сбор, обработка и практическое использование статистических данных. О том удалось, или нет, мне расшевелить ваш интерес к этой теме, надеюсь узнать из комментариев и рейтинга статьи в поисковиках.
Затронутый вопрос аппроксимации функции одной переменной имеет широкое практическое применение в разных сферах жизни. Но гораздо большее применение имеет решение задачи аппроксимации функции нескольких независимых переменных…. Об этом и не только читайте в следующих статьях на блоге.
Подписывайтесь на анонсы статей в окне, расположенном в конце каждой статьи или в окне вверху страницы.
Не забывайте подтверждать подписку кликом по ссылке в письме, которое придет к вам на указанную почту (может прийти в папку «Спам»)!!!
С интересом прочту Ваши комментарии, уважаемые читатели! Пишите!
P.S. (04.06.2017)
Высокоточная красивая замена табличных данных простым уравнением.
Вас не устраивают полученные точность аппроксимации (R2
Подробности Автор: Administrator Родительская категория: Заметки Категория: Компьютерная повседневность Создано: 28 января 2013 Обновлено: 15 мая 2014 Просмотров: 28651
Чтобы приступить к аппроксимации кривой ваших экспериментальных данных в Excel 2003:
1. Создайте диаграмму (график).
2. Выделите линию функции на графике и нажмите правую кнопку мыши, выберите «Добавить линию тренда»
3. Выберите тип аппроксимации во вкладке «Тип» в откурывшемся диалоговом окне «Линия тренда»
4. На вкладке «Параметры» — прогностические параметры, показывать уравнение на графике или нет
Аппроксимация (от лат. approximo — приближаюсь) — это замена одних математических объектов другими, в том или ином смысле близкими к исходным. Аппроксимация позволяет исследовать числовые характеристики и качественные свойства объекта, сводя задачу к изучению более простых или более удобных объектов (например, таких, характеристики которых легко вычисляются или свойства которых уже известны). В этой нашей статье мы постараемся подробно рассмотреть вопрос о том, как апроксимировать график в офисной программе Excel?
В MS Excel аппроксимация экспериментальных данных осуществляется путем построения их графика (x – отвлеченные величины) или точечного графика (x – имеет конкретные значения) с последующим подбором подходящей аппроксимирующей функции (линии тренда).
1. Создайте диаграмму (график).
2. Выделите линию функции на графике и нажмите правую кнопку мыши, выберите «Добавить линию тренда».
3. Выберите тип аппроксимации во вкладке «Тип» в откурывшемся диалоговом окне «Линия тренда».
4. На вкладке «Параметры» — прогностические параметры, показывать уравнение на графике или нет.
Решить задачу аппроксимации экспериментальных данных – значит построить уравнение регрессии. Задача аппроксимации возникает в случае необходимости аналитически, то есть в виде математической зависимости, описать реальные явления, наблюдения за которыми заданы в виде таблицы, содержащей значения показателя в разные моменты времени или при разных значениях независимого аргумента. Например,
— известны показатели прибыли (их можно обозначить Y) в зависимости от размера капиталовложений (X);
— известны объемы реализации фирмы (Y) за шесть недель ее работы. В этом случае, X – это последовательность недель.
Иногда говорят, что требуется построить эмпирическую модель. Эмпирической называется модель, построенная на основе реальных наблюдений. Если модель удается найти, можно сделать прогноз о поведении исследуемого явления и процесса в будущем и, возможно, выбрать оптимальное направление ее развития.
В общем случае задача аппроксимации экспериментальных данных имеет следующую постановку:
Пусть известны данные, полученные практическим путем (в ходе n экспериментов или наблюдений), которые можно представить парами чисел (хi; уi). Зависимость между ними отражает таблица:
X | х1 | х2 | х3 | … | хn |
Y | y1 | y2 | y3 | … | yn |
Имеется класс разнообразных функций F. Требуется найти аналитическое (т.е. математическое) выражение зависимости между этими показателями, то есть надо подобрать из множества функций F функцию f, такую что . которая наилучшим образом сглаживала бы экспериментальную зависимость между переменными и по возможности точно отражала общую тенденцию зависимости между X и Y, исключая погрешности измерения и случайные отклонения.
Выяснить вид функции можно либо из теоретических соображений, либо анализируя расположение точек (хi; уi) на координатной плоскости.
Графически решить задачу аппроксимации означает, провести такую кривую , точки которой (хi; ŷi) находились бы как можно ближе к исходным точкам (хi; уi), отображающим экспериментальные данные.
Для решения задачи аппроксимации используют метод наименьших квадратов.
При этом функция считается наилучшим приближением к , если для нее сумма квадратов отклонений «теоретических» значений , найденных по эмпирической формуле, от соответствующих опытных значений , имеет наименьшее значение по сравнению с другими функциями, из числа которых выбирается искомое приближение.
Математическая запись метода наименьших квадратов имеет вид:
(1)
где n — количество наблюдений показателей.
Таким образом, задача аппроксимации распадается на две части.
Сначала устанавливают вид зависимости и, соответственно, вид эмпирической формулы, то есть решают, является ли она линейной, квадратичной, логарифмической или какой-либо другой. Если нет каких-либо теоретических соображений для подбора вида формулы, обычно выбирают функциональную зависимость из числа наиболее простых, сравнивая их графики с графиком заданной функции.
После этого определяются численные значения неизвестных параметров выбранной эмпирической формулы, для которых приближение к заданной функции оказывается наилучшим.
Простейшим видом эмпирической модели с двумя параметрами, используемой для аппроксимации результатов экспериментов, является линейная регрессия, описываемая линейной функцией:
где а, b — искомые параметры.
Для модели линейной регрессии метод наименьших квадратов (1) запишется :
(2)
Для решения (2) относительно а и b приравнивают к нулю частные производные:
В итоге для нахождения a и b надо решить систему линейных алгебраических уравнений вида:
(3)
Реализовать метод наименьших квадратов в случае линейной регрессии в Excel можно различными способами.
1 способ. Построить систему линейных алгебраических уравнений, подставив в (3) все известные значения, и решить ее, например, матричным методом (см. зад. 4).
Рис. 25
В формульном виде элемент расчетной таблицы приведен на рис. 26.
Рис.26
2 способ. Решить в Excel задачу оптимизации (2), применив для этого Поиск решения (см. зад. 5).
Рис.27
Замечание 1. Следует обратить внимание, что для целевой функции S удобно применить встроенную математическую функцию СУММКВРАЗН(массив1;массив2), в результате которой как раз и вычисляется сумма квадратов разностей двух массивов. В нашем случае следует в качестве массива1 указать диапазон исходных значений , а в качестве массива2 – «теоретические» значения , рассчитанные по формуле , где a и b – это адреса ячеек с искомыми значениями.
Замечание 2. В диалоговом окне команды Поиск решения следует задать целевую ячейку, направление цели – на минимум и изменяемые ячейки (рис. 28). Данная задача ограничений не содержит.
Рис.28
Замечание3. В качестве эмпирических моделей с двумя параметрами могут использоваться и нелинейные модели вида:
Описанный способ решения метода наименьших квадратов применим и для нелинейных зависимостей.
3 способ. Для нахождения значений параметров a и b в случае линейной регрессии можно использовать следующие встроенные в Excel статистические функции:
НАКЛОН(известные_значения_У; известные_значения_Х)
ОТРЕЗОК(известные_значения_У; известные_значения_Х)
ЛИНЕЙН (известные_значения_У; известные_значения_Х)
Причем, функция НАКЛОН ( ) возвращает значение параметра а, функция ОТРЕЗОК( ) возвращает значение параметра b. Функция ЛИНЕЙН( ) возвращает одновременно оба параметра линейной зависимости, так как является функцией массива. Поэтому для ввода функции ЛИНЕЙН( ) в таблицу надо соблюдать следующие правила:
· выделить две рядом стоящие ячейки
· ввести формулу
· по окончании нажать одновременно комбинацию клавиш Ctrl+ Shift+Enter.
В результате в левой ячейке получится значение параметра а, а в правой – значение параметра b.
Для решения задачи аппроксимации графическим способом в Excel надо построить по исходным данным график, например, точечную диаграмму со значениями, соединенными сглаживающими линиями (см.зад.1). На эту диаграмму Excel может нанести Линию тренда. Линию тренда можно добавить к любому ряду данных, использующему следующие типы диаграмм: диаграммы с областями, графики, гистограммы, линейчатые или точечные диаграммы.
При создании линии тренда в Excel на основе данных диаграммы применяется та или иная аппроксимация. Excel позволяет выбрать один из пяти аппроксимирующих линий или вычислить линию, показывающую скользящее среднее.
Кроме того, Excel предоставляет возможность выбирать значения пересечения линии тренда с осью Y, а также добавлять к диаграмме уравнение аппроксимации и величину достоверности аппроксимации (R2). Также, можно определять будущие и прошлые значения данных, исходя из линии тренда и связанного с ней уравнения аппроксимации.
Чтобы добавить линию тренда к ряду данных надо:
1. Активизировать щелчком мыши диаграмму.
2. Выполнить команду Диаграмма, Добавить линию тренда или переместить указатель на ряд данных, щелкнуть правой кнопкой мыши, а затем в контекстном меню выбрать команду Добавить линию тренда. В появившемся окне Линия тренда раскрыть вкладку Тип (рис. 29)
3. В списке Построен на ряде – выделить ряд данных, к которому нужно добавить линию тренда (Рис.29).
4. В группе Построение линии тренда (аппроксимация и сглаживание) выбрать один из шести типов аппроксимации (сглаживания). – линейная, логарифмическая, полиномиальная, степенная, экспоненциальная, скользящее среднее (Рис.29)
Рис.29
5. Чтобы установить параметры линии тренда надо раскрыть вкладку Параметры диалогового окна Линия тренда(рис. 30)
Рис.30
Показывать уравнение на диаграмме – осуществляет вывод уравнения аппроксимации на диаграмму в виде текстового поля.
Поместить на диаграмму величину достоверности аппроксимации R2– осуществляет вывод на диаграмму достоверности аппроксимации в виде текста.
6. По окончании нажимают экранную кнопку ОК.
Пример результирующей диаграммы приведен на рисунке 31.
Рис.31