Модели статистического прогнозирования в excel

Содержание

  • Процедура прогнозирования
    • Способ 1: линия тренда
    • Способ 2: оператор ПРЕДСКАЗ
    • Способ 3: оператор ТЕНДЕНЦИЯ
    • Способ 4: оператор РОСТ
    • Способ 5: оператор ЛИНЕЙН
    • Способ 6: оператор ЛГРФПРИБЛ
  • Вопросы и ответы

Прогнозирование в Microsoft Excel

Прогнозирование – это очень важный элемент практически любой сферы деятельности, начиная от экономики и заканчивая инженерией. Существует большое количество программного обеспечения, специализирующегося именно на этом направлении. К сожалению, далеко не все пользователи знают, что обычный табличный процессор Excel имеет в своем арсенале инструменты для выполнения прогнозирования, которые по своей эффективности мало чем уступают профессиональным программам. Давайте выясним, что это за инструменты, и как сделать прогноз на практике.

Процедура прогнозирования

Целью любого прогнозирования является выявление текущей тенденции, и определение предполагаемого результата в отношении изучаемого объекта на определенный момент времени в будущем.

Способ 1: линия тренда

Одним из самых популярных видов графического прогнозирования в Экселе является экстраполяция выполненная построением линии тренда.

Попробуем предсказать сумму прибыли предприятия через 3 года на основе данных по этому показателю за предыдущие 12 лет.

  1. Строим график зависимости на основе табличных данных, состоящих из аргументов и значений функции. Для этого выделяем табличную область, а затем, находясь во вкладке «Вставка», кликаем по значку нужного вида диаграммы, который находится в блоке «Диаграммы». Затем выбираем подходящий для конкретной ситуации тип. Лучше всего выбрать точечную диаграмму. Можно выбрать и другой вид, но тогда, чтобы данные отображались корректно, придется выполнить редактирование, в частности убрать линию аргумента и выбрать другую шкалу горизонтальной оси.
  2. Построение графика в Microsoft Excel

  3. Теперь нам нужно построить линию тренда. Делаем щелчок правой кнопкой мыши по любой из точек диаграммы. В активировавшемся контекстном меню останавливаем выбор на пункте «Добавить линию тренда».
  4. Добавление линии тренда в Microsoft Excel

  5. Открывается окно форматирования линии тренда. В нем можно выбрать один из шести видов аппроксимации:
    • Линейная;
    • Логарифмическая;
    • Экспоненциальная;
    • Степенная;
    • Полиномиальная;
    • Линейная фильтрация.

    Давайте для начала выберем линейную аппроксимацию.

    В блоке настроек «Прогноз» в поле «Вперед на» устанавливаем число «3,0», так как нам нужно составить прогноз на три года вперед. Кроме того, можно установить галочки около настроек «Показывать уравнение на диаграмме» и «Поместить на диаграмме величину достоверности аппроксимации (R^2)». Последний показатель отображает качество линии тренда. После того, как настройки произведены, жмем на кнопку «Закрыть».

  6. Параметры линии тренда в Microsoft Excel

  7. Линия тренда построена и по ней мы можем определить примерную величину прибыли через три года. Как видим, к тому времени она должна перевалить за 4500 тыс. рублей. Коэффициент R2, как уже было сказано выше, отображает качество линии тренда. В нашем случае величина R2 составляет 0,89. Чем выше коэффициент, тем выше достоверность линии. Максимальная величина его может быть равной 1. Принято считать, что при коэффициенте свыше 0,85 линия тренда является достоверной.
  8. Линия тренда построена в Microsoft Excel

  9. Если же вас не устраивает уровень достоверности, то можно вернуться в окно формата линии тренда и выбрать любой другой тип аппроксимации. Можно перепробовать все доступные варианты, чтобы найти наиболее точный.
    Выбор другого типа апроксимации в Microsoft Excel

    Нужно заметить, что эффективным прогноз с помощью экстраполяции через линию тренда может быть, если период прогнозирования не превышает 30% от анализируемой базы периодов. То есть, при анализе периода в 12 лет мы не можем составить эффективный прогноз более чем на 3-4 года. Но даже в этом случае он будет относительно достоверным, если за это время не будет никаких форс-мажоров или наоборот чрезвычайно благоприятных обстоятельств, которых не было в предыдущих периодах.

Урок: Как построить линию тренда в Excel

Способ 2: оператор ПРЕДСКАЗ

Экстраполяцию для табличных данных можно произвести через стандартную функцию Эксель ПРЕДСКАЗ. Этот аргумент относится к категории статистических инструментов и имеет следующий синтаксис:

=ПРЕДСКАЗ(X;известные_значения_y;известные значения_x)

«X» – это аргумент, значение функции для которого нужно определить. В нашем случае в качестве аргумента будет выступать год, на который следует произвести прогнозирование.

Lumpics.ru

«Известные значения y» — база известных значений функции. В нашем случае в её роли выступает величина прибыли за предыдущие периоды.

«Известные значения x» — это аргументы, которым соответствуют известные значения функции. В их роли у нас выступает нумерация годов, за которые была собрана информация о прибыли предыдущих лет.

Естественно, что в качестве аргумента не обязательно должен выступать временной отрезок. Например, им может являться температура, а значением функции может выступать уровень расширения воды при нагревании.

При вычислении данным способом используется метод линейной регрессии.

Давайте разберем нюансы применения оператора ПРЕДСКАЗ на конкретном примере. Возьмем всю ту же таблицу. Нам нужно будет узнать прогноз прибыли на 2018 год.

  1. Выделяем незаполненную ячейку на листе, куда планируется выводить результат обработки. Жмем на кнопку «Вставить функцию».
  2. Переход в Мастер функций в Microsoft Excel

  3. Открывается Мастер функций. В категории «Статистические» выделяем наименование «ПРЕДСКАЗ», а затем щелкаем по кнопке «OK».
  4. Переход к аргументам функции ПРЕДСКАЗ в Microsoft Excel

  5. Запускается окно аргументов. В поле «X» указываем величину аргумента, к которому нужно отыскать значение функции. В нашем случаем это 2018 год. Поэтому вносим запись «2018». Но лучше указать этот показатель в ячейке на листе, а в поле «X» просто дать ссылку на него. Это позволит в будущем автоматизировать вычисления и при надобности легко изменять год.

    В поле «Известные значения y» указываем координаты столбца «Прибыль предприятия». Это можно сделать, установив курсор в поле, а затем, зажав левую кнопку мыши и выделив соответствующий столбец на листе.

    Аналогичным образом в поле «Известные значения x» вносим адрес столбца «Год» с данными за прошедший период.

    После того, как вся информация внесена, жмем на кнопку «OK».

  6. Аргументы функции ПРЕДСКАЗ в Microsoft Excel

  7. Оператор производит расчет на основании введенных данных и выводит результат на экран. На 2018 год планируется прибыль в районе 4564,7 тыс. рублей. На основе полученной таблицы мы можем построить график при помощи инструментов создания диаграммы, о которых шла речь выше.
  8. Результат функции ПРЕДСКАЗ в Microsoft Excel

  9. Если поменять год в ячейке, которая использовалась для ввода аргумента, то соответственно изменится результат, а также автоматически обновится график. Например, по прогнозам в 2019 году сумма прибыли составит 4637,8 тыс. рублей.

Изменение аргумента функции ПРЕДСКАЗ в Microsoft Excel

Но не стоит забывать, что, как и при построении линии тренда, отрезок времени до прогнозируемого периода не должен превышать 30% от всего срока, за который накапливалась база данных.

Урок: Экстраполяция в Excel

Способ 3: оператор ТЕНДЕНЦИЯ

Для прогнозирования можно использовать ещё одну функцию – ТЕНДЕНЦИЯ. Она также относится к категории статистических операторов. Её синтаксис во многом напоминает синтаксис инструмента ПРЕДСКАЗ и выглядит следующим образом:

=ТЕНДЕНЦИЯ(Известные значения_y;известные значения_x; новые_значения_x;[конст])

Как видим, аргументы «Известные значения y» и «Известные значения x» полностью соответствуют аналогичным элементам оператора ПРЕДСКАЗ, а аргумент «Новые значения x» соответствует аргументу «X» предыдущего инструмента. Кроме того, у ТЕНДЕНЦИЯ имеется дополнительный аргумент «Константа», но он не является обязательным и используется только при наличии постоянных факторов.

Данный оператор наиболее эффективно используется при наличии линейной зависимости функции.

Посмотрим, как этот инструмент будет работать все с тем же массивом данных. Чтобы сравнить полученные результаты, точкой прогнозирования определим 2019 год.

  1. Производим обозначение ячейки для вывода результата и запускаем Мастер функций обычным способом. В категории «Статистические» находим и выделяем наименование «ТЕНДЕНЦИЯ». Жмем на кнопку «OK».
  2. Переход к аргументам функции ТЕНДЕНЦИЯ в Microsoft Excel

  3. Открывается окно аргументов оператора ТЕНДЕНЦИЯ. В поле «Известные значения y» уже описанным выше способом заносим координаты колонки «Прибыль предприятия». В поле «Известные значения x» вводим адрес столбца «Год». В поле «Новые значения x» заносим ссылку на ячейку, где находится номер года, на который нужно указать прогноз. В нашем случае это 2019 год. Поле «Константа» оставляем пустым. Щелкаем по кнопке «OK».
  4. Аргументы функции ТЕНДЕНЦИЯ в Microsoft Excel

  5. Оператор обрабатывает данные и выводит результат на экран. Как видим, сумма прогнозируемой прибыли на 2019 год, рассчитанная методом линейной зависимости, составит, как и при предыдущем методе расчета, 4637,8 тыс. рублей.

Результат функции ТЕНДЕНЦИЯ в Microsoft Excel

Способ 4: оператор РОСТ

Ещё одной функцией, с помощью которой можно производить прогнозирование в Экселе, является оператор РОСТ. Он тоже относится к статистической группе инструментов, но, в отличие от предыдущих, при расчете применяет не метод линейной зависимости, а экспоненциальной. Синтаксис этого инструмента выглядит таким образом:

=РОСТ(Известные значения_y;известные значения_x; новые_значения_x;[конст])

Как видим, аргументы у данной функции в точности повторяют аргументы оператора ТЕНДЕНЦИЯ, так что второй раз на их описании останавливаться не будем, а сразу перейдем к применению этого инструмента на практике.

  1. Выделяем ячейку вывода результата и уже привычным путем вызываем Мастер функций. В списке статистических операторов ищем пункт «РОСТ», выделяем его и щелкаем по кнопке «OK».
  2. Переход к аргументам функции РОСТ в Microsoft Excel

  3. Происходит активация окна аргументов указанной выше функции. Вводим в поля этого окна данные полностью аналогично тому, как мы их вводили в окне аргументов оператора ТЕНДЕНЦИЯ. После того, как информация внесена, жмем на кнопку «OK».
  4. Аргументы функции РОСТ в Microsoft Excel

  5. Результат обработки данных выводится на монитор в указанной ранее ячейке. Как видим, на этот раз результат составляет 4682,1 тыс. рублей. Отличия от результатов обработки данных оператором ТЕНДЕНЦИЯ незначительны, но они имеются. Это связано с тем, что данные инструменты применяют разные методы расчета: метод линейной зависимости и метод экспоненциальной зависимости.

Результат функции РОСТ в Microsoft Excel

Способ 5: оператор ЛИНЕЙН

Оператор ЛИНЕЙН при вычислении использует метод линейного приближения. Его не стоит путать с методом линейной зависимости, используемым инструментом ТЕНДЕНЦИЯ. Его синтаксис имеет такой вид:

=ЛИНЕЙН(Известные значения_y;известные значения_x; новые_значения_x;[конст];[статистика])

Последние два аргумента являются необязательными. С первыми же двумя мы знакомы по предыдущим способам. Но вы, наверное, заметили, что в этой функции отсутствует аргумент, указывающий на новые значения. Дело в том, что данный инструмент определяет только изменение величины выручки за единицу периода, который в нашем случае равен одному году, а вот общий итог нам предстоит подсчитать отдельно, прибавив к последнему фактическому значению прибыли результат вычисления оператора ЛИНЕЙН, умноженный на количество лет.

  1. Производим выделение ячейки, в которой будет производиться вычисление и запускаем Мастер функций. Выделяем наименование «ЛИНЕЙН» в категории «Статистические» и жмем на кнопку «OK».
  2. Переход к аргументам функции ЛИНЕЙН в Microsoft Excel

  3. В поле «Известные значения y», открывшегося окна аргументов, вводим координаты столбца «Прибыль предприятия». В поле «Известные значения x» вносим адрес колонки «Год». Остальные поля оставляем пустыми. Затем жмем на кнопку «OK».
  4. Аргументы функции ЛИНЕЙН в Microsoft Excel

  5. Программа рассчитывает и выводит в выбранную ячейку значение линейного тренда.
  6. Результат функции ЛИНЕЙН в Microsoft Excel

  7. Теперь нам предстоит выяснить величину прогнозируемой прибыли на 2019 год. Устанавливаем знак «=» в любую пустую ячейку на листе. Кликаем по ячейке, в которой содержится фактическая величина прибыли за последний изучаемый год (2016 г.). Ставим знак «+». Далее кликаем по ячейке, в которой содержится рассчитанный ранее линейный тренд. Ставим знак «*». Так как между последним годом изучаемого периода (2016 г.) и годом на который нужно сделать прогноз (2019 г.) лежит срок в три года, то устанавливаем в ячейке число «3». Чтобы произвести расчет кликаем по кнопке Enter.

Итоговый расчет функции ЛИНЕЙН в Microsoft Excel

Как видим, прогнозируемая величина прибыли, рассчитанная методом линейного приближения, в 2019 году составит 4614,9 тыс. рублей.

Способ 6: оператор ЛГРФПРИБЛ

Последний инструмент, который мы рассмотрим, будет ЛГРФПРИБЛ. Этот оператор производит расчеты на основе метода экспоненциального приближения. Его синтаксис имеет следующую структуру:

= ЛГРФПРИБЛ (Известные значения_y;известные значения_x; новые_значения_x;[конст];[статистика])

Как видим, все аргументы полностью повторяют соответствующие элементы предыдущей функции. Алгоритм расчета прогноза немного изменится. Функция рассчитает экспоненциальный тренд, который покажет, во сколько раз поменяется сумма выручки за один период, то есть, за год. Нам нужно будет найти разницу в прибыли между последним фактическим периодом и первым плановым, умножить её на число плановых периодов (3) и прибавить к результату сумму последнего фактического периода.

  1. В списке операторов Мастера функций выделяем наименование «ЛГРФПРИБЛ». Делаем щелчок по кнопке «OK».
  2. Переход к аргументам функции ЛГРФПРИБЛ в Microsoft Excel

  3. Запускается окно аргументов. В нем вносим данные точно так, как это делали, применяя функцию ЛИНЕЙН. Щелкаем по кнопке «OK».
  4. Аргументы функции ЛГРФПРИБЛ в Microsoft Excel

  5. Результат экспоненциального тренда подсчитан и выведен в обозначенную ячейку.
  6. Результат функции ЛГРФПРИБЛ в Microsoft Excel

  7. Ставим знак «=» в пустую ячейку. Открываем скобки и выделяем ячейку, которая содержит значение выручки за последний фактический период. Ставим знак «*» и выделяем ячейку, содержащую экспоненциальный тренд. Ставим знак минус и снова кликаем по элементу, в котором находится величина выручки за последний период. Закрываем скобку и вбиваем символы «*3+» без кавычек. Снова кликаем по той же ячейке, которую выделяли в последний раз. Для проведения расчета жмем на кнопку Enter.

Итоговый расчет функции ЛГРФПРИБЛ в Microsoft Excel

Прогнозируемая сумма прибыли в 2019 году, которая была рассчитана методом экспоненциального приближения, составит 4639,2 тыс. рублей, что опять не сильно отличается от результатов, полученных при вычислении предыдущими способами.

Урок: Другие статистические функции в Excel

Мы выяснили, какими способами можно произвести прогнозирование в программе Эксель. Графическим путем это можно сделать через применение линии тренда, а аналитическим – используя целый ряд встроенных статистических функций. В результате обработки идентичных данных этими операторами может получиться разный итог. Но это не удивительно, так как все они используют разные методы расчета. Если колебание небольшое, то все эти варианты, применимые к конкретному случаю, можно считать относительно достоверными.

Формируемые
навыки и умения
:


освоение методики анализа статистических
данных;


освоение методики прогнозирования
значений экономических показателей
с помощью функций и пакета анализа
MS
Excel;


изучение и освоение методики проведения
корреляционного и регрессионного
анализа.

Теоретическая
поддержка

Наиболее
широкое распространение при построении
прогнозов развития в практике коммерческой
деятельности получили экономико-статистические
модели
,
которые описывают зависимость исследуемого
экономического показателя от одного
или нескольких факторов, оказывающих
на него существенное влияние.

MS
Excel
предлагает широкий диапазон средств
для изу­чения экономической информации.
Множество встроенных статистических
функций (СРЗНАЧ, МЕДИАНА, МОДА и др.)
используют для проведения несложного
анализа дан­ных.

Если
возможностей встроенных функций
недостаточ­но, то обращаются к
инструменту Описательная
статистика
,
имеющийся в па­кете «Статистический
анализ» MS
Excel.
Выходной диапазон инструмента Описательная
статистика

содержит следующие статистические
характеристики для каждой переменной
из входного диапазона: среднее, стандартная
ошибка, медиана, мода, стандартное
отклоне­ние, дисперсия и др.

Корреляционный
анализ

это раздел математической статистики,
посвященный изучению взаимосвязей
между случайными величинами. Основной
целью корреляционного анализа

является уста­новление характера
влияния факторной переменной на
ис­следуемый показатель и определение
тесноты их связи с тем, чтобы с достаточной
степенью надежности строить модель
развития исследуемого показателя.

С
технической точки зрения проведение
корреляционно­го анализа сводится к
расчету коэффициентов парной корре­ляции,
значения которых помогут судить о
характере и тес­ноте связи между
исследуемым показателем и каждой
отоб­ранной факторной переменной.

Коэффициент
парной корреляции

используется в качес­тве меры,
характеризующей степень линейной связи
двух переменных. Значение коэффициента
корреляции лежит в интервале от -1 (в
случае строгой линейной отрицательной
связи) до +1 (в случае строгой линейной
положительной связи). Соответ­ственно,
положительное значение коэффициента
корреля­ции свидетельствует о прямой
связи между исследуемым и факторным
показателем, а отрицательное — об
обратной. Чем ближе значение коэффициента
корреляции к 1, тем тес­нее связь.
Качественно оценить тесноту связи
позволяет спе­циальная шкала значений
коэффициентов корреляции, раз­работанная
профессором Колумбийского университета
США Чеддоком (таблица 3.1).

Таблица 3.1 — Шкала
значений коэффициентов корреляции

Размер
коэффициента корреляции

0,1-0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,99

Теснота связи

слабая

умеренная

заметная

высокая

весьма высокая

Для
количественной оценки взаимосвязи двух
наборов данных можно обратиться к
статистической функции КОРРЕЛ, вызывая
ее в диалоговом окне Мастера
функций
.

Од­нако
чаще всего в экономических расчетах
приходится иметь дело сразу с несколькими
(более двух) наборами данных, вза­имосвязи
которых требуется изучить. В этом случае
рассчитывают коэффициент
множественной корреляции,
который
при­нимает значения от 0 до 1, но несет
в себе более универсаль­ный смысл:
чем ближе его значение к 1, тем в большей
степе­ни учтены факторы, влияющие на
зависимую переменную, тем более точной
выглядит построенная на основе отобран­ных
факторов модель.

В
таких случаях обра­щаются к инструменту
Корреляция,
содержащемуся в паке­те «Статистический
анализ» Excel.
Для этого используют ко­манду Анализ
данных
из
меню Сервис.
В открывшемся окне Инструменты
анализа

вызывают инструмент Корреляция.

Регрессионный
анализ
имеет
своей целью вывод, определение
(идентификацию) уравнения регрессии,
включая статистическую оценку его
параметров.

В
основе любой регресси­онной модели
лежит уравнение (или система уравнений)
рег­рессии, которое показывает, каким
будет в среднем измене­ние зависимой
переменной у,
если независимые переменные х
примут конкретные значения. Это
обстоятельство позволя­ет применять
модель регрессии не только для анализа,
но и для прогнозирования.

Методика
построения и виды моделей тренда.
Если
имеется некоторая совокупность данных,
характе­ризующих динамику исследуемого
показателя, то всегда можно попытаться
найти на графике наилучшую линию,
ко­торая будет «ближайшей» к точкам
наблюдений в рамках всей их совокупности.
Чтобы составить прогноз развития
исследуемого показа­теля, используя
линии тренда Excel,
сначала необходимо с помощью Мастера
диаграмм

построить диаграмму его дина­мики на
основе базовых данных. Когда диаграмма
построена, откры­вается контекстное
меню, в котором содержится команда
«Добавить
линию тренда
».
После ее выбора Excel
выведет ок­но диалога Линии
тренда
,
содержащее две основные вкладки: Тип
и Параметры.

Прогнозирование
с применением функции экспоненциального
сглаживания.
Для
составления прогнозов методом
экспоненциального сглаживания в Excel
предусмотрен инструмент Экспоненци­альное
сглаживание
.
Активизировать инстру­мент
Экспоненциальное
сглаживание

можно из меню Сер­вис
после загрузки надстройки Пакет
анализа

посредством команды Анализ
данных
.
Инструмент Экспо­ненциальное
сглаживание

целесообразно применять для со­ставления
прогнозов только на период, непосредственно
сле­дующий за интервалом базовых
наблюдений.

Вычисление
скользящего среднего средствами
Excel.
Инструмент
Скользящее
среднее

можно вызвать в диалоговом окне команды
Анализ данных
из меню Сервис.
Как правило, прогноз с применением
скользящего сред­него составляется
на период, непосредственно следующий
за интервалом наблюдения.

Составление
линейных прогнозов средствами
Excel

Функция рабочего
листа ЛИНЕЙН помогает определить
характер линейной связи между результатами
наблюдений и временем их фиксации и
дать ей математическое описание,
наилучшим образом аппроксимирующее
исходные данные.

Функция
ТЕНДЕНЦИЯ рассчитывает прогнозные
значе­ния исследуемого показателя в
соответствии с линейным трендом.

Функция
ПРЕДСКАЗ аналогична функции ТЕНДЕН­ЦИЯ
за исключением того, что она определяет
лишь одну точку на линии тренда и не
может рассчитать массив, кото­рый
формирует эту линию. Поэтому ее удобно
использовать для оперативного вычисления
единичных прогнозов.

Использование
возможностей
Excel
при построении нелинейных прогнозов

Функция
ЛГРФПРИБЛ работает подобно функции
ЛИНЕЙН. Различия между ними состоят
лишь в том, что ЛИНЕЙН определяет
параметры прямой линии, наилучшим
об­разом аппроксимирующей исходные
данные, а функция ЛГРФПРИБЛ —
экспоненциальной кривой.

В
то время как функция ЛГРФПРИБЛ рассчитывает
па­раметры уравнения экспоненциальной
кривой роста, кото­рая аппроксимирует
наилучшим образом множество базо­вых
данных, функция РОСТ определяет точки,
лежащие на этой кривой.

Вызвать
функции ЛИНЕЙН, ТЕНДЕНЦИЯ, ПРЕДСКАЗ,
ЛГРФПРИБЛ и РОСТ можно в диалоговом
окне Мастера
функций

(категория «Статистические»), располо­женном
на панели инструментов Стандартная.

Задание
1. Использование инструмента
Описательная
статистика

В
рамках оценки конкурентоспособности
гас­тронома исследовать центральную
тенденцию и изменчивость уровня
рентабельности двадцати продовольственных
мага­зинов (гастрономов) области на
основе следующих собран­ных по ним
за отчетный период данных (таблица 3.2).

Таблица
3.2 — Данные об уровне рентабельности по
магазинам (гастрономам) области за
отчетный период

А

В

С

D

Е

F

G

Н

1

№ п/п

Уровень
рентабель­ности, %

2

1

0,94

3

2

1,22

4

3

0,8

5

4

1,67

6

5

1,56

7

6

0,94

8

7

1,23

9

8

0,87

10

9

1,22

11

10

1,43

12

11

0,16

13

12

0,44

14

13

0,8

15

14

1,03

16

15

0,55

17

16

1,22

18

17

1,17

19

18

0,02

20

19

0,28

21

20

1,22

Выполнение:

Порядок
обработки ряда данных с помощью
инструмента Описательная статистика
установлен в диалоговом окне Описательная
статистика
,
которое можно вызвать из меню Сервис
через команду Анализ
данных
.
Открывшееся окно диалога предлагает
пользователю определиться с набором
следующих параметров (рисунок 3.1):

1)
Входной
диапазон

(интервал) — предполагает ввод ссылки
на ячейки рабочего листа, которые
содержат анали­зируемые данные. Тогда
входной диапазон объединяет ячейки
В1:В21;

2)
Группирование
— требует установления переключате­ля
в положение «По столбцам» или «По
строкам» в зависи­мости от расположения
данных во входном диапазоне. Пос­кольку
данные об уровне рентабельности
расположены в таблице 3.2 в виде столбца,
то переключатель следует устано­вить
в положение «По столбцам»;

3)
Метки в первой
строке/Метки в первом столбце

— позволяет определить название каждого
столбца (или стро­ки) выходной таблицы.
Переключатель устанавливается в
положение «Метки в первой строке», если
первая строка во входном диапазоне
содержит названия столбцов. Когда в
первом столбце входного диапазона
находятся названия строк, переключатель
устанавливается в положение «Метки в
первом столбце». Если входной диапазон
не содержит ме­ток, то необходимые
заголовки в выходном диапазоне созда­ются
на основе программы автоматически.
Учитывая, что в таблице 3.2 первая строка
содержит названия столбцов, пере­ключатель
следует установить в положение «Метки
в первой строке»;

4)
Уровень
надежности

— используется, если в выход­ную
таблицу необходимо включить строку для
уровня на­дежности. Тогда в соответствующее
поле диалогового окна вводится требуемое
значение. В экономических расчетах, как
правило, значения уровня надежности
задают в размере 95 или 99 %. Например,
значение 95 % вычисляет уровень надежности
среднего со значимостью 0,05;

5)
К-й наибольший

— применяется, если в выходную таб­лицу
необходимо включить строку для k-го
наибольшего значения входного диапазона
данных. В соответствующем окне вводится
число k.
Если k
равно 1, эта строка будет со­держать
максимум из набора данных. Например,
при оценке конкурентоспособности нашего
гастронома (пусть в таблице 3.2 он имеет
порядковый номер 7) для нас важно
проследить, по­пал ли уровень его
рентабельности в первую тройку наиболее
высокорентабельных предприятий, а
также, каков диапазон изменения уровня
рентабельности у трех самых
высокорен­табельных магазинов. Тогда
для k-го
наибольшего в диалого­вом окне надо
ввести цифру 3 (т.е. k
= 3). Это значит, что в выходной таблице,
кроме максимального значения уровня
рентабельности, будет отражен третий
за ним по убывающей размер уровня
рентабельности из всей исследуемой
совокуп­ности данных;

6)
К-й наименьший
— применяется, если в выходную таб­лицу
необходимо включить строку для k-го
наименьшего значения входного диапазона
данных. В соответствующем окне вводится
число k.
Если k
равно 1, эта строка будет со­держать
минимум из набора данных. Например, для
нас важно убедиться, что уровень
рентабельности исследуемого гастронома
не относится к пяти самым низким
показателям. Тогда в диалоговом окне
для k-го
наименьшего вводится цифра 5. Это значит,
что в выходной таблице, кроме мини­мального
значения уровня рентабельности, будет
отражен пя­тый за ним по возрастающей
размер уровня рентабельности;

7)
Выходной
диапазон

предполагает введение ссылки на левую
верхнюю ячейку выходного диапазона.
Инстру­мент Описательная статистика
выводит два столбца сведе­ний для
каждого набора данных. Левый столбец
содержит наименования рассчитанных
статистических величин, а пра­вый —
их значения. В нашем случае выходная
таблица статистических характеристик
должна быть расположена, например, на
том же рабочем листе, что и входная, на
одном с ней уровне, но правее. Тогда
можно за­дать следующий выходной
диапазон — D1;

8)
Новый лист
— применяют, чтобы открыть новый лист
в книге и вставить результаты анализа,
начиная с ячейки А1. При необходимости
в поле диалогового окна, располо­женном
напротив соответствующего положения
переключа­теля, вводится имя нового
листа;

9)
Новая книга
— используется, когда необходимо
от­крыть новую книгу и вставить
результаты анализа в ячейку А1 на первом
листе этой книги;

10)
Итоговая
статистика

— требует установления флажка, который
означает, что в выходном диапазоне
необ­ходимо получить полный список
статистических характе­ристик:
Среднее, Стандартная ошибка (среднего),
Медиана, Мода, Стандартное отклонение,
Дисперсия выборки, Эк­сцесс,
Асимметричность, Интервал, Минимум,
Максимум, Сумма, Счет, Наибольшее (k-e),
Наименьшее (k-e),
Уровень надежности.

Рисунок
3.1 — Окно диалога Описательная
статистика

Проведение
всех вышеобозначенных действий с данными
таблицы 3.2 позволяет получить следующую
итоговую таблицу обобщенных статистических
характеристик уровня рента­бельности
исследуемых торговых предприятий
(таблица 3.3).

Таблица
3.3 — Статистическая оценка данных об
уровне рентабельности по магазинам
(гастрономам) области за отчетный год

А

В

С

D

Е

1

№ п/п

Уровень
рентабельности, %

Результат

2

1

0,94

3

2

1,22

Среднее

0,9385

4

3

0,8

Стандартная
ошибка

0,10199

5

4

1,67

Медиана

0,985

6

5

1,56

Мода

1,22

7

6

0,94

Стандартное
отклонение

0,45611

Продолжение
таблицы 3.3

А

В

С

D

Е

1

№ п/п

Уровень
рентабельности, %

Результат

8

7

1,23

Дисперсия выборки

0,20803

9

8

0,87

Эксцесс

-0,3986

10

9

1,22

Асимметричность

-0,5196

11

10

1,43

Интервал

1,65

12

11

0,16

Минимум

0,02

13

12

0,44

Максимум

1,67

14

13

0,8

Сумма

18,77

15

14

1,03

Счет

20

16

15

0,55

Наибольший(5)

1,22

17

16

1,22

Наименьший(3)

0,28

18

17

1,17

Уровень
надежности(95,0%)

0,21347

19

18

0,02

20

19

0,28

21

20

1,22

Вывод:
Приведенные в таблице 3.3 данные позволяют
оперативно проследить, что уровень
рентабельности по двадцати иссле­дуемым
предприятиям за анализируемый период
сложился в среднем 0,94+0,46
% и колебался в пределах 0,02-1,67 %.

С известной долей
условности можно предположить, что
приблизительно 68 % магазинов имели
уровень рента­бельности между 0,48%
(0,94 — 0,46) и 1,4% (0,94 + 0,46).

Стандартное
отклонение (± 0,456) свидетельствует о
доста­точно сильном разбросе размеров
уровня рентабельности предприятий
относительно его среднего значения,
т.е. отоб­ранные магазины далеко не в
равной степени могут рассмат­риваться
в качестве конкурентов нашего предприятия.

Ис­следуемый
гастроном № 7, имея уровень рентабельности
1,23 %, не относится к тройке самых
высокорентабельных предприятий
(1,43-1,67 %), но, судя по медиане, принадле­жит
к той половине предприятий, которая
обладает большей рентабельностью. Чаще
всего в выборке присутствует уро­вень
рентабельности 1,22 % (что тоже ниже
показателя на­шего гастронома), а
отрицательное значение коэффициента
асимметрии свидетельствует о более
высокой плотности рас­пределения
значений уровня рентабельности, больших
вели­чины 1,22 % (левосторонней асимметрии).
Следовательно, по показателю рентабельности
у гастронома № 7 гораздо меньше реальных
конкурентов, чем общее количество
чле­нов выборки. При этом рассчитанные
коэффициенты асим­метрии и эксцесса
указывают на неоднородность исследуе­мого
массива данных и необходимость пересмотра
его соста­ва. В этой связи для проведения
углубленного анализа реаль­ных
конкурентов магазина № 7 по избранному
признаку це­лесообразно пересмотреть
и урезать выборку.

Задание
2. Проведение корреляционного анализа

Провести
корреляционный анализ това­рооборота
на основе информации, подготовленной
с помощью электронных таблиц Excel
(таблица 3.4).

Для
проведения корреляционного анализа
объема товарообо­рота (исследуемый
показатель) могут быть отобраны следую­щие
факторы:

— товарооборачиваемость
в днях;

— удельный вес
торговой площади в общей площади
пред­приятия;


удельный вес торгово-оперативных
работников в их об­щей численности;


удельный вес товаров с высоким (в рамках
установленно­го действующим
законодательством предельного уровня)
уровнем торговых надбавок.

Таблица
3.4 — Исходные данные для проведения
корреляционного анализа

А

В

С

D

Е

F

1

2

Поряд­ковый
номер месяца

Объем
товаро­оборота, ден. ед.

Обора­чивае­мость
товаров,

дни

Удельный
вес торговой площади в общей, %

Удельный
вес торгово-оперативного персонала
в общей численности работников, %

Удельный
вес товаров с высокими торговыми
надбавками, %

3

1

28415

43,5

44,0

67,7

22,5

4

2

28231

43,0

44,0

67,7

18,0

5

3

29783

43,0

44,0

70,2

24,9

6

4

30969

43,5

47,8

70,0

24,4

7

5

30494

43,0

47,8

68,0

20,6

8

6

29757

42,5

47,8

68,0

19,0

9

7

30850

43,0

49,0

70,2

22,2

10

8

31325

41,5

49,0

70,0

21,6

11

9

31359

42,0

50,3

70,0

19,8

12

10

31610

41,5

50,3

70,0

19,7

13

11

32366

40,5

50,3

70,0

23,1

14

12

33313

40,0

50,3

70,0

23,9

15

13

33508

40,0

50,3

68,0

21,2

16

14

33374

39,0

50,3

68,0

20,4

17

15

34811

39,5

50,3

70,0

24,2

18

16

36046

39,0

49,0

70,0

26,5

Выполнение:

Для
количественной оценки взаимосвязи
объема данных обра­щаются к инструменту
Корреляция,
содержащемуся в паке­те «Статистический
анализ» Excel.
Для этого используют ко­манду Анализ
данных
из
меню Сервис.
В открывшемся окне Инструменты
анализа

вызывают инструмент Корреляция,
диалоговое окно которого предлагает
пользователю опреде­лить следующие
параметры (рисунок 3.2):

1)
Входной
диапазон (интервал)

— предполагает ввод ссылки на ячейки
рабочего листа, которые содержат
анали­зируемые данные. Для данных
таблицы 3.4 вход­ной диапазон имеет
вид — B2:F18;

2)
Группирование
— требует установления переключа­теля
в положение «По столбцам» или «По
строкам» в зави­симости от расположения
данных во входном диапазоне. Поскольку
анализируемые наборы данных расположены
в таблице 3.4 в виде столбцов, то
переключатель следует устано­вить в
положение «По столбцам»;

3)
Метки в первой
строке/Метки в первом столбце

— позволяет определить название каждого
столбца (или стро­ки) выходной таблицы.
Переключатель устанавливается в
положение «Метки в первой строке», если
первая строка во входном диапазоне
содержит названия столбцов. Когда в
первом столбце входного диапазона
находятся названия строк, переключатель
устанавливается в положение «Метки в
первом столбце». Если входной диапазон
не содержит ме­ток, то необходимые
заголовки в выходном диапазоне созда­ются
на основе программы автоматически.
Учитывая, что в таблице 3.4 первая строка
содержит названия столбцов, пере­ключатель
следует установить в положение «Метки
в первой строке»;

4)
Выходной
диапазон

предполагает введение ссылки на левую
верхнюю ячейку выходного диапазона.
Например, если необходимо, чтобы выходная
таблица располагалась на том же рабочем
листе, что и входная, и непосредственно
под ней, то можно задать выходной диапазон
ячейкой А21;

5)
Новый лист
— применяют, чтобы открыть новый лист
в книге и вставить результаты анализа,
начиная с ячейки А1. При необходимости
в поле диалогового окна, располо­женном
напротив соответствующего положения
переключа­теля, вводится имя нового
листа;

6)
Новая книга
— используется, когда необходимо
от­крыть новую книгу и вставить
результаты анализа в ячейку А1 на первом
листе этой книги.

Рисунок
3.2 — Окно диалога Корреляция

Проведение
всех обозначенных действий с данными
таблицы 3.4 позволяет получить матрицу
значений парных ко­эффициентов
корреляции, рассчитанных для всех
возмож­ных пар переменных без учета
влияния других факторов (таблица 3.5).
Поскольку коэффициент корреляции двух
набо­ров данных не зависит от
последовательности их обработки, то
выходная область занимает только
половину предназна­ченного для нее
места. Ячейки выходного диапазона,
имею­щие совпадающие координаты строк
и столбцов, содержат значение 1, так как
каждая строка или столбец во входном
диапазоне полностью коррелирует с самим
собой.

Таблица
3.5 — Матрица парных коэффициентов
корреляции

А

В

С

D

E

F

21

Объем товарооборота,
ден. ед.

Оборачиваемость
товаров, дни

Удельный вес
торговой площади в общей, %

Удельный вес
торгово-оперативного персонала в
общей численности работников, %

Удельный вес
товаров с высокими торговыми надбавками,
%

22

Объем товарооборота,
ден. ед.

1

23

Оборачиваемость
товаров, дни

-0,90538094

1

24

Удельный вес
торговой площади в общей, %

0,75014268

-0,690531

1

25

Удельный вес
торгово-оперативного персонала в
общей численности работников, %

0,38663194

-0,153964

0,3726409

1

26

Удельный вес
товаров с высокими торговыми надбавками,
%

0,50878765

-0,276455

0,0374572

0,580400123

1

Вывод:
На основе приведенной матрицы можно
содержательно оценить связь значений
объема товарооборота с каждым из
отобранных факторов и выбрать наиболее
значимые из них для включения в модель.
Так, полученные коэффициенты корреляции,
характеризующие тесноту связи объема
товаро­оборота с отобранными факторами
(см. столбец В21:В26 таблицы 3.5), составляют
соответственно: -0,905 для фактора
«оборачиваемость товаров»; 0,750 для
фактора «удельный вес торговой площади
в общей»; 0,509 для фактора «удельный вес
товаров с высокими торговыми надбавками»;
0,387 для фактора «удельный вес
торгово-оперативного персонала в общей
численности работников». Согласно шкале
Чеддока (таблица 3.1), для данного торгового
предприятия показатель объема
товарооборота имеет весьма высокую
тесноту связи с фактором «оборачиваемость
това­ров» и высокую — с фактором
«удельный вес торговой пло­щади в
общей». Значение коэффициента корреляции,
рассчитанное для товарооборота и фактора
«удельный вес торгово-оперативно­го
персонала», свидетельствует о слабо
выраженной линей­ной связи между
этими показателями.

Знак
«-» перед коэффициентом корреляции в
ячейке В23 означает, что между объемом
товарооборота и размером товарооборачиваемости
в днях имеет место обратная связь, т.е.
при росте количества дней одного оборота
товарного запаса предприятия в днях
(иными словами — замедлении
товарооборачиваемости) объем его
реализации при прочих равных условиях
будет падать. С остальными факторами
объем то­варооборота находится в
прямой зависимости.

Задание
3. Прогнозирование развития показателей
с помощью линии тренда
Excel

Составить
прогноз товарооборота торгового
пред­приятия на 17-й месяц (см. данные
таблицы 3.6) с помощью ко­манды Добавить
линию тренда
.

Таблица 3.6 — Сведения
о динамике товарооборота торгового
предприятия

А

В

С

D

E

F

1

2

Порядковый номер
месяца

Объем
товарооборота, ден. ед.

3

1

28415

4

2

28231

5

3

29783

6

4

30969

7

5

30494

8

6

29757

9

7

30850

10

8

31325

11

9

31359

12

10

31610

13

11

32366

14

12

33313

15

13

33508

16

14

33374

17

15

34811

18

16

36046

19

Итого

Выполнение:

Чтобы
составить прогноз развития исследуемого
показа­теля, используя линии тренда
Excel,
сначала необходимо с помощью Мастера
диаграмм

построить диаграмму (График)
его дина­мики на основе базовых данных
(ячейки В3:В19 таблицы 3.6).

Когда
диаграмма построена, необходимо щелкнуть
правой клавишей мыши на любой точке
графика, чтобы открылось контекстное
меню, в котором содержится команда
Добавить
линию тренда
.
После ее выбора Excel
выведет ок­но диалога Линии
тренда,

содержащее две основные вкладки: Тип
и Параметры.

Вкладка
Тип
помогает пользователю выбрать тип линии
тренда, которая будет аппроксимировать
исходные данные. В диалоговом окне
предлагается пять типов линий тренда.
Для их построения Excel
использует модели следующего вида:


линейную (у
=
mх
+
b);


полиномиальную (у
=
b
+
m1x
+
m2x2
+…+
m6х6);


логарифмическую (у
=
m
·
ln
x
+
b);


экспоненциальную (у
=
m
· е
b·x);


степенную (у
=
m
· х
b).

После
задания типа линии тренда выделяют
вкладку Па­раметры.
Откроется ее окно диалога, в котором
пользова­тель определяет следующие
важные моменты:

1)
количество прогнозируемых периодов и
направление прогноза: вперед или назад;

2)
когда выбрана линейная, полиномиальная
или экспо­ненциальная кривая роста,
то в поле Пересечение
кривой с осью у в точке 0

задается ее у-пересечение:
если данное поле обозначить флажком,
то Excel
будет искать лучшее уравне­ние кривой,
которая на координатной плоскости
обязатель­но должна пройти через
начало координат;

3)
через установку флажка в соответствующих
полях ок­на диалога пользователь
решает, отражать ли на выходной диаграмме
уравнение, на основе которого была
построена ли­ния тренда, и размер
квадрата коэффициента корреляции r2,
характеризующий качество аппроксимации.

C
помощью ко­манды Добавить
линию тренда

составим сразу пять различных вариантов
прогноза товарооборота торгового
пред­приятия на 17-й месяц и при этом
по r2
оценить общее качество моделей, на
основе которых они были полу­чены.

Используя
возмож­ности Excel
по созданию в ячейках рабочего листа
формул, с помощью приведенных на графиках
уравнений кривых рос­та рассчитаем
значения прогноза товарооборота на
17-й месяц (таблица 3.7).

Таблица
3.7 — Прогноз товарооборота на 17-й месяц

Тип
модели тренда

Формула
расчета прогноза

Прогноз
объема товарооборота на 17-й месяц,
ден. ед.

Линейная

=437,43*17+27920

35356,3

Логарифмиче­ская

=2429,4*ln(17)+26981

33864,0

Полиноми­альная

=3,9737*17^3-88,245*17^2+925,09*17+27432

1 37178,5

Степенная

=27215*17^0,0774

33887,9

Экспоненци­альная

=28081*е^(0,0138*17)

35490,0

Рисунок
3.3 — График развития товарооборота
торгового предприятия

Рисунок
3.4 — Оценка прогноза товарооборота
торгового предприятия на основе
линейной кривой роста

Рисунок
3.5 — Оценка прогноза товарооборота на
основе логарифмической кривой роста

Рисунок
3.6 — Оценка прогноза товарооборота на
основе полиномиальной кривой роста
(степень 3)

Рисунок
3.7 — Оценка прогноза товарооборота на
основе степенной кривой роста

Рисунок
3.8 — Оценка прогноза товарооборота на
основе экспоненциальной кривой роста

Вывод:
Приведенные на рисунках 3.3–3.8 графики
динамики то­варооборота свидетельствуют,
что наибольшая степень при­ближения
линии тренда к базовым данным достигнута
в слу­чае полиномиальной кривой роста
3-й степени (см. рисунок 3.6, r2
= 0,9519), наименьшая — в случае логарифмической
кри­вой (см. рисунок 3.5, r2
= 0,7779).

Задание
4. Прогнозирование с применением функции
экспоненциального сглаживания

Составить
прогноз товарооборота торгового
предприятия на основе данных таблицы
3.6 с помощью инструмента Экспоненциальное
сгла­живание
.

Выполнение:

Активизировать
инстру­мент Экспоненциальное
сглаживание

можно из меню Сер­вис
после загрузки надстройки Пакет
анализа

посредством команды Анализ
данных
.
Открывшееся окно диалога Экспоненциальное
сглаживание

предлагает пользователю оп­ределиться
со следующими параметрами (рисунок
3.9):

1)
Входной
диапазон

требует ссылки на ячейки, содер­жащие
данные об исследуемом показателе. Этот
диапазон должен состоять из одного
столбца или одной строки и содер­жать
данные как минимум в четырех ячейках.
В нашем примере параметр Входной
диапазон

включает ячейки В2:В19 (таблица 3.8);

2)
Фактор
затухания

— это корректировочный фактор,
минимизирующий нестабильность
совокупности данных. Он может иметь
значения в пределах от 0 до 1. По умолчанию
пользователя Excel
самостоятельно принимает значение
фак­тора затухания равным 0,3. В нашем
примере для параметра Фактор
затухания

введем значение 0,1;

3)
Метки
— требует установки флажка, если первая
строка или первый столбец входного
диапазона содержит за­головки (название
столбца или строки). В нашем примере
установим флажок для параметра Метки;

4)
Выходной
диапазон

предполагает ссылку на вер­хнюю ячейку
выходного диапазона. В нашем примере
установим верхнюю ячейку Выходного
диапазона – С3;

5)
Вывод графика
— требует установки флажка, если
пользователю, кроме значения прогноза,
необходимо полу­чить встроенную
диаграмму динамики фактических и
рас­четных значений;

6)
Стандартные
погрешности

— требует установки флаж­ка, если
пользователю для проведения оценки
качества про­гнозов необходимо
включить в выходной диапазон столбец
со стандартными погрешностями e(t).

Рисунок 3.9 — Окно
диалога «Экспоненциальное сглаживание»

В
результате работы инструмента
Экспоненциальное
сглаживание

получаем следующие сглаженные показатели
товарооборота (см. столбец С таблицы
3.8), в том числе прогноз на 17-й месяц —
35 908 ден. ед.

Таблица
3.8 — Расчет прогноза товарооборота с
помощью инструмента Экспоненциальное
сглаживание

А

В

С

1

2

Порядковый
номер месяца

Объем
товарооборота, ден. ед.

Экспоненциальное
сглаживание

3

1

28415

#Н/Д

4

2

28231

28415

5

3

29783

28249,4

6

4

30969

29629,6

7

5

30494

30835,1

8

6

29757

30528,1

9

7

30850

29834,1

10

8

31325

30748,4

11

9

31359

31267,3

12

10

31610

31349,8

13

11

32366

31584,0

14

12

33313

32287,8

15

13

33508

33210,5

16

14

33374

33478,2

17

15

34811

33384,4

18

16

36046

34668,3

19

17

35908,2

Задание
5. Прогнозирование с применением метода
скользящего среднего

5.1
При исследовании спроса на реализуемый
то­вар-новинку в фирменном магазине
в течение 20 дней было зафиксировано
определенное количество поступивших
на не­го жалоб со стороны покупателей
(таблица 3.9, ячейки В2:В21). Выяснить,
существует ли какая-либо тенденция
поступления жалоб с помощью инструмента
Скользящее
сред­нее
.

Выполнение:

Инструмент
Скользящее
среднее

можно вызвать в диалоговом окне команды
Анализ данных
из меню Сервис.
Открывшееся окно диалога предлагает
пользователю за­дать следующие
основные параметры (рисунок 3.10):

1)
Входной
диапазон (интервал) —
это
диапазон ячеек В2:В21 (см. таблицу 3.9);

2)
Интервал
усреднения

примем равным 3, т.е. бу­дем определять
трехдневное скользящее среднее;

3)
Выходной
диапазон (интервал)

за­даем именем ячейки С2. При этом
следует иметь в виду, что первые несколько
ячеек выходного диапазона будут всегда
содержать значение #Н/Д. Количество
таких ячеек равно значению выбранного
интервала усреднения минус один. Эта
ситуация связана с недостаточным
количеством базовых данных для вычисления
среднего значения первых результа­тов
наблюдений;

4)
Вывод графика
— требует установки флажка, который
означает, что пользователю, кроме
выходного массива (в на­шем примере
— в столбце С), необходимо получить
график, который наглядно демонстрирует
линию тренда скользяще­го среднего.
Если флажок установлен, то Excel
самостоятель­но создает график,
включающий две линии: одна из них строится
на основе базовых данных, другая — по
числовым значениям скользящего среднего.

Рисунок
3.10 — Окно диалога Скользящее
среднее

Таблица
3.9 — Оценка тенденции поведения показателей
исследуемого динамического ряда методом
скользящего среднего

А

В

С

1

День
месяца

Количество
жалоб

2

1

10

#Н/Д

3

2

11

#Н/Д

4

3

10

10,333

5

4

12

11

6

5

13

11,667

7

6

13

12,667

8

7

13

13

9

8

10

12

10

9

16

13

11

10

9

11,667

12

11

15

13,333

13

12

10

11,333

14

13

15

13,333

15

14

17

14

16

15

12

14,667

17

16

15

14,667

18

17

14

13,667

19

18

18

15,667

20

19

19

17

21

20

15

17,333

Вывод:
Приведенные в столбце С таблицы 3.9
выходные значения свидетельствуют (и
это наглядно подтверждает рисунок), что
показатель скользящего среднего имеет
тенденцию к увели­чению. В данном
случае выявленная тенденция вызывает
опасения относительно дальнейшей судьбы
товара и требует принятия адекватных
мер со стороны его производителя.

5.2
Составить прогноз объема товарооборота
по торговому предприятию на основе
данных таблицы 3.6, исполь­зуя расчет
скользящего среднего.

Выполнение:


на отдельном рабочем листе Excel
составим разработочную таблицу следующего
вида (таблица 3.10);

Таблица
3.10 — Методика составления прогноза
товарооборота на основе скользящего
среднего средствами Excel
(разработочная таблица)

А

В

С

D

Е

1

2

Порядковый
номер месяца

Объем
товарооборота, ден. ед.

Цепные
темпы прироста, %

Показатели
выравненного ряда

Среднее
изменение темпов прироста

3

1

28415

4

2

28231

5

3

29783

6

4

30969

7

5

30494

8

6

29757

9

7

30850

10

8

31325

11

9

31359

12

10

31610

13

11

32366

14

12

33313

15

13

33508

16

14

33374

17

15

34811

18

16

36046


учитывая, что объем товарооборота
представляет собой абсолютный стои­мостный
показатель, для расчета скользящего
среднего соз­дадим в разработочной
таблице колонку относительных ве­личин,
характеризующих динамику товарооборота
предпри­ятия — цепных темпов прироста
(вводим в ячейку С4 формулу =В4/В3*100-100 и
копируем ее в ячейки С5:С18) (столбец С
таблицы 3.10);


вы­равнивание динамического ряда,
состоящего из 15 цепных темпов прироста
товарооборота, проведем, используя
интер­вал усреднения, равный, например,
5. Для расчета показате­лей выровненного
ряда (столбец D
таблицы 3.10) воспользуемся другим способом
создания скользящего среднего в Excel,
т.е. прямым введением формулы в
соответствующую ячей­ку рабочего
листа. Так, чтобы получить пятимесячное
сколь­зящее среднее цепных темпов
прироста, в ячейку D8
таблицы 10 вводится формула =СРЗНАЧ(С4:С8).
Затем эта формула с помощью средства
Автозаполнение
копируется и вставляет­ся в ячейки
D9:D18;


для составления прогноза товарооборота
на 17-й месяц в таблице 3.10 необходимо
занести еще три формулы: расчета среднего
изменения темпов его прироста: =(D18-D8)/10
(ячейка Е18), расче­та прогнозируемого
цепного темпа прироста на 17-й месяц:
=D18+2*E18
(ячейка С20), расчета прогнозируемого
объема товарооборо­та: B18*(C20+100)/100
(ячейка В20). Результатом всех проведенных
операций становится итоговая таблица
3.11, содержащая все промежуточ­ные
элементы и значения единой цепи
составления прогноза товарооборота.

Таблица
3.11 — Прогноз товарооборота на основе
скользящего среднего средствами Excel
(итоговая таблица)

А

В

С

D

Е

1

2

Порядковый
номер месяца

Объем
товарооборота, ден. ед.

Цепные
темпы прироста, %

Показатели
выравненного ряда

Среднее
изменение темпов прироста

3

1

28415

4

2

28231

-0,648

#Н/Д

5

3

29783

5,498

#Н/Д

6

4

30969

3,982

#Н/Д

7

5

30494

-1,534

#Н/Д

8

6

29757

-2,417

0,976

9

7

30850

3,673

1,840

10

8

31325

1,540

1,049

11

9

31359

0,109

0,274

12

10

31610

0,800

0,741

13

11

32366

2,392

1,703

14

12

33313

2,926

1,553

15

13

33508

0,585

1,362

16

14

33374

-0,400

1,261

17

15

34811

4,306

1,962

18

16

36046

3,548

2,193

0,122

19

Прогноз

20

17

36924

2,436

Задание
6. Использование функции ЛИНЕЙН для
создания модели тренда

Составить
прогноз товарооборота торгового
пред­приятия по данным таблицы 3.6 с
помощью функции ЛИНЕЙН.

Выполнение:

Функция
рабочего листа ЛИНЕЙН помогает определить
характер линейной связи между результатами
наблюдений и временем их фиксации и
дать ей математическое описание,
наилучшим образом аппроксимирующее
исходные данные. Для построения трендовой
модели она использует уравнение вида
у = mх
+
b,
где у
— исследуемый показатель; х
=
t
— временной
тренд; b,
m
— параметры уравнения, характери­зующие
соответственно у-пересечение
и наклон линии трен­да.

Вызвать
функцию ЛИНЕЙН можно в диалоговом окне
Мастера
функций

(категория «Статистические»),
располо­женном на панели инструментов
Стандартная.

Используя
метод наименьших квадратов, функция
ЛИНЕЙН создает массив значений, который
описывает ис­комую модель тренда.
Учитывая, что создается массив зна­чений,
функция должна задаваться пользователем
в виде формулы массива. Поэтому перед
началом работы с ЛИ­НЕЙН необходимо
на рабочем листе выделить диапазон
яче­ек, достаточный для размещения
создаваемого ею массива значений. Так,
для прогнозирования товарооборота по
дан­ным таблицы 3.6 обозначим ячейками
E10:F14
диапазон для формирования выходного
массива (таблица 3.12). После того, как
выделен выходной диапазон и пользователь
определился с аргументами функции
посредством диалогового окна ЛИ­НЕЙН,
следует нажать на клавиатуре кнопки
Ctrl+Shift+Enter.

Таблица 3.12 — Расчет
и оценка линейной модели тренда с помощью
функции ЛИНЕЙН

A

B

C

D

E

F

1

2

Порядковый
номер месяца

Объем
товарооборота, ден. ед.

3

1

28415

4

2

28231

5

3

29783

6

4

30969

7

5

30494

8

6

29757

9

7

30850

10

8

31325

Линейная
оценка

437,425

27920,1

11

9

31359

Статистика

34,958505

338,033

12

10

31610

0,917921

644,603

13

11

32366

156,56746

14

14

12

33313

65055814

5817182

15

13

33508

16

14

33374

17

15

34811

18

16

36046

Функция
ЛИНЕЙН имеет четыре аргумента (рисунок
3.11):

1)
Известные
значения у

— это множество уже извес­тных значений
исследуемого показателя, на основе
которых будет производиться оценка
параметров уравнения тренда. Так, при
составлении прогноза товарооборота
торгового пред­приятия по данным
таблицы 3.6 известные значения у
представ­лены в виде столбца и находятся
в ячейках В3:В18;

2)
Известные
значения х

— при построении трендовой модели
представляют собой временной ряд,
соответствую­щий по размерам первому
аргументу. В нашем примере он находится
в ячейках А3:А18 таблицы 3.6 и отражает
порядко­вые номера месяца;

3)
Конст
— логическое значение, которое указывает
на необходимость расчета параметра b
(свободного члена) при построении модели
тренда. Если Конст
имеет значение ИСТИНА, то параметр b
вычисляется. Если Конст
имеет значение ЛОЖЬ, то параметр b
принимается равным нулю;

4)
Статистика
— логическое значение, которое указы­вает
на необходимость отражения на рабочем
листе дополни­тельной статистической
информации, позволяющей судить о качестве
построенной модели. Если этот аргумент
имеет зна­чение ЛОЖЬ или ссылка на
него отсутствует, то функция ЛИНЕЙН не
рассчитывает статистические характеристики.
Если Статистика
задана значением ИСТИНА, то мас­сив,
создаваемый функцией, содержит значения
следующих статистических величин
(таблица 3.13).

Таблица
3.13 — Значения статистических величин
функции ЛИНЕЙН

Стандартная
ошибка для параметра m
(COm)

Стандартная
ошибка для свободного члена b
(СОb)

Квадрат
коэффициента корреляции
(r2)

Стандартная
ошибки для у
(СОу)

F-критерий
(F)

Степень
свободы (df)

Сумма
квадратов регрессии (SSp)

Остаточная
сумма квадратов (SS0)

Рисунок 3.11 — Окно
диалога функции ЛИНЕЙН

Вывод:
Число в ячейке Е10 представляет собой
наклон линии тренда (m
= 437,425
), а
число в ячейке F10
— это у-пересечение
прямой линии (b
= 27920,1
). Можно
составить линей­ную модель, описывающую
динамику товарооборота торго­вого
предприятия, которая принимает следующий
вид:

Y
= 27920,1 + 437,425
x,

где
х = t
— порядковый номер месяца.

В
нашем примере коэффициент корреляции
(см. таблицу 3.12, ячейка Е12) r2
= 0,9179
, что
указывает на высокое качество линейной
модели.

В
нашем примере Fкрит
находится по таблице F-распреде­ления
на пересечении столбца 1 (так как в модели
только од­на переменная х
— временной тренд) и строки 14 (см. ячейку
F13
таблицы 3.12). В приложении А находим для
рас­пределения Фишера с (1;14) степенями
свободы, что при 5%-м уровне значимости
(доверительная вероятность 95 %) табличное
значение Fкp
= 4,6
. Поскольку
F
= 156,567 > 4,6

(см. ячейку Е13 таблицы 3.12), то полученная
модель трен­да полезна для использования
в прогнозировании.

Рассчитаем
значения t-статистики
для оценки параметров m
и b
построенной нами модели на основе данных
таблицы 3.12:

Табличное
значение tкрит
для уровня значимости 0,05 (до­верительная
вероятность 0,95) с df
= 14 степенями свободы равно 2,145 (см.
приложение Б). Поскольку |tm|
> 2,145, |tf|
> 2,145, статистическая значимость
параметров построенной модели признается
весьма высокой.

Задание
7. Использование функции ТЕНДЕНЦИЯ для
построения прогнозов

Составить
прогноз товарооборота торгового
пред­приятия по данным таблицы 3.6 с
помощью функции ТЕНДЕНЦИЯ.

Выполнение:

Функция
ТЕНДЕНЦИЯ рассчитывает прогнозные
значе­ния исследуемого показателя в
соответствии с линейным трендом. Она с
помощью метода наименьших квадратов
аппроксимирует прямой линией мас­сивы
известных значений у
и известных
значений х,
а также определяет точки, лежащие на
этой ли­нии, и прогнозирует значения
у
для вновь заданных значе­ний х.
Но при этом ТЕНДЕНЦИЯ не приводит
математичес­кого описания и
статистических характеристик самой
моде­ли тренда.

Вызвать
функцию ТЕНДЕНЦИЯ можно из окна диалога
Мастера
функций
,
расположенного на панели Стандартная,
в категориях – Статистические.
ТЕНДЕНЦИЯ имеет четыре аргумента
(рисунок 3.12):

1)
Известные
значения у
;

2)
Известные
значения х
;

3)
Новые значения
х
;

4)
Конст.

Первый,
второй и четвертый аргументы формируются
аналогично тому, как это происходит при
работе с функцией ЛИНЕЙН (соответственно
первым, вторым и третьим ее ар­гументом).

Третий
аргумент — это определяемые самим
пользовате­лем значения х
(в модели тренда — времени t),
для которых ТЕНДЕНЦИЯ рассчитывает по
найденной модели соответст­вующие
значения у.
Так, при прогнозировании товарооборо­та
торгового предприятия с помощью функции
ТЕНДЕН­ЦИЯ на рабочем листе выделим
диапазон ячеек С3:С21, где ячейки С3:С18 —
для отражения значений каждой точки
базового интервала вре­мени на линии
тренда (таблица 3.14), а ячейки С19:С21 — для
перспективной оценки товарооборота на
три ближайших месяца. Аргумент Новые
значения х

в этом случае будет за­дан ячейками
А3:А21, и формируется следующая формула
массива: =ТЕНДЕНЦИЯ(В3:В18;А3:А18;А3:А21).

По
окончании работы с окном диалога
ТЕНДЕНЦИЯ необходимо нажать на клавиатуре
кнопки Ctrl
+ Shift
+ Enter.
В выходном диапазоне (см. столбец С
таблицы 3.14) фун­кция ТЕНДЕНЦИЯ
моментально отразит все рассчитанные
на основе линейной модели тренда значения
у,
соответствую­щие заданному аргументу
Новые значения
х
(т.е. ячейкам
А3:А21). Из них значения, находящиеся в
ячейках С3:С18, будут относиться к базовому
временному интервалу, а в ячейках С19:С21
— содержать прогноз товарооборота на
17-й, 18-й и 19-й месяцы.

Рисунок 3.12 — Окно
диалога функции ТЕНДЕНЦИЯ

Таблица
3.14 — Расчет прогноза товарооборота с
помощью функции ТЕНДЕНЦИЯ

А

В

С

1

2

Порядковый
номер месяца

Объем
товарооборота, ден. ед.

Тенденция

3

1

28415

28358

4

2

28231

28795

5

3

29783

29232

6

4

30969

29670

7

5

30494

30107

8

6

29757

30545

9

7

30850

30982

10

8

31325

31419

11

9

31359

31857

12

10

31610

32294

13

11

32366

32732

14

12

33313

33169

15

13

33508

33607

16

14

33374

34044

17

15

34811

34481

18

16

36046

34919

19

17

35356

20

18

35794

21

19

36231

Задание
8. Использование функции ПРЕДСКАЗ для
построения прогнозов

Составить
прогноз товарооборота торгового
пред­приятия по данным таблицы 3.6 с
помощью функции ПРЕДСКАЗ.

Выполнение:

Функция
ПРЕДСКАЗ определяет лишь одну точку на
линии тренда и не может рассчитать
массив, кото­рый формирует эту линию.
Поэтому ее удобно использовать для
оперативного вычисления единичных
прогнозов. Функцию ПРЕДСКАЗ можно
вызвать в ди­алоговом окне Мастера
функций
, в
категориях – Статистические,
она имеет только три аргумента (рисунок
3.13):

1)
X
— это точка данных (числовое значение),
для кото­рой необходимо рассчитать
прогноз исследуемого показате­ля.
Так,
при прогнозировании товарооборота на
17-й,
18-й и 19-й месяцы
(таблица 3.15) в качестве аргумента X
определим ячейки А19:А21;

2)
Известные
значения у

(прогнозируемого показателя). В нашем
примере их можно задать в виде диапазона
ячеек В3:В18 (см. таблицу 3.15);

3)
Известные
значения х

(времени t).
Этот аргумент дол­жен совпадать по
размерам с массивом Известные
значения у
.
Этот аргумент в нашем примере охватывает
ячейки А3:А18.

Соответственно
обозначенным в окне диалога ПРЕДСКАЗ
аргументам формируется формула следующего
вида: =ПРЕДСКАЗ(А19:А21;В3:В18;А3:А18).

По
окончании работы с окном диалога ПРЕДСКАЗ
необходимо нажать на клавиатуре кнопки
Ctrl
+ Shift
+ Enter.

Рисунок 3.13 — Окно
диалога функции ПРЕДСКАЗ

Таблица
3.15 — Расчет прогноза товарооборота с
помощью функции ПРЕДСКАЗ

А

В

С

1

2

Порядковый
номер месяца

Объем
товарооборота, ден. ед.

3

1

28415

4

2

28231

5

3

29783

6

4

30969

7

5

30494

8

6

29757

Продолжение таблицы
3.15

А

В

С

Порядковый
номер месяца

Объем
товарооборота, ден. ед.

9

7

30850

10

8

31325

11

9

31359

12

10

31610

13

11

32366

14

12

33313

15

13

33508

16

14

33374

17

15

34811

18

16

36046

19

17

35356

ПРЕДСКАЗ

20

18

35794

21

19

36231

Задание
9. Анализ нелинейных процессов с помощью
функции ЛГРФПРИБЛ

Рассчитать
параметры модели тренда и дать ей
качественную оценку с помощью функции
ЛГРФПРИБЛ для базовых данных о динамике
товарооборота предприя­тия, приведенных
в таблице 3.6.

Выполнение:

Функция
ЛГРФПРИБЛ определяет параметры
экспоненциальной кривой, наилучшим
об­разом аппроксимирующей исходные
данные. Эта функция относится к категории
«Статистические»
и может быть вызвана с помощью окна
диалога Мастера
фун­кций
.

Функция
ЛГРФПРИБЛ имеет те же четыре аргумента,
что и функция ЛИНЕЙН и формирует
аналогичный массив результатов (рисунок
3.14). Поэтому она вводится как формула
для работы с массивами, т.е. требует:
во-первых, выделения диапазона ячеек,
в которых будет формироваться массив
результатов; во-вторых, после работы с
окном диалога ЛГРФПРИБЛ — нажатия
клавиш Ctrl
+ Shift
+ Enter.

Однако
следует учиты­вать, что дополнительная
статистика, которую отражает функция
ЛГРФПРИБЛ, основана на линейной модели
вида

In
у = х

ln
т +
ln
b.

Поэтому
при оценке значений стандартных ошибок
пара­метров модели (СОт
и COb)
их необходимо сравнивать не с са­мими
значениями параметров, а с их натуральными
лога­рифмами — ln
m
и ln
b.
Последние можно рассчитать с по­мощью
функции LN
(категория «Математические»),
вызы­вая ее в окне диалога Мастера
функций
.

С
этой целью на рабочем листе Excel
выделим диапазон ячеек D11:E15
для формирования выходного массива
(таблица 3.16). Работая с окном диалога
ЛГРФПРИБЛ, формируем следующую формулу
массива: =ЛГРФПРИБЛ(В3:В18;А3:А18;ИСТИНА;
ИСТИНА). Затем нажимаем клавиши Ctrl
+ Shift
+ Enter.

Рисунок 3.14 — Окно
диалога функции ЛГРФПРИБЛ

Таблица
3.16 — Расчет и оценка модели тренда с
помощью функции ЛГРФПРИБЛ

A

B

C

D

E

1

2

Порядковый номер
месяца

Объем
товарооборота, ден. ед.

3

1

28415

4

2

28231

5

3

29783

6

4

30969

7

5

30494

8

6

29757

9

7

30850

10

8

31325

11

9

31359

Экспоненциальная

оценка

1,014

28080,897

12

10

31610

Статистика

0,001

0,010

13

11

32366

0,922

0,020

14

12

33313

165,579

14

15

13

33508

0,065

0,005

16

14

33374

17

15

34811

28

16

36046

Вывод:
Приведенный в таблице 3.16 массив
результатов работы фун­кции позволяет
построить следующую модель тренда, в
осно­ве которой лежит уравнение
экспоненциальной кривой роста:

у
= 28080,897 · 1,01
х,

где
х = t
— порядковый номер месяца.

Оценка
статистических характеристик приведенной
мо­дели показывает, что качество ее
подгонки к фактическим значениям у
выше, чем модели, построенной с помощью
функции ЛИНЕЙН. Коэффициент r2
в данном случае имеет значение 0,922
(ячейка D13),
что несколько больше соответ­ствующего
показателя в случае линейной модели,
равного 0,9179. В этой связи (и учитывая
однофакторный характер модели) можно
ожидать улучшение оценок F
и t-статистики.
Следо­вательно, качество построенной
модели позволяет использо­вать ее
при составлении прогнозов развития
товарооборота на ближайшую перспективу.

Задание
10. Составление нелинейных прогнозов с
помощью функции РОСТ

Учитывая
оценку статистических характеристик
фун­кции ЛГРФПРИБЛ, рассчитать прогноз
товарооборота по торговому предприятию
с помощью функции РОСТ. При этом необходимо
получить теорети­ческие значения
товарооборота (оцененные на основе
най­денной модели у
= 28080,897·1,01
х)
для базового диапазо­на времени (т.е.
16 прошедших месяцев), а также спрогно­зировать
динамику товарооборота на ближайшие 3
месяца.

Выполнение:

Функция
РОСТ определяет точки, лежащие на
экспоненциальной кривой роста. Она
работает точно так же, как ее линейный
аналог ТЕНДЕНЦИЯ, и имеет те же четыре
аргумента (рисунок 3.15).

Подобно
функции ТЕНДЕНЦИЯ, РОСТ вводится как
формула массива и требует выделения
достаточного числа ячеек для формирования
выходного диапазона результатов.

Для
формирования выходного массива
результатов выде­лим на рабочем листе
Excel,
соответственно, ячейки С3:С21 (таблица
3.17). Затем вызовем функцию РОСТ из окна
диалога Мастера
функций
. При
работе с диалоговым окном РОСТ формула
массива принимает вид:
=РОСТ(В3:В18;А3:А18;А3:А21). Последнее действие
— нажать клавиши Ctrl
+ Shift
+ + Enter.

Рисунок 3.15 — Окно
диалога функции РОСТ

Таблица
3.17 — Расчет прогноза товарооборота с
помощью функции РОСТ

А

В

С

1

2

Порядковый
номер месяца

Объем
товарооборота, ден. ед.

РОСТ

3

1

28415

28470,4

4

2

28231

28865,2

5

3

29783

29265,6

6

4

30969

29671,5

7

5

30494

30083,0

8

6

29757

30500,3

9

7

30850

30923,3

10

8

31325

31352,2

11

9

31359

31787,0

12

10

31610

32227,9

13

11

32366

32674,9

14

12

33313

33128,1

15

13

33508

33587,5

16

14

33374

34053,4

17

15

34811

34525,7

18

16

36046

35004,5

19

17

35490,0

20

18

35982,3

21

19

36481,3

Задание
11. Прогнозирование с использованием
парной регрессии

Проанализировать
тесноту связи между товарооборотом
торго­вого предприятия и оборачиваемостью
товаров и найти уравнение парной
регрессии, которое наилучшим образом
опишет изучаемую зависимость. Исходные
данные представлены в таблице 3.18.

Таблица
3.18 — Исходные данные для поиска уравнения
связи переменных

А

В

С

1

2

Поряд­ковый
номер месяца

Объем
товаро­оборота, ден. ед.

Обора­чивае­мость
товаров, дни

3

1

28415

43,5

4

2

28231

43,0

5

3

29783

43,0

6

4

30969

43,5

7

5

30494

43,0

8

6

29757

42,5

9

7

30850

43,0

10

8

31325

41,5

11

9

31359

42,0

12

10

31610

41,5

13

11

32366

40,5

Продолжение таблицы
3.18

А

В

С

Поряд­ковый
номер месяца

Объем
товаро­оборота, ден. ед.

Обора­чивае­мость
товаров, дни

14

12

33313

40,0

15

13

33508

40,0

16

14

33374

39,0

17

15

34811

39,5

18

16

36046

39,0

19

Выполнение:

Чтобы
найти уравнение парной регрессии,
которое наилучшим образом опишет
изучаемую зависимость, обратимся к
графическому методу. С помощью Мастера
диаг­рамм
построим
точечную диаграмму зависимости
товарооборота от оборачиваемости
товаров (см. рисунок 3.16).

Рисунок
3.16 — График зависимости товарооборота
от

товарооборачиваемости
товаров

После
того как диаграмма построена, необходимо
обратиться к команде Excel
«Добавить
линию тренда
»
из контекстного ме­ню панели Диаграмма.
Учитывая возможности Excel,
оце­ним качество аппроксимации базовых
данных каждым из пяти предлагаемых
окном диалога Линии
тренда
типом
ли­ний: для линейного уравнения
R2
= 0,8197; для уравнения логарифмической
кривой R2
= 0,8216; для уравнений полинома 4-й степени
R2
= 0,8287; для
уравнения степенной кривой R2
= 0,8155; для уравнения экспоненциальной
кривой R2
= 0,8142.

Полученные
результаты свидетельствуют, что наиболее
адекватно (судя по величине R2)
отражают зависимость това­рооборота
от изменения товарооборачиваемости
кривые, пос­троенные на основе уравнений
полиномов 4-й степе­ни. На рисунке 3.17
приведена кривая роста, которую описывает
уравнение полинома 4-й степени. Рассчитанный
Excel
коэффициент R2
(0,8287) указывает на достаточно высокое
качес­тво приближения базовых данных.

Рисунок
3.17 — Аппроксимация базовых данных
полиномиальной кривой роста

Проведем
оценку статистической значимости
параметров уравнения полинома 4-й
степени, построенного на основе
соответствующего массива базовых данных
(таблица 3.19, ячей­ки A2:F18)
с помощью функции ЛИНЕЙН. Для формирования
выходного массива значе­ний параметров
уравнения и статистических характерис­тик
обозначим диапазон ячеек В20:F24.

Таблица
3.19 — Оценка статистической значимости
модели регрессии с помощью функции
ЛИНЕЙН (уравнение полинома 4-й степени)

А

В

С

D

E

F

1

2

Порядковый номер
месяца

Объем товарооборота,
ден. ед.

Оборачиваемость
товаров, дни (х)

х^2

х^3

х^4

3

1

28415

43,5

1892,3

82312,9

3580610,1

4

2

28231

43

1849,0

79507,0

3418801,0

5

3

29783

43

1849,0

79507,0

3418801,0

6

4

30969

43,5

1892,3

82312,9

3580610,1

7

5

30494

43

1849,0

79507,0

3418801,0

8

6

29757

42,5

1806,3

76765,6

3262539,1

9

7

30850

43

1849,0

79507,0

3418801,0

10

8

31325

41,5

1722,3

71473,4

2966145,1

11

9

31359

42

1764,0

74088,0

3111696,0

12

10

31610

41,5

1722,3

71473,4

2966145,1

13

11

32366

40,5

1640,3

66430,1

2690420,1

14

12

33313

40

1600,0

64000,0

2560000,0

15

13

33508

40

1600,0

64000,0

2560000,0

16

14

33374

39

1521,0

59319,0

2313441,0

17

15

34811

39,5

1560,3

61629,9

2434380,1

18

16

36046

39

1521,0

59319,0

2313441,0

19

17 (прогноз)

36667

37,5

20

2,269166117

-330,0698403

17765,93

-419248

3693351,7

21

Статистика

100,6502388

16606,9862

1027052

28216610

290563825

22

0,828678371

1050,630858

#Н/Д

#Н/Д

#Н/Д

23

13,30168019

11

#Н/Д

#Н/Д

#Н/Д

24

58730919,23

12142077,21

#Н/Д

#Н/Д

#Н/Д

При
определении в диалоговом окне ЛИНЕЙН
аргумен­тов функции формируется
следующая формула массива:
=ЛИНЕЙН(В3:В18;С3:F18;ИСТИНА;ИСТИНА).

В
первой строке массива результатов,
отображенного функцией ЛИНЕЙН после
нажатия клавиш Ctrl
+ Shift
+ + Enter
(ячейки В20:F24
таблицы 3.19), находим уточненные в ходе
математических расчетов значения
параметров уравне­ния.

Вывод:
Модель связи товарооборота (у)
и оборачиваемости това­ров (х),
построенная на основе уравнения полинома
4-й сте­пени, имеет вид:

у
= 3693352 — 419248х + 17765,93х
2
— 330,07х
3
+ 2,269х
4.

Заметьте,
что рассчитанный в массиве Статистика
ко­эффициент R2,
равный 0,8287 (ячейка В22), соответствует
значению R2,
приведенному на рисунке 3.17.

В
нашем примере (см. таблицу 3.19) значения
всех рассчитан­ных параметров уравнения
(ячейки В20:F20)
меньше по мо­дулю значений их стандартных
ошибок (ячейки В21:F21).
Следовательно, надежность оценок
параметров регрессии не может быть
признана удовлетворительной и составленную
модель не следует применять для
прогнозирования исследуе­мого
показателя.

Используя
линии тренда Excel,
найдем уравнение другой кривой, для
которой значение R2
будет наибольшим. Таким об­разом,
наилучшее качество аппроксимации
исходных дан­ных достигается в случае
уравнения логарифмической кри­вой
(рисунок 3.18).

Рисунок
3.18 — Аппроксимация базовых данных
логарифмической кривой роста

Статистическую
надежность сделанной оценки можно
проверить с помощью F-критерия,
расчетное значение которого в случае
парной регрессии определяют на основе
следующей формулы

.

Итак,
для уравнения парной регрессии с
коэффициентом R2,
равным 0,8216, F
=
64,5.

По
таблице F-распределения
(см. приложение А) находим, что при 5%-м
уровне значимости для распределения
Фишера с (1;14) степенями свободы Fкрит
= 4,60. Поскольку 64,5 > 4,60, можно сделать
вывод об адекватности и достаточной
точности модели. Следовательно, при
условии сохранения существовавшей
ранее взаимосвязи переменных на период
упреждения модель вида у
= -49619
ln(х)
+ 216503
мо­жет
быть использована для прогнозирования.

Чтобы
составить прогноз объема товарооборота
на 17-й месяц, осталось определить значение
переменной х
(т.е. оборачиваемости товаров) для данного
месяца. Это зна­чение может быть
получено (в зависимости от характера
по­казателя) на основе экстраполяционных
методов, методов экспертных оценок или
непосредственно задано составите­лем
прогноза. Так, будем полагать, что
рассматриваемое тор­говое предприятие
на 17-й месяц планирует проведение
оп­ределенных рекламных мероприятий
и выставки-продажи, что по оценкам
специалистов позволит ускорить
оборачивае­мость товаров в среднем
на 1,5 дня. В этом случае товарооборачиваемость
по предприятию в прогнозируемом месяце
сос­тавит 37,5 дня.

Прогноз
объема товарооборота можно получить,
создав соответствующую модели формулу
в любой (предваритель­но выделенной)
ячейке рабочего листа. Выделим, к
приме­ру, ячейку В19 (см. таблицу 3.19) и
внесем в нее следующую формулу:
=-49619*ln(37,5)+216503.
После нажатия клавиши Enter
в ячейке В19 отразится прогноз объема
товарооборота на 17-й месяц, равный 36 667
ден. ед.

Задание
12. Расчет и оценка уравнения множественной
регрессии средствами
Excel

Построить
модель множествен­ной линейной
регрессии, которая позволит оценить
объем товарооборота на ближайшую
перспективу при заданных па­раметрах
независимых переменных: «обо­рачиваемость
товаров» и «удельный вес товаров с
высо­кими торговыми надбавками».
Исходные данные представлены в таблице
3.20.

Таблица
3.20 — Исходные данные

А

В

С

D

1

2

Поряд­ковый
номер месяца

Объем товаро­оборота,
ден. ед.

Обора­чивае­мость
товаров, дни

Удельный вес
товаров с высокими торговыми надбавками,
%

3

1

28415

43,5

22,5

4

2

28231

43,0

18,0

5

3

29783

43,0

24,9

6

4

30969

43,5

24,4

7

5

30494

43,0

20,6

8

6

29757

42,5

19,0

9

7

30850

43,0

22,2

10

8

31325

41,5

21,6

11

9

31359

42,0

19,8

12

10

31610

41,5

19,7

13

11

32366

40,5

23,1

14

12

33313

40,0

23,9

15

13

33508

40,0

21,2

16

14

33374

39,0

20,4

17

15

34811

39,5

24,2

18

16

36046

39,0

26,5

Выполнение:

При
построении модели множественной
регрессии целесооб­разнее обратиться
к инструменту Excel
Регрессия,
который предлагает исчерпывающую
статистическую информацию о ее параметрах
и качестве. Порядок работы с инструментом
Регрессия
определяется соответствующим окном
диалога. Его можно вызвать через команду
Анализ данных
из контекстного меню панели Сер­вис.
Диалоговое окно Регрессия
предлагает пользователю определиться
с набором следующих параметров (рисунок
3.19):

1)
Входной
интервал У

— предлагает ввод ссылки на ячейки
рабочего листа, которые содержат диапазон
базовых данных зависимой переменной у
(исследуемого показателя). В нашем
примере Входной
интервал
Y
– В2:В18;

2)
Входной
интервал
X
— предполагает ввод ссылки на ячейки
рабочего листа, которые содержат диапазон
базовых данных независимых переменных
х1,
х
2,
…,
xk.
В нашем примере Входной
интервал Х

– С2:D18;

3)
Метки
— требует установления флажка, если
первая строка входного интервала
содержит заголовки (названия столбцов).
Если заголовки отсутствуют, то флажок
устанав­ливать не нужно — Excel
автоматически создаст соответству­ющие
названия для данных выходного диапазона.
В нашем примере – устанавливаем флажок;

4)
Уровень
надежности

— позволяет пользователю опре­делить
необходимый уровень надежности оценки
выходного диапазона значений. По
умолчанию Excel
применяет уро­вень 95 %. Если его нужно
изменить, то для данного параметра
следует установить флажок и в специально
открывше­еся поле ввести нужный
уровень надежности. В нашем — примере
флажок не устанавливаем;

5)
Константа-ноль
— требует установления флажка, ес­ли
для уравнения регрессии не нужно
рассчитывать пара­метр b
(свободный член). В этом случае Excel
принимает b,
равным нулю. В нашем примере – флажок
не устанавливаем;

6)
Выходной
диапазон

предполагает ввод ссылки на верхнюю
левую ячейку выходного диапазона.
Выходной массив значений будет зани­мать
не менее семи столбцов и содержать три
основных раз­дела: 1. Регрессионная
статистика; 2. Дисперсионный ана­лиз;
3. Параметры (коэффициенты) регрессии и
характерис­тики их статистической
значимости;

7)
Новый лист
— применяют, если результаты анализа
следует разместить на новом листе книги,
начиная с ячейки А1;

8)
Новая книга
— используется, если результаты анализа
необходимо разместить на первом листе
специально откры­той для этого новой
книги;

9)
Остатки
— требует установления флажка, если в
це­лях проведения углубленного
статистического анализа ка­чества
модели в выходной диапазон, кроме трех
основных разделов, необходимо включить
значения отклонений фак­тических
данных исследуемого показателя от
соответствую­щих им точек регрессионной
прямой (У
фактическое — У
рас­четное);

10)
Стандартизированные
остатки

применяют с той же целью для включения
в выходной диапазон значений стандартных
остатков;

11)
График
остатков

используется, если для статис­тического
анализа необходимо построить диаграммы
остат­ков для каждой независимой
переменной х;

12)
График подбора
— предполагает формирование на ра­бочем
листе диаграмм, позволяющих отследить
характер связи и степень разброса
наблюдаемых и предсказанных значений
исследуемого показателя у
с каждой независимой пе­ременной х;

13)
График
нормальной вероятности

— требует установ­ления флажка, если
пользователю необходимо получить
гра­фик нормального распределения
вероятности для исследуе­мого
показателя.

Рисунок
3.19 — Окно диалога Регрессия

Так,
в первом разделе выходного массива
«Регрессионная
статистика
»
(см. ячейки А4:В8 таблицы 3.21) приведены
основные статистические характерис­тики
общего качества уравнения: коэффициент
множествен­ной корреляции R,
коэффициент детерминации R2,
стандартная ошибка оценки. Значе­ние
R2,
равное 0,892, свидетельствует о том, что
на основе полученного уравнения регрессии
можно объяснить 89,2 % вариации объема
товарооборота.

Статистические
характеристики второго раздела выход­ного
массива «Дисперсионный
анализ
»
(ячейки A10:F14)
по­зволяют оценить меру разброса
(дисперсию) зависимой пере­менной у
и остаточной вариации (дисперсии)
отклонений во­круг линии регрессии.
Так, значение SSр
(ячейка С12) ха­рактеризует часть
дисперсии, объясненную регрессией, а
SSо
(ячейка С13) — часть дисперсии, не
объясненной регрес­сией из-за наличия
ошибок ε. При проведении регрессионно­го
анализа особый интерес представляет
изменение этих зна­чений по мере
введения каждого регрессора. Качество
моде­ли улучшится, если после введения
в нее нового фактора зна­чение
объясненной части дисперсии возрастет,
а не объяс­ненной — снизится.

В
ячейках D12:D13
отражены соответственно дисперсия
исходного ряда (МSp
=
SSp
/
df,
где df
=
k
— см. ячейку В12) и несмещенная дисперсия
остаточной компоненты (MS0
=
SS0
/
df,
где df
= п —
k
— 1
— см.
ячейку В13).

В
ячейке F12
второго раздела выходного массива
приведен уровень значимости для
оцененного F.
Значения
F-статистики
(53,72) выглядит вполне допус­тимым,
поскольку уровень значимости для нее
(5,2107)
ос­тается гораздо ниже 5%-го предела,
принятого для табличных F-статистик.
Следова­тельно, есть основания ожидать,
что F-наблюдаемое
будет больше Fкрит.

Оценив
на основе первого и второго разделов
выходного массива общее качество модели
связи и убедившись в ее зна­чимости,
можем перейти к третьему разделу (см.
ячейки A16:G19
таблицы 3.21), который содержит детальную
информа­цию о параметрах уравнения
регрессии. Приведенные в ячей­ках
В17:В19 значения параметров (коэффициентов)
уравне­ния позволяют придать формальный
вид модели, построен­ной с помощью
регрессионного анализа:

у
= 71650,26 – 1098,94х
1
+
255,838х
2,

где
х1
— оборачиваемость товаров, дни; х2
— удельный вес товаров с высокими
торговыми надбавками, %.

Оценить
значимость каждого параметра позволяют
зна­чения t-статистики
(см. ячейки D17:D19).
Можно использо­вать приведенный в
выходном массиве уровень значимости
(см. ячейки Е17:Е19): если он не превышает
0,05 (т.е. 5%-го уровня), то рассчитанные
характеристики t-статистики
будут больше табличного значения.
Следовательно, статис­тическая
значимость рассчитанных параметров
уравнения весьма высока.

И,
наконец, наряду с точечными значениями
коэффици­ентов регрессии третий
раздел выходного массива позволяет
получить их интервальные оценки с
доверительной вероят­ностью 95 % (см.
ячейки F17:G19
таблицы 3.21):

58598,85
<
b
<
84701,68; -1370,81
<
m1
<
-827,08; 68,597
<
m2
<
443,079.

На
основании изложенного можно с 95%-й
увереннос­тью утверждать, что параметры
уравнения содержат информацию, значимую
для расчета исследуемого показателя.

Таблица
3.21 — Регрессионный анализ

А

В

С

D

E

F

G

1

ВЫВОД
ИТОГОВ

2

3

Регрессионная

статистика

4

Множественный
R

0,94449

5

R-квадрат

0,892061

6

Нормированный
R-квадрат

0,875455

7

Стандартная
ошибка

767,1098

8

Наблюдения

16

9

10

Дисперсионный
анали
з

11

df

SS

MS

F

Значимость
F

12

Регрессия

2

63223048,8

31611524,42

53,7193

5,2E-07

13

Остаток

13

7649947,59

588457,5077

14

Итого

15

70872996,4

15

16

Коэффициенты

Стандартная
ошибка

t-статистика

P-Значение

Нижние
95%

Верхние
95%

17

Y-пересечение

71650,26

6041,29087

11,86009163

2,41E-08

58598,85

84701,68

18

Оборачиваемость
товаров, дни

-1098,94

125,841366

-8,732770177

8,46E-07

-1370,81

-827,08

19

Удельный
вес товаров с высокими торговыми
надбавками, %

255,8378

86,6708225

2,951832613

0,011232

68,59687

443,0787


КУРС

EXCEL ACADEMY

Научитесь использовать все прикладные инструменты из функционала MS Excel.

Любому бизнесу интересно заглянуть в будущее и правильно ответить на вопрос: «А сколько денег мы заработаем за следующий период?» Ответить на такого рода вопросы позволяют различные методики прогнозирования. В данной статье мы с вами рассмотрим несколько таких методик и произведем все необходимые расчеты в Excel. Еще больше про анализ данных в Excel мы рассказываем на нашем открытом курсе «Аналитика в Excel».

Постановка задачи

Исходные данные

Для начала, давайте определимся, какие у нас есть исходные данные и что нам нужно получить на выходе. Фактически, все что у нас есть, это некоторые исторические данные. Если мы говорим о прогнозировании продаж, то историческими данными будут продажи за предыдущие периоды.

Примечание. Собранные в разные моменты времени значения одной и той же величины образуют временной ряд. Каждое значение такого временного ряда называется измерением. Например: данные о продажах за последние 5 лет по месяцам — временной ряд; продажи за январь прошлого года — измерение.

Составляющие прогноза

Следующий шаг: давайте определимся, что нам нужно учесть при построении прогноза. Когда мы исследуем наши данные, нам необходимо учесть следующие факторы:

  • Изменение нашей пронозируемой величины (например, продаж) подчиняется некоторому закону. Другими словами, в временном ряде можно проследить некую тенденцию. В математике такая тенденция называется трендом.
  • Изменение значений в временном ряде может зависить от промежутка времени. Другими словами, при построении модели необходимо будет учесть коэффициент сезонности. Например, продажи арбузов в январе и августе не могут быть одинаковыми, т.к. это сезонный продукт и летом продажи значительно выше.
  • Изменение значений в временном ряде периодически повторяется, т.е. наблюдается некоторая цикличность.

Эти три пункта в совокупность образуют регулярную составляющую временного ряда.

Примечание. Не обязательно все три элемента регулярной составляющей должны присутствовать в временном ряде.

Однако, помимо регулярной составляющей, в временном ряде присутствует еще некоторое случайное отклонение. Интуитивно это понятно – продажи могут зависеть от многих факторов, некоторые из которых могут быть случайными.

Вывод. Чтобы комплексно описать временной ряд, необходимо учесть 2 главных компонента: регулярную составляющую (тренд + сезонность + цикличность) и случайную составляющую.

Виды моделей

Следующий вопрос, на который нужно ответить при построении прогноза: “А какие модели временного ряда бывают?”

Обычно выделяют два основных вида:

  • Аддитивная модель: Уровень временного ряда = Тренд + Сезонность + Случайные отклонения
  • Мультипликативная модель: Уровень временного ряда = Тренд X Сезонность X Случайные отклонения

Иногда также выделают смешанную модель в отдельную группу:

  • Смешанная модель: Уровень временного ряда = Тренд X Сезонность + Случайные отклонения

С моделями мы определились, но теперь возникает еще один вопрос: «А когда какую модель лучше использовать?»

Классический вариант такой:
— Аддитивная модель используется, если амплитуда колебаний более-менее постоянная;
— Мультипликативная – если амплитуда колебаний зависит от значения сезонной компоненты.

Пример:

график пример адаптивной и мультипликативной модели

Решение задачи с помощью Excel

Итак, необходимые теоретические знания мы с вами получили, пришло время применить их на практике. Мы будем с вами использовать классическую аддитивную модель для построения прогноза. Однако, мы построим с вами два прогноза:

  1. с использованием линейного тренда
  2. с использованием полиномиального тренда

Во всех руководствах, как правило, разбирается только линейный тренд, поэтому полиномиальная модель будет крайне полезна для вас и вашей работы!


КУРС

EXCEL ACADEMY

Научитесь использовать все прикладные инструменты из функционала MS Excel.

Модель с линейным трендом

Пусть у нас есть исходная информация по продажам за 2 года:

таблица с информацией о продажах для прогнозирования

Учитывая, что мы используем линейный тренд, то нам необходимо найти коэффициенты уравнения

y = ax + b

где:

  • y – значения продаж
  • x – номер периода
  • a – коэффициент наклона прямой тренда
  • b – свободный член тренда

Рассчитать коэффициенты данного уравнения можно с помощью формулы массива и функции ЛИНЕЙН. Нам необходимо будет сделать следующую последовательность действий:

  1. Выделяем две ячейки рядом
  2. Ставим курсор в поле формул и вводим формулу =ЛИНЕЙН(C4:C27;B4:B27)
  3. Нажимаем Ctrl+Shift+Enter, чтобы активировать формулу массива

На выходе мы получили 2 числа: первое — коэффициент a, второе – свободный член b.

таблица с информацией о продажах для прогнозирования 2

Теперь нам нужно рассчитать для каждого периода значение линейного тренда. Сделать это крайне просто — достаточно в полученное уравнение подставить известные номера периодов. Например, в нашем случае, мы прописываем формулу =B4*$F$4+$G$4 в ячейке I4 и протягиваем ее вниз по всем периодам.

расчет значения линейного тренда

Нам осталось рассчитать коэффициент сезонности для каждого периода. Учитывая, что у нас есть исторические данные за два года, разумно будет учесть это при расчете. Можем сделать следующим образом: в ячейке J4 прописываем формулу =(C4+C16)/СРЗНАЧ($C$4:$C$27)/2 и протягиваем вниз на 12 месяцев (т.е. до J15).

расчет коэффициента сезонности

Что нам это дало? Мы посчитали, сколько суммарно продавалось каждый январь/каждый февраль и так далее, а потом разделили это на среднее значение продаж за все два периода.

То есть мы выяснили, как продажи двух январей отклонялись от средних продаж за два года, как продажи двух февралей отклонялись и так далее. Это и дает нам коэффициент сезонности. В конце формулы делим на 2, т.к. в расчете фигурировало 2 периода.

Примечание. Рассчитали только 12 коэффициентов, т.к. один коэффициент учитывает продажи сразу за 2 аналогичных периода.

Итак, теперь мы на финишной прямой. Нам осталось рассчитать тренд для будущих периодов и учесть коэффициент сезонности для них. Давайте амбициозно построим прогноз на год вперед.

Сначала создаем столбец, в котором прописываем номера будущих периодов. В нашем случае нумерация начинается с 25 периода.

Далее, для расчета значения тренда просто прописываем уже известную нам формулу =L4*$F$4+$G$4 и протягиваем вниз на все 12 прогнозируемых периодов.

И последний штрих — умножаем полученное значение на коэффициент сезонности. Вуаля, это и есть итоговый ответ в данной модели!

финальная таблица с прогнозом

Модель с полиномиальным трендом

Конструкция, которую мы только что с вами построили, достаточно проста. Но у нее есть один большой минус — далеко не всегда она дает достоверные результаты.

Посмотрите сами, какая модель более точно аппроксимирует наши точки — линейный тренд (прямая зеленая линия) или полиномиальный тренд (красная кривая)? Ответ очевиден. Поэтому сейчас мы с вами и разберем, как построить полиномиальную модель в Excel.

Модель прогнозирования с полиномиальным трендом

Пусть все исходные данные у нас будут такими же. Для простоты модели будем учитывать только тренд, без сезонной составляющей.

Для начала давайте определимся, чем полиномиальный тренд отличается от обычного линейного. Правильно — формой уравнения. У линейного тренда мы разбирали обычный график прямой:

У полиномиального тренда же уравнение выглядит иначе:

формула полиномиального тренда

где конечная степень определяется степенью полинома.

Т.е. для полинома 4 степени необходимо найти коэффициенты уравнения:

Согласитесь, выглядит немного страшно. Однако, ничего страшного нет, и мы с легкостью можем решить эту задачку с помощью уже известных нам методов.

  1. Ставим в ячейку F4 курсор и вводим формулу =ИНДЕКС(ЛИНЕЙН($C$4:$C$27;$B$4:$B$27^{1;2;3;4});1;1). Функция ЛИНЕЙН позволяет произвести расчет коэффициентов, а с помощью функции ИНДЕКС мы вытаскиваем нужный нам коэффициент. В данном случае за выбор коэффициента отвечает самый последний аргумент. У нас стоит 1 — это коэффициент при самой высокой степени (т.е. при 4 степени, коэффициент). Кстати, узнать о самых полезных математических формулах Excel можно в нашем бесплатном гайде «Математические функции Excel».
  2. Аналогично прописываем формулу =ИНДЕКС(ЛИНЕЙН($C$4:$C$27;$B$4:$B$27^{1;2;3;4});1;2) в ячейке ниже.
  3. Делаем такие же действия, пока не найдем все коэффициенты.

Кстати говоря, мы можем легко сами себя проверить. Давайте построим график наших продаж и добавим к нему полиномиальный тренд.

  1. Выделяем столбец с продажами
  2. Выбираем «Вставка» → «График» → «Точечный» → «Точечная диаграмма»
  3. Нажимаем на любую точку графика правой кнопкой мыши и выбираем «Добавить линию тренда»
  4. В открывшемся справа меню выбираем «Полиномиальная модель», меняем степень на 4 и ставим галочку на «Показывать уравнение на диаграмме»

Теперь вы наглядно можете видеть, как рассчитанный тренд аппроксимирует исходные данные и как выглядит само уравнение. Можно сравнить уравнение на графике с вашими коэффициентами. Сходится? Значит сделали все верно!

Помимо всего прочего, вы можете сразу оценить точность аппроксимации (не полностью, но хотя бы первично). Это делается с помощью коэффициента R^2. Тут у вас снова есть два пути:

  1. Вы можете вывести коэффициент на график, поставив галочку «Поместить на диаграмму величину достоверности аппроксимации»
  2. Вы можете рассчитать коэффициент R^2 самостоятельно по формуле =ИНДЕКС(ЛИНЕЙН($C$4:$C$27;$B$4:$B$27^{1;2;3;4};;1);3;1)

Заключение

Мы с вами подробно разобрали вопрос прогнозирования — изучили необходимые термины и виды моделей, построили аддитивную модель в Excel с использованием линейного и полиномиального тренда, а также научились отображать результаты своих вычислений на графиках. Все это позволит вам эффективно внедрять полученные знания на работе, усложнять существующие модели и уточнять прогнозы. Чем большим количеством методов и инструментов вы будете владеть, тем выше будет ваш профессиональный уровень и статус на рынке труда.

Если вас интересуют еще какие-то модели прогнозирования — напишите нам об этом, и мы постараемся осветить эти темы в дальнейших своих статьях! Или запишитесь на курс «Excel Academy» от SF Education, где мы рассказываем про возможности Excel, необходимые для анализа.

Автор: Алексанян Андрон, эксперт SF Education


КУРС

EXCEL ACADEMY

Научитесь использовать все прикладные инструменты из функционала MS Excel.

Блог SF Education

Data Science

5 примеров экономии времени в Excel

Что для работодателя главное в сотруднике? Добросовестность, ответственность, профессионализм и, конечно же, умение пользоваться отведенным временем! Предлагаем познакомиться с очень нужными, на наш взгляд,…

Excel для Microsoft 365 Excel 2021 Excel 2019 Excel 2016 Еще…Меньше

Если у вас есть статистические данные с зависимостью от времени, вы можете создать прогноз на их основе. При этом в Excel создается новый лист с таблицей, содержащей статистические и предсказанные значения, и диаграммой, на которой они отражены. С помощью прогноза вы можете предсказывать такие показатели, как будущий объем продаж, потребность в складских запасах или потребительские тенденции.

Сведения о том, как вычисляется прогноз и какие параметры можно изменить, приведены ниже в этой статье.

Часть электронной таблицы, содержащая таблицу прогнозируемых чисел и диаграмму прогноза

Создание прогноза

  1. На листе введите два ряда данных, которые соответствуют друг другу:

    • ряд значений даты или времени для временной шкалы;

    • ряд соответствующих значений показателя.

      Эти значения будут предсказаны для дат в будущем.

    Примечание: Для временной шкалы требуются одинаковые интервалы между точками данных. Например, это могут быть месячные интервалы со значениями на первое число каждого месяца, годичные или числовые интервалы. Если на временной шкале не хватает до 30 % точек данных или есть несколько чисел с одной и той же меткой времени, это нормально. Прогноз все равно будет точным. Но для повышения точности прогноза желательно перед его созданием обобщить данные.

  2. Выделите оба ряда данных.

    Совет: Если выделить ячейку в одном из рядов, Excel автоматически выделит остальные данные.

  3. На вкладке Данные в группе Прогноз нажмите кнопку Лист прогноза.

    Кнопка "Лист прогнозов" на вкладке "Данные"

  4. В окне Создание прогноза выберите график или гограмму для визуального представления прогноза.

    Снимок диалогового окна "Создание листа прогноза" со свернутыми параметрами

  5. В поле Завершение прогноза выберите дату окончания, а затем нажмите кнопку Создать.

    В Excel будет создан новый лист с таблицей, содержащей статистические и предсказанные значения, и диаграммой, на которой они отражены.

    Этот лист будет находиться слева от листа, на котором вы ввели ряды данных (то есть перед ним).

Настройка прогноза

Если вы хотите изменить дополнительные параметры прогноза, нажмите кнопку Параметры.

Сведения о каждом из вариантов можно найти в таблице ниже.

Параметры прогноза

Описание

Начало прогноза

Выберите дату, с которой должен начинаться прогноз. При выборе даты начала, которая наступает раньше, чем заканчиваются статистические данные, для построения прогноза используются только данные, предшествующие ей (это называется «ретроспективным прогнозированием»).

Советы: 

  • Если вы начинаете прогноз перед последней точкой, вы сможете получить оценку точности прогноза, так как сможете сравнить прогнозируемый ряд с фактическими данными. Но если начать прогнозирование со слишком ранней даты, построенный прогноз может отличаться от созданного на основе всех статистических данных. При использовании всех статистических данных прогноз будет более точным.

  • Если в ваших данных прослеживаются сезонные тенденции, то рекомендуется начинать прогнозирование с даты, предшествующей последней точке статистических данных.

Доверительный интервал

Установите или снимите флажок Доверительный интервал, чтобы показать или скрыть его. Доверительный интервал — это диапазон вокруг каждого предсказанного значения, в который в соответствии с прогнозом (при нормальном распределении) предположительно должны попасть 95 % точек, относящихся к будущему. Доверительный интервал помогает определить точность прогноза. Чем он меньше, тем выше достоверность прогноза для данной точки. Доверительный интервал по умолчанию определяется для 95 % точек, но это значение можно изменить с помощью стрелок вверх или вниз.

Сезонность

Сезонность — это число для длины (количества точек) сезонного шаблона и автоматически обнаруживается. Например, в ежегодном цикле продаж, каждый из которых представляет месяц, сезонность составляет 12. Автоматическое обнаружение можно переопрепредидить, выбрав установить вручную и выбрав число.

Примечание: Если вы хотите задать сезонность вручную, не используйте значения, которые меньше двух циклов статистических данных. При таких значениях этого параметра приложению Excel не удастся определить сезонные компоненты. Если же сезонные колебания недостаточно велики и алгоритму не удается их выявить, прогноз примет вид линейного тренда.

Диапазон временной шкалы

Здесь можно изменить диапазон, используемый для временной шкалы. Этот диапазон должен соответствовать параметру Диапазон значений.

Диапазон значений

Здесь можно изменить диапазон, используемый для рядов значений. Этот диапазон должен совпадать со значением параметра Диапазон временной шкалы.

Заполнить отсутствующие точки с помощью

Для обработки отсутствующих точек в Excel используется интерполяция, то есть отсутствующие точки будут заполнены в качестве взвешенного среднего значения соседних точек, если отсутствует менее 30 % точек. Чтобы нули в списке не были пропущены, выберите в списке пункт Нули.

Использование агрегатных дубликатов

Если данные содержат несколько значений с одной меткой времени, Excel находит их среднее. Чтобы использовать другой метод вычисления, например Медиана илиКоличество,выберите нужный способ вычисления из списка.

Включить статистические данные прогноза

Установите этот флажок, если хотите поместить на новом листе дополнительную статистическую информацию о прогнозе. При этом добавляется таблица статистики, созданная с помощью прогноза. Ets. Функция СТАТ и показатели, такие как коэффициенты сглаживания («Альфа», «Бета», «Гамма») и метрики ошибок (MASE, SMAPE, MAE, RMSE).

Формулы, используемые при прогнозировании

При использовании формулы для создания прогноза возвращаются таблица со статистическими и предсказанными данными и диаграмма. Прогноз предсказывает будущие значения на основе имеющихся данных, зависящих от времени, и алгоритма экспоненциального сглаживания (ETS) версии AAA.

Таблицы могут содержать следующие столбцы, три из которых являются вычисляемыми:

  • столбец статистических значений времени (ваш ряд данных, содержащий значения времени);

  • столбец статистических значений (ряд данных, содержащий соответствующие значения);

  • столбец прогнозируемых значений (вычисленных с помощью функции ПРЕДСКАЗ.ЕTS);

  • два столбца, представляющие доверительный интервал (вычисленные с помощью функции ПРЕДСКАЗ.ЕTS.ДОВИНТЕРВАЛ). Эти столбцы отображаются только при проверке доверительный интервал в разделе Параметры.

Скачивание образца книги

Щелкните эту ссылку, чтобы скачать книгу с Excel FORECAST. Примеры функции ETS

Дополнительные сведения

Вы всегда можете задать вопрос специалисту Excel Tech Community или попросить помощи в сообществе Answers community.

Статьи по теме

Функции прогнозирования

Нужна дополнительная помощь?

Тема урока: Модели статистического прогнозирования. Регрессионная модель Практическая работа №11 (1 часть) «Получение регрессионных моделей».

Цель урока:

Освоить способы построения по экспериментальным данным регрессионной модели и тренда средствами MO Excel.

Используемые программные средства: табличный процессор MO Excel.

Видеоматериалы:

  1. Теоретический материал https://www.youtube.com/watch?v=DJr8a2kwWjc

  2. Рассмотрение практической работы https://www.youtube.com/watch?v=Pj-hP8lqtGk

Ход урока.

1. Организационная часть.

Подготовьтесь к уроку. Откройте тетради и учебник на странице на § 18. Откройте файл с дистанционным материалом.

Запишите тему урока. Модели статистического прогнозирования. Регрессионная модель.

2. Постановка цели урока. Актуализация знаний

Статистика — наука о сборе, измерении и анализе массовых количественных данных.

Анализ данных — область информатики, занимающаяся построением и исследованием наиболее общих математических методов и вычислительных алгоритмов извлечения знаний из экспериментальных (в широком смысле) данных.

Вопросы ученикам: 1) Как Вы думаете, какое программное обеспечение имеет средства анализа данных? (табличный процессор Excel)

2) Какие именно возможности табличного процессора можно отнести к средствам анализа данных? ЗАПОМНИТЬ

К средствам анализа относятся:

• Обработка списка с помощью различных формул и функций;

• Построение диаграмм и использование карт Ms Excel;

• Проверка данных рабочих листов и рабочих книг на наличие ошибок;

• Структуризация рабочих листов;

• Автоматическое подведение итогов (включая мастер частичных сумм);

• Консолидация данных;

• Сводные таблицы;

• Специальные средства анализа выборочных записей и данных — подбор параметра, поиск решения, сценарии и др.

3) В каких областях могут найти практическое применение средства анализа табличного процессора Excel?

Цель нашего урока: научиться строить регрессионные модели средствами Excel.

В состав Microsoft Excel входит набор средств анализа данных (так называемый пакет анализа), предназначенный для решения сложных статистических и инженерных задач. Для проведения анализа данных с помощью этих инструментов следует указать входные данные и выбрать параметры; анализ будет проведен с помощью подходящей статистической или инженерной макрофункции, а результат будет помещен в выходной диапазон. Другие средства позволяют представить результаты анализа в графическом виде.

Статистические данные приводятся в виде длинных и сложных статистических таблиц, поэтому бывает весьма трудно обнаружить в них имеющиеся неточности и ошибки.

Графическое же представление статистических данных помогает легко и быстро выявить ничем не оправданные пики и впадины, явно не соответствующие изображаемым статистическим данным, аномалии и отклонения.

  1. Теоретическая часть.

Ознакомитесь с видеоматериалом урока Видео:

https://www.youtube.com/watch?v=DJr8a2kwWjc

MO Excel – это не просто электронная таблица с данными и формулами для вычислений. Это универсальная система обработки данных, которая может использоваться для анализа и представления данных в наглядной форме.

Мы уже с вами говорили о том, что решение задач планирования и управления постоянно требует учета зависимостей одних факторов от других. Таких примеров мы приводили очень много.

Один из таких примеров: определение зависимости время падения тела на землю от первоначальной высоты. Зависимость эта очевидна. Для её проверки можно провести эксперимент, сбрасывая предметы с разных этажей многоэтажного здания, данные занесены в таблицу. Таким образом, мы легко создадим табличную модель, на основе её построим график. Кроме этого нам не составит особого труда и составление функциональной зависимости, так как падение тел происходит согласно всем нам известному физическому закону. Тем самым у нас будет и математическая модель по которой мы легко рассчитаем время падения тел даже с очень большой высоты.

Н (м)

t (сек)

6

9

12

15

18

21

24

27

30

1,1

1,4

1,6

1,7

1,9

2,1

2,2

2,3

2,5

,

С, мг/куб.м

Р, бол./тыс.

2

19

2,5

20

2,9

32

3,2

34

3,6

51

3,9

55

4,2

90

4,6

108

5

171

Но не все зависимости так просты.

Н апример, нам необходимо найти зависимость частоты заболеваемости жителей города бронхиальной астмой от качества воздуха.

Любому человеку понятно, что такая зависимость существует. Очевидно, что чем хуже воздух, тем больше больных астмой. Но это качественное заключение. Его недостаточно для того, чтобы управлять этим процессом, нам потребуются более конкретные знания. Нужно установить, какие именно примеси сильнее всего влияют на здоровье людей, как связаны концентрация этих примесей в воздухе с числом заболеваний. Такую зависимость можно установить только путем сбора многочисленных данных, их анализа и обобщения.

В таких ситуациях на помощь приходит статистика: наука о сборе, изменении и анализе массовых количественных данных.

Специалисты по медицинской статистике проводят сбор данных. Они собирают сведения из разных городов о средней концентрации угарного газа в атмосфере и о заболеваемости астмой (число хронических больных на тысячу жителей). Полученные данные можно свести в таблицу, а также представить в виде точечной диаграммы.

При этом необходимо помнить, что статистические данные всегда являются приближенными, усредненными. Поэтому они носят оценочный характер. Однако, они верно отражают характер зависимости величин. И еще одно важное замечание: для достоверности результатов, полученных путем анализа статистических данных, этих данных должно быть много.

Из полученных данных можно сделать вывод, что при концентрации угарного газа до 3 мг/куб.м его влияние на заболеваемость астмой несильное. С дальнейшим ростом концентрации наступает резкий рост заболеваемости.

Построить табличную модель и графическую по экспериментальным данным

Но нужно ещё и получить формулу, отражающую эту зависимость. На языке математики это называется функцией зависимости Р от С: Р(С). Вид такой функции неизвестен, её следует искать методом подбора по экспериментальным данным. Понятно, что график искомой функции должен проходить близко к точкам диаграммы экспериментальных данных. Строить функцию так, чтобы ёе график точно проходил через все данные точки (рисунок 2), не имеет смысла. Во-первых, математический вид такой функции может оказаться слишком сложным. Во-вторых, уже говорилось о том, что экспериментальные значения являются приближенными.

Отсюда следуют основные требования к искомой функции:

  • она должна быть достаточно простой для использования её в дальнейших вычислениях;

  • г рафик этой функции должен проходить вблизи экспериментальных точек так, чтобы отклонения этих точек от графика были минимальны и равномерны

Полученную функцию, график которой приведен на рисунке, принято называть в статистике регрессионной моделью. Регрессионная модель – это функция, описывающая зависимость между количественными характеристиками сложных систем.

Получение регрессионной модели происходит в два этапа:

  1. подбор вида функции;

  2. вычисление параметров функции.

Чаще всего выбор производится среди следующих функций:

y=ax+b – линейная функция;

y=ax2+bx+c – квадратичная функция;

y=aln(x)+b – логарифмическая функция;

y=aebx — экспоненциальная функция;

y=axb — степенная функция.

Если Вы выбрали (сознательно или наугад) одну из предлагаемых функций, то следующим шагом нужно подобрать параметры (a,b,c и пр.) так, чтобы функция располагалась как можно ближе к экспериментальным точкам. Для этого подходит метод наименьших квадратов (МНК). Суть его заключается в следующем: искомая функция должна быть построена так, чтобы сумма квадратов отклонений у – координат всех экспериментальных точек от у – координат графика функции была бы минимальной.

В ажно понимать следующее: методом наименьших квадратов по данному набору экспериментальных точек можно построить любую функцию. А вот будет ли она нас удовлетворять, это уже другой вопрос – вопрос критерия соответствия. На рисунке 4 изображены 3 функции, построенные методом наименьших квадратов.

     Рисунок 4

Данные рисунки получены с помощью MO Excel. График регрессионной модели называется трендом (trend – направление, тенденция).

Г рафик линейной функции – это прямая. Полученная по методу МНК прямая отражает факт роста заболеваемости от концентрации угарного газа, но по этому графику трудно что – либо сказать о характере этого роста. А вот квадратичный и экспоненциальный тренды – ведут себя очень правдоподобно.

На графиках присутствует ещё одна величина, полученная в результате построения трендов. Она обозначена как R2. В статистике эта величина называется коэффициентом детерминированности. Именно она определяет, насколько удачной получится регрессионная модель. Коэффициент детерминированности всегда заключен в диапазоне от 0 до 1. Если он равен 1, то функция точно проходит через табличные значения, если 0, то выбранный вид регрессионной модели неудачен. Чем R2 ближе к 1, тем удачнее регрессионная модель.

Метод наименьших квадратов используется для вычисления параметров регрессионной модели. Этот метод содержится в математическом арсенале электронных таблиц.

Письменное задание. Составить конспект по §18

4. Практическая часть. Перед выполнением практической работы посмотрите видео

https://www.youtube.com/watch?v=Pj-hP8lqtGk

Выполнение практической работы в MO Excel.

Задание

По предложенной инструкции выполнить практическую работу, оформить отчет. Этапы работы:

   1. Ввести табличные данные зависимости заболеваемости бронхиальной астмой от концентрации угарного газа в атмосфере (см. рисунок).
   2. Представить зависимость в виде точечной диаграммы (см. рисунок).

Меню Вставка / Диаграмма / Точечная диаграмма

   3.Скопировать и вставить ещё 4 диаграммы (Всего 5)

Выделили диаграмму / Скопировали / нажали на другую ячейку / Вставили.

   4. К каждой диаграмме построить линии тренда

Нажать на диаграмму / меню Макет / Линия тренда / Дополнительные параметры линии тренда), задавая поочерёдно функции. 1диаграмма – экспоненциальная функция, 2 –линейная, 3 – логарифмическая, 4 – полиномиальная, 5 – степенная.

Не забудьте поставить галочки «Показать уравнение на диаграмме» и «Поместить на диаграмму величину достоверности аппроксимации R^2».

5. Результат работы:

  1. файл в Excel

  1. Сделать отчёт в тетради, прислать фото в ВК

Форма отчёта

Практическая работа

Отчет по практической работе

«Построение регрессионных моделей с помощью табличный процессор MO Excel»

Тип тренда

Уравнение тренда

R2

Линейный

Квадратичный

Логарифмический

Степенной

Экспоненциальный

Полином третей степени

Вывод: для графика, полученного по экспериментальным точкам больше всего подходит регрессионная модель, построенная с помощью ________________ функции._______________________________

Ёе формула имеет вид y=_______________________________

R2 = _________________

По полученной формуле рассчитайте y, при x = 15.

________________________________________________________________________________________________________

Вывод по работе: ____________________________________________________________ ________________________________________________________________________________________________________________________________________________________________________________________________________________

   Прислать в ВК: фото конспекта и отчёта, файл с практической работой в Excel.

Прислать до 03.02.22 включительно.

5. Домашнее задание:

Изучить § 18 и составленный конспект

Понравилась статья? Поделить с друзьями:
  • Множественные условия для функции если excel
  • Модели систем в excel
  • Множественное условие если в excel или
  • Модели реализуемые в excel
  • Множественное или в excel примеры