Решение задач по математической статистике в excel

Предложите, как улучшить StudyLib

(Для жалоб на нарушения авторских прав, используйте

другую форму
)

Ваш е-мэйл

Заполните, если хотите получить ответ

Оцените наш проект

1

2

3

4

5

МИНОБРНАУКИ РОССИИ Федеральное государственное автономное образовательное

учреждение высшего образования «ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»

Филиал ЮФУ в г. Новошахтинске

С. Ю. АВЕРЬЯНОВА, Н. В. РАСТЕРЯЕВ

ЛАБОРАТОРНЫЙ ПРАКТИКУМ ПО МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ

В СРЕДЕ ЭТ MS EXCEL

Ростов-на-Дону — 2014

УДК [311:004.9](075.8) ББК32.973.26-018.2я73

А 19

Печатается по решению кафедры информатики и математики филиала ЮФУ в г. Новошахтинске

протокол №1 от 01.09.2014 г.;

учебно-методической комиссии филиала ЮФУ в г. Новошахтинске протокол № 3 от 02.12.2014 г.

Рецензенты:

доктор технических наук, профессор Галушкин Н.Е.; кандидат технических наук, доцент Байдюк А.П.

А 19 Аверьянова С.Ю., Растеряев Н.В.

Лабораторный практикум по математической статистике в среде ЭТ MS Excel: учебное пособие; Южный федеральный университет. – Ростов-на-Дону: Издательство Южного федерального университета, 2014. – 64 с.

ISBN 978-5-9275-1459-5

Учебное пособие предназначено для проведения лабораторных работ, а также организации управляемой самостоятельной работы студентов.

Пособие содержит краткие основные теоретические положения и примеры решения типовых задач статистической обработки выборки. Рассмотрены вопросы графического представления выборки, вычисления ее числовых характеристик и проверки близости эмпирической и теоретической функций распределения. Задачи решаются в среде электронных таблиц MS Excel. Представлены варианты заданий для самостоятельной работы студентов.

Пособие предназначено для студентов, обучающихся по направлениям подготовки «Экономика», «Менеджмент», «Бизнес-информатика» и преподавателей высших учебных заведений.

Публикуется в авторской редакции

ISBN 978-5-9275-1459-5

УДК [311:004.9](075.8) ББК32.973.26-018.2я73

© Южный федеральный университет, 2014

2

СОДЕРЖАНИЕ

Предисловие

4

Лабораторная работа №1

5

ВАРИАЦИОННЫЕ РЯДЫ.

ВЫБОРОЧНАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ

Лабораторная работа №2

25

ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВЫБОРКИ

Лабораторная работа №3

36

ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВЫБОРКИ

СТАНДАРТНЫМИ СРЕДСТВАМИ ЭТ MS EXCEL

Лабораторная работа №4

41

РАСЧЕТ ЧИСЛОВЫХ ХАРАКТЕРИСТИК ВЫБОРКИ С

ПОМОЩЬЮ ВСТРОЕННЫХ ФУНКЦИЙ ЭТ MSEXCEL

Лабораторная работа №5

56

НАХОЖДЕНИЕ ЧИСЛОВЫХ ХАРАКТЕРИСТИК ВЫБОРКИ

СТАНДАРТНЫМИ СРЕДСТВАМИ ЭТ MS EXCEL

Список использованных источников

64

3

Предисловие

Курс «Теории вероятностей и математической статистики» является одним из важнейших математических курсов для экономических специальностей. Весь комплекс социальноэкономических наук простроен и развивается на вероятностностатистической базе, и без соответствующей подготовки невозможно полноценное изучение этих дисциплин. Математическая статистика использует математический аппарат и выводы теории вероятностей, изучает математические методы систематизации, обработки и использования статистических данных для научных и практических выводов. Современная математическая статистика разрабатывает способы определения числа необходимых испытаний до начала исследования (планирование эксперимента), в ходе исследования (последовательный анализ) и решает многие другие задачи. Современную математическую статистику определяют как науку о принятии решений в условиях неопределенности.

Одной из важных сфер приложения теории вероятностей и математической статистики является экономика, так как при исследовании и прогнозировании экономических показателей используется эконометрика, опирающаяся на теорию вероятностей. Практическое значение вероятностных методов состоит в том, что они позволяют по известным характеристикам простых случайных явлений прогнозировать характеристики более сложных явлений. Знания и практические навыки, приобретенные в ходе изучения данного курса, могут найти применение при изучении дальнейшего цикла специальных финансовых дисциплин, а также в курсовом и дипломном проектировании.

Основная цель лабораторного практикума — дать краткие основные теоретические положения, рассмотреть примеры решения типовых задач статистической обработки выборки, вопросы графического представления выборки, вычисления ее числовых характеристик и проверки близости эмпирической и теоретической функций распределения. Рассмотрены способы решения задач в среде электронных таблиц MS Excel.

4

Лабораторная работа №1 ВАРИАЦИОННЫЕ РЯДЫ.

ВЫБОРОЧНАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ Цель работы: овладеть навыками составления дискретных и

интервальных вариационных рядов выборки, построения выборочной (эмпирической) функции распределения в среде ЭТ MS.

Краткая теория

Для решения задач, связанных с анализом данных при наличии случайных непредсказуемых воздействий, разработан математический аппарат ‒ математическая статистика, что позволяет выявлять закономерности на основе случайностей, делать на их основе обоснованные выводы и прогнозы.

Важнейшими понятиями математической статистики являются понятия генеральной совокупности и выборки.

Генеральной совокупностью наблюдаемого признака (случайной величины) Х называют множество всевозможных значений, принимаемых наблюдаемым признаком Х.

Часть отобранных объектов из генеральной совокупности называется выборочной совокупностью, или выборкой. Результаты измерений изучаемого признака n объектов выборочной совокупности порождают n значений х1, х2, … , хn случайной величины X . Число n

называется объемом выборки.

Выборку можно рассматривать двояко:

а) как случайный вектор длины n, каждая компонента которого имеет такое же распределение, как и наблюдаемый признак;

б) как на результаты измерений, т.е. набор nчисел.

Случайная величина Х называется дискретной случайной величиной, если она принимает свое значение из некоторого конечного фиксированного набора, например, случайная величина Х ‒ число появления шестерки при двух бросках игрального кубика

Х: 0,1,2 .

Случайная величина Х называется непрерывной случайной величиной, если она принимает любое значение из некоторого интервала (в том числе ‒ ∞ и +∞), например, рост человека.

5

После получения выборки имеем данные, которые представляют собой множество чисел, расположенных в беспорядке. Анализ таких данных весьма затруднителен, и для изучения скрытых закономерностей их подвергают определенной обработке.

Простейшая операция – ранжирование опытных данных, результатом которого являются значения, расположенные в порядке не убывания. Если среди элементов встречаются одинаковые, то они объединяются в одну группу. Значение случайной величины, соответствующее отдельной группе сгруппированного ряда наблюдаемых данных, называется вариантом, а изменение этого значения – варьированием. Варианты будем обозначать строчными буквами с соответствующими порядковому номеру группы индексами x(1) , x(2) , …, x(N) , где N– число групп. При этом x(1)<x(2)<… <x(N).

Численность отдельной группы сгруппированного ряда данных называется частотой ni, где i– индекс варианта, а отношение частоты данного варианта к общей сумме частот называется частностью (или относительной частотой) и обозначается ωi,i = 1, …,N, т.е.

,

при этом

‒ объему выборки.

Дискретным вариационным рядом называется ранжированная совокупность вариантов x(i) с соответствующими им частотами ni или частностями ωi .

Если число возможных значений дискретной случайной величины достаточно велико или наблюдаемая случайная величина является непрерывной, то строят интервальный вариационный ряд, под которым понимают упорядоченную совокупность интервалов варьирования значений случайной величины с соответствующими частотами или частностями попаданий в каждый из них значений случайной величины.

Как правило, частичные интервалы, на которые разбивается весь интервал варьирования, имеют одинаковую длину , которая может быть вычислена по следующей формуле

∆ .

6

где R – размах варьирования (изменения) случайной величины; xmax , xmin – наибольшее и наименьшее значения исследуемой

случайной величины;

N – число частичных интервалов группировки.

Некоторые авторы рекомендуют пользоваться следующими эмпирическими формулами для определения числа интервалов:

N n ,N = 5.lg(n) ,

N = 1 + 3,322.lg(n) ‒ формула Стерджеса.

В рекомендациях по стандартизации Р 50.1.033-2001 «Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть I. Критерии типа хи-квадрат» рекомендует следующие значения N в зависимости от объема выборки n:

Объем выборки n

Число интервалов

группировки N

40 ‒ 100

7

‒ 9

100

‒ 500

8

‒ 12

500

‒ 1000

10 ‒ 16

1000 ‒ 10000

12 ‒ 22

В теории вероятностей для характеристики распределения случайной величины X служит функция распределения

F ( x) P( X x) ,

определяющую для каждого значения х вероятность того, что случайная величина Х примет значение, меньшее х, т.е. равная вероятности события А {X x}, где x – любое действительное число.

Одной из основных характеристик выборки является выборочная

(эмпирическая) функция распределения

F * (x)

nx

,

n

n

где nx – количество элементов выборки, меньших чем x. Другими

словами,

Fn*(x) есть

относительная

частота появления события

A {X x}

в n независимых испытаниях. Главное различие междуF (x)

и Fn* (x) состоит в том,

что F (x)

определяет вероятность события A, а

7

выборочная функция распределения Fn*(x) – относительную частоту этого события.

Свойства функции Fn*(x) :

1.0 Fn* (x) 1 .

2.Fn*(x) – неубывающая функция.

3. Fn* ( ) 0;

Fn* ( ) 1.

Функция Fn*(x)

является «ступенчатой», имеются разрывы в

точках, которым соответствуют наблюдаемые значения вариантов. Величина скачка равна относительной частоте варианта.

Аналитически Fn*(x) задается следующим соотношением:

0 при

;

2,3…, ;

при

,

1при

,

где i – соответствующие относительные частоты; x(i) – элементы вариационного ряда (варианты).

Замечание. В случае интервального вариационного ряда подx(i) понимается середина i-го частичного интервала. Эмпирическую функцию распределения непрерывной случайной величины так же называют «накопленная частота».

Перед вычислением Fn*(x) полезно построить дискретный или

интервальный вариационный ряд.

Пример выполнения Постановка задачи 1.На телефонной станции проводились

наблюдения над числом неправильных соединений в минуту. Наблюдения в течение 30 минут дали следующие результаты (табл. 1).

Таблица 1.

3

0

1

5

1

2

4

5

3

4

2

4

2

0

2

3

1

3

2

1

4

3

0

2

1

0

4

2

3

2

8

Требуется найти дискретный вариационный ряд, выборочную (эмпирическую) функцию распределения данной выборки и построить ее график в среде ЭТ MS Excel.

Решение.

Очевидно, что число X является дискретной случайной величиной,

аполученные данные есть значения этой случайной величины.

Врезультате выполнения операций ранжирования и группировки были получены шесть значений случайной величины (варианты): 0; 1; 2; 3; 4; 5. При этом значение 0 в этой группе встречается 4 раза, значение 1

– 5 раз, значение 2 – 8 раз, значение 3 – 6 раз, значение 4 – 5 раз, значение 5 – 2 раза. Вычисленные значения частот и частностей приведены в табл. 2.

Таблица 2.

Индекс

i

1, 2, 3, 4, 5, 6

Вариант

x(i )

0, 1, 2, 3, 4, 5

Частота

ni

4, 5, 8, 6, 5, 2

Частность

i

4

,

5

,

8

,

6

,

5

,

2

30

30

30

30

30

30

Используя данный дискретный вариационный ряд (см. табл. 2), вычислим значения Fn*(x) по формуле, приведенной выше, и занесем их

в табл. 3.

Таблица 3.

x

F30* (x)

x 0

0

0 <x 1

1

4

30

4

5

9

1 <x 2

1

2

30

30

30

2 <x 3

1

2 3

4

5

8

17

30

30

30

30

3 <x 4

1

2 3

4

4

5

8

6

23

30

30

30

30

30

4 <x 5

1

2 3

4

5

4

5

8

6

5

28

30

30

30

30

30

30

x>5

1

2 3

4

5 6

28

2

30

1

30

30

30

9

По данным таблицы 3 построим график эмпирической функции распределения.

Решение задачи в среде ЭТ MS Excel. Для решения задачи в среде ЭТ MS Excel необходимо выполнить следующие действия:

1.Идентифицируйте свою работу, переименовав Лист1 в Титульный лист и записав номер лабораторной работы, ее название, кто выполнил и проверил.

2.Переименуйте Лист 2 в Дискретный. Наберите массив 30 значений исходных данных выборки.

3.Найдите величины хmax, хmin, n, используя встроенные функции

ExcelМАКС, МИН и СЧЕТ.

10

Соседние файлы в папке Информационные технологии

  • #
  • #
  • #
  • #

    07.03.202318.08 Кб19ЛР5.xlsx

  • #

    07.03.202311.17 Кб9Пр6.xlsx

Понравилось? Добавьте в закладки

Комбинаторика и вероятность

Ниже вы найдете основные формулы Excel, которые могут применяться при решении вероятностных задач и задач по комбинаторике.

ЧИСЛКОМБ / COMBIN

Возвращает количество сочетаний без повторений.

ФАКТР / FACT

Вычисляет факториал числа.

СЛЧИС / RAND

Выдает случайное число в интервале от 0 до 1 (равномерно распределенное).

СЛУЧМЕЖДУ / RANDBETVEEN

Выдает случайное число в заданном интервале.

БИНОМРАСП / BINOMDIST

Вычисляет отдельное значение биномиального распределения.

ГИПЕРГЕОМЕТ / HYRGEOMDIST

Определяет гипергеометрическое распределение.

НОРМРАСП / NORMDIST

Вычисляет значение нормальной функции распределения.

НОРМОБР / NORMINV

Выдает обратное нормальное распределение.

НОРМСТРАСП / NORMSDIST

Выдает стандартное нормальное интегральное распределение.

НОРМСТОБР / NORMSINV

Выдает обратное значение стандартного нормального распределения.

ПЕРЕСТ / PERMUT

Находит количество размещений без повторений

ВЕРОЯТНОСТЬ / PROB

Определяет вероятность того, что значение из диапазона находится внутри заданных пределов.

Подробнее: Формулы комбинаторики в Excel.

Подробно решим ваши задачи по теории вероятностей

Математическая статистика

При решении задач по математической статистике можно использовать те формулы, что перечислены выше, а также следующие (сгруппированы для удобства: обработка выборки, разные распределения, остальные формулы):

Обработка выборки: формулы Excel

СРОТКЛ / AVEDEV

Вычисляет среднее абсолютных значений отклонений точек данных от среднего.

СРЗНАЧ / AVERAGE

Вычисляет среднее арифметическое аргументов.

СРГЕОМ / GEOMEAN

Вычисляет среднее геометрическое.

СРГАРМ / HARMEAN

Вычисляет среднее гармоническое.

ЭКСЦЕСС / KURT

Определяет эксцесс множества данных.

МЕДИАНА / MEDIAN

Находит медиану заданных чисел.

МОДА / MODE

Определяет значение моды множества данных.

КВАРТИЛЬ / QUARTILE

Определяет квартиль множества данных.

СКОС / SKEW

Определяет асимметрию распределения.

СТАНДОТКЛОН / STDEV

Оценивает стандартное отклонение по выборке.

ДИСП / VAR

Оценивает дисперсию по выборке.

Законы распределений: формулы Excel

БЕТАРАСП / BETADIST

Определяет интегральную функцию плотности бета-вероятности.

БЕТАОБР / BETAINV

Определяет обратную функцию к интегральной функции плотности бета-вероятности.

ХИ2РАСП / CHIDIST

Вычисляет одностороннюю вероятность распределения хи-квадрат.

ХИ2ОБР / CHIINV

Вычисляет обратное значение односторонней вероятности распределения хи-квадрат.

ЭКСПРАСП / EXPONDIST

Находит экспоненциальное распределение.

FРАСП / FDIST

Находит F-распределение вероятности.

FРАСПОБР / FINV

Определяет обратное значение для F-распределения вероятности.

ФИШЕР / FISHER

Находит преобразование Фишера.

ФИШЕРОБР / FISHERINV

Находит обратное преобразование Фишера.

ГАММАРАСП / GAMMADIST

Находит гамма-распределение.

ГАММАОБР / GAMMAINV

Находит обратное гамма-распределение.

ПУАССОН / POISSON

Выдает распределение Пуассона.

СТЬЮДРАСП / TDIST

Выдает t-распределение Стьюдента.

СТЬЮДРАСПОБР / TINV

Выдает обратное t-распределение Стьюдента.

ВЕЙБУЛЛ / WEIBULL

Выдает распределение Вейбулла.

Другое (корреляция, регрессия и т.п.)

ДОВЕРИТ / CONFIDENCE

Определяет доверительный интервал для среднего значения по генеральной совокупности.

КОРРЕЛ / CORREL

Находит коэффициент корреляции между двумя множествами данных.

СЧЁТ / COUNT

Подсчитывает количество чисел в списке аргументов.

СЧЁТЕСЛИ / COUNTIF

Подсчитывает количество непустых ячеек, удовлетворяющих заданному условию внутри диапазона.

КОВАР / COVAR

Определяет ковариацию, то есть среднее произведений отклонений для каждой пары точек.

ПРЕДСКАЗ / FORECAST

Вычисляет значение линейного тренда.

ЛИНЕЙН / LINEST

Находит параметры линейного тренда.

ПИРСОН / PEARSON

Определяет коэффициент корреляции Пирсона.

Справочный файл по формулам Excel

Нужна шпаргалка по функциям Excel под рукой? Скачивайте файл: Математические и статистические формулы Excel

Полезные ссылки

  • Онлайн калькуляторы
  • Онлайн учебник для чайников
  • Более 200 примеров
  • Решенные контрольные
  • Формулы и таблицы
  • Решебник по ТВ
  • Решение на заказ
  • Онлайн помощь

А если у вас есть задачи, которые надо срочно сделать, а времени нет? Можете поискать готовые решения в решебнике:

Like this post? Please share to your friends:
  • Решение задач по максимальной прибыли в excel
  • Решение задач по линейной алгебре в excel
  • Решение задач по информатике огэ excel
  • Решение задач по информатике в электронных таблицах excel
  • Решение задач по информатике в excel онлайн