Предложите, как улучшить StudyLib
(Для жалоб на нарушения авторских прав, используйте
другую форму
)
Ваш е-мэйл
Заполните, если хотите получить ответ
Оцените наш проект
1
2
3
4
5
МИНОБРНАУКИ РОССИИ Федеральное государственное автономное образовательное
учреждение высшего образования «ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»
Филиал ЮФУ в г. Новошахтинске
С. Ю. АВЕРЬЯНОВА, Н. В. РАСТЕРЯЕВ
ЛАБОРАТОРНЫЙ ПРАКТИКУМ ПО МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ
В СРЕДЕ ЭТ MS EXCEL
Ростов-на-Дону — 2014
УДК [311:004.9](075.8) ББК32.973.26-018.2я73
А 19
Печатается по решению кафедры информатики и математики филиала ЮФУ в г. Новошахтинске
протокол №1 от 01.09.2014 г.;
учебно-методической комиссии филиала ЮФУ в г. Новошахтинске протокол № 3 от 02.12.2014 г.
Рецензенты:
доктор технических наук, профессор Галушкин Н.Е.; кандидат технических наук, доцент Байдюк А.П.
А 19 Аверьянова С.Ю., Растеряев Н.В.
Лабораторный практикум по математической статистике в среде ЭТ MS Excel: учебное пособие; Южный федеральный университет. – Ростов-на-Дону: Издательство Южного федерального университета, 2014. – 64 с.
ISBN 978-5-9275-1459-5
Учебное пособие предназначено для проведения лабораторных работ, а также организации управляемой самостоятельной работы студентов.
Пособие содержит краткие основные теоретические положения и примеры решения типовых задач статистической обработки выборки. Рассмотрены вопросы графического представления выборки, вычисления ее числовых характеристик и проверки близости эмпирической и теоретической функций распределения. Задачи решаются в среде электронных таблиц MS Excel. Представлены варианты заданий для самостоятельной работы студентов.
Пособие предназначено для студентов, обучающихся по направлениям подготовки «Экономика», «Менеджмент», «Бизнес-информатика» и преподавателей высших учебных заведений.
Публикуется в авторской редакции
ISBN 978-5-9275-1459-5
УДК [311:004.9](075.8) ББК32.973.26-018.2я73
© Южный федеральный университет, 2014
2
СОДЕРЖАНИЕ |
|
Предисловие |
4 |
Лабораторная работа №1 |
5 |
ВАРИАЦИОННЫЕ РЯДЫ. |
|
ВЫБОРОЧНАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ |
|
Лабораторная работа №2 |
25 |
ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВЫБОРКИ |
|
Лабораторная работа №3 |
36 |
ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВЫБОРКИ |
|
СТАНДАРТНЫМИ СРЕДСТВАМИ ЭТ MS EXCEL |
|
Лабораторная работа №4 |
41 |
РАСЧЕТ ЧИСЛОВЫХ ХАРАКТЕРИСТИК ВЫБОРКИ С |
|
ПОМОЩЬЮ ВСТРОЕННЫХ ФУНКЦИЙ ЭТ MSEXCEL |
|
Лабораторная работа №5 |
56 |
НАХОЖДЕНИЕ ЧИСЛОВЫХ ХАРАКТЕРИСТИК ВЫБОРКИ |
|
СТАНДАРТНЫМИ СРЕДСТВАМИ ЭТ MS EXCEL |
|
Список использованных источников |
64 |
3
Предисловие
Курс «Теории вероятностей и математической статистики» является одним из важнейших математических курсов для экономических специальностей. Весь комплекс социальноэкономических наук простроен и развивается на вероятностностатистической базе, и без соответствующей подготовки невозможно полноценное изучение этих дисциплин. Математическая статистика использует математический аппарат и выводы теории вероятностей, изучает математические методы систематизации, обработки и использования статистических данных для научных и практических выводов. Современная математическая статистика разрабатывает способы определения числа необходимых испытаний до начала исследования (планирование эксперимента), в ходе исследования (последовательный анализ) и решает многие другие задачи. Современную математическую статистику определяют как науку о принятии решений в условиях неопределенности.
Одной из важных сфер приложения теории вероятностей и математической статистики является экономика, так как при исследовании и прогнозировании экономических показателей используется эконометрика, опирающаяся на теорию вероятностей. Практическое значение вероятностных методов состоит в том, что они позволяют по известным характеристикам простых случайных явлений прогнозировать характеристики более сложных явлений. Знания и практические навыки, приобретенные в ходе изучения данного курса, могут найти применение при изучении дальнейшего цикла специальных финансовых дисциплин, а также в курсовом и дипломном проектировании.
Основная цель лабораторного практикума — дать краткие основные теоретические положения, рассмотреть примеры решения типовых задач статистической обработки выборки, вопросы графического представления выборки, вычисления ее числовых характеристик и проверки близости эмпирической и теоретической функций распределения. Рассмотрены способы решения задач в среде электронных таблиц MS Excel.
4
Лабораторная работа №1 ВАРИАЦИОННЫЕ РЯДЫ.
ВЫБОРОЧНАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ Цель работы: овладеть навыками составления дискретных и
интервальных вариационных рядов выборки, построения выборочной (эмпирической) функции распределения в среде ЭТ MS.
Краткая теория
Для решения задач, связанных с анализом данных при наличии случайных непредсказуемых воздействий, разработан математический аппарат ‒ математическая статистика, что позволяет выявлять закономерности на основе случайностей, делать на их основе обоснованные выводы и прогнозы.
Важнейшими понятиями математической статистики являются понятия генеральной совокупности и выборки.
Генеральной совокупностью наблюдаемого признака (случайной величины) Х называют множество всевозможных значений, принимаемых наблюдаемым признаком Х.
Часть отобранных объектов из генеральной совокупности называется выборочной совокупностью, или выборкой. Результаты измерений изучаемого признака n объектов выборочной совокупности порождают n значений х1, х2, … , хn случайной величины X . Число n
называется объемом выборки.
Выборку можно рассматривать двояко:
а) как случайный вектор длины n, каждая компонента которого имеет такое же распределение, как и наблюдаемый признак;
б) как на результаты измерений, т.е. набор nчисел.
Случайная величина Х называется дискретной случайной величиной, если она принимает свое значение из некоторого конечного фиксированного набора, например, случайная величина Х ‒ число появления шестерки при двух бросках игрального кубика
Х: 0,1,2 .
Случайная величина Х называется непрерывной случайной величиной, если она принимает любое значение из некоторого интервала (в том числе ‒ ∞ и +∞), например, рост человека.
5
После получения выборки имеем данные, которые представляют собой множество чисел, расположенных в беспорядке. Анализ таких данных весьма затруднителен, и для изучения скрытых закономерностей их подвергают определенной обработке.
Простейшая операция – ранжирование опытных данных, результатом которого являются значения, расположенные в порядке не убывания. Если среди элементов встречаются одинаковые, то они объединяются в одну группу. Значение случайной величины, соответствующее отдельной группе сгруппированного ряда наблюдаемых данных, называется вариантом, а изменение этого значения – варьированием. Варианты будем обозначать строчными буквами с соответствующими порядковому номеру группы индексами x(1) , x(2) , …, x(N) , где N– число групп. При этом x(1)<x(2)<… <x(N).
Численность отдельной группы сгруппированного ряда данных называется частотой ni, где i– индекс варианта, а отношение частоты данного варианта к общей сумме частот называется частностью (или относительной частотой) и обозначается ωi,i = 1, …,N, т.е.
∑,
при этом ∑ |
‒ объему выборки. |
Дискретным вариационным рядом называется ранжированная совокупность вариантов x(i) с соответствующими им частотами ni или частностями ωi .
Если число возможных значений дискретной случайной величины достаточно велико или наблюдаемая случайная величина является непрерывной, то строят интервальный вариационный ряд, под которым понимают упорядоченную совокупность интервалов варьирования значений случайной величины с соответствующими частотами или частностями попаданий в каждый из них значений случайной величины.
Как правило, частичные интервалы, на которые разбивается весь интервал варьирования, имеют одинаковую длину , которая может быть вычислена по следующей формуле
∆ .
6
где R – размах варьирования (изменения) случайной величины; xmax , xmin – наибольшее и наименьшее значения исследуемой
случайной величины;
N – число частичных интервалов группировки.
Некоторые авторы рекомендуют пользоваться следующими эмпирическими формулами для определения числа интервалов:
N n ,N = 5.lg(n) ,
N = 1 + 3,322.lg(n) ‒ формула Стерджеса.
В рекомендациях по стандартизации Р 50.1.033-2001 «Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть I. Критерии типа хи-квадрат» рекомендует следующие значения N в зависимости от объема выборки n:
Объем выборки n |
Число интервалов |
||
группировки N |
|||
40 ‒ 100 |
7 |
‒ 9 |
|
100 |
‒ 500 |
8 |
‒ 12 |
500 |
‒ 1000 |
10 ‒ 16 |
|
1000 ‒ 10000 |
12 ‒ 22 |
В теории вероятностей для характеристики распределения случайной величины X служит функция распределения
F ( x) P( X x) ,
определяющую для каждого значения х вероятность того, что случайная величина Х примет значение, меньшее х, т.е. равная вероятности события А {X x}, где x – любое действительное число.
Одной из основных характеристик выборки является выборочная
(эмпирическая) функция распределения
F * (x) |
nx |
, |
|||
n |
|||||
n |
|||||
где nx – количество элементов выборки, меньших чем x. Другими |
|||||
словами, |
Fn*(x) есть |
относительная |
частота появления события |
||
A {X x} |
в n независимых испытаниях. Главное различие междуF (x) |
||||
и Fn* (x) состоит в том, |
что F (x) |
определяет вероятность события A, а |
|||
7 |
выборочная функция распределения Fn*(x) – относительную частоту этого события.
Свойства функции Fn*(x) :
1.0 Fn* (x) 1 .
2.Fn*(x) – неубывающая функция.
3. Fn* ( ) 0; |
Fn* ( ) 1. |
Функция Fn*(x) |
является «ступенчатой», имеются разрывы в |
точках, которым соответствуют наблюдаемые значения вариантов. Величина скачка равна относительной частоте варианта.
Аналитически Fn*(x) задается следующим соотношением:
0 при |
; |
2,3…, ; |
|
при |
, |
||
1при |
, |
где i – соответствующие относительные частоты; x(i) – элементы вариационного ряда (варианты).
Замечание. В случае интервального вариационного ряда подx(i) понимается середина i-го частичного интервала. Эмпирическую функцию распределения непрерывной случайной величины так же называют «накопленная частота».
Перед вычислением Fn*(x) полезно построить дискретный или
интервальный вариационный ряд.
Пример выполнения Постановка задачи 1.На телефонной станции проводились
наблюдения над числом неправильных соединений в минуту. Наблюдения в течение 30 минут дали следующие результаты (табл. 1).
Таблица 1.
3 |
0 |
1 |
5 |
1 |
2 |
4 |
5 |
3 |
4 |
|
2 |
4 |
2 |
0 |
2 |
3 |
1 |
3 |
2 |
1 |
|
4 |
3 |
0 |
2 |
1 |
0 |
4 |
2 |
3 |
2 |
|
8 |
Требуется найти дискретный вариационный ряд, выборочную (эмпирическую) функцию распределения данной выборки и построить ее график в среде ЭТ MS Excel.
Решение.
Очевидно, что число X является дискретной случайной величиной,
аполученные данные есть значения этой случайной величины.
Врезультате выполнения операций ранжирования и группировки были получены шесть значений случайной величины (варианты): 0; 1; 2; 3; 4; 5. При этом значение 0 в этой группе встречается 4 раза, значение 1
– 5 раз, значение 2 – 8 раз, значение 3 – 6 раз, значение 4 – 5 раз, значение 5 – 2 раза. Вычисленные значения частот и частностей приведены в табл. 2.
Таблица 2. |
||||||||||||||
Индекс |
i |
1, 2, 3, 4, 5, 6 |
||||||||||||
Вариант |
x(i ) |
0, 1, 2, 3, 4, 5 |
||||||||||||
Частота |
ni |
4, 5, 8, 6, 5, 2 |
||||||||||||
Частность |
i |
4 |
, |
5 |
, |
8 |
, |
6 |
, |
5 |
, |
2 |
||
30 |
30 |
30 |
30 |
30 |
30 |
|||||||||
Используя данный дискретный вариационный ряд (см. табл. 2), вычислим значения Fn*(x) по формуле, приведенной выше, и занесем их
в табл. 3.
Таблица 3.
x |
F30* (x) |
|||||||||||||||||||||||||||||||||||||||
x 0 |
0 |
|||||||||||||||||||||||||||||||||||||||
0 <x 1 |
1 |
4 |
||||||||||||||||||||||||||||||||||||||
30 |
4 |
5 |
9 |
|||||||||||||||||||||||||||||||||||||
1 <x 2 |
1 |
2 |
||||||||||||||||||||||||||||||||||||||
30 |
30 |
|||||||||||||||||||||||||||||||||||||||
30 |
||||||||||||||||||||||||||||||||||||||||
2 <x 3 |
1 |
2 3 |
4 |
5 |
8 |
17 |
||||||||||||||||||||||||||||||||||
30 |
||||||||||||||||||||||||||||||||||||||||
30 |
30 |
30 |
||||||||||||||||||||||||||||||||||||||
3 <x 4 |
1 |
2 3 |
4 |
4 |
5 |
8 |
6 |
23 |
||||||||||||||||||||||||||||||||
30 |
30 |
30 |
30 |
30 |
||||||||||||||||||||||||||||||||||||
4 <x 5 |
1 |
2 3 |
4 |
5 |
4 |
5 |
8 |
6 |
5 |
28 |
||||||||||||||||||||||||||||||
30 |
30 |
30 |
30 |
30 |
30 |
|||||||||||||||||||||||||||||||||||
x>5 |
1 |
2 3 |
4 |
5 6 |
28 |
2 |
30 |
1 |
||||||||||||||||||||||||||||||||
30 |
30 |
30 |
||||||||||||||||||||||||||||||||||||||
9 |
По данным таблицы 3 построим график эмпирической функции распределения.
Решение задачи в среде ЭТ MS Excel. Для решения задачи в среде ЭТ MS Excel необходимо выполнить следующие действия:
1.Идентифицируйте свою работу, переименовав Лист1 в Титульный лист и записав номер лабораторной работы, ее название, кто выполнил и проверил.
2.Переименуйте Лист 2 в Дискретный. Наберите массив 30 значений исходных данных выборки.
3.Найдите величины хmax, хmin, n, используя встроенные функции
ExcelМАКС, МИН и СЧЕТ.
10
Соседние файлы в папке Информационные технологии
- #
- #
- #
- #
07.03.202318.08 Кб19ЛР5.xlsx
- #
07.03.202311.17 Кб9Пр6.xlsx
Понравилось? Добавьте в закладки
Комбинаторика и вероятность
Ниже вы найдете основные формулы Excel, которые могут применяться при решении вероятностных задач и задач по комбинаторике.
ЧИСЛКОМБ / COMBIN |
Возвращает количество сочетаний без повторений. |
ФАКТР / FACT |
Вычисляет факториал числа. |
СЛЧИС / RAND |
Выдает случайное число в интервале от 0 до 1 (равномерно распределенное). |
СЛУЧМЕЖДУ / RANDBETVEEN |
Выдает случайное число в заданном интервале. |
БИНОМРАСП / BINOMDIST |
Вычисляет отдельное значение биномиального распределения. |
ГИПЕРГЕОМЕТ / HYRGEOMDIST |
Определяет гипергеометрическое распределение. |
НОРМРАСП / NORMDIST |
Вычисляет значение нормальной функции распределения. |
НОРМОБР / NORMINV |
Выдает обратное нормальное распределение. |
НОРМСТРАСП / NORMSDIST |
Выдает стандартное нормальное интегральное распределение. |
НОРМСТОБР / NORMSINV |
Выдает обратное значение стандартного нормального распределения. |
ПЕРЕСТ / PERMUT |
Находит количество размещений без повторений |
ВЕРОЯТНОСТЬ / PROB |
Определяет вероятность того, что значение из диапазона находится внутри заданных пределов. |
Подробнее: Формулы комбинаторики в Excel.
Подробно решим ваши задачи по теории вероятностей
Математическая статистика
При решении задач по математической статистике можно использовать те формулы, что перечислены выше, а также следующие (сгруппированы для удобства: обработка выборки, разные распределения, остальные формулы):
Обработка выборки: формулы Excel
СРОТКЛ / AVEDEV |
Вычисляет среднее абсолютных значений отклонений точек данных от среднего. |
СРЗНАЧ / AVERAGE |
Вычисляет среднее арифметическое аргументов. |
СРГЕОМ / GEOMEAN |
Вычисляет среднее геометрическое. |
СРГАРМ / HARMEAN |
Вычисляет среднее гармоническое. |
ЭКСЦЕСС / KURT |
Определяет эксцесс множества данных. |
МЕДИАНА / MEDIAN |
Находит медиану заданных чисел. |
МОДА / MODE |
Определяет значение моды множества данных. |
КВАРТИЛЬ / QUARTILE |
Определяет квартиль множества данных. |
СКОС / SKEW |
Определяет асимметрию распределения. |
СТАНДОТКЛОН / STDEV |
Оценивает стандартное отклонение по выборке. |
ДИСП / VAR |
Оценивает дисперсию по выборке. |
Законы распределений: формулы Excel
БЕТАРАСП / BETADIST |
Определяет интегральную функцию плотности бета-вероятности. |
БЕТАОБР / BETAINV |
Определяет обратную функцию к интегральной функции плотности бета-вероятности. |
ХИ2РАСП / CHIDIST |
Вычисляет одностороннюю вероятность распределения хи-квадрат. |
ХИ2ОБР / CHIINV |
Вычисляет обратное значение односторонней вероятности распределения хи-квадрат. |
ЭКСПРАСП / EXPONDIST |
Находит экспоненциальное распределение. |
FРАСП / FDIST |
Находит F-распределение вероятности. |
FРАСПОБР / FINV |
Определяет обратное значение для F-распределения вероятности. |
ФИШЕР / FISHER |
Находит преобразование Фишера. |
ФИШЕРОБР / FISHERINV |
Находит обратное преобразование Фишера. |
ГАММАРАСП / GAMMADIST |
Находит гамма-распределение. |
ГАММАОБР / GAMMAINV |
Находит обратное гамма-распределение. |
ПУАССОН / POISSON |
Выдает распределение Пуассона. |
СТЬЮДРАСП / TDIST |
Выдает t-распределение Стьюдента. |
СТЬЮДРАСПОБР / TINV |
Выдает обратное t-распределение Стьюдента. |
ВЕЙБУЛЛ / WEIBULL |
Выдает распределение Вейбулла. |
Другое (корреляция, регрессия и т.п.)
ДОВЕРИТ / CONFIDENCE |
Определяет доверительный интервал для среднего значения по генеральной совокупности. |
КОРРЕЛ / CORREL |
Находит коэффициент корреляции между двумя множествами данных. |
СЧЁТ / COUNT |
Подсчитывает количество чисел в списке аргументов. |
СЧЁТЕСЛИ / COUNTIF |
Подсчитывает количество непустых ячеек, удовлетворяющих заданному условию внутри диапазона. |
КОВАР / COVAR |
Определяет ковариацию, то есть среднее произведений отклонений для каждой пары точек. |
ПРЕДСКАЗ / FORECAST |
Вычисляет значение линейного тренда. |
ЛИНЕЙН / LINEST |
Находит параметры линейного тренда. |
ПИРСОН / PEARSON |
Определяет коэффициент корреляции Пирсона. |
Справочный файл по формулам Excel
Нужна шпаргалка по функциям Excel под рукой? Скачивайте файл: Математические и статистические формулы Excel
Полезные ссылки
|
|
А если у вас есть задачи, которые надо срочно сделать, а времени нет? Можете поискать готовые решения в решебнике: