МИНОБРНАУКИ РОССИИ Федеральное государственное автономное образовательное
учреждение высшего образования «ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»
Филиал ЮФУ в г. Новошахтинске
С. Ю. АВЕРЬЯНОВА, Н. В. РАСТЕРЯЕВ
ЛАБОРАТОРНЫЙ ПРАКТИКУМ ПО МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ
В СРЕДЕ ЭТ MS EXCEL
Ростов-на-Дону — 2014
УДК [311:004.9](075.8) ББК32.973.26-018.2я73
А 19
Печатается по решению кафедры информатики и математики филиала ЮФУ в г. Новошахтинске
протокол №1 от 01.09.2014 г.;
учебно-методической комиссии филиала ЮФУ в г. Новошахтинске протокол № 3 от 02.12.2014 г.
Рецензенты:
доктор технических наук, профессор Галушкин Н.Е.; кандидат технических наук, доцент Байдюк А.П.
А 19 Аверьянова С.Ю., Растеряев Н.В.
Лабораторный практикум по математической статистике в среде ЭТ MS Excel: учебное пособие; Южный федеральный университет. – Ростов-на-Дону: Издательство Южного федерального университета, 2014. – 64 с.
ISBN 978-5-9275-1459-5
Учебное пособие предназначено для проведения лабораторных работ, а также организации управляемой самостоятельной работы студентов.
Пособие содержит краткие основные теоретические положения и примеры решения типовых задач статистической обработки выборки. Рассмотрены вопросы графического представления выборки, вычисления ее числовых характеристик и проверки близости эмпирической и теоретической функций распределения. Задачи решаются в среде электронных таблиц MS Excel. Представлены варианты заданий для самостоятельной работы студентов.
Пособие предназначено для студентов, обучающихся по направлениям подготовки «Экономика», «Менеджмент», «Бизнес-информатика» и преподавателей высших учебных заведений.
Публикуется в авторской редакции
ISBN 978-5-9275-1459-5
УДК [311:004.9](075.8) ББК32.973.26-018.2я73
© Южный федеральный университет, 2014
2
СОДЕРЖАНИЕ |
|
Предисловие |
4 |
Лабораторная работа №1 |
5 |
ВАРИАЦИОННЫЕ РЯДЫ. |
|
ВЫБОРОЧНАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ |
|
Лабораторная работа №2 |
25 |
ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВЫБОРКИ |
|
Лабораторная работа №3 |
36 |
ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВЫБОРКИ |
|
СТАНДАРТНЫМИ СРЕДСТВАМИ ЭТ MS EXCEL |
|
Лабораторная работа №4 |
41 |
РАСЧЕТ ЧИСЛОВЫХ ХАРАКТЕРИСТИК ВЫБОРКИ С |
|
ПОМОЩЬЮ ВСТРОЕННЫХ ФУНКЦИЙ ЭТ MSEXCEL |
|
Лабораторная работа №5 |
56 |
НАХОЖДЕНИЕ ЧИСЛОВЫХ ХАРАКТЕРИСТИК ВЫБОРКИ |
|
СТАНДАРТНЫМИ СРЕДСТВАМИ ЭТ MS EXCEL |
|
Список использованных источников |
64 |
3
Предисловие
Курс «Теории вероятностей и математической статистики» является одним из важнейших математических курсов для экономических специальностей. Весь комплекс социальноэкономических наук простроен и развивается на вероятностностатистической базе, и без соответствующей подготовки невозможно полноценное изучение этих дисциплин. Математическая статистика использует математический аппарат и выводы теории вероятностей, изучает математические методы систематизации, обработки и использования статистических данных для научных и практических выводов. Современная математическая статистика разрабатывает способы определения числа необходимых испытаний до начала исследования (планирование эксперимента), в ходе исследования (последовательный анализ) и решает многие другие задачи. Современную математическую статистику определяют как науку о принятии решений в условиях неопределенности.
Одной из важных сфер приложения теории вероятностей и математической статистики является экономика, так как при исследовании и прогнозировании экономических показателей используется эконометрика, опирающаяся на теорию вероятностей. Практическое значение вероятностных методов состоит в том, что они позволяют по известным характеристикам простых случайных явлений прогнозировать характеристики более сложных явлений. Знания и практические навыки, приобретенные в ходе изучения данного курса, могут найти применение при изучении дальнейшего цикла специальных финансовых дисциплин, а также в курсовом и дипломном проектировании.
Основная цель лабораторного практикума — дать краткие основные теоретические положения, рассмотреть примеры решения типовых задач статистической обработки выборки, вопросы графического представления выборки, вычисления ее числовых характеристик и проверки близости эмпирической и теоретической функций распределения. Рассмотрены способы решения задач в среде электронных таблиц MS Excel.
4
Лабораторная работа №1 ВАРИАЦИОННЫЕ РЯДЫ.
ВЫБОРОЧНАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ Цель работы: овладеть навыками составления дискретных и
интервальных вариационных рядов выборки, построения выборочной (эмпирической) функции распределения в среде ЭТ MS.
Краткая теория
Для решения задач, связанных с анализом данных при наличии случайных непредсказуемых воздействий, разработан математический аппарат ‒ математическая статистика, что позволяет выявлять закономерности на основе случайностей, делать на их основе обоснованные выводы и прогнозы.
Важнейшими понятиями математической статистики являются понятия генеральной совокупности и выборки.
Генеральной совокупностью наблюдаемого признака (случайной величины) Х называют множество всевозможных значений, принимаемых наблюдаемым признаком Х.
Часть отобранных объектов из генеральной совокупности называется выборочной совокупностью, или выборкой. Результаты измерений изучаемого признака n объектов выборочной совокупности порождают n значений х1, х2, … , хn случайной величины X . Число n
называется объемом выборки.
Выборку можно рассматривать двояко:
а) как случайный вектор длины n, каждая компонента которого имеет такое же распределение, как и наблюдаемый признак;
б) как на результаты измерений, т.е. набор nчисел.
Случайная величина Х называется дискретной случайной величиной, если она принимает свое значение из некоторого конечного фиксированного набора, например, случайная величина Х ‒ число появления шестерки при двух бросках игрального кубика
Х: 0,1,2 .
Случайная величина Х называется непрерывной случайной величиной, если она принимает любое значение из некоторого интервала (в том числе ‒ ∞ и +∞), например, рост человека.
5
После получения выборки имеем данные, которые представляют собой множество чисел, расположенных в беспорядке. Анализ таких данных весьма затруднителен, и для изучения скрытых закономерностей их подвергают определенной обработке.
Простейшая операция – ранжирование опытных данных, результатом которого являются значения, расположенные в порядке не убывания. Если среди элементов встречаются одинаковые, то они объединяются в одну группу. Значение случайной величины, соответствующее отдельной группе сгруппированного ряда наблюдаемых данных, называется вариантом, а изменение этого значения – варьированием. Варианты будем обозначать строчными буквами с соответствующими порядковому номеру группы индексами x(1) , x(2) , …, x(N) , где N– число групп. При этом x(1)<x(2)<… <x(N).
Численность отдельной группы сгруппированного ряда данных называется частотой ni, где i– индекс варианта, а отношение частоты данного варианта к общей сумме частот называется частностью (или относительной частотой) и обозначается ωi,i = 1, …,N, т.е.
∑,
при этом ∑ |
‒ объему выборки. |
Дискретным вариационным рядом называется ранжированная совокупность вариантов x(i) с соответствующими им частотами ni или частностями ωi .
Если число возможных значений дискретной случайной величины достаточно велико или наблюдаемая случайная величина является непрерывной, то строят интервальный вариационный ряд, под которым понимают упорядоченную совокупность интервалов варьирования значений случайной величины с соответствующими частотами или частностями попаданий в каждый из них значений случайной величины.
Как правило, частичные интервалы, на которые разбивается весь интервал варьирования, имеют одинаковую длину , которая может быть вычислена по следующей формуле
∆ .
6
где R – размах варьирования (изменения) случайной величины; xmax , xmin – наибольшее и наименьшее значения исследуемой
случайной величины;
N – число частичных интервалов группировки.
Некоторые авторы рекомендуют пользоваться следующими эмпирическими формулами для определения числа интервалов:
N n ,N = 5.lg(n) ,
N = 1 + 3,322.lg(n) ‒ формула Стерджеса.
В рекомендациях по стандартизации Р 50.1.033-2001 «Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть I. Критерии типа хи-квадрат» рекомендует следующие значения N в зависимости от объема выборки n:
Объем выборки n |
Число интервалов |
||
группировки N |
|||
40 ‒ 100 |
7 |
‒ 9 |
|
100 |
‒ 500 |
8 |
‒ 12 |
500 |
‒ 1000 |
10 ‒ 16 |
|
1000 ‒ 10000 |
12 ‒ 22 |
В теории вероятностей для характеристики распределения случайной величины X служит функция распределения
F ( x) P( X x) ,
определяющую для каждого значения х вероятность того, что случайная величина Х примет значение, меньшее х, т.е. равная вероятности события А {X x}, где x – любое действительное число.
Одной из основных характеристик выборки является выборочная
(эмпирическая) функция распределения
F * (x) |
nx |
, |
|||
n |
|||||
n |
|||||
где nx – количество элементов выборки, меньших чем x. Другими |
|||||
словами, |
Fn*(x) есть |
относительная |
частота появления события |
||
A {X x} |
в n независимых испытаниях. Главное различие междуF (x) |
||||
и Fn* (x) состоит в том, |
что F (x) |
определяет вероятность события A, а |
|||
7 |
выборочная функция распределения Fn*(x) – относительную частоту этого события.
Свойства функции Fn*(x) :
1.0 Fn* (x) 1 .
2.Fn*(x) – неубывающая функция.
3. Fn* ( ) 0; |
Fn* ( ) 1. |
Функция Fn*(x) |
является «ступенчатой», имеются разрывы в |
точках, которым соответствуют наблюдаемые значения вариантов. Величина скачка равна относительной частоте варианта.
Аналитически Fn*(x) задается следующим соотношением:
0 при |
; |
2,3…, ; |
|
при |
, |
||
1при |
, |
где i – соответствующие относительные частоты; x(i) – элементы вариационного ряда (варианты).
Замечание. В случае интервального вариационного ряда подx(i) понимается середина i-го частичного интервала. Эмпирическую функцию распределения непрерывной случайной величины так же называют «накопленная частота».
Перед вычислением Fn*(x) полезно построить дискретный или
интервальный вариационный ряд.
Пример выполнения Постановка задачи 1.На телефонной станции проводились
наблюдения над числом неправильных соединений в минуту. Наблюдения в течение 30 минут дали следующие результаты (табл. 1).
Таблица 1.
3 |
0 |
1 |
5 |
1 |
2 |
4 |
5 |
3 |
4 |
|
2 |
4 |
2 |
0 |
2 |
3 |
1 |
3 |
2 |
1 |
|
4 |
3 |
0 |
2 |
1 |
0 |
4 |
2 |
3 |
2 |
|
8 |
Требуется найти дискретный вариационный ряд, выборочную (эмпирическую) функцию распределения данной выборки и построить ее график в среде ЭТ MS Excel.
Решение.
Очевидно, что число X является дискретной случайной величиной,
аполученные данные есть значения этой случайной величины.
Врезультате выполнения операций ранжирования и группировки были получены шесть значений случайной величины (варианты): 0; 1; 2; 3; 4; 5. При этом значение 0 в этой группе встречается 4 раза, значение 1
– 5 раз, значение 2 – 8 раз, значение 3 – 6 раз, значение 4 – 5 раз, значение 5 – 2 раза. Вычисленные значения частот и частностей приведены в табл. 2.
Таблица 2. |
||||||||||||||
Индекс |
i |
1, 2, 3, 4, 5, 6 |
||||||||||||
Вариант |
x(i ) |
0, 1, 2, 3, 4, 5 |
||||||||||||
Частота |
ni |
4, 5, 8, 6, 5, 2 |
||||||||||||
Частность |
i |
4 |
, |
5 |
, |
8 |
, |
6 |
, |
5 |
, |
2 |
||
30 |
30 |
30 |
30 |
30 |
30 |
|||||||||
Используя данный дискретный вариационный ряд (см. табл. 2), вычислим значения Fn*(x) по формуле, приведенной выше, и занесем их
в табл. 3.
Таблица 3.
x |
F30* (x) |
|||||||||||||||||||||||||||||||||||||||
x 0 |
0 |
|||||||||||||||||||||||||||||||||||||||
0 <x 1 |
1 |
4 |
||||||||||||||||||||||||||||||||||||||
30 |
4 |
5 |
9 |
|||||||||||||||||||||||||||||||||||||
1 <x 2 |
1 |
2 |
||||||||||||||||||||||||||||||||||||||
30 |
30 |
|||||||||||||||||||||||||||||||||||||||
30 |
||||||||||||||||||||||||||||||||||||||||
2 <x 3 |
1 |
2 3 |
4 |
5 |
8 |
17 |
||||||||||||||||||||||||||||||||||
30 |
||||||||||||||||||||||||||||||||||||||||
30 |
30 |
30 |
||||||||||||||||||||||||||||||||||||||
3 <x 4 |
1 |
2 3 |
4 |
4 |
5 |
8 |
6 |
23 |
||||||||||||||||||||||||||||||||
30 |
30 |
30 |
30 |
30 |
||||||||||||||||||||||||||||||||||||
4 <x 5 |
1 |
2 3 |
4 |
5 |
4 |
5 |
8 |
6 |
5 |
28 |
||||||||||||||||||||||||||||||
30 |
30 |
30 |
30 |
30 |
30 |
|||||||||||||||||||||||||||||||||||
x>5 |
1 |
2 3 |
4 |
5 6 |
28 |
2 |
30 |
1 |
||||||||||||||||||||||||||||||||
30 |
30 |
30 |
||||||||||||||||||||||||||||||||||||||
9 |
По данным таблицы 3 построим график эмпирической функции распределения.
Решение задачи в среде ЭТ MS Excel. Для решения задачи в среде ЭТ MS Excel необходимо выполнить следующие действия:
1.Идентифицируйте свою работу, переименовав Лист1 в Титульный лист и записав номер лабораторной работы, ее название, кто выполнил и проверил.
2.Переименуйте Лист 2 в Дискретный. Наберите массив 30 значений исходных данных выборки.
3.Найдите величины хmax, хmin, n, используя встроенные функции
ExcelМАКС, МИН и СЧЕТ.
10
Соседние файлы в папке Информационные технологии
- #
- #
- #
- #
07.03.202318.08 Кб19ЛР5.xlsx
- #
07.03.202311.17 Кб9Пр6.xlsx
Подборка по базе: Лабораторный практикум 1.docx, Задачи по статистике решённые.doc, Лабораторный практикум № 1 Финтех опыт банка Тинькофф.docx, 194- Информатика и ИКТ. Базовый ур. Практикум. 10-11кл_Семакин И, клиническая практикум.docx, Силлабус Ағылшын тілінің лек.аспект практикумы силлабус (1) (4) , Лекции по статистике [Фляжникова].DOC, Психодиагностика практикум .docx, Общепсихологический практикум 2ч.ppt, РЭНГМ_Дуркин_Лабораторный практикум по дисциплине Повышение неф
МИНОБРНАУКИ РОССИИ
Федеральное государственное автономное образовательное учреждение высшего образования
«ЮЖНЫЙ ФЕДЕРАЛЬНЫЙ УНИВЕРСИТЕТ»
Филиал ЮФУ в г. Новошахтинске
С. Ю. АВЕРЬЯНОВА, Н. В. РАСТЕРЯЕВ
ЛАБОРАТОРНЫЙ ПРАКТИКУМ
ПО МАТЕМАТИЧЕСКОЙ СТАТИСТИКЕ
В СРЕДЕ ЭТ MS EXCEL
Ростов-на-Дону — 2014
2
УДК [311:004.9](075.8)
ББК32.973.26-018.2я73
А 19
Печатается по решению
кафедры информатики и математики филиала ЮФУ в г. Новошахтинске
протокол №1 от 01.09.2014 г.;
учебно-методической комиссии филиала ЮФУ в г. Новошахтинске протокол
№ 3 от 02.12.2014 г.
Рецензенты: доктор технических наук, профессор Галушкин Н.Е.; кандидат технических наук, доцент Байдюк А.П.
А 19
Аверьянова С.Ю., Растеряев Н.В.
Лабораторный практикум по математической статистике в среде ЭТ
MS Excel: учебное пособие; Южный федеральный университет. –
Ростов-на-Дону: Издательство Южного федерального университета,
2014. – 64 с.
ISBN 978-5-9275-1459-5
Учебное пособие предназначено для проведения лабораторных работ, а также организации управляемой самостоятельной работы студентов.
Пособие содержит краткие основные теоретические положения и примеры решения типовых задач статистической обработки выборки. Рассмотрены вопросы графического представления выборки, вычисления ее числовых характеристик и проверки близости эмпирической и теоретической функций распределения. Задачи решаются в среде электронных таблиц MS Excel. Представлены варианты заданий для самостоятельной работы студентов.
Пособие предназначено для студентов, обучающихся по направлениям подготовки
«Экономика», «Менеджмент», «Бизнес-информатика» и преподавателей высших учебных заведений.
Публикуется в авторской редакции
ISBN 978-5-9275-1459-5
УДК [311:004.9](075.8)
ББК32.973.26-018.2я73
© Южный федеральный университет, 2014
3
СОДЕРЖАНИЕ
Предисловие 4
Лабораторная работа №1
ВАРИАЦИОННЫЕ РЯДЫ.
ВЫБОРОЧНАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ
5
Лабораторная работа №2
ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВЫБОРКИ
25
Лабораторная работа №3
ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВЫБОРКИ
СТАНДАРТНЫМИ СРЕДСТВАМИ ЭТ MS EXCEL
36
Лабораторная работа №4
РАСЧЕТ ЧИСЛОВЫХ ХАРАКТЕРИСТИК ВЫБОРКИ С
ПОМОЩЬЮ ВСТРОЕННЫХ ФУНКЦИЙ ЭТ MSEXCEL
41
Лабораторная работа №5
НАХОЖДЕНИЕ ЧИСЛОВЫХ ХАРАКТЕРИСТИК ВЫБОРКИ
СТАНДАРТНЫМИ СРЕДСТВАМИ ЭТ MS EXCEL
56
Список использованных источников 64
4
Предисловие
Курс «Теории вероятностей и математической статистики» является одним из важнейших математических курсов для экономических специальностей.
Весь комплекс социально- экономических наук простроен и развивается на вероятностно- статистической базе, и без соответствующей подготовки невозможно полноценное изучение этих дисциплин. Математическая статистика использует математический аппарат и выводы теории вероятностей, изучает математические методы систематизации, обработки и использования статистических данных для научных и практических выводов. Современная математическая статистика разрабатывает способы определения числа необходимых испытаний до начала исследования (планирование эксперимента), в ходе исследования
(последовательный анализ) и решает многие другие задачи.
Современную математическую статистику определяют как науку о принятии решений в условиях неопределенности.
Одной из важных сфер приложения теории вероятностей и математической статистики является экономика, так как при исследовании и прогнозировании экономических показателей используется эконометрика, опирающаяся на теорию вероятностей.
Практическое значение вероятностных методов состоит в том, что они позволяют по известным характеристикам простых случайных явлений прогнозировать характеристики более сложных явлений. Знания и практические навыки, приобретенные в ходе изучения данного курса, могут найти применение при изучении дальнейшего цикла специальных финансовых дисциплин, а также в курсовом и дипломном проектировании.
Основная цель лабораторного практикума — дать краткие основные теоретические положения, рассмотреть примеры решения типовых задач статистической обработки выборки, вопросы графического представления выборки, вычисления ее числовых характеристик и проверки близости эмпирической и теоретической функций распределения. Рассмотрены способы решения задач в среде электронных таблиц MS Excel.
5
Лабораторная работа №1
ВАРИАЦИОННЫЕ РЯДЫ.
ВЫБОРОЧНАЯ ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ
Цель работы: овладеть навыками составления дискретных и интервальных вариационных рядов выборки, построения выборочной
(эмпирической) функции распределения в среде ЭТ MS.
Краткая теория
Для решения задач, связанных с анализом данных при наличии случайных непредсказуемых воздействий, разработан математический аппарат ‒ математическая статистика, что позволяет выявлять закономерности на основе случайностей, делать на их основе обоснованные выводы и прогнозы.
Важнейшими понятиями математической статистики являются понятия генеральной совокупности и выборки.
Генеральной совокупностью наблюдаемого признака (случайной величины)
Х называют множество всевозможных значений, принимаемых наблюдаемым признаком Х.
Часть отобранных объектов из генеральной совокупности называется выборочной совокупностью, или выборкой. Результаты измерений изучаемого признака n объектов выборочной совокупности порождают n значений х
1
, х
2
, … , х n
случайной величины X . Число n
называется объемом выборки.
Выборку можно рассматривать двояко: а) как случайный вектор длины n, каждая компонента которого имеет такое же распределение, как и наблюдаемый признак; б) как на результаты измерений, т.е. набор nчисел.
Случайная величина Х называется дискретной случайной
величиной, если она принимает свое значение из некоторого конечного фиксированного набора, например, случайная величина Х ‒ число появления шестерки при двух бросках игрального кубика
Х: 0,1,2 .
Случайная величина Х называется непрерывной случайной
величиной, если она принимает любое значение из некоторого интервала (в том числе ‒ ∞ и +∞), например, рост человека.
6
После получения выборки имеем данные, которые представляют собой множество чисел, расположенных в беспорядке. Анализ таких данных весьма затруднителен, и для изучения скрытых закономерностей их подвергают определенной обработке.
Простейшая операция – ранжирование опытных данных, результатом которого являются значения, расположенные в порядке не убывания. Если среди элементов встречаются одинаковые, то они объединяются в одну группу. Значение случайной величины, соответствующее отдельной группе сгруппированного ряда наблюдаемых данных, называется вариантом, а изменение этого значения – варьированием. Варианты будем обозначать строчными буквами с соответствующими порядковому номеру группы индексами
x
(1)
, x
(2)
, …, x
(N)
, где N– число групп. При этом x
(1)
(2)
<…
(N)
Численность отдельной группы сгруппированного ряда данных называется частотой n
i
, где i– индекс варианта, а отношение частоты данного варианта к общей сумме частот называется частностью (или относительной частотой) и обозначается ω
i
,i = 1, …,N, т.е.
∑
, при этом ∑
‒ объему выборки.
Дискретным вариационным рядом называется ранжированная совокупность вариантов x
(i)
с соответствующими им частотами n
i
или частностями ω
i
.
Если число возможных значений дискретной случайной величины достаточно велико или наблюдаемая случайная величина является непрерывной, то строят интервальный вариационный ряд, под которым понимают упорядоченную совокупность интервалов варьирования значений случайной величины с соответствующими частотами или частностями попаданий в каждый из них значений случайной величины.
Как правило, частичные интервалы, на которые разбивается весь интервал варьирования, имеют одинаковую длину Δ, которая может быть вычислена по следующей формуле
∆
7 где R – размах варьирования (изменения) случайной величины;
x
max
, x
min
– наибольшее и наименьшее значения исследуемой случайной величины;
N – число частичных интервалов группировки.
Некоторые авторы рекомендуют пользоваться следующими эмпирическими формулами для определения числа интервалов:
n
N
,N = 5
.
lg(n) ,
N = 1 + 3,322
.
lg(n) ‒ формула Стерджеса.
В рекомендациях по стандартизации Р 50.1.033-2001 «Прикладная статистика. Правила проверки согласия опытного распределения с теоретическим. Часть I. Критерии типа хи-квадрат» рекомендует следующие значения N в зависимости от объема выборки n:
Объем выборки n
Число интервалов группировки N
40 ‒ 100 7 ‒ 9 100 ‒ 500 8 ‒ 12 500 ‒ 1000 10 ‒ 16 1000 ‒ 10000 12 ‒ 22
В теории вероятностей для характеристики распределения случайной величины
X
служит функция распределения
)
(
)
(
x
X
P
x
F
, определяющую для каждого значения х вероятность того, что случайная величина Х примет значение, меньшее х, т.е. равная вероятности события
}
{
x
X
А
, где
x
– любое действительное число.
Одной из основных характеристик выборки является выборочная
(эмпирическая) функция распределения
n
n
x
F
x
n
)
(
*
, где
x
n – количество элементов выборки, меньших чем
x
. Другими словами,
)
(
*
x
F
n
есть относительная частота появления события
}
{
x
X
A
в n независимых испытаниях. Главное различие между
)
(x
F
и
)
(
*
x
F
n
состоит в том, что
)
(x
F
определяет вероятность события A, а
8 выборочная функция распределения
)
(
*
x
F
n
– относительную частоту этого события.
Свойства функции
)
(
*
x
F
n
:
1.
*
0
( ) 1
n
F x
.
2.
)
(
*
x
F
n
– неубывающая функция.
3.
1
)
(
;
0
)
(
*
*
n
n
F
F
Функция
)
(
*
x
F
n
является «ступенчатой», имеются разрывы в точках, которым соответствуют наблюдаемые значения вариантов.
Величина скачка равна относительной частоте варианта.
Аналитически
)
(
*
x
F
n
задается следующим соотношением:
∗
0 при
;
при
,
2,3 … , ;
1 при
,
где
– соответствующие относительные частоты;
)
(i
x – элементы вариационного ряда (варианты).
Замечание. В случае интервального вариационного ряда под
)
(i
x понимается середина i-го частичного интервала. Эмпирическую функцию распределения непрерывной случайной величины так же называют «накопленная частота».
Перед вычислением
)
(
*
x
F
n
полезно построить дискретный или интервальный вариационный ряд.
Пример выполнения
Постановка задачи 1.На телефонной станции проводились наблюдения над числом неправильных соединений в минуту.
Наблюдения в течение 30 минут дали следующие результаты (табл. 1).
Таблица 1.
3 0 1 5 1 2 4 5 3 4 2 4 2 0 2 3 1 3 2 1 4 3 0 2 1 0 4 2 3 2
i
9
Требуется найти дискретный вариационный ряд, выборочную
(эмпирическую) функцию распределения данной выборки и построить ее график в среде ЭТ MS Excel.
Решение.
Очевидно, что число X является дискретной случайной величиной, а полученные данные есть значения этой случайной величины.
В результате выполнения операций ранжирования и группировки были получены шесть значений случайной величины (варианты): 0; 1; 2;
3; 4; 5. При этом значение 0 в этой группе встречается 4 раза, значение 1
– 5 раз, значение 2 – 8 раз, значение 3 – 6 раз, значение 4 – 5 раз, значение 5 – 2 раза. Вычисленные значения частот и частностей приведены в табл. 2.
Таблица 2.
Индекс
i
1, 2, 3, 4, 5, 6
Вариант
( )
i
x
0, 1, 2, 3, 4, 5
Частота
i
n
4, 5, 8, 6, 5, 2
Частность
i
30 2
,
30 5
,
30 6
,
30 8
,
30 5
,
30 4
Используя данный дискретный вариационный ряд (см. табл. 2), вычислим значения
)
(
*
x
F
n
по формуле, приведенной выше, и занесем их в табл. 3.
Таблица 3.
x
)
(
*
30
x
F
x
0 0
0 <x
1 30 4
1
1 <x
2 30 9
30 5
30 4
2 1
2 <x
3 30 17 30 8
30 5
30 4
3 2
1
3 <x
4 30 23 30 6
30 8
30 5
30 4
4 3
2 1
4 <x
5 30 28 30 5
30 6
30 8
30 5
30 4
5 4
3 2
1
x>5 1
30 30 30 2
30 28 6
5 4
3 2
1
10
По данным таблицы 3 построим график эмпирической функции распределения.
Решение задачи в среде ЭТ MS Excel. Для решения задачи в среде ЭТ MS Excel необходимо выполнить следующие действия:
1. Идентифицируйте свою работу, переименовав Лист1 в
Титульный лист и записав номер лабораторной работы, ее название, кто выполнил и проверил.
2. Переименуйте Лист 2 в Дискретный. Наберите массив 30 значений исходных данных выборки.
3. Найдите величины х
max
, х
min
, n, используя встроенные функции
ExcelМАКС, МИН и СЧЕТ.
11 4. Сформируйте столбец вариант x
(i) от 0 до 5 и с помощью функции ЧАСТОТА найдите частоту появления значений случайной величины Х в данном интервале.
Синтаксис функции:
ЧАСТОТА(массивданных;массивинтервалов).
Массив данных ‒ массив или ссылка на множество данных, для которых вычисляются частоты. В нашем случае это диапазон
B2:K2.Если массив данных не содержит значений, то функция
ЧАСТОТА возвращает массив нулей.
Массив интервалов ‒ массив или ссылка на множество интервалов, в которые группируются значения аргумента массив данных. В нашем случае это диапазон F7:F12. Если массив интервалов не содержит значений, то функция ЧАСТОТА возвращает количество элементов в аргументе Массив данных.
12
Функция ЧАСТОТА вводится как формула массива после выделения интервала смежных ячеек, в которые нужно вернуть полученный массив частот.
Количество элементов в возвращаемом массиве на единицу больше числа элементов в массиве интервалов. Дополнительный элемент в возвращаемом массиве содержит количество значений, больших, чем максимальное значение в интервалах, т.е. больше 5 в нашем случае.
Поскольку данная функция возвращает массив, она должна задаваться в качестве формулы массива и работа с ней завершается трехклавишной комбинацией CTRL+SHIFT+ENTER.
Функция ЧАСТОТА игнорирует пустые ячейки и тексты.
13 5. Сформируйте столбец частностей, вычислив значения ω
i
,i = 1,
…,6 по формуле
6. Сформируйте столбец значений выборочной функции распределения
)
(
*
x
F
n
. При этом первое значение в ячейке I7 просто копируется из ячейки Н7.
Следующее значение вычисляется как накопленная сумма предыдущего значения ω
1
из ячейки I7 и текущего значения ω
2 из ячейки Н8:
=I7+H8 .
14
Затем данная формула копируется автозаполнением в остальные ячейки диапазона, с выходом на значение, равное 1.
7. Построим график эмпирической функции распределения. С использованием штатных средств Мастера диаграмм ЭТ MS Excel построить ступенчатый график функции распределения дискретной случайной величины нельзя.
Покажем, как в MS Excel все-таки можно построить такой график.
7.1. Расположим данные полученного дискретного вариационного ряда так, как показано на рисунке ниже.
15
При этом данные копируются из предыдущей таблицы.
Используют контекстное меню команды Вставка: Параметры вставки →
Значения
7.2. В разреженную таким образом таблицу введем ряд дополнений. В ячейку К7 введем значение -2, а в ячейку К20 значение 7, это границы интервала [-2 ;7] на котором будет построен наш график. В оставшиеся пустые ячейки введем значения, чуть меньшие значений полученных вариант (см. случай а) ниже).
Случай а)
Случай б)
16
Два первых значения функции F(x) в ячейках L7 и L8 примем равным нулю, т.к.
0
)
(
*
x
F
n
при x ≤ x
(1)
. В оставшиеся пустые ячейки скопируем значения функции, расположенные выше (см. случай б) выше).
7.3. По данным, находящимся в диапазоне ячеек K7:L20, с помощью Мастера диаграмм, построим диаграмму типа Точечная без маркеров. Отформатируем диаграмму, убрав маркеры и задав линию, соединяющую табличные значения.
Т.к. функция
)
(x
F
‒ непрерывна слева в любой точке x, т. е.
)
(
)
0
(
x
F
x
F
, то устраним неоднозначность в точках разрыва,
17
“вырезав” соответствующие значения. Для этого построим точечный график по данным первого и последнего столбца полученного дискретного вариационного ряда.
8. Постройте пунктирные линии в вырезанных точках графика.
Для этого выделим точки графика и на вкладке Макет в группе Анализ нажмём кнопку Планки погрешностей, а затем выберем строку
Дополнительные параметры планок погрешностей … .
18
В диалоговом окне Формат планок погрешностей выполните установки, представленные ниже. Установите радиокнопку – пользовательская и в появившемся окне, в поле ввода Отрицательное значение ошибки введите значения столбца F(x).
19
Получили график функции распределения с пунктирными линиями.
20 9. Сделайте выводы и сохраните работу в вашем каталоге.
- Авторы
- Файлы работы
- Сертификаты
Коваль О.В. 1, Аверьянова С.Ю. 1
1Филиал Южного федерального университета в г.Новошахтинске Ростовской области
Комментарии
Текст работы размещён без изображений и формул.
Полная версия работы доступна во вкладке «Файлы работы» в формате PDF
овладеть навыками расчета числовых характеристик выборки с помощью Надстройки Пакет Анализа ЭТ MS Excel.
Краткая теория
В ЭТ MS Excel имеется набор мощных инструментов для работы с выборками и углубленного статистического анализа данных, называемый Пакет анализа, который может быть использован для решения задач статистической обработки выборочных данных.
Надстройка Пакет анализа вызывается командой главного меню Данные → Анализ данных. В появившемся окне Анализ данных выбираем пункт Описательная статистика.
Далее откроется окно Описательная статистика, в котором необходимо сделать нужные установки.
Входной диапазон. Ссылка на диапазон, содержащий анализируемые данные. Ссылка должна состоять не менее чем из двух смежных диапазонов данных, данные в которых расположены по строкам или столбцам.
Группирование. Установите переключатель в положение «По столбцам» или «По строкам» в зависимости от расположения данных во входном диапазоне.
Метки в первой строке/Метки в первом столбце. Если первая строка исходного диапазона содержит названия столбцов, установите переключатель в положение Метки в первой строке. Если названия строк находятся в первом столбце входного диапазона, установите переключатель в положение Метки в первом столбце. Если входной диапазон не содержит меток, то необходимые заголовки в выходном диапазоне будут созданы автоматически.
Уровень надежности. Установите флажок, если в выходную таблицу необходимо вывести границу доверительного интервала для среднего. В поле введите требуемое значение в процентах. Например, значение 95% вычисляет уровень надежности среднего с уровнем значимости 0,05.
К-ый наибольший. Установите флажок, если в выходную таблицу необходимо включить строку для k-го наибольшего значения для каждого диапазона данных. В соответствующем окне введите число k. Если k равно 1, эта строка будет содержать максимальное значение выборки.
К-ый наименьший. Установите флажок, если в выходную таблицу необходимо включить строку для k-го наименьшего значения для каждого диапазона данных. В соответствующем окне введите число k. Если k равно 1, эта строка будет содержать минимальное значение выборки.
Выходной диапазон. Введите ссылку на левую верхнюю ячейку выходного диапазона. Этот инструмент анализа выводит два столбца сведений для каждого набора данных. Левый столбец содержит метки статистических данных; правый столбец содержит статистические данные. Состоящий их двух столбцов диапазон статистических данных будет выведен для каждого столбца или для каждой строки входного диапазона в зависимости от положения переключателя Группирование.
Если хотим вывести результаты расчета на новый лист, то установите переключатель, чтобы открыть новый лист в книге и вставить результаты анализа, начиная с ячейки A1. Если в этом есть необходимость, введите имя нового листа в поле, расположенном напротив соответствующего положения переключателя.
Если хотим вывести результаты расчета в новой книге, то установите переключатель, чтобы открыть новую книгу и вставить результаты анализа в ячейку A1 на первом листе в этой книге.
Итоговая статистика. Установите флажок, если в выходном диапазоне необходимо получить по одному полю для каждого из следующих видов статистических данных, представленных в таблице 2.
Таблица 2.
Значение |
Примечания |
Среднее |
Выборочное среднее х=1n∙i=1nxi. Функция СРЗНАЧ. |
Стандартная ошибка |
Оценка среднеквадратичного отклонения выборочного среднего. Вычисляется по формуле 1n∙(n-1)∙i=1n(xi-x)2 |
Медиана |
Число, которое является серединой множества чисел, то есть половина чисел имеют значения большие, чем медиана, а половина чисел имеют значения меньшие, чем медиана. Функция МЕДИАНА. |
Мода |
Наиболее часто встречающееся значение в выборке. Если нет одинаковых значений, то возвращается значение ошибки #Н/Д. Функция МОДА.ОДН. |
Стандартное отклонение |
Оценка среднеквадратичного отклонения генеральной совокупности S=1n-1∙i=1n(xi-x)2. Функция СТАНДОТКЛОН.В. |
Дисперсия выборки |
Оценка дисперсии генеральной совокупности . Функция ДИСП.В. |
Эксцесс |
Выборочный эксцесс. Функция ЭКСЦЕСС. |
Асимметрич-ность |
Коэффициент асимметрии. Функция СКОС. |
Интервал |
Размах варьирования R = xmax ‒ xmin . |
Минимум |
Минимальное значение в выборке. Функция МИН. |
Максимум |
Максимальное значение в выборке. Функция МАКС. |
Сумма |
Сумма всех значений в выборке. Функция СУММ. |
Счет |
Объем выборки. Функция СЧЕТ. |
Наибольший |
k-тое наибольшее значение выборки. Если k=1, то выводится максимальное значение. Функция НАИБОЛЬШИЙ. |
Наименьший |
k-тое наименьшее значение выборки. Если k=1, то выводится минимальное значение. Функция НАИМЕНЬШИЙ |
Уровень надежности |
Параметр показывает возможность отклонения среднего по выборке, от среднего для генеральной совокупности, при заданном уровне надежности. |
Замечание. Следует обратить внимание на то, что расчет параметров в режиме Описательная статистика имеет ряд важных особенностей:
1. В качестве значений параметров: Стандартное отклонение, Дисперсия выборки, Эксцесс, Асимметричность – Excel генерирует оценки соответствующих параметров для генеральной совокупности, а не для выборки.
2. Для применения Описательной статистики предварительное ранжирование исходных данных не требуется: при вычислении показателей ранжирование выполняется автоматически.
3. Появление в ячейке Мода индикатора ошибки #Н/Д указывает на то, что в анализируемых данных нет одинаковых значений признака. В этом случае в качестве моды Мо выбирается то значение признака, которое соответствует максимальной ординате теоретической кривой распределения.
4. Индикатор ошибки #ДЕЛ/0! В ячейке Эксцесс и/или Асимметричность означает, что в результативной таблице стандартное отклонение является нулевым или же заданный входной диапазон данных содержит менее четырех элементов данных
5. Стандартная ошибка ‒ это разность между ожидаемыми и наблюдаемыми значениями исследуемого признака.
Стандартная ошибка или ошибка среднегонаходится из выражения
m=Sn .
Стандартная ошибка – это параметр, характеризующий степень возможного отклонения среднего значения, полученного на исследуемой ограниченной выборке, от истинного среднего значения, полученного на всей совокупности элементов. С помощью стандартной ошибки задается так называемый доверительный интервал. 95%-ый доверительный интервал, равный х ± 2т , обозначает диапазон, в который с вероятностью р = 0,95 (при достаточно большом числе наблюдений п>30) попадает среднее значение генеральной совокупности.
Пример выполнения
Постановка задачи. Приведены объемы дневной выручки (в тыс. руб.) 24 продавцов колбасных изделий, работающих в разных районах города (см. табл.1).
Таблица 1.
20,2 |
19,3 |
19,9 |
23,1 |
18,8 |
17,4 |
19,9 |
18,3 |
16,4 |
17,3 |
18,3 |
15,8 |
20,5 |
20,6 |
19,4 |
18,7 |
16,3 |
18,4 |
21,6 |
21,2 |
19,3 |
19,1 |
19,3 |
18,8 |
Требуется: выполнить описательную статистику выборки с помощью Надстройки Пакет Анализа ЭТ MS Excel.
Решение задачи в среде ЭТ MSExcel. Для решения задачи в среде ЭТ MS Excel необходимо выполнить следующие действия:
1. Идентифицируйте свою работу, переименовав Лист1 в Титульный лист и записав номер лабораторной работы, ее название, кто выполнил и проверил.
2. Переименуйте Лист 2 в Исходные данные и наберите столбец исходных данных.
3. Вычислите величины хmax, хmin, R, n, N, Nокругл., Δ и Δокругл. , используя встроенные функции Excel МАКС, МИН, СЧЕТ, КОРЕНЬ и ОКРУГЛ.
4. Сформируйте столбец интервалов группировки. Наберите команду Данные → Анализ данных → Гистограмма и в появившемся диалоговом окне выполните нужные установки. Отформатируйте полученную таблицу и построенную гистограмму выборки.
5. Наберите команду Данные → Анализ данных → Описательная статистика и в появившемся диалоговом окне выполните нужные установки.
6. Щелчок по кнопке «ОК» приводит к появлению результирующей таблицы статистических характеристик выборки.
7. Повторно вычислим найденные характеристики с помощью встроенных функций MS Excel или формул. Сравним полученные результаты.
8. Сделайте выводы и сохраните работу в вашем каталоге.
Исходные данные для самостоятельного решения
Задание. Имеется выборка объема n = 27 (табл. 2).
Требуется: выполнить описательную статистику выборки с помощью Надстройки Пакет Анализа ЭТ MS Excel.
Таблица 2.
№ варианта |
Выборка |
||||||||
1 |
22,5 |
20,2 |
19,3 |
19,9 |
23,1 |
18,8 |
17,4 |
21,6 |
19,1 |
21,6 |
19,9 |
18,3 |
16,4 |
17,3 |
18,3 |
15,8 |
21,2 |
19,3 |
|
17,8 |
20,5 |
20,6 |
19,4 |
18,7 |
16,3 |
18,4 |
19,3 |
18,8 |
|
2 |
18,8 |
20,2 |
19,3 |
19,9 |
23,2 |
22,5 |
17,4 |
21,8 |
19,2 |
19,4 |
18,7 |
16,3 |
18,4 |
19,3 |
18,8 |
19,4 |
18,7 |
16,3 |
|
20,5 |
20,6 |
19,4 |
18,7 |
16,3 |
18,4 |
19,3 |
18,8 |
17,8 |
|
2 |
20,2 |
19,3 |
19,9 |
23,1 |
18,8 |
17,4 |
21,6 |
19,1 |
22,4 |
18,7 |
20,2 |
19,3 |
19,9 |
23,2 |
22,5 |
17,4 |
21,8 |
19,2 |
|
18,1 |
19,8 |
18,2 |
16,4 |
17,2 |
21,8 |
15,8 |
21,2 |
19,2 |
|
3 |
19,4 |
18,7 |
16,3 |
18,4 |
19,3 |
18,8 |
19,4 |
18,7 |
16,3 |
18,5 |
20,6 |
19,4 |
20,7 |
16,3 |
18,4 |
19,3 |
18,8 |
17,8 |
|
20,1 |
19,3 |
19,9 |
23,1 |
18,8 |
17,4 |
21,6 |
19,1 |
22,4 |
|
4 |
19,7 |
20,2 |
19,3 |
18,9 |
23,2 |
22,5 |
17,4 |
21,8 |
19,2 |
18,3 |
19,8 |
18,2 |
16,4 |
17,2 |
21,8 |
15,8 |
21,2 |
19,2 |
|
19,7 |
18,7 |
16,3 |
18,4 |
19,3 |
18,8 |
19,4 |
18,7 |
16,3 |
|
5 |
19,4 |
20,7 |
16,3 |
18,4 |
19,3 |
18,8 |
17,8 |
18,7 |
20,2 |
19,9 |
23,1 |
18,8 |
17,4 |
21,6 |
19,1 |
22,4 |
18,1 |
19,8 |
|
19,3 |
18,9 |
23,2 |
22,5 |
17,4 |
21,8 |
19,2 |
19,4 |
18,7 |
|
6 |
18,7 |
16,3 |
18,4 |
19,3 |
18,8 |
19,4 |
18,7 |
18,5 |
20,6 |
20,6 |
19,4 |
20,7 |
16,3 |
18,4 |
19,3 |
18,8 |
18,4 |
19,3 |
|
19,3 |
19,9 |
23,1 |
18,8 |
17,4 |
21,6 |
19,1 |
18,4 |
19,3 |
|
7 |
16,3 |
18,4 |
19,3 |
18,8 |
19,4 |
18,7 |
18,5 |
20,6 |
18,7 |
19,4 |
20,7 |
16,3 |
18,4 |
19,3 |
18,8 |
18,4 |
19,3 |
20,6 |
|
19,9 |
23,1 |
18,8 |
17,4 |
21,6 |
19,1 |
18,4 |
19,3 |
19,3 |
|
8 |
19,3 |
19,9 |
23,1 |
18,8 |
17,4 |
21,6 |
19,1 |
22,5 |
20,2 |
18,3 |
16,4 |
17,3 |
18,3 |
15,8 |
21,2 |
19,3 |
21,6 |
19,9 |
|
20,6 |
19,4 |
18,7 |
16,3 |
18,4 |
19,3 |
18,8 |
17,8 |
20,5 |
|
9 |
19,4 |
20,7 |
16,3 |
18,4 |
19,3 |
18,8 |
17,8 |
18,7 |
20,2 |
19,9 |
23,1 |
18,8 |
17,4 |
21,6 |
19,1 |
22,4 |
18,1 |
19,8 |
|
19,3 |
18,9 |
23,2 |
22,5 |
17,4 |
21,8 |
19,2 |
19,4 |
18,7 |
|
10 |
18,7 |
16,3 |
18,4 |
19,3 |
18,8 |
19,4 |
18,7 |
18,5 |
20,6 |
20,6 |
19,4 |
20,7 |
16,3 |
18,4 |
19,3 |
18,8 |
18,4 |
19,3 |
|
16,4 |
20,4 |
20,8 |
19,4 |
18,7 |
17,8 |
18,4 |
19,4 |
18,8 |
Просмотров работы: 4378
Код для цитирования:
Лабораторный практикум по математической статистике направлен на отработку навыка исследования выборки из генеральной совокупности. Также предполагается использования статистического аппарата Microsoft Excel. Может быть использован на элективных курсах для старших классов или при обучении по дисциплине «Теория вероятностей и математическая статистика»
- Файлы
- Академическая и специальная литература
- Математика
- Теория вероятностей и математическая статистика
- Математическая статистика
-
Файл формата
pdf - размером 2,67 МБ
- Добавлен пользователем Николай Устинов 04.12.2016 16:18
- Описание отредактировано 04.12.2016 21:47
Учебное пособие. -Тверь: Тверской государственный технический университет, 2016. -104 с. ISBN: 978-5-7995-0839-5
Рассмотрены задачи оценки законов распределения, точечного и интервального оценивания числовых характеристик и параметров распределения, проверки статистических гипотез, а также элементы корреляционного, регрессионного и дисперсионного анализа.
Материал изложен таким образом, что сначала вводятся основные понятия, перечисляются основные формулы и алгоритмы с указанием условий их применения и получения, затем рассматривается решение типовых задач, многие из которых прикладного характера. После этого приводятся задания и методики выполнения лабораторных работ в среде MS Excel 2010. В конце каждой главы приведены задания для самостоятельного решения.
Рекомендуется для студентов вузов, аспирантов и всех, кто связан с задачами принятия решений на основе имеющегося статистического материала.
- Чтобы скачать этот файл зарегистрируйтесь и/или войдите на сайт используя форму сверху.
- Регистрация
- Узнайте сколько стоит уникальная работа конкретно по Вашей теме:
- Сколько стоит заказать работу?