What is descriptive statistics in excel

Descriptive Statistics in Excel summarizes the statistical data using the available information in the dataset. This technique also provides us with various types of output options.

The Excel Descriptive Statistics function is an inbuilt tool found in the “Data Analysis” group of the “Data” tab.

Table of contents
  • What Is Descriptive Statistics In Excel?
    • How To Enable Descriptive Statistics In Excel?
    • How To Use Descriptive Statistics In Excel?
    • Examples
    • Important Things To Note
    • Frequently Asked Questions (FAQs)
    • Download Template
    • Recommended Articles
  • Descriptive Statistics in Excel derives a bundle of statistical results such as Mean, Std Dev, Median, Mode, Skew, Range, Min, Max, Count, etc.,
  • If the “Data Analysis” option is not seen, we must enable it from the Analysis ToolPak first, and then it will be found in the “Data” tab ribbon.
  • As per the options selected in the “Descriptive Statistics” window, the required details will be derived, i.e., the SUMMARY will be based on the data selection we make in the step shown.
Descriptive Statistics in Excel - Key Takeaways

How To Enable Descriptive Statistics In Excel?

The steps to enable the Descriptive Statistics option in Excel are,

  1. First, we must go to “File”, and then “Options.”

    Descriptive statistics step 1

  2. Next, we need to go to “Add-ins.”

    Descriptive statistics step 2

  3. We may see all the inactive applications under “Add-ins” on the right-hand side. Select “Analysis Toolpak”, and click “Go.”

    Descriptive statistics step 3

  4. Now we must see the “Data Analysis” option under the “Data” tab.

    Descriptive statistics step 5

    We must click on “Data Analysis.” Thus, we may see all the available analysis techniques like Anova, T-Test, F-Test in Excel, Correlation, Histogram, Regression, Descriptive Statistics, and many more.

  5. Now, we will have all the add-ins available for Excel. Select “Analysis ToolPak”, and click “OK.”

    Descriptive statistics step 4

How To Use Descriptive Statistics In Excel?

We can use Descriptive Statistics In Excel as follows:

First, select the “Data” tab → go to the “Analysis” group → click the “Data Analysis” option, as shown below.

[Note: If the “Data Analysis” option is not found in the “Data” tab ribbon, then we must enable it following the procedure we learned in the previous section.]

How to Use Descriptive Statistics in Excel - 1

The “Data Analysis” window opens. Here, select the “Descriptive Analysis” option from the “Analysis Tools” category, and click “OK”, as shown below.

How to Use Descriptive Statistics in Excel - 2

Then, the “Descriptive Statistics” window opens. Here, add the required details such as the cell range in the “Input Range:”, check/tick the “Summary Statistics” checkbox, and click “OK” to get the Descriptive Summary.

How to Use Descriptive Statistics in Excel - 3

Examples

We will consider some advanced scenarios to use Descriptive Statistics In Excel.

Example #1

Now, let us look at the simple data from a test, which includes the scores of 10 students. Using this data of scores, we need Descriptive Statistics data analysis.

Descriptive statistics Example 1

We must first copy this data to our Excel sheet.

  • Step 1: Then, Go to Data → Data Analysis.

Descriptive statistics Example 1-1

  • Step 2: On clicking “Data Analysis,” we get the list of all the available analysis techniques. After that, scroll down and select “Descriptive Statistics”.

Descriptive statistics Example 1-2

  • Step 3: Under “Input Range,” select the “Scores range,” including the heading. Then, check “Labels in the first row”, choose “Output Range,” give cell reference as D1 and check summary statistics.

Descriptive statistics Example 1-3

  • Step 4: Next, we must click “OK” to complete the task. In the D1 cell, we may see the summary report of Descriptive Statistics data analysis.

Descriptive statistics Example 1-4

We got various statistical results from the selected data, i.e., scores.

The average score (mean) is 70.2, and the standard deviation is 15.97. Also, the minimum score is 46. At the same time, the maximum score is 91. So, the total score sum is 702, and the total number of students in this sample is 10. Like this, we have all kinds of statistical results.

Example #2

We have learned how Descriptive Statistics works in the previous example. Download the workbook to this Descriptive Statistics in Excel.

We have a list of students, their age, gender, height, weight, weekly hours of study, and recent examination score details for a few students.

Example 2

By looking at the above data, the common questions are: What is the average age of the student group? Average weight, Average exam score, Average height, Maximum value in each category, Minimum value, etc.

We have as many as five different categories to tell the statistical results. Therefore, we can conduct a descriptive statistical analysis to find all these.

  • Step 1: We must go to DataData Analysis.

Example 2-1

  • Step 2: On clicking “Data Analysis,” we get the list of all the available analysis techniques. After that, scroll down and select “Descriptive Statistics.”

Example 2-1

  • Step 3: Under “Input Range,” we must select all the category ranges, including headings, i.e., C1:G26.

Example 2-3

We can get the summary result in the same worksheet, different worksheets, and workbooks. Then, based on our selection, it will show the summary report. We have demonstrated the summary in the same worksheet, i.e., from the J1 cell.

Example 2-4

Since we have selected the headings, we need to tick the checkbox “Labels in the first row.” Because we have chosen the headers, it will be helpful while showing the results. Otherwise, understanding each category’s results would not be very clear.

Example 2-5

And then, tick the Summary Statistics option.

Example 2-6

  • Step 4: After that, we must click “OK” to complete the test. We will get the Descriptive Statistics results from the J1 cell.

Descriptive statistics Example 2-4

It has shown up all the statistical results for all five categories. So, for example, the total number of students is 25, the average age is 26.64, the average height is 5.244, the average weight is 67.44, and the average exam score is 57.8, which is relatively low compared to modern-day standards and many other results.

Important Things To Note

  • Label as first row” means the data range we have selected includes headings.
  • We can find the average value using the AVERAGE function in excel and the maximum and minimum value using the MAX and MIN functions, respectively.

Frequently Asked Questions (FAQs)

1. What is the purpose of Descriptive Statistics in Excel?

Descriptive Statistics gets the summary of the selected dataset. It helps us derive the details related to the statistical variations such as Mean, Mode, Median, etc.

2. Where is the Descriptive Statistics in Excel found?

We can use Descriptive Statistics In Excel as follows:

First, select the “Data” tab → go to the “Analysis” group → click the “Data Analysis” option, as shown below.

FAQ 2 - 1

The “Data Analysis” window opens. Here, select the “Descriptive Analysis” option from the “Analysis Tools” category, and click “OK”, as shown below.

FAQ 2 - 2

3. Why is the Descriptive Statistics in Excel not working?

The Descriptive Statistics may give an error if we have not selected any of the following options such as “Summary Statistics”, “Confidence Level for Mean”, etc., in the following image step.

How to Use Descriptive Statistics in Excel - FAQ 3

Download Template

This article must help understand Descriptive Statistics in Excel with its formulas and examples. You can download the template here to use it instantly.

You can download this Descriptive Statistics Excel Template here – Descriptive Statistics Excel Template

Recommended Articles

This article is a guide to Descriptive Statistics in Excel. Here, we discuss using descriptive statistics tools in Excel and practical examples, and downloadable Excel templates. You may learn more about Excel from the following articles: –

  • Examples of Regression Formula
  • Excel Correlation Matrix – Examples
  • T-TEST Excel

Содержание

  1. Применение описательной статистики в Microsoft Excel
  2. Использование описательной статистики
  3. Подключение «Пакета анализа»
  4. Применение инструмента «Описательная статистика»
  5. How to Get Descriptive Statistics in Excel? (Quick and Easy)
  6. Descriptive Statistics in Excel
  7. Enabling Data Analysis Toolpak
  8. Getting the Descriptive Analysis
  9. Descriptive Statistics in Excel
  10. What is Descriptive Statistics in Excel?
  11. Steps to Enable Descriptive Statistics in Excel
  12. How to use Descriptive Statistics in Excel?
  13. Example #1
  14. Example #2
  15. Things to Remember
  16. Recommended Articles

Применение описательной статистики в Microsoft Excel

Пользователи Эксель знают, что данная программа имеет очень широкий набор статистических функций, по уровню которых она вполне может потягаться со специализированными приложениями. Но кроме того, у Excel имеется инструмент, с помощью которого производится обработка данных по целому ряду основных статистических показателей буквально в один клик.

Этот инструмент называется «Описательная статистика». С его помощью можно в очень короткие сроки, использовав ресурсы программы, обработать массив данных и получить о нем информацию по целому ряду статистических критериев. Давайте взглянем, как работает данный инструмент, и остановимся на некоторых нюансах работы с ним.

Использование описательной статистики

Под описательной статистикой понимают систематизацию эмпирических данных по целому ряду основных статистических критериев. Причем на основе полученного результата из этих итоговых показателей можно сформировать общие выводы об изучаемом массиве данных.

В Экселе существует отдельный инструмент, входящий в «Пакет анализа», с помощью которого можно провести данный вид обработки данных. Он так и называется «Описательная статистика». Среди критериев, которые высчитывает данный инструмент следующие показатели:

  • Медиана;
  • Мода;
  • Дисперсия;
  • Среднее;
  • Стандартное отклонение;
  • Стандартная ошибка;
  • Асимметричность и др.

Рассмотрим, как работает данный инструмент на примере Excel 2010, хотя данный алгоритм применим также в Excel 2007 и в более поздних версиях данной программы.

Подключение «Пакета анализа»

Как уже было сказано выше, инструмент «Описательная статистика» входит в более широкий набор функций, который принято называть Пакет анализа. Но дело в том, что по умолчанию данная надстройка в Экселе отключена. Поэтому, если вы до сих пор её не включили, то для использования возможностей описательной статистики, придется это сделать.

  1. Переходим во вкладку «Файл». Далее производим перемещение в пункт «Параметры».
  2. В активировавшемся окне параметров перемещаемся в подраздел «Надстройки». В самой нижней части окна находится поле «Управление». Нужно в нем переставить переключатель в позицию «Надстройки Excel», если он находится в другом положении. Вслед за этим жмем на кнопку «Перейти…».
  3. Запускается окно стандартных надстроек Excel. Около наименования «Пакет анализа» ставим флажок. Затем жмем на кнопку «OK».

После вышеуказанных действий надстройка Пакет анализа будет активирована и станет доступной во вкладке «Данные» Эксель. Теперь мы сможем использовать на практике инструменты описательной статистики.

Применение инструмента «Описательная статистика»

Теперь посмотрим, как инструмент описательная статистика можно применить на практике. Для этих целей используем готовую таблицу.

  1. Переходим во вкладку «Данные» и выполняем щелчок по кнопке «Анализ данных», которая размещена на ленте в блоке инструментов «Анализ».
  2. Открывается список инструментов, представленных в Пакете анализа. Ищем наименование «Описательная статистика», выделяем его и щелкаем по кнопке «OK».
  3. После выполнения данных действий непосредственно запускается окно «Описательная статистика».

В поле «Входной интервал» указываем адрес диапазона, который будет подвергаться обработке этим инструментом. Причем указываем его вместе с шапкой таблицы. Для того, чтобы внести нужные нам координаты, устанавливаем курсор в указанное поле. Затем, зажав левую кнопку мыши, выделяем на листе соответствующую табличную область. Как видим, её координаты тут же отобразятся в поле. Так как мы захватили данные вместе с шапкой, то около параметра «Метки в первой строке» следует установить флажок. Тут же выбираем тип группирования, переставив переключатель в позицию «По столбцам» или «По строкам». В нашем случае подходит вариант «По столбцам», но в других случаях, возможно, придется выставить переключатель иначе.

Выше мы говорили исключительно о входных данных. Теперь переходим к разбору настроек параметров вывода, которые расположены в этом же окне формирования описательной статистики. Прежде всего, нам нужно определиться, куда именно будут выводиться обработанные данные:

В первом случае нужно указать конкретный диапазон на текущем листе или его верхнюю левую ячейку, куда будет выводиться обработанная информация. Во втором случае следует указать название конкретного листа данной книги, где будет отображаться результат обработки. Если листа с таким наименованием в данный момент нет, то он будет создан автоматически после того, как вы нажмете на кнопку «OK». В третьем случае никаких дополнительных параметров указывать не нужно, так как данные будут выводиться в отдельном файле Excel (книге). Мы выбираем вывод результатов на новом рабочем листе под названием «Итоги».

Далее, если вы хотите чтобы выводилась также итоговая статистика, то нужно установить флажок около соответствующего пункта. Также можно установить уровень надежности, поставив галочку около соответствующего значения. По умолчанию он будет равен 95%, но его можно изменить, внеся другие числа в поле справа.

Кроме этого, можно установить галочки в пунктах «K-ый наименьший» и «K-ый наибольший», установив значения в соответствующих полях. Но в нашем случае этот параметр так же, как и предыдущий, не является обязательным, поэтому флажки мы не ставим.

После того, как все указанные данные внесены, жмем на кнопку «OK».

  • После выполнения этих действий таблица с описательной статистикой выводится на отдельном листе, который был нами назван «Итоги». Как видим, данные представлены сумбурно, поэтому их следует отредактировать, расширив соответствующие колонки для более удобного просмотра.
  • После того, как данные «причесаны» можно приступать к их непосредственному анализу. Как видим, при помощи инструмента описательной статистики были рассчитаны следующие показатели:
    • Асимметричность;
    • Интервал;
    • Минимум;
    • Стандартное отклонение;
    • Дисперсия выборки;
    • Максимум;
    • Сумма;
    • Эксцесс;
    • Среднее;
    • Стандартная ошибка;
    • Медиана;
    • Мода;
    • Счет.
  • Если какие-то из вышеуказанных данных для конкретного вида анализа не нужны, то их можно удалить, чтобы они не мешали. Далее производится анализ с учетом статистических закономерностей.

    Как видим, с помощью инструмента «Описательная статистика» можно сразу получить результат по целому ряду критериев, которые в ином случае рассчитывались с применением отдельно предназначенной для каждого расчета функцией, что заняло бы значительное время у пользователя. А так, все эти расчеты можно получить практически в один клик, использовав соответствующий инструмент — Пакета анализа.

    Источник

    How to Get Descriptive Statistics in Excel? (Quick and Easy)

    If you’re working with large datasets in excel, getting Descriptive Statistics for this data set could be useful.

    Descriptive Statistic quickly summarizes your data and gives you a few data points that you can use to quickly understand the entire data set.

    While you can also calculate each of these statistical values individually, using the descriptive statistics option in Excel quickly gives you all this data in one single place (and it’s a lot faster than using different formulas to calculate different values).

    In this short tutorial, I will show you how to get Descriptive Statistics in Excel.

    This Tutorial Covers:

    Descriptive Statistics in Excel

    To get the Descriptive Statistics in Excel, you need to have the Data Analysis Toolpak enabled.

    You can check whether you already have it enabled by going to the Data tab.

    If you see the Data Analysis option in the Analysis group, you already have it enabled (and you can skip the next section and go directly to the ‘Getting Descriptive Analysis’ section).

    In case you do not see the data analysis option in the data tab, follow the steps in the next section to enable it.

    Enabling Data Analysis Toolpak

    Below are the steps to enable the Data Analysis Toolpak in Excel:

    1. Open any Excel document
    2. Click the File tab

    1. Click on Options. This will open the Excel Options dialog box

    1. In the Excel Options dialog box, click on Add-ins in the left pane

    1. From the Manage drop-down (which is at the bottom of the dialog box), select ‘Excel Add-ins’

    1. In the Add-ins dialog box that shows up, check the Analysis Toolpak option

    The other steps would enable the Data Analysis toolpak and you will be able to use it on all your Excel Workbooks.

    Getting the Descriptive Analysis

    Now that the Data Analysis Toolpak is enabled, let’s see how to get the descriptive statistics using it.

    Suppose you have a data set as shown below where I have the sales data of different products of a company. For this data, I want to get descriptive statistics.

    Below are the steps to do this:

    1. Click the Data tab
    2. In the Analysis group, click on Data Analysis

    1. In the Data Analysis dialog box that opens, click on Descriptive Statistics

    1. Click OK
    2. In the Descriptive Statistics dialog box, specify the input range that has the data. Note that I have only used Column B as the data source (as you can only use numeric data as the input here)

    1. If your data has headers, check the ‘Labels in first row’ option

    1. Select the New Worksheet Ply option (this will give the result in a new sheet)

    1. Select the statistics options you want (you need to select atleast one, and can select all four)

    The above steps would insert a new sheet and you will get the statistics as shown below:

    Note that you can specify the following in step 8:

    1. Confidence Level for mean – the default is 95%, but you can change the value
    2. Kth Largest – the default is 1, but you can change it. If you enter 3 here, it will give you the third largest value from the dataset
    3. Kth Smallest – the default is 1, but you can change it. If you enter 3 here, it will give you the third smallest value from the dataset

    Note that the resulting values you get are static values.

    In case your original data changes and you again want to get the Descriptive Statistics, you will have to repeat the above steps again.

    So this is how you can quickly get Descriptive Statistics in Microsoft Excel.

    I hope you found this tutorial useful.

    Other Excel Tutorials you may also like:

    Источник

    Descriptive Statistics in Excel

    What is Descriptive Statistics in Excel?

    Summarizing available information in statistics is known as descriptive statistics. In Excel, we also have a function for descriptive statistics. This inbuilt tool is located in the “Data” tab, and then in the “Data Analysis,” we will find the method for the descriptive statistics. This technique also provides us with various types of output options.

    Table of contents

    Steps to Enable Descriptive Statistics in Excel

    The following are the steps to enable descriptive statistics in excel.

      First, we must go to “File” and then “Options.”

    Next, we need to go to “Add-ins.”

    We may see all the inactive applications under “Add-ins” on the right-hand side. Select “Analysis Toolpak” and click on “Go.”

    Now we must see the “Data Analysis” option under the “Data” tab.

    We must click on “Data Analysis.” Thus, we may see all the available analysis techniques like Anova, T-Test, F-Test in Excel, Correlation, Histogram, Regression, Descriptive Statistics, and many more.

    Now, we will have all the add-ins available for Excel. Select “Analysis ToolPak” and click on “OK.”

    How to use Descriptive Statistics in Excel?

    Example #1

    Now, let us look at the simple data from a test, which includes the scores of 10 students. Using this data of scores, we need descriptive statistics data analysis.

    We must first copy this data to our Excel sheet.

    • Step 1: Then, Go to Data > Data Analysis.

    • Step 2: On clicking on “Data Analysis,” we get the list of all the available analysis techniques. After that, scroll down and select “Descriptive Statistics.”

    • Step 3: Under “Input Range,” select the ” Scores range,” including the heading. Then, check “Labels in the first row”, choose “Output Range,” give cell referenceCell ReferenceCell reference in excel is referring the other cells to a cell to use its values or properties. For instance, if we have data in cell A2 and want to use that in cell A1, use =A2 in cell A1, and this will copy the A2 value in A1.read more as D1 and check summary statistics.

    • Step 4: Next, we must click on “OK” to complete the task. In the D1 cell, we may see the summary report of descriptive statistics data analysis.

    We got all kinds of statistical results from the selected data, i.e., scores.

    The average score (mean) is 70.2, the standard deviation is 15.97. Also, the minimum score is 46. At the same time, the maximum score is 91. So, the total score sum is 702, and the total number of students in this sample is 10. Like this, we have all kinds of statistical results.

    Example #2

    We have learned how descriptive statistics works in the previous example. Download the workbook to this descriptive statistics in Excel.

    We have a list of students, their age, gender, height, weight, weekly hours of study, and recent examination score details for a few students.

    By looking at the above data, the common questions are: What is the average age of the student group? Average weight, Average exam score, Average height, Maximum value in each category, Minimum value, etc.

    We have as many as five different categories to tell the statistical results. Therefore, we can conduct a descriptive statistical analysis to find all these.

    • Step 1: We mustgo to Data > Data Analysis.

    • Step 2: On clicking on “Data Analysis,” we get the list of all the available analysis techniques. After that, scroll down and select “Descriptive Statistics.”

    • Step 3: Under “Input Range,” we must select all the category ranges, including headings, i.e., C1:G26.

    We can get the summary result in the same worksheet, different worksheets, and different workbooks. Then, based on the selection we give, it will show the summary report. We have demonstrated the summary in the same worksheet, i.e., from the J1 cell.

    Since we have selected the headings, we need to tick the checkbox “Labels in the first row.” Because we have chosen the headers, it will be helpful while showing the results. Otherwise, understanding each category’s results would not be very clear.

    And then tick the Summary Statistics option.

    It has shown up all the statistical results for all five categories. So, for example, the total number of students is 25, the average age is 26.64, the average height is 5.244, the average weight is 67.44, and the average exam score is 57.8, which is relatively low compared to modern-day standards and many other results.

    Things to Remember

    • Descriptive statistics in Excel is a bundle of many statistical results.
    • “Label as first row” means the data range we have selected includes headings.
    • We can find the average value using an AVERAGE in excelAVERAGE In ExcelThe AVERAGE function in Excel gives the arithmetic mean of the supplied set of numeric values. This formula is categorized as a Statistical Function. The average formula is =AVERAGE(read more function like this maximum value by MAX and minimum value by MIN functions.
    • It will display the SUMMARY based on the selection we make.

    Recommended Articles

    This article is a guide to Descriptive Statistics in Excel. Here, we discuss using descriptive statistics tools in Excel and practical examples, and downloadable Excel templates. You may learn more about Excel from the following articles: –

    Источник

    Содержание

    • Использование описательной статистики
      • Подключение «Пакета анализа»
      • Применение инструмента «Описательная статистика»
    • Вопросы и ответы

    Описательная статистика в Microsoft Excel

    Пользователи Эксель знают, что данная программа имеет очень широкий набор статистических функций, по уровню которых она вполне может потягаться со специализированными приложениями. Но кроме того, у Excel имеется инструмент, с помощью которого производится обработка данных по целому ряду основных статистических показателей буквально в один клик.

    Этот инструмент называется «Описательная статистика». С его помощью можно в очень короткие сроки, использовав ресурсы программы, обработать массив данных и получить о нем информацию по целому ряду статистических критериев. Давайте взглянем, как работает данный инструмент, и остановимся на некоторых нюансах работы с ним.

    Использование описательной статистики

    Под описательной статистикой понимают систематизацию эмпирических данных по целому ряду основных статистических критериев. Причем на основе полученного результата из этих итоговых показателей можно сформировать общие выводы об изучаемом массиве данных.

    В Экселе существует отдельный инструмент, входящий в «Пакет анализа», с помощью которого можно провести данный вид обработки данных. Он так и называется «Описательная статистика». Среди критериев, которые высчитывает данный инструмент следующие показатели:

    • Медиана;
    • Мода;
    • Дисперсия;
    • Среднее;
    • Стандартное отклонение;
    • Стандартная ошибка;
    • Асимметричность и др.

    Рассмотрим, как работает данный инструмент на примере Excel 2010, хотя данный алгоритм применим также в Excel 2007 и в более поздних версиях данной программы.

    Подключение «Пакета анализа»

    Как уже было сказано выше, инструмент «Описательная статистика» входит в более широкий набор функций, который принято называть Пакет анализа. Но дело в том, что по умолчанию данная надстройка в Экселе отключена. Поэтому, если вы до сих пор её не включили, то для использования возможностей описательной статистики, придется это сделать.

    1. Переходим во вкладку «Файл». Далее производим перемещение в пункт «Параметры».
    2. Переход в параметры в Microsoft Excel

    3. В активировавшемся окне параметров перемещаемся в подраздел «Надстройки». В самой нижней части окна находится поле «Управление». Нужно в нем переставить переключатель в позицию «Надстройки Excel», если он находится в другом положении. Вслед за этим жмем на кнопку «Перейти…».
    4. Переход в надстройки в Microsoft Excel

    5. Запускается окно стандартных надстроек Excel. Около наименования «Пакет анализа» ставим флажок. Затем жмем на кнопку «OK».

    Включение надстройки Пакет анализа в Microsoft Excel

    После вышеуказанных действий надстройка Пакет анализа будет активирована и станет доступной во вкладке «Данные» Эксель. Теперь мы сможем использовать на практике инструменты описательной статистики.

    Применение инструмента «Описательная статистика»

    Теперь посмотрим, как инструмент описательная статистика можно применить на практике. Для этих целей используем готовую таблицу.

    1. Переходим во вкладку «Данные» и выполняем щелчок по кнопке «Анализ данных», которая размещена на ленте в блоке инструментов «Анализ».
    2. Запуск инструмента Анализ данных в Microsoft Excel

    3. Открывается список инструментов, представленных в Пакете анализа. Ищем наименование «Описательная статистика», выделяем его и щелкаем по кнопке «OK».
    4. Переход к Описательной статистике в Microsoft Excel

    5. После выполнения данных действий непосредственно запускается окно «Описательная статистика».

      В поле «Входной интервал» указываем адрес диапазона, который будет подвергаться обработке этим инструментом. Причем указываем его вместе с шапкой таблицы. Для того, чтобы внести нужные нам координаты, устанавливаем курсор в указанное поле. Затем, зажав левую кнопку мыши, выделяем на листе соответствующую табличную область. Как видим, её координаты тут же отобразятся в поле. Так как мы захватили данные вместе с шапкой, то около параметра «Метки в первой строке» следует установить флажок. Тут же выбираем тип группирования, переставив переключатель в позицию «По столбцам» или «По строкам». В нашем случае подходит вариант «По столбцам», но в других случаях, возможно, придется выставить переключатель иначе.

      Lumpics.ru

      Выше мы говорили исключительно о входных данных. Теперь переходим к разбору настроек параметров вывода, которые расположены в этом же окне формирования описательной статистики. Прежде всего, нам нужно определиться, куда именно будут выводиться обработанные данные:

      • Выходной интервал;
      • Новый рабочий лист;
      • Новая рабочая книга.

      В первом случае нужно указать конкретный диапазон на текущем листе или его верхнюю левую ячейку, куда будет выводиться обработанная информация. Во втором случае следует указать название конкретного листа данной книги, где будет отображаться результат обработки. Если листа с таким наименованием в данный момент нет, то он будет создан автоматически после того, как вы нажмете на кнопку «OK». В третьем случае никаких дополнительных параметров указывать не нужно, так как данные будут выводиться в отдельном файле Excel (книге). Мы выбираем вывод результатов на новом рабочем листе под названием «Итоги».

      Далее, если вы хотите чтобы выводилась также итоговая статистика, то нужно установить флажок около соответствующего пункта. Также можно установить уровень надежности, поставив галочку около соответствующего значения. По умолчанию он будет равен 95%, но его можно изменить, внеся другие числа в поле справа.

      Кроме этого, можно установить галочки в пунктах «K-ый наименьший» и «K-ый наибольший», установив значения в соответствующих полях. Но в нашем случае этот параметр так же, как и предыдущий, не является обязательным, поэтому флажки мы не ставим.

      После того, как все указанные данные внесены, жмем на кнопку «OK».

    6. Окно Описательной статистики в Microsoft Excel

    7. После выполнения этих действий таблица с описательной статистикой выводится на отдельном листе, который был нами назван «Итоги». Как видим, данные представлены сумбурно, поэтому их следует отредактировать, расширив соответствующие колонки для более удобного просмотра.
    8. Лист Итоги с итоговыми результатами в Microsoft Excel

    9. После того, как данные «причесаны» можно приступать к их непосредственному анализу. Как видим, при помощи инструмента описательной статистики были рассчитаны следующие показатели:
      • Асимметричность;
      • Интервал;
      • Минимум;
      • Стандартное отклонение;
      • Дисперсия выборки;
      • Максимум;
      • Сумма;
      • Эксцесс;
      • Среднее;
      • Стандартная ошибка;
      • Медиана;
      • Мода;
      • Счет.

    Отредактированные итоги описательной статистики в Microsoft Excel

    Если какие-то из вышеуказанных данных для конкретного вида анализа не нужны, то их можно удалить, чтобы они не мешали. Далее производится анализ с учетом статистических закономерностей.

    Урок: Статистические функции в Excel

    Как видим, с помощью инструмента «Описательная статистика» можно сразу получить результат по целому ряду критериев, которые в ином случае рассчитывались с применением отдельно предназначенной для каждого расчета функцией, что заняло бы значительное время у пользователя. А так, все эти расчеты можно получить практически в один клик, использовав соответствующий инструмент — Пакета анализа.

    Еще статьи по данной теме:

    Помогла ли Вам статья?

    If you’re working with large datasets in excel, getting Descriptive Statistics for this data set could be useful.

    Descriptive Statistic quickly summarizes your data and gives you a few data points that you can use to quickly understand the entire data set.

    While you can also calculate each of these statistical values individually, using the descriptive statistics option in Excel quickly gives you all this data in one single place (and it’s a lot faster than using different formulas to calculate different values).

    In this short tutorial, I will show you how to get Descriptive Statistics in Excel.

    Descriptive Statistics in Excel

    To get the Descriptive Statistics in Excel, you need to have the Data Analysis Toolpak enabled.

    You can check whether you already have it enabled by going to the Data tab.

    If you see the Data Analysis option in the Analysis group, you already have it enabled (and you can skip the next section and go directly to the ‘Getting Descriptive Analysis’ section).

    Data analysis option in Excel

    In case you do not see the data analysis option in the data tab, follow the steps in the next section to enable it.

    Enabling Data Analysis Toolpak

    Below are the steps to enable the Data Analysis Toolpak in Excel:

    1. Open any Excel document
    2. Click the File tab
    Click the File option
    1. Click on Options. This will open the Excel Options dialog box
    Click on Options
    1. In the Excel Options dialog box, click on Add-ins in the left pane
    Click on Add-ins
    1. From the Manage drop-down (which is at the bottom of the dialog box), select ‘Excel Add-ins’
    Select Excel Add-ins
    1. Click on the Go button
    Click on the Go button
    1. In the Add-ins dialog box that shows up, check the Analysis Toolpak option
    Select Analysis Toolpak
    1. Click OK

    The other steps would enable the Data Analysis toolpak and you will be able to use it on all your Excel Workbooks.

    Getting the Descriptive Analysis

    Now that the Data Analysis Toolpak is enabled, let’s see how to get the descriptive statistics using it.

    Suppose you have a data set as shown below where I have the sales data of different products of a company. For this data, I want to get descriptive statistics.

    Dataset to find descriptive statistics

    Below are the steps to do this:

    1. Click the Data tab
    2. In the Analysis group, click on Data Analysis
    Data analysis option in Excel
    1. In the Data Analysis dialog box that opens, click on Descriptive Statistics
    Select Descriptive statistics
    1. Click OK
    2. In the Descriptive Statistics dialog box, specify the input range that has the data. Note that I have only used Column B as the data source (as you can only use numeric data as the input here)
    Specify the input range
    1. If your data has headers, check the ‘Labels in first row’ option
    check Labels in first row
    1. Select the New Worksheet Ply option (this will give the result in a new sheet)
    Select New Worksheet Ply
    1. Select the statistics options you want (you need to select atleast one, and can select all four)
    Select the statistics you want in the report
    1. Click OK

    The above steps would insert a new sheet and you will get the statistics as shown below:

    Descriptive analysis result

    Note that you can specify the following in step 8:

    1. Confidence Level for mean – the default is 95%, but you can change the value
    2. Kth Largest – the default is 1, but you can change it. If you enter 3 here, it will give you the third largest value from the dataset
    3. Kth Smallest – the default is 1, but you can change it. If you enter 3 here, it will give you the third smallest value from the dataset

    Note that the resulting values you get are static values.

    In case your original data changes and you again want to get the Descriptive Statistics, you will have to repeat the above steps again.

    So this is how you can quickly get Descriptive Statistics in Microsoft Excel.

    I hope you found this tutorial useful.

    Other Excel Tutorials you may also like:

    • How to Calculate Standard Deviation in Excel
    • How to Calculate PERCENTILE in Excel
    • Calculating Weighted Average in Excel.
    • Calculating CAGR in Excel
    • How to Calculate Correlation Coefficient in Excel
    • Calculate the Coefficient of Variation (CV) in Excel


    Рассмотрим инструмент Описательная статистика, входящий в надстройку Пакет Анализа. Рассчитаем показатели выборки: среднее, медиана, мода, дисперсия, стандартное отклонение и др.

    Задача

    описательной статистики

    (descriptive statistics) заключается в том, чтобы с использованием математических инструментов свести сотни значений

    выборки

    к нескольким итоговым показателям, которые дают представление о

    выборке

    .В качестве таких статистических показателей используются:

    среднее

    ,

    медиана

    ,

    мода

    ,

    дисперсия, стандартное отклонение

    и др.

    Опишем набор числовых данных с помощью определенных показателей. Для чего нужны эти показатели? Эти показатели позволят сделать определенные

    статистические выводы о распределении

    , из которого была взята

    выборка

    . Например, если у нас есть

    выборка

    значений толщины трубы, которая изготавливается на определенном оборудовании, то на основании анализа этой

    выборки

    мы сможем сделать, с некой определенной вероятностью, заключение о состоянии процесса изготовления.

    Содержание статьи:

    • Надстройка Пакет анализа;
    • Среднее выборки

      ;

    • Медиана выборки

      ;

    • Мода выборки

      ;

    • Мода и среднее значение

      ;

    • Дисперсия выборки

      ;

    • Стандартное отклонение выборки

      ;

    • Стандартная ошибка

      ;

    • Ассиметричность

      ;

    • Эксцесс выборки

      ;

    • Уровень надежности

      .

    Надстройка Пакет анализа

    Для вычисления статистических показателей одномерных

    выборок

    , используем

    надстройку Пакет анализа

    . Затем, все показатели рассчитанные надстройкой, вычислим с помощью встроенных функций MS EXCEL.


    СОВЕТ

    : Подробнее о других инструментах надстройки

    Пакет анализа

    и ее подключении – читайте в статье

    Надстройка Пакет анализа MS EXCEL

    .


    Выборку

    разместим на

    листе

    Пример

    в файле примера

    в диапазоне

    А6:А55

    (50 значений).


    Примечание

    : Для удобства написания формул для диапазона

    А6:А55

    создан

    Именованный диапазон

    Выборка.

    В диалоговом окне

    Анализ данных

    выберите инструмент

    Описательная статистика

    .

    После нажатия кнопки

    ОК

    будет выведено другое диалоговое окно,

    в котором нужно указать:


    • входной интервал

      (Input Range) – это диапазон ячеек, в котором содержится массив данных. Если в указанный диапазон входит текстовый заголовок набора данных, то нужно поставить галочку в поле

      Метки в первой строке (

      Labels

      in

      first

      row

      ).

      В этом случае заголовок будет выведен в

      Выходном интервале.

      Пустые ячейки будут проигнорированы, поэтому нулевые значения необходимо обязательно указывать в ячейках, а не оставлять их пустыми;

    • выходной интервал

      (Output Range). Здесь укажите адрес верхней левой ячейки диапазона, в который будут выведены статистические показатели;

    • Итоговая статистика (

      Summary

      Statistics

      )

      . Поставьте галочку напротив этого поля – будут выведены основные показатели выборки:

      среднее, медиана, мода, стандартное отклонение

      и др.;
    • Также можно поставить галочки напротив полей

      Уровень надежности (

      Confidence

      Level

      for

      Mean

      )

      ,

      К-й наименьший

      (Kth Largest) и

      К-й наибольший

      (Kth Smallest).

    В результате будут выведены следующие статистические показатели:

    Все показатели выведены в виде значений, а не формул. Если массив данных изменился, то необходимо перезапустить расчет.

    Если во

    входном интервале

    указать ссылку на несколько столбцов данных, то будет рассчитано соответствующее количество наборов показателей. Такой подход позволяет сравнить несколько наборов данных. При сравнении нескольких наборов данных используйте заголовки (включите их во

    Входной интервал

    и установите галочку в поле

    Метки в первой строке

    ). Если наборы данных разной длины, то это не проблема — пустые ячейки будут проигнорированы.

    Зеленым цветом на картинке выше и в

    файле примера

    выделены показатели, которые не требуют особого пояснения. Для большинства из них имеется специализированная функция:


    • Интервал

      (Range) — разница между максимальным и минимальным  значениями;

    • Минимум

      (Minimum) – минимальное значение в диапазоне ячеек, указанном во

      Входном интервале

      (см.

      статью про функцию

      МИН()

      );


    • Максимум

      (Maximum)– максимальное значение (см.

      статью про функцию

      МАКС()

      );


    • Сумма

      (Sum) – сумма всех значений (см.

      статью про функцию

      СУММ()

      );


    • Счет

      (Count) – количество значений во

      Входном интервале

      (пустые ячейки игнорируются, см.

      статью про функцию

      СЧЁТ()

      );


    • Наибольший

      (Kth Largest) – выводится К-й наибольший. Например, 1-й наибольший – это максимальное значение (см.

      статью про функцию

      НАИБОЛЬШИЙ()

      );


    • Наименьший

      (Kth Smallest) – выводится К-й наименьший. Например, 1-й наименьший – это минимальное значение (см.

      статью про функцию

      НАИМЕНЬШИЙ()

      ).

    Ниже даны подробные описания остальных показателей.

    Среднее выборки


    Среднее

    (mean, average) или

    выборочное среднее

    или

    среднее выборки

    (sample average) представляет собой

    арифметическое среднее

    всех значений массива. В MS EXCEL для вычисления среднего выборки используется функция

    СРЗНАЧ()

    .

    Выборочное среднее

    является «хорошей» (несмещенной и эффективной) оценкой

    математического ожидания

    случайной величины (подробнее см. статью

    Среднее и Математическое ожидание в MS EXCEL

    ).

    Медиана выборки


    Медиана

    (Median) – это число, которое является серединой множества чисел (в данном случае выборки): половина чисел множества больше, чем

    медиана

    , а половина чисел меньше, чем

    медиана

    . Для определения

    медианы

    необходимо сначала

    отсортировать множество чисел

    . Например,

    медианой

    для чисел 2, 3, 3,

    4

    , 5, 7, 10 будет 4.

    Если множество содержит четное количество чисел, то вычисляется

    среднее

    для двух чисел, находящихся в середине множества. Например,

    медианой

    для чисел 2, 3,

    3

    ,

    5

    , 7, 10 будет 4, т.к. (3+5)/2.

    Если имеется длинный хвост распределения, то

    Медиана

    лучше, чем

    среднее значение

    , отражает «типичное» или «центральное» значение. Например, рассмотрим несправедливое распределение зарплат в компании, в которой руководство получает существенно больше, чем основная масса сотрудников.


    Очевидно, что средняя зарплата (71 тыс. руб.) не отражает тот факт, что 86% сотрудников получает не более 30 тыс. руб. (т.е. 86% сотрудников получает зарплату в более, чем в 2 раза меньше средней!). В то же время медиана (15 тыс. руб.) показывает, что

    как минимум

    у 50% сотрудников зарплата меньше или равна 15 тыс. руб.

    Для определения

    медианы

    в MS EXCEL существует одноименная функция

    МЕДИАНА()

    , английский вариант — MEDIAN().


    Медиану

    также можно вычислить с помощью формул

    =КВАРТИЛЬ.ВКЛ(Выборка;2) =ПРОЦЕНТИЛЬ.ВКЛ(Выборка;0,5).

    Подробнее о

    медиане

    см. специальную статью

    Медиана в MS EXCEL

    .


    СОВЕТ

    : Подробнее про

    квартили

    см. статью, про

    перцентили (процентили)

    см. статью.

    Мода выборки


    Мода

    (Mode) – это наиболее часто встречающееся (повторяющееся) значение в

    выборке

    . Например, в массиве (1; 1;

    2

    ;

    2

    ;

    2

    ; 3; 4; 5) число 2 встречается чаще всего – 3 раза. Значит, число 2 – это

    мода

    . Для вычисления

    моды

    используется функция

    МОДА()

    , английский вариант MODE().


    Примечание

    : Если в массиве нет повторяющихся значений, то функция вернет значение ошибки #Н/Д. Это свойство использовано в статье

    Есть ли повторы в списке?

    Начиная с

    MS EXCEL 2010

    вместо функции

    МОДА()

    рекомендуется использовать функцию

    МОДА.ОДН()

    , которая является ее полным аналогом. Кроме того, в MS EXCEL 2010 появилась новая функция

    МОДА.НСК()

    , которая возвращает несколько наиболее часто повторяющихся значений (если количество их повторов совпадает). НСК – это сокращение от слова НеСКолько.

    Например, в массиве (1; 1;

    2

    ;

    2

    ;

    2

    ; 3;

    4

    ;

    4

    ;

    4

    ; 5) числа 2 и 4 встречаются наиболее часто – по 3 раза. Значит, оба числа являются

    модами

    . Функции

    МОДА.ОДН()

    и

    МОДА()

    вернут значение 2, т.к. 2 встречается первым, среди наиболее повторяющихся значений (см.

    файл примера

    , лист

    Мода

    ).

    Чтобы исправить эту несправедливость и была введена функция

    МОДА.НСК()

    , которая выводит все

    моды

    . Для этого ее нужно ввести как

    формулу массива

    .

    Как видно из картинки выше, функция

    МОДА.НСК()

    вернула все три

    моды

    из массива чисел в диапазоне

    A2:A11

    : 1; 3 и 7. Для этого, выделите диапазон

    C6:C9

    , в

    Строку формул

    введите формулу

    =МОДА.НСК(A2:A11)

    и нажмите

    CTRL+SHIFT+ENTER

    . Диапазон

    C

    6:

    C

    9

    охватывает 4 ячейки, т.е. количество выделяемых ячеек должно быть больше или равно количеству

    мод

    . Если ячеек больше чем м

    о

    д, то избыточные ячейки будут заполнены значениями ошибки #Н/Д. Если

    мода

    только одна, то все выделенные ячейки будут заполнены значением этой

    моды

    .

    Теперь вспомним, что мы определили

    моду

    для выборки, т.е. для конечного множества значений, взятых из

    генеральной совокупности

    . Для

    непрерывных случайных величин

    вполне может оказаться, что выборка состоит из массива на подобие этого (0,935; 1,211; 2,430; 3,668; 3,874; …), в котором может не оказаться повторов и функция

    МОДА()

    вернет ошибку.

    Даже в нашем массиве с

    модой

    , которая была определена с помощью

    надстройки Пакет анализа

    , творится, что-то не то. Действительно,

    модой

    нашего массива значений является число 477, т.к. оно встречается 2 раза, остальные значения не повторяются. Но, если мы посмотрим на

    гистограмму распределения

    , построенную для нашего массива, то увидим, что 477 не принадлежит интервалу наиболее часто встречающихся значений (от 150 до 250).

    Проблема в том, что мы определили

    моду

    как наиболее часто встречающееся значение, а не как наиболее вероятное. Поэтому,

    моду

    в учебниках статистики часто определяют не для выборки (массива), а для функции распределения. Например, для

    логнормального распределения

    мода

    (наиболее вероятное значение непрерывной случайной величины х), вычисляется как

    exp

    (

    m



    s

    2

    )

    , где m и s параметры этого распределения.

    Понятно, что для нашего массива число 477, хотя и является наиболее часто повторяющимся значением, но все же является плохой оценкой для

    моды

    распределения, из которого взята

    выборка

    (наиболее вероятного значения или для которого плотность вероятности распределения максимальна).

    Для того, чтобы получить оценку

    моды

    распределения, из

    генеральной совокупности

    которого взята

    выборка

    , можно, например, построить

    гистограмму

    . Оценкой для

    моды

    может служить интервал наиболее часто встречающихся значений (самого высокого столбца). Как было сказано выше, в нашем случае это интервал от 150 до 250.


    Вывод

    : Значение

    моды

    для

    выборки

    , рассчитанное с помощью функции

    МОДА()

    , может ввести в заблуждение, особенно для небольших выборок. Эта функция эффективна, когда случайная величина может принимать лишь несколько дискретных значений, а размер

    выборки

    существенно превышает количество этих значений.

    Например, в рассмотренном примере о распределении заработных плат (см. раздел статьи выше, о Медиане),

    модой

    является число 15 (17 значений из 51, т.е. 33%). В этом случае функция

    МОДА()

    дает хорошую оценку «наиболее вероятного» значения зарплаты.


    Примечание

    : Строго говоря, в примере с зарплатой мы имеем дело скорее с

    генеральной совокупностью

    , чем с

    выборкой

    . Т.к. других зарплат в компании просто нет.

    О вычислении

    моды

    для распределения

    непрерывной случайной величины

    читайте статью

    Мода в MS EXCEL

    .

    Мода и среднее значение

    Не смотря на то, что

    мода

    – это наиболее вероятное значение случайной величины (вероятность выбрать это значение из

    Генеральной совокупности

    максимальна), не следует ожидать, что

    среднее значение

    обязательно будет близко к

    моде

    .


    Примечание

    :

    Мода

    и

    среднее

    симметричных распределений совпадает (имеется ввиду симметричность

    плотности распределения

    ).

    Представим, что мы бросаем некий «неправильный» кубик, у которого на гранях имеются значения (1; 2; 3; 4; 6; 6), т.е. значения 5 нет, а есть вторая 6.

    Модой

    является 6, а среднее значение – 3,6666.

    Другой пример. Для

    Логнормального распределения

    LnN(0;1)

    мода

    равна =EXP(m-s2)= EXP(0-1*1)=0,368, а

    среднее значение

    1,649.

    Дисперсия выборки


    Дисперсия выборки

    или

    выборочная дисперсия (

    sample

    variance

    ) характеризует разброс значений в массиве, отклонение от

    среднего

    .

    Из формулы №1 видно, что

    дисперсия выборки

    это сумма квадратов отклонений каждого значения в массиве

    от среднего

    , деленная на размер выборки минус 1.

    В MS EXCEL 2007 и более ранних версиях для вычисления

    дисперсии выборки

    используется функция

    ДИСП()

    . С версии MS EXCEL 2010 рекомендуется использовать ее аналог — функцию

    ДИСП.В()

    .


    Дисперсию

    можно также вычислить непосредственно по нижеуказанным формулам (см.

    файл примера

    ):

    =КВАДРОТКЛ(Выборка)/(СЧЁТ(Выборка)-1) =(СУММКВ(Выборка)-СЧЁТ(Выборка)*СРЗНАЧ(Выборка)^2)/ (СЧЁТ(Выборка)-1)

    – обычная формула

    =СУММ((Выборка -СРЗНАЧ(Выборка))^2)/ (СЧЁТ(Выборка)-1)

    формула массива


    Дисперсия выборки

    равна 0, только в том случае, если все значения равны между собой и, соответственно, равны

    среднему значению

    .

    Чем больше величина

    дисперсии

    , тем больше разброс значений в массиве относительно

    среднего

    .

    Размерность

    дисперсии

    соответствует квадрату единицы измерения исходных значений. Например, если значения в выборке представляют собой измерения веса детали (в кг), то размерность

    дисперсии

    будет кг

    2

    . Это бывает сложно интерпретировать, поэтому для характеристики разброса значений чаще используют величину равную квадратному корню из

    дисперсии – стандартное отклонение

    .

    Подробнее о

    дисперсии

    см. статью

    Дисперсия и стандартное отклонение в MS EXCEL

    .

    Стандартное отклонение выборки


    Стандартное отклонение выборки

    (Standard Deviation), как и

    дисперсия

    , — это мера того, насколько широко разбросаны значения в выборке

    относительно их среднего

    .

    По определению,

    стандартное отклонение

    равно квадратному корню из

    дисперсии

    :


    Стандартное отклонение

    не учитывает величину значений в

    выборке

    , а только степень рассеивания значений вокруг их

    среднего

    . Чтобы проиллюстрировать это приведем пример.

    Вычислим стандартное отклонение для 2-х

    выборок

    : (1; 5; 9) и (1001; 1005; 1009). В обоих случаях, s=4. Очевидно, что отношение величины стандартного отклонения к значениям массива у

    выборок

    существенно отличается.

    В MS EXCEL 2007 и более ранних версиях для вычисления

    Стандартного отклонения выборки

    используется функция

    СТАНДОТКЛОН()

    . С версии MS EXCEL 2010 рекомендуется использовать ее аналог

    СТАНДОТКЛОН.В()

    .


    Стандартное отклонение

    можно также вычислить непосредственно по нижеуказанным формулам (см.

    файл примера

    ):

    =КОРЕНЬ(КВАДРОТКЛ(Выборка)/(СЧЁТ(Выборка)-1)) =КОРЕНЬ((СУММКВ(Выборка)-СЧЁТ(Выборка)*СРЗНАЧ(Выборка)^2)/(СЧЁТ(Выборка)-1))

    Подробнее о

    стандартном отклонении

    см. статью

    Дисперсия и стандартное отклонение в MS EXCEL

    .

    Стандартная ошибка

    В

    Пакете анализа

    под термином

    стандартная ошибка

    имеется ввиду

    Стандартная ошибка среднего

    (Standard Error of the Mean, SEM).

    Стандартная ошибка среднего

    — это оценка

    стандартного отклонения

    распределения

    выборочного среднего

    .


    Примечание

    : Чтобы разобраться с понятием

    Стандартная ошибка среднего

    необходимо прочитать о

    выборочном распределении

    (см. статью

    Статистики, их выборочные распределения и точечные оценки параметров распределений в MS EXCEL

    ) и статью про

    Центральную предельную теорему

    .


    Стандартное отклонение распределения выборочного среднего

    вычисляется по формуле σ/√n, где n — объём

    выборки, σ — стандартное отклонение исходного

    распределения, из которого взята

    выборка

    . Т.к. обычно

    стандартное отклонение

    исходного распределения неизвестно, то в расчетах вместо

    σ

    используют ее оценку

    s



    стандартное отклонение выборки

    . А соответствующая величина s/√n имеет специальное название —

    Стандартная ошибка среднего.

    Именно эта величина вычисляется в

    Пакете анализа.

    В MS EXCEL

    стандартную ошибку среднего

    можно также вычислить по формуле

    =СТАНДОТКЛОН.В(Выборка)/ КОРЕНЬ(СЧЁТ(Выборка))

    Асимметричность


    Асимметричность

    или

    коэффициент асимметрии

    (skewness) характеризует степень несимметричности распределения (

    плотности распределения

    ) относительно его

    среднего

    .

    Положительное значение

    коэффициента асимметрии

    указывает, что размер правого «хвоста» распределения больше, чем левого (относительно среднего). Отрицательная асимметрия, наоборот, указывает на то, что левый хвост распределения больше правого.

    Коэффициент асимметрии

    идеально симметричного распределения или выборки равно 0.


    Примечание

    :

    Асимметрия выборки

    может отличаться расчетного значения асимметрии теоретического распределения. Например,

    Нормальное распределение

    является симметричным распределением (

    плотность его распределения

    симметрична относительно

    среднего

    ) и, поэтому имеет асимметрию равную 0. Понятно, что при этом значения в

    выборке

    из соответствующей

    генеральной совокупности

    не обязательно должны располагаться совершенно симметрично относительно

    среднего

    . Поэтому,

    асимметрия выборки

    , являющейся оценкой

    асимметрии распределения

    , может отличаться от 0.

    Функция

    СКОС()

    , английский вариант SKEW(), возвращает коэффициент

    асимметрии выборки

    , являющейся оценкой

    асимметрии

    соответствующего распределения, и определяется следующим образом:

    где n – размер

    выборки

    , s –

    стандартное отклонение выборки

    .

    В

    файле примера на листе СКОС

    приведен расчет коэффициента

    асимметрии

    на примере случайной выборки из

    распределения Вейбулла

    , которое имеет значительную положительную

    асимметрию

    при параметрах распределения W(1,5; 1).

    Эксцесс выборки


    Эксцесс

    показывает относительный вес «хвостов» распределения относительно его центральной части.

    Для того чтобы определить, что относится к хвостам распределения, а что к его центральной части, можно использовать границы μ +/-

    σ

    .


    Примечание

    : Не смотря на старания профессиональных статистиков, в литературе еще попадается определение

    Эксцесса

    как меры «остроконечности» (peakedness) или сглаженности распределения. Но, на самом деле, значение

    Эксцесса

    ничего не говорит о форме пика распределения.

    Согласно определения,

    Эксцесс

    равен четвертому

    стандартизированному моменту:

    Для

    нормального распределения

    четвертый момент равен 3*σ

    4

    , следовательно,

    Эксцесс

    равен 3. Многие компьютерные программы используют для расчетов не сам

    Эксцесс

    , а так называемый Kurtosis excess, который меньше на 3. Т.е. для

    нормального распределения

    Kurtosis excess равен 0. Необходимо быть внимательным, т.к. часто не очевидно, какая формула лежит в основе расчетов.


    Примечание

    : Еще большую путаницу вносит перевод этих терминов на русский язык. Термин Kurtosis происходит от греческого слова «изогнутый», «имеющий арку». Так сложилось, что на русский язык оба термина Kurtosis и Kurtosis excess переводятся как

    Эксцесс

    (от англ. excess — «излишек»). Например, функция MS EXCEL

    ЭКСЦЕСС()

    на самом деле вычисляет Kurtosis excess.

    Функция

    ЭКСЦЕСС()

    , английский вариант KURT(), вычисляет на основе значений выборки несмещенную оценку

    эксцесса распределения

    случайной величины и определяется следующим образом:

    Как видно из формулы MS EXCEL использует именно Kurtosis excess, т.е. для выборки из

    нормального распределения

    формула вернет близкое к 0 значение.

    Если задано менее четырех точек данных, то функция

    ЭКСЦЕСС()

    возвращает значение ошибки #ДЕЛ/0!

    Вернемся к

    распределениям случайной величины

    .

    Эксцесс

    (Kurtosis excess) для

    нормального распределения

    всегда равен 0, т.е. не зависит от параметров распределения μ и σ. Для большинства других распределений

    Эксцесс

    зависит от параметров распределения: см., например,

    распределение Вейбулла

    или

    распределение Пуассона

    , для котрого

    Эксцесс

    = 1/λ.

    Уровень надежности


    Уровень

    надежности

    — означает вероятность того, что

    доверительный интервал

    содержит истинное значение оцениваемого параметра распределения.

    Вместо термина

    Уровень

    надежности

    часто используется термин

    Уровень доверия

    . Про

    Уровень надежности

    (Confidence Level for Mean) читайте статью

    Уровень значимости и уровень надежности в MS EXCEL

    .

    Задав значение

    Уровня

    надежности

    в окне

    надстройки Пакет анализа

    , MS EXCEL вычислит половину ширины

    доверительного интервала для оценки среднего (дисперсия неизвестна)

    .

    Тот же результат можно получить по формуле (см.

    файл примера

    ):

    =ДОВЕРИТ.СТЬЮДЕНТ(1-0,95;s;n)

    s —

    стандартное отклонение выборки

    , n – объем

    выборки

    .

    Подробнее см. статью про

    построение доверительного интервала для оценки среднего (дисперсия неизвестна)

    .

    Понравилась статья? Поделить с друзьями:
  • What is defined name in excel
  • What is default style in word
  • What is decoding a word
  • What is dde in excel
  • What is date formatting in excel