Нормализация в excel это

Excel для Microsoft 365 Excel для Microsoft 365 для Mac Excel для Интернета Excel 2021 Excel 2021 для Mac Excel 2019 Excel 2019 для Mac Excel 2016 Excel 2016 для Mac Excel 2013 Excel 2010 Excel 2007 Excel для Mac 2011 Excel Starter 2010 Еще…Меньше

В этой статье описаны синтаксис формулы и использование функции НОРМАЛИЗАЦИЯ в Microsoft Excel.

Описание

Возвращает нормализованное значение для распределения, характеризуемого средним и стандартным отклонением.

Синтаксис

НОРМАЛИЗАЦИЯ(x;среднее;стандартное_откл)

Аргументы функции НОРМАЛИЗАЦИЯ описаны ниже.

  • X    Обязательный. Нормализуемое значение.

  • Среднее    Обязательный. Среднее арифметическое распределения.

  • Стандартное_откл    Обязательный. Стандартное отклонение распределения.

Замечания

  • Если standard_dev ≤ 0, возвращается стандартное #NUM! значение ошибки #ЗНАЧ!.

  • Уравнение для нормализованного значения имеет следующий вид:

    Уравнение

Пример

Скопируйте образец данных из следующей таблицы и вставьте их в ячейку A1 нового листа Excel. Чтобы отобразить результаты формул, выделите их и нажмите клавишу F2, а затем — клавишу ВВОД. При необходимости измените ширину столбцов, чтобы видеть все данные.

Данные

Описание

42

Значение, которое нужно нормализовать.

40

Среднее арифметическое распределения.

1,5

Стандартное отклонение распределения.

Формула

Описание

Результат

=НОРМАЛИЗАЦИЯ(A2;A3;A4)

Нормализованное значение числа 42, полученное с использованием числа 40 в качестве среднего арифметического и числа 1,5 в качестве стандартного отклонения.

1,33333333

Нужна дополнительная помощь?

  • Редакция Кодкампа

17 авг. 2022 г.
читать 2 мин


«Нормализация» набора значений данных означает масштабирование значений таким образом, чтобы среднее значение всех значений равнялось 0, а стандартное отклонение равнялось 1.

В этом руководстве объясняется, как нормализовать данные в Excel.

Пример: как нормализовать данные в Excel

Предположим, у нас есть следующий набор данных в Excel:

Необработанные данные в Excel в один столбец

Выполните следующие шаги, чтобы нормализовать этот набор значений данных.

Шаг 1: Найдите среднее значение.

Во-первых, мы будем использовать функцию =AVERAGE(диапазон значений) , чтобы найти среднее значение набора данных.

Средняя функция в Excel

Шаг 2: Найдите стандартное отклонение.

Далее мы будем использовать функцию = СТАНДОТКЛОН (диапазон значений) , чтобы найти стандартное отклонение набора данных.

Функция стандартного отклонения в Excel

Шаг 3: нормализуйте значения.

Наконец, мы будем использовать функцию STANDARDIZE(x, mean, standard_dev) для нормализации каждого из значений в наборе данных.

ПРИМЕЧАНИЕ:

Функция СТАНДАРТИЗАЦИЯ использует следующую формулу для нормализации заданного значения данных:

Нормализованное значение = (x – x ) / с

куда:

  • х = значение данных
  • x = среднее значение набора данных
  • s = стандартное отклонение набора данных

На следующем изображении показана формула, используемая для нормализации первого значения в наборе данных:

Нормализация данных в Excel

Как только мы нормализуем первое значение в ячейке B2, мы можем навести указатель мыши на правый нижний угол ячейки B2, пока не появится маленький +.Дважды щелкните + , чтобы скопировать формулу в оставшиеся ячейки:

Нормализованные данные в Excel

Теперь каждое значение в наборе данных нормализовано.

Как интерпретировать нормализованные данные

Формула, которую мы использовали для нормализации заданного значения данных x, была следующей:

Нормализованное значение = (x – x ) / с

куда:

  • х = значение данных
  • x = среднее значение набора данных
  • s = стандартное отклонение набора данных

Если конкретная точка данных имеет нормализованное значение больше 0, это указывает на то, что точка данных больше среднего. И наоборот, нормализованное значение меньше 0 указывает на то, что точка данных меньше среднего значения.

В частности, нормализованное значение говорит нам, сколько стандартных отклонений исходной точки данных от среднего. Например, рассмотрим точку данных «12» в нашем исходном наборе данных:

Формула нормализованных данных в Excel

Нормализованное значение для «12» оказалось равным -1,288, которое было рассчитано как:

Нормализованное значение = (х – х ) / с = (12 – 22,267) / 7,968 = -1,288

Это говорит нам о том, что значение «12» на 1,288 стандартных отклонения ниже среднего значения в исходном наборе данных.

Каждое из нормализованных значений в наборе данных может помочь нам понять, насколько близко или далеко конкретное значение данных от среднего. Небольшое нормализованное значение указывает, что значение близко к среднему, в то время как большое нормализованное значение указывает, что значение далеко от среднего.

The term normalization in itself is a buzzword that is popular amongst people who come from different fields such as Machine Learning, Data Science, Statistics, etc. Normalization is a general term that means to scale down values inside a certain range. The origin of the word normalization being a buzzword comes from the fact that it is often misunderstood by people and is interchangeably used with another statistical term standardization. In this article, we are going to demystify both of these terms and later we will read how we can implement these techniques on a sample dataset in Excel.

Normalization (Or Min-Max scaling) data in excel

It is the process of scaling data in such a way that all data points lie in a range of 0 to 1. Thus, this technique, makes it possible to bring all data points to a common scale. The mathematical formula for normalization is given as:

X^{'} = frac{X - X_{min}}{X_{max}-X_{min}} , where X is the data point, Xmax and Xmin are the maximum and minimum value in the group of records respectively. The process of normalization is generally used when the distribution of data does not follow the Gaussian distribution.

Let’s have a look at one example to see how can we perform normalization on a sample dataset. Suppose, we have a record of the height of 10 students inside a class as shown below:

Height (in cm)
152
155
168
175
153
162
173
166
158
156

Step 1: Calculate the minimum value in the distribution. It can be calculated using the MIN() function. The minimum value comes out to be 152 which is stored in the B14 cell.

Calculating-minimum

Calculating the minimum value using the MIN() function

Step 2: Calculate the maximum value in the distribution. It can be calculated using the MAX() function. The maximum value comes out to be 175 which is stored in the B15 cell.

Calculating-maximum

Calculating the maximum value using the MAX() function

Step 3: Find the difference between the maximum and minimum values. Their difference comes out to be 175 – 152 = 23 which is stored in the B16 cell.

Calculating-difference

Calculating the difference (Max-Min)

Step 4: For the first data stored in the A2 cell, we will calculate the normalized value as shown in the below video.

Calculating-normalized-value

Calculating the normalized value for the first element

Step 5: We can manually calculate all values one by one for each data record or we can directly get values for all the other cells using the auto-fill feature of Excel. For this, go to the right corner of the B2 cell until a (+) symbol appears, and then drag the cursor to the bottom to auto-populate values inside all the cells.

All-normalized-values-obtained

Calculating the normalized value for the entire range

Note: While calculating the first normalized value in the B2 cell, it should be made sure that the reference address for the B14 and B16 cells should be locked using Fn + F4 button otherwise an error will be thrown.

If we have a close look at the results, we can notice all the values lies in the range 0 to 1.

Standardization (Or Z-score normalization) 

Standardization is a process in which we want to scale our data in such a way that the distribution of our data has its mean as 0 and standard deviation as 1. The mathematical formula for standardization is given as:

X^{'} = frac{X - X_{mean}}{sigma_{_{x}}}, where where X is the data point, Xmean is the mean of the distribution and σx is the standard deviation of the distribution.

The process of standardization is generally used when we know the distribution of data follows the gaussian distribution.

Method 1: Calculating z-score normalization manually 

Step 1: Calculate the mean/average of the distribution. It can be done using the AVERAGE() function. The mean value comes out to be 161.8 and is stored in the B14 cell.

Calculating-average

Calculating the mean value using the AVERAGE() function

Step 2: Calculate the standard deviation of the distribution which can be done using the STDEV() function. The standard deviation comes out to be 8.323994767 which is stored in the B15 cell.

Calculating-standard-deviation

Calculating the standard deviation using the STDEV() function

Step 3:  For the first data stored in the A2 cell, we will calculate the standardized value as shown in the image given below.

Calculating-standardized-value

Calculating the standardized value for the first element

Step 4: After manually calculating the first value, we can simply use the auto-fill feature of Excel to populate the standardized values for all other records.

All-standardized-values-obtained

Calculating the standardized value for the entire range using auto-fill

Note: While calculating the first standardized value in the B2 cell, it should be made sure that the reference address for the B14 and B15 cells should be locked using  Fn+F4 button otherwise an error will be thrown.

Method 2: Calculating Z-score normalization using the STANDARDIZE() function

We can even use the built-in STANDARDIZE() function to find the standardized value of an element. The syntax for STANDARDIZE() function is given as:

=STANDARDIZE(x,mean,std_dev)

Where x is the specific element/range of cells, mean is the average/arithmetic mean of all the elements in the record, and std_dev is the standard deviation of all the elements in the record

Step 1: Calculate the mean/average of the distribution. It can be done using the AVERAGE() function. The mean value comes out to be 161.8 and is stored in the B14 cell.

Calculating-average

Calculating the mean value using the AVERAGE() function

Step 2: Calculate the standard deviation of the distribution which can be done using the STDEV() function. The standard deviation comes out to be 8.323994767 which is stored in the B15 cell.

Calculating-standard-deviation

Calculating the standard deviation using the STDEV() function

Step 3: For the first data stored in the A2 cell, we will calculate the standardized value as shown in the below image.

Calculating-standardized-value

Calculating the standardized value for the first element using the STANDARDIZE() function

Step 4: After manually calculating the first value, we can simply use the auto-fill feature of Excel to populate the standardized values for all other records.

All-standardized-values-obtained

Calculating the standardized value for the entire range using auto-fill

Функция НОРМАЛИЗАЦИЯ в Excel предназначена для нахождения нормализованного значения некоторой величины из распределения, характеризующегося известными показателями стандартного отклонения и среднего.

Примеры использования функции НОРМАЛИЗАЦИЯ в Excel

Значение, определяемое функцией НОРМАЛИЗАЦИЯ, используется для вычисления вероятности нахождения некоторой величины в диапазоне значений. Эту вероятность можно рассчитать в Excel с помощью функции НОРМ.СТ.РАСП. Таким образом, эти функции имеют следующую взаимосвязь: =НОРМ.СТ.РАСП(НОРМАЛИЗАЦИЯ(аргументы)).

Таким образом, функция НОРМАЛИЗАЦИЯ может быть использована для преобразования нормального распределения к стандартному нормальному. У такого распределения дисперсия равна 1, а математическое ожидание – 0. Таким образом, рассматриваемая функция использует следующий алгоритм вычислений:

Z=(x-M)/D

где:

  • Z – вычисляемая величина, распределенная по стандартному нормальному закону;
  • x — исходное значение;
  • M – математическое ожидание;
  • D – дисперсия.

Пример 1. Определить вероятность того, что некоторая величина, которая распределена по нормальному закону, меньше или равна значению 5. Для ряда значений этой величины известны следующие показатели: среднее – 1,7, стандартное отклонение – 2,4.

Вид таблицы данных:

Пример 1.

Для нахождения вероятности используем следующую формулу:

Для вычисления вероятности вхождения в диапазон (<=5) используем функцию НОРМ.СТ.РАСП со вторым аргументом, принимающим значение ИСТИНА (интегральная). Значение z (нормализованное) определено с помощью рассматриваемой функции.

Искомое число вероятности:

НОРМАЛИЗАЦИЯ.

В итоговом результате вычисления функции получаем относительное – 92%.



Расчет процента вероятности с помощью нормализации в Excel

Пример 2. Данные о прочности изделий из исследуемой партии приведены в таблице Excel. Определить вероятность того, что потребитель купит партию изделий, прочность которых будет равна 20 Мпа или превысит это значение.

Вид таблицы данных:

Пример 2.

Для нахождения вероятности используем следующую формулу:

С помощью функции НОРМ.СТ.РАСП определяем вероятность того, что прочность изделий из партии не будет соответствовать условию (больше 20Мпа). Поэтому искомое значение получаем в виде разности 1 и найденной вероятности. Для определения среднего значения и стандартного отклонений для исследуемого ряда используем функции СРЗНАЧ и СТАНДОТКЛОН.В соответственно.

Полученный результат:

Расчет вероятности.

Правила использования функции НОРМАЛИЗАЦИЯ в Excel

Функция имеет следующую синтаксическую запись:

=НОРМАЛИЗАЦИЯ(x;среднее;стандартное_откл)

Описание аргументов (все обязательны для заполнения):

  • x – принимает числовое значение, соответствующее величине, для которой требуется определить нормализованное значение;
  • среднее – принимает числовое значение, характеризующее величину среднего арифметического исследуемого числового ряда;
  • стандартное_откл – принимает число, которое соответствует величине стандартного отклонения, определенной для исследуемой последовательности.

Примечания:

  1. Каждый аргумент рассматриваемой функции необходимо указывать как число либо передавать ссылку на ячейку, содержащую числовые данные. НОМАЛИЗАЦИЯ будет возвращать код ошибки #ЗНАЧ!, если любой из аргументов указан в виде данных, которые не могут быть преобразованы к числовым значениям.
  2. Если рассматриваемая функция принимает в качестве любого аргумента данные логического типа (ИСТИНА, ЛОЖЬ), выполняется автоматическое преобразование к соответствующим числовым значениям (1, 0 соответственно).
  3. Если аргумент стандартное_откл задан в виде числа из диапазона отрицательных значений или 0 (нулем), функция вернет код ошибки #ЧИСЛО!

To “normalize” a set of data values means to scale the values such that the mean of all of the values is 0 and the standard deviation is 1. 

This tutorial explains how to normalize data in Excel.

Example: How to Normalize Data in Excel

Suppose we have the following dataset in Excel:

Raw data in Excel in one column

Perform the following steps to normalize this set of data values.

Step 1: Find the mean.

First, we will use the =AVERAGE(range of values) function to find the mean of the dataset.

Average function in Excel

Step 2: Find the standard deviation.

Next, we will use the =STDEV(range of values) function to find the standard deviation of the dataset.

Standard deviation function in Excel

Step 3: Normalize the values.

Lastly, we will use the STANDARDIZE(x, mean, standard_dev) function to normalize each of the values in the dataset.

NOTE:

The STANDARDIZE function uses the following formula to normalize a given data value:

Normalized value = (x – x) / s

where:

  • x = data value
  • x = mean of dataset
  • s = standard deviation of dataset

The following image shows the formula used to normalize the first value in the dataset:

Normalize data in Excel

Once we normalize the first value in cell B2, we can hover the mouse over the bottom right corner of cell B2 until a small appears. Double click the to copy the formula down to the remaining cells:

Normalized data in Excel

Now every value in the dataset is normalized.

How to Interpret Normalized Data

The formula that we used to normalize a given data value, x, was as follows:

Normalized value = (x – x) / s

where:

  • x = data value
  • x = mean of dataset
  • s = standard deviation of dataset

If a particular data point has a normalized value greater than 0, it’s an indication that the data point is greater than the mean. Conversely, a normalized value less than 0 is an indication that the data point is less than the mean.

In particular, the normalized value tells us how many standard deviations the original data point is from the mean. For example, consider the data point “12” in our original dataset:

Normalized data formula in Excel

The normalized value for “12” turned out to be -1.288, which was calculated as:

Normalized value = (x – x) / s = (12 – 22.267) / 7.968 = -1.288

This tells us that the value “12” is 1.288 standard deviations below the mean in the original dataset.

Each of the normalized values in the dataset can help us understand how close or far a particular data value is from the mean. A small normalized value indicates that a value is close to the mean while a large normalized value indicates that a value is far from the mean.

Понравилась статья? Поделить с друзьями:
  • Норма топлива в excel
  • Норма расчета гсм в excel
  • Норма или функция в excel
  • Норм ст расп excel
  • Номнедели в excel примеры