ЛУЧШИЙ САЙТ ДЛЯ ВЕБ-РАЗРАБОТЧИКОВ

Статистика Учебник

Stat Главная Stat Интро Stat Сбор данных Stat Описание данных Stat Делаем выводы Stat Прогнозирование & Объяснение Stat Совокупность & Выборка Stat Параметры & Статистика Stat Типы исследований Stat Типы выборок Stat Типы данных Stat Уровни измерения

Описательная статистика

Stat Описательная статистика Stat Таблицы частот Stat Гистограммы Stat Бар-графики Stat Круговые диаграммы Stat Коробчатые графики Stat Среднее значение Stat Среднее Stat Медиана Stat Режим Stat Вариация Stat Диапазон Stat Квартили и процентили Stat Межквартильный диапазон Stat Среднеквадратичное отклонение

Выведенная статистика

Stat Статистические выводы Stat Нормальное распределение Stat Стандартное нормальное Stat Т-распределение Stat Предварительный расчет Stat Оценка доли населения Stat Оценка численности населения Stat Проверка гипотезы Stat Проверки пропорции Stat Среднее значение

Stat Справочник

Stat Z-таблица Stat T-таблица Stat Пропорция проверки гипотез (левосторонняя) Stat Пропорция проверки гипотез (двусторонняя) Stat Среднее значение проверки гипотез (левосторонняя) Stat Среднее значение проверки гипотез (двусторонняя)

Статистика. W3Schools на русском. Уроки для начинающих

Статистика - Стандартное (среднеквадратичное) отклонение


Стандартное отклонение - это наиболее часто используемая мера вариации, которая описывает разброс данных.


Стандартное отклонение

Стандартное отклонение (σ) измеряет, насколько "типичное" наблюдение отличается от среднего значения данных (μ).

Стандартное отклонение является важным для многих статистических методов.

Вот гистограмма возраста всех 934 лауреатов Нобелевской премии до 2020 года, показывающая стандартные отклонения.:

Гистограмма возраста лауреатов Нобелевской премии с указанием межквартильного диапазона

Каждая пунктирная линия на гистограмме показывает сдвиг на одно дополнительное стандартное отклонение.

Если данные нормально распределены

  • Примерно 68.3% данных находится в пределах 1 стандартного отклонения от среднего (от μ-1σ до μ+1σ)
  • Примерно 95.5% данных находится в пределах 2 стандартных отклонений от среднего (от μ-2σ до μ+2σ)
  • Примерно 99.7% данных находится в пределах 3 стандартных отклонений от среднего (от μ-3σ до μ+3σ)

Примечание: Нормальное распределение имеет форму колокола и равномерно распространяется с обеих сторон.


Расчет стандартного отклонения

Вы можете рассчитать стандартное отклонение как для совокупности, так и для выборки.

Формулы почти одинаковы, и для обозначения стандартного отклонения (\(\sigma\)) и для выборки используются разные символы (\(s\)).

Расчет стандартного отклонения (\(\sigma\)) выполняется по этой формуле:

\(\displaystyle \sigma = \sqrt{\frac{\sum (x_{i}-\mu)^2}{n}}\)

Расчет выборки стандартного отклонения (\(s\)) выполняется по этой формуле:

\(\displaystyle s = \sqrt{\frac{\sum (x_{i}-\bar{x})^2}{n-1}}\)

\(n\) это общее количество наблюдений.

\(\sum \) это символ для сложения списка чисел.

\(x_{i}\) это список значений в данных: \(x_{1}, x_{2}, x_{3}, \ldots \)

\(\mu\) - среднее значение совокупности, а \(\bar{x}\) - среднее выборки (среднее значение).

\( (x_{i} - \mu ) \) и \( (x_{i} - \bar{x} ) \) разницы между значениями наблюдений (\(x_{i}\)) и средним.

Каждая разница возводится в квадрат и складывается.

Затем сумма делится на \(n\) or (\( n - 1 \)) и затем мы находим квадратный корень.

Используя эти 4 примера значений для расчета стандартного отклонения генеральной совокупности:

4, 11, 7, 14

Сначала мы должны найти среднее значение:

\(\displaystyle \mu = \frac{\sum x_{i}}{n} = \frac{4 + 11 + 7 + 14}{4} = \frac{36}{4} = \underline{9} \)

Затем мы находим разницу между каждым значением и средним значением \( (x_{i}- \mu)\):

  • \( 4-9 \; \:= -5 \)
  • \( 11-9 = 2 \)
  • \( 7-9 \; \:= -2 \)
  • \( 14-9 = 5 \)

Затем каждое значение возводится в квадрат или умножается само на себя \( ( x_{i}- \mu )^2\):

  • \( (-5)^2 = (-5)(-5) = 25 \)
  • \( 2^2 \; \; \; \; \; \, = 2*2 \; \; \; \; \; \; \; \: = 4 \)
  • \( (-2)^2 = (-2)(-2) = 4 \)
  • \( 5^2 \; \; \; \; \; \, = 5*5 \; \; \; \; \; \; \; \: = 25 \)

Затем все квадраты разностей складываются \( \sum (x_{i} -\mu )^2\):

\( 25 + 4 + 4 + 25 = 58\)

Затем сумма делится на общее количество наблюдений, \( n \):

\( \displaystyle \frac{58}{4} = 14.5\)

Наконец, извлекаем квадратный корень из этого числа:

\( \sqrt{14.5} \approx \underline{3.81} \)

Таким образом, стандартное отклонение значений примера примерно: \(3.81 \)


Расчет стандартного отклонения с помощью программирования

Стандартное отклонение можно легко вычислить с помощью многих языков программирования.

Использование программного обеспечения и программирования для расчета статистики более распространено для больших наборов данных, поскольку расчет вручную становится затруднительным.

Стандартное отклонение совокупности

Пример

В Python используйте метод std() библиотеки NumPy, чтобы найти стандартное отклонение значений 4,11,7,14:

import numpy

values = [4,11,7,14]

x = numpy.std(values)

print(x)
Попробуйте сами »

Пример

Используйте формулу R, чтобы найти стандартное отклонение значений 4,11,7,14:

values <- c(4,7,11,14)

sqrt(mean((values-mean(values))^2))
Попробуйте сами »

Стандартное отклонение выборки

Пример

В Python используйте метод std() библиотеки NumPy, чтобы найти выборку стандартного отклонения значений 4,11,7,14:

import numpy

values = [4,11,7,14]

x = numpy.std(values, ddof=1)

print(x)
Попробуйте сами »

Пример

Используйте функцию R sd() чтобы найти выборку стандартного отклонения значений 4,11,7,14:

values <- c(4,7,11,14)

sd(values)
Попробуйте сами »

Справка по символам статистики

Символ Описание
\( \sigma \) Стандартное отклонение совокупности. Произносится 'sigma'
\( s \) Стандартное отклонение выборки
\( \mu \) Среднее совокупности. Произносится 'mu'
\( \bar{x} \) Среднее выборки. Произносится 'x-bar'
\( \sum \) Оператор суммирования, 'заглавная сигма'
\( x \) По переменной 'x' мы вычисляем среднее значение
\( i \) Индекс 'i' переменной 'x'. Это идентифицирует каждое наблюдение для переменной
\( n \) Количество наблюдений