Статистика - Стандартное (среднеквадратичное) отклонение
Стандартное отклонение - это наиболее часто используемая мера вариации, которая описывает разброс данных.
Стандартное отклонение
Стандартное отклонение (σ) измеряет, насколько "типичное" наблюдение отличается от среднего значения данных (μ).
Стандартное отклонение является важным для многих статистических методов.
Вот гистограмма возраста всех 934 лауреатов Нобелевской премии до 2020 года, показывающая стандартные отклонения.:
Каждая пунктирная линия на гистограмме показывает сдвиг на одно дополнительное стандартное отклонение.
Если данные нормально распределены
- Примерно 68.3% данных находится в пределах 1 стандартного отклонения от среднего (от μ-1σ до μ+1σ)
- Примерно 95.5% данных находится в пределах 2 стандартных отклонений от среднего (от μ-2σ до μ+2σ)
- Примерно 99.7% данных находится в пределах 3 стандартных отклонений от среднего (от μ-3σ до μ+3σ)
Примечание: Нормальное распределение имеет форму колокола и равномерно распространяется с обеих сторон.
Расчет стандартного отклонения
Вы можете рассчитать стандартное отклонение как для совокупности, так и для выборки.
Формулы почти одинаковы, и для обозначения стандартного отклонения (\(\sigma\)) и для выборки используются разные символы (\(s\)).
Расчет стандартного отклонения (\(\sigma\)) выполняется по этой формуле:
\(\displaystyle \sigma = \sqrt{\frac{\sum (x_{i}-\mu)^2}{n}}\)
Расчет выборки стандартного отклонения (\(s\)) выполняется по этой формуле:
\(\displaystyle s = \sqrt{\frac{\sum (x_{i}-\bar{x})^2}{n-1}}\)
\(n\) это общее количество наблюдений.
\(\sum \) это символ для сложения списка чисел.
\(x_{i}\) это список значений в данных: \(x_{1}, x_{2}, x_{3}, \ldots \)
\(\mu\) - среднее значение совокупности, а \(\bar{x}\) - среднее выборки (среднее значение).
\( (x_{i} - \mu ) \) и \( (x_{i} - \bar{x} ) \) разницы между значениями наблюдений (\(x_{i}\)) и средним.
Каждая разница возводится в квадрат и складывается.
Затем сумма делится на \(n\) or (\( n - 1 \)) и затем мы находим квадратный корень.
Используя эти 4 примера значений для расчета стандартного отклонения генеральной совокупности:
4, 11, 7, 14
Сначала мы должны найти среднее значение:
\(\displaystyle \mu = \frac{\sum x_{i}}{n} = \frac{4 + 11 + 7 + 14}{4} = \frac{36}{4} = \underline{9} \)
Затем мы находим разницу между каждым значением и средним значением \( (x_{i}- \mu)\):
- \( 4-9 \; \:= -5 \)
- \( 11-9 = 2 \)
- \( 7-9 \; \:= -2 \)
- \( 14-9 = 5 \)
Затем каждое значение возводится в квадрат или умножается само на себя \( ( x_{i}- \mu )^2\):
- \( (-5)^2 = (-5)(-5) = 25 \)
- \( 2^2 \; \; \; \; \; \, = 2*2 \; \; \; \; \; \; \; \: = 4 \)
- \( (-2)^2 = (-2)(-2) = 4 \)
- \( 5^2 \; \; \; \; \; \, = 5*5 \; \; \; \; \; \; \; \: = 25 \)
Затем все квадраты разностей складываются \( \sum (x_{i} -\mu )^2\):
\( 25 + 4 + 4 + 25 = 58\)
Затем сумма делится на общее количество наблюдений, \( n \):
\( \displaystyle \frac{58}{4} = 14.5\)
Наконец, извлекаем квадратный корень из этого числа:
\( \sqrt{14.5} \approx \underline{3.81} \)
Таким образом, стандартное отклонение значений примера примерно: \(3.81 \)
Расчет стандартного отклонения с помощью программирования
Стандартное отклонение можно легко вычислить с помощью многих языков программирования.
Использование программного обеспечения и программирования для расчета статистики более распространено для больших наборов данных, поскольку расчет вручную становится затруднительным.
Стандартное отклонение совокупности
Пример
В Python используйте метод std()
библиотеки NumPy, чтобы найти стандартное отклонение значений 4,11,7,14:
import numpy
values = [4,11,7,14]
x = numpy.std(values)
print(x)
Попробуйте сами »
Пример
Используйте формулу R, чтобы найти стандартное отклонение значений 4,11,7,14:
values <- c(4,7,11,14)
sqrt(mean((values-mean(values))^2))
Попробуйте сами »
Стандартное отклонение выборки
Пример
В Python используйте метод std()
библиотеки NumPy, чтобы найти выборку стандартного отклонения значений 4,11,7,14:
import numpy
values = [4,11,7,14]
x = numpy.std(values, ddof=1)
print(x)
Попробуйте сами »
Пример
Используйте функцию R sd()
чтобы найти выборку стандартного отклонения значений 4,11,7,14:
values <- c(4,7,11,14)
sd(values)
Попробуйте сами »
Справка по символам статистики
Символ | Описание |
---|---|
\( \sigma \) | Стандартное отклонение совокупности. Произносится 'sigma' |
\( s \) | Стандартное отклонение выборки |
\( \mu \) | Среднее совокупности. Произносится 'mu' |
\( \bar{x} \) | Среднее выборки. Произносится 'x-bar' |
\( \sum \) | Оператор суммирования, 'заглавная сигма' |
\( x \) | По переменной 'x' мы вычисляем среднее значение |
\( i \) | Индекс 'i' переменной 'x'. Это идентифицирует каждое наблюдение для переменной |
\( n \) | Количество наблюдений |