Статистика - Медиана
Медиана - это тип среднего значения, которое описывает, где находится центр данных.
Медиана
Медиана - это среднее значение в наборе данных, упорядоченное от меньшего к большему.
Нахождение медианы
Медиана может быть вычислена только для числовых переменных.
Формула для определения среднего значения:
\( \displaystyle \frac{n + 1}{2} \)
Где \(n\) общее количество наблюдений.
Если общее количество наблюдений является нечётным числом, формула даёт целое число, а значение этого наблюдения - медиана.
13, 21, 21, 40, 48, 55, 72
Здесь всего 7 наблюдений, поэтому медиана - это 4-е значение:
\( \displaystyle \frac{7 + 1}{2} = \frac{8}{2} = 4 \)
Четвёртое значение в упорядоченном списке - 40, так что это медиана.
Если общее количество наблюдений является чётным числом, формула даёт десятичное число между двумя наблюдениями.
13, 21, 21, 40, 42, 48, 55, 72
Здесь всего 8 наблюдений, поэтому медиана находится между 4-м и 5-м значениями:
\( \displaystyle \frac{8 + 1}{2} = \frac{9}{2} = 4.5 \)
4-е и 5-е значения в упорядоченном списке - 40 и 42, поэтому медиана - это среднее этих двух значений. То есть сумма этих двух значений, делённая на 2:
\( \displaystyle \frac{40+42}{2} = \frac{82}{2} = \underline{41} \)
Примечание: Важно, чтобы числа были упорядочены, прежде чем вы сможете найти медианное значение.
Поиск медианы с помощью программирования
Медиану легко найти во многих языках программирования.
Использование программного обеспечения и программирования для расчета статистики более распространено для больших наборов данных, так как найти их вручную становится сложно.
Пример
В Python используйте метод median()
библиотеки NumPy, чтобы найти медиану значений 13, 21, 21, 40, 42, 48, 55, 72:
import numpy
values = [13,21,21,40,42,48,55,72]
x = numpy.median(values)
print(x)
Попробуйте сами »
Пример
Используйте функцию R median()
чтобы найти медиану значений 13, 21, 21, 40, 42, 48, 55, 72:
values <- c(13,21,21,40,42,48,55,72)
median(values)
Попробуйте сами »