Статистика - Квартили и процентили
Квартили и процентили - это меры вариации, которые показывают, насколько разбросаны данные.
И квартили, и процентили являются типами квантилей.
Квартили
Квартили - это значения, которые разделяют данные на четыре равные части.
Вот гистограмма возраста всех 934 лауреатов Нобелевской премии до 2020 года, показывающая квартили:
Квартили (Q0,Q1,Q2,Q3,Q4) - это значения, которые разделяют каждую четверть.
Между Q0 и Q1 находятся 25% самые низкие значения в данных. Между Q1 и Q2 находятся следующие 25%. И так далее.
- Q0 это наименьшее значение в данных.
- Q1 это значение, отделяющее первую четверть от второй четверти данных
- Q2 это среднее значение (медиана), отделяющее нижнюю часть от верхней
- Q3 это значение, отделяющее третью четверть от четвёртой четверти
- Q4 это наибольшее значение в данных
Расчет квартилей с помощью программирования
Квартили можно легко найти на многих языках программирования.
Использование программного обеспечения и программирования для расчета статистики более распространено для больших наборов данных, так как поиск их вручную становится затруднительным.
Пример
В Python используйте метод quantile()
библиотеки NumPy, чтобы найти квартили значений 13, 21, 21, 40, 42, 48, 55, 72:
import numpy
values = [13,21,21,40,42,48,55,72]
x = numpy.quantile(values, [0,0.25,0.5,0.75,1])
print(x)
Попробуйте сами »
Пример
Используйте функцию R quantile()
чтобы найти квантили значений 13, 21, 21, 40, 42, 48, 55, 72:
values <- c(13,21,21,40,42,48,55,72)
quantile(values)
Попробуйте сами »
Процентили
Процентили - это значения, которые разделяют данные на 100 равных частей.
Например, 95-й процентиль отделяет самые низкие 95% из значений сверху 5%
25-й процентиль (P25%) совпадает с первым квартилем (Q1).
50-й процентиль (P50%) совпадает со вторым квартилем (Q2) и медианой.
75-й процентиль (P75%) совпадает с третьим квартилем (Q3)
Расчет процентилей с помощью программирования
Процентили легко найти во многих языках программирования.
Использование программного обеспечения и программирования для расчета статистики более распространено для больших наборов данных, так как найти их вручную становится сложно.
Пример
В Python используйте метод percentile()
библиотеки NumPy, чтобы найти 65
-й процентиль значений 13, 21, 21, 40, 42, 48, 55, 72:
import numpy
values = [13,21,21,40,42,48,55,72]
x = numpy.percentile(values, 65)
print(x)
Попробуйте сами »
Пример
Используйте функцию R quantile()
чтобы найти 65-й процентиль (0.65
) значений 13, 21, 21, 40, 42, 48, 55, 72:
values <- c(13,21,21,40,42,48,55,72)
quantile(values, 0.65)
Попробуйте сами »