Статистика Интро
Статистика даёт нам методы получения знаний из данных.
Для чего используется статистика?
Статистика используется во всех областях науки и бизнеса.
Статистика даёт нам более точные знания, которые помогают нам принимать более обоснованные и правильные решения.
Статистика может сосредоточиться на том, чтобы делать прогнозы о том, что произойдет в будущем. Она также может сосредоточиться на объяснении того, как разные вещи связаны между собой.
Примечание: Хорошие статистические объяснения также полезны для прогнозов.
Типичные шаги статистических методов
Типичные шаги:
- Сбор данных
- Описание и визуализация данных
- Делаем выводы
Важно помнить обо всех трёх шагах при возникновении любых вопросов, о которых мы хотим узнать больше.
Зная, какие типы данных доступны, вы будет знать, на какие вопросы вы можете ответить с помощью статистических методов.
Знание того, на какие вопросы вы хотите ответить, поможет определить, какие данные вам нужны. Может быть доступно много данных, и важно знать, на чем сосредоточить внимание.
Как используется статистика?
Статистику можно использовать для точного объяснения вещей. Вы можете использовать её, чтобы понять и сделать выводы о группе, о которой вы хотите узнать больше. Эта группа называется совокупность.
Совокупность может состоять из самых разных групп. Например:
- Все люди в стране
- Все компании в отрасли
- Все клиенты компании
- Все, кто играет в футбол, старше 45 лет...
... и так далее - это просто зависит от того, что вы хотите знать.
Сбор данных о совокупности даст вам выборку. Это часть всей совокупности. Затем для этой выборки используются статистические методы.
Результаты статистических методов из выборки используются для выводов об основной совокупности.
Примечание: Слово "статистика" также может относиться к конкретным знаниям; как среднее значение чего-либо.
Важные понятия статистики
- Прогнозы и объяснения
- Совокупности и выборки
- Параметры и выборки статистики
- Методы выборки
- Типы данных
- Уровень измерения
- Описательная статистика
- Случайные переменные
- Одномерная и многомерная статистика
- Расчет вероятности
- Распределение вероятностей
- Статистический вывод
- Оценка параметров
- Проверка гипотез
- Корреляция
- Регрессионный анализ
- Причинный вывод
В данном учебнике мы рассмотрим эти темы шаг за шагом.
Статистика и программирование
Статистический анализ обычно выполняется с помощью компьютеров. Небольшие объемы данных можно достаточно хорошо проанализировать без компьютеров.
Раньше весь анализ данных выполнялся вручную. Это занимало много времени и приводило к ошибкам.
В настоящее время для анализа данных обычно используются программирование и программное обеспечение.
В этом курсе мы покажем примеры кода для сбора статистики на языках программирования Python и R.