Главная » Статьи » Обзорные » Тематические |
“Есть ложь, есть большая ложь и есть статистика”, - так сказал Марк Твен. Применение статистических методов для научных, промышленных, или социальных исследований, используется для изучения различных процессов или состава населения. Обычно это количество населения в стране, или изучение пород в скале, или количество произведенных товаров в течение определенного периода. Эти данные исследуются на протяжении определенного промежутка времени; подобные о "населении" имеют название временных рядов. По практическим соображениям данные собираются не со всей популяции населения, а как правило, исследователи выбирают подмножество, которое называется - выборка. Данные о выборке собираются с помощью наблюдений и в экспериментальных условиях. В дальнейшем полученные данные подвергаются статистическому анализу, цель которого выполнить две взаимосвязанные задачи: описание и выводы. Детальные описательные статистики применяются, чтобы обобщить данные, они могут быть представлены либо численно, либо графически, для описания выборки. Основным видом описательной статистики являются среднее и стандартное отклонение. Для графического описания данных используют некоторые виды диаграмм и графиков. Полученная статистика используется для создания типовых моделей с погрешностью на случайность, и представляют выводы о крупных популяциях. Эти выводы могут быть в виде ответов: да / нет (гипотезы), оценки числовых характеристик (оценка), описания ассоциации (корреляция), или моделирование взаимосвязей (регрессии). Другие методы моделирования включают ANOVA (дисперсионный анализ), временные ряды. Остановимся на корреляции. При проведении статистического анализа часто получается, что две переменные (например две характеристики населения вес и рост), как правило, изменяются при изменении другой, как если бы они были взаимосвязаны. Вот пример, при исследовании годового дохода населения и возраста смерти среди населения, часто обнаруживается, что бедные люди, как правило, живут меньше, чем длится жизнь богатых людей. Эти две переменные, как говорят, коррелируют (в данном случае - положительная корреляция). Тем не менее, нельзя только основываясь на этом делать вывод о существовании причинно-следственной связи между нашими двумя переменными. Необходимо опасаться преждевременных выводов насчет корреляции, т.к. это явление может быть вызвано третьей переменной, на которую не обратили внимание, которую называют скрытой переменной или смешанной переменной. Если выборка получилась репрезентативной для населения, то предположения и выводы, сделанные на основе этой выборки могут быть разнесены на все население в целом. Основная проблема заключается в определении того, насколько выбранный образец представителен. Статистика предоставляет методы для оценки этого. Также в статистике используется рандомизация, чтобы в образец попали данные случайным образом. Математическая статистика (величается теорией статистики), является частью прикладной математики, которая использует теорию вероятностей и анализ, чтобы изучить теоретические основы статистики. Использование каждого статистического метода является правильным только тогда, когда рассматриваемая выборка удовлетворяет основным математическим предположениям о статистическом методе. Некорректное использование статистических методов может произвести маленькие, но серьезные ошибки в описании и интерпретации - маленькие в том смысле, что даже опытные специалисты иногда делают подобные ошибки, серьезные в том смысле, что они могут влиять, например, на социальную политику, медицинскую практику или надежность строений (например мосты). Набор базовых статистических навыков (и скептицизма), необходимые людям в наше время постоянной поступающей информации в нашей жизни называют статистической грамотности. | |
Категория: Тематические | Добавил: irusymix (04.02.2013) | |
Просмотров: 391 |
Всего комментариев: 0 | |