stat_analysis


Статистический анализ данных


Previous Entry Share Next Entry
Закон больших чисел и центральная предельная теорема
Сакура
ady_1981 wrote in stat_analysis
Чему нас учит "закон больших чисел"?

1) Как ни странно, одной простой вещи: если есть много случайных реализаций одной и той же величины, а нужно знать и использовать истинное значение этой величины, то в качестве такого значения можно принять обычное среднее значение от всех реализаций.
Почему лучше использовать именно среднее значение?
Чтобы ответить на этот вопрос, нужно ввести математическое качество среднего значения.
2) Оказывается, чтобы понять суть этого качества, нужно выучить второй урок закона больших чисел: гарантии для статистических выводов существуют только в вероятностном пределе. Например, это означает, что мы может надеяться лишь на то, что *вероятность* отклонения статистической характеристики, вычисленной из имеющихся данных, от реального значений этой характеристики будет стремиться к нулю для увеличивающейся выборки (в бесконечном пределе).

Пример. Мореплаватели только сравнительно недавно научились точно определять координаты своего корабля вдали от берега. Раньше, чтобы определить коордитату долготы корабля (то есть угол поворота Земного шара) надо было точно знать гринвичское время. Однако, до XIX века существовавшие часы не обеспечивали для измерения долготы точности. Когда в 1831 г. в кругосветное путешествие отправлялся корабль "Бигль" (с молодым Ч. Дарвином на борту), то капитан корабля взял с собой 24 хронометра. Время капитал определял усреднением всех показателей.

3) Теперь, для того, чтобы совсем понять основы основ математической статистики не хватает только двух уроков. Первый них (и третий по счету) состоит в том, что распределение *любых* случайных величин в первом приближении (а до второго обычно никто не доходит) характеризуются только двумя характеристиками: математическим ожиданием (обобщенным средним значением) и дисперсией.
Ключевой момент математического ожидания MX состоит в том, что оно должно существовать (чтобы надеяться на нормальные себе асимпотические законы распределения).
На вопрос, откуда вдруг взялась дисперсия ответ таков: это мера частоты отклонения от "среднего".
Вообще, по определению дисперсии: M{(X_ист-X_ср)^2}.
4) А второй урок из двух (и четвертый по счету) состоит в центральной предельной теореме. Она нас учит каково распределение отклонения среднего значения от истинного значения величины. Точнее, не совсем уж учит, а показывает куда копать и как глубоко. Она нам говорит, каково точное *асимпотическое* распределение этого отклонения. Итак, глубокий фокус тут состоит в том, что хотя мы совсем не знаем распределение нашей случайной величены, но каково бы оно не было и какова бы ни была природа этой величены, мы в пределе бесконечной выборки знаем плотность распределения среднего значения нашей величены от истинного значения (точнее распеределение величины n^(1/2)*(X_ист-X_ср), n - размер выборки). Итак, с бесконечными выборками, как выяснилось, все хорошо, но вопрос, что делать с земными, конечными выборками? Оказывается, что если мы можем допустить гипотезу, что при некотором размере выборки наше искомое распределение можно считать асимпотическим, то можно использовать на здоровье это известное асимпотическое распеределение. Оно оказалось на удивление - нормальным, гауссовым (c некоторыми параметрами).
Оказывается, что в рамках гипотезы о возможности использования асимпотического распределения, оценка дисперсии легко и безболезненно расчитывается.
5) И еще раз, зачем нужна оценка дисперсии? Оценка на среднее и оценка на дисперсию в случае с известной плотностью (которая, как правило, рано или поздно возникает в асимптотическом приближении) дает нам полное знание о нашей задаче. Никакого другого знания без новых данных, увы, уже быть не может.

Далее рассмотрим примеры (в смысле далее потом :)). После осветим другие вопросы (асимпотические, и не только, функции плотности вероятностей, доверительные интервалы, статистические гипотезы, оценивание параметров по выборке).

?

Log in

No account? Create an account