Alexander Kuklev (akuklev) wrote,
Alexander Kuklev
akuklev

Распределение Стьюдента в контексте байесовского анализа

Пусть у вас есть случайная величина X с распределением P(x), про которое известно, что оно относится к некому семейству: в типовом случае известно, что это нормальное распределение P[µ, ε](x), где параметры µ и ε (среднее и дисперсия) заранее неизвестны.

Чтобы найти неизвестные параметры, вы делаете несколько измерений X, получаете в результате выборку чисел x1, …, x_n. Вы можете найти наиболее вероятные значения параметров исходя из имеющихся измерений: наиболее вероятное µ* = среднее выборки, наиболее вероятное ε* = дисперсия выборки (как корень среднеквадратичного отклонения от среднего выборки.
Теперь следующий вопрос: какова оценка распределения X исходя из имеющейся у нас информации (N семплов)?

Люди часто считают, что оценка — P[µ*, ε*](x), но это не так! Чтобы найти правильную оценку*, следует взять P[µ', ε'](x) для всех возможных µ' и ε' и усреднить с весами соответствующими тому, насколько вероятна соответствующая пара (µ', ε') исходя из имеющейся у нас информации. Распределения µ' и ε' (выборочного среднего и выборочной дисперсии соответственно) зависят только от (µ*, ε*) и числа N измерений, которые мы используем. Таким образом, оценкой (исходя из N проделанных измерений) распределения X является некое распределение SP[µ*, ε*, N](x), называемое распределением Стьюдента для распределения P и быстро стремящееся к P[µ*, ε*](x) при увеличивающемся N.

(* ниже в комментариях подробное обсуждение того, в каком смысле это _правильная_ оценка. Благодарю certus и ro-che.info.)

Сам Уилльям Госсет, писавший под псевдонимом Стьюдент, вычислил только классическое распределение Стьюдента — т.е. распределение Стьюдента, стремящееся к нормальному. Много позже были подсчитаны распределения Стьюдента для других распространённых распределений.

На практике весьма полезно т.н. косонормальное (skew-normal) распределение, оно отвечает следующему физическому положению дел: пусть величина X распределена нормально, как будет распределена величина Y = f(X)? Если f линейная функция или близка к линейной локально, то Y тоже будет распределена нормально. Однако если нелинейностью f нельзя пренебречь, можно учесть ещё и вторую производную: тогда Y будет распределена косонормально. У косонормального распределения к параметрам матожидание и дисперсия добовляется коэффициент асимметрии. Альтернативно можно рассматривать матожидание, положительную дисперсию и отрицательную дисперсию (у последние всегда совпадают у нормального распределения). Для косонормального распределения рассчитано соответствующее косое распределение Стьюдента SP[µ*, ε*, γ*, N](x).

_____
Отдельно благодарю молодого учителя физики лет 20-22 (чьё имя я, увы, уже не помню), который работал в нашей 64 физматшколе в Омске, и как-то раз несколько недель ведшего наш класс, за то что он не пожалел сил и нескольких часов своего времени после уроков, чтобы рассказать мне, тогдашнему восьмикласснику-почемучке с тысячей вопросов, про распределение Стьюдента, центральные предельные теоремы, хи-квадрат и массу других полезных вещей.
Subscribe

  • (no subject)

    Встретил фотографию толпы футбольных фанатов, и она меня скорее напугала, у меня уж точно нет желания быть там среди них. Но внезапно я понял, что…

  • Прогресс

    Десять дней назад, вторая ступень SpaceX'овского корабля Starship своим ходом слетала своим ходом на десять километров вверх, и усмепшно приземлилась…

  • О водосбережении

    Как известно, питьевая вода во многих странах дефицитный ресурс. И даже в дождливой Германии летом иногда случаются засухи, в результате которых она…

  • Post a new comment

    Error

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 5 comments