LINUX.ORG.RU

Как посчитать среднюю вероятность от вероятностных вероятностей?

 


1

2

Пусть будет множество процессов, каждый из которых состоит из событий А и Б. Для каждого процесса можно посчитать процент событий А от известной выборки и предположив что это его вероятность, посчитать арифметическую среднюю вероятность для всех процессов. Так же пособирав такие вероятности, можно посчитать возможные границы вероятности процесса А для любого последующего подобного процесса.

Примерно такие же рассуждения можно делать на Гауссовских средних, но меня интересует расчет вероятностей. Использовать это можно для расчета прогнозирования.

Как упомянул, для каждого процесса, делается предположение вероятности А по ограниченной выборке.

А если большинство процессов возможно наблюдать маленькое количество раз? Например всего лишь 5 раз, и в нем 4 раза было событие. 4 из 5 это слишком не определенно какая в итоге будет вероятность. Какое распределение вероятностей для выборочной вероятности одного процесса понимание имеется. Так же понятно какие границы у множества вероятностей, если эти вероятности известны, но в ограниченном количестве.

Вопрос, как можно сложить несколько вероятностных вероятностей для расчета средней и границ? Ведь по сути 5 наблюдений, или 100 наблюдений, все равно остается разброс возможной вероятности для одного процесса. Значит даже при сложении вероятностей из 100 или 100500 наблюдений, все равно должен применяться некий коэффициент взвешивания зависимый от количества наблюдений.

Есть еще отдельный вопрос, как можно учесть в этой сумме те процессы, в которых наблюдений было всего один раз, т.к. если таких было много, то ихняя средняя по наличию и отсутствию события будет то же в какой то степени средней вероятностью.

Есть на эту тему какие либо описания?

как можно сложить несколько вероятностных вероятностей для расчета средней и границ?

Для классических доверительных интервалов можно использовать квантили распределения хи-квадрат ©: библиотека scipy для языка python, функция scipy.stats.distributions.chi2.ppf.

Для остальных — один из вариантов непараметрической статистики ©.

А если большинство процессов возможно наблюдать маленькое количество раз?

Бутстреп, малые выборки, применение в анализе данных ©.

Есть на эту тему какие либо описания?

Справочник по теории вероятностей и математической статистике ©.

quickquest ★★★★★ ()
Ответ на: комментарий от quickquest

Ну Вы как всегда много умного сказали, но все не то.

Квантили хи-квадрат используют для для гауссовских распределений, здесь же смесь беты с тем что попадется.

Бутстреп, спасибо за название, в другом месте это как-то семплированием называли. В остальном это пока не решение.

Этим бутстрепом я могу найти по отдельности границы распределения величины вероятность, и границы группы вероятностей если они точные, а не выборочные. Что я и делаю. А соединить эти две схемы пока не понятно как.

Ну и кидать ссылку на справочник по всему направлению математики означает на самом деле, что Вы ответа не знаете, но зачем то пытаетесь ответить.

victor79 ()
Последнее исправление: victor79 (всего исправлений: 1)
Ответ на: комментарий от victor79

здесь же смесь беты с тем что попадется

Дык, сразу нужно было признаваться, что гаусса нету.

Для этого случая есть робастные статистики © и, например, как частный случай, порядковые статистики ©.

Ну и кидать ссылку на справочник по всему

Ссылка «по всему» на вопрос: «какие либо описания?» :)

А конкретные ответы на особые случаи лучше искать на форумах статистиков типа ©.

quickquest ★★★★★ ()
Ответ на: комментарий от quickquest

Ну и на этом спасибо) На другом форуме позже может еще спрошу, а пока посмотрю что здесь еще ответят. Я этот вопрос как то давно уже пытался спрашивать на форумах, но пока никто не ответил.

victor79 ()

Бутстреп получает доверительные интервалы оптимальные для собранной выборки. Не понимаю чего вам не нравится в нем?

psv1967 ★★★★★ ()
Ответ на: комментарий от psv1967

Не понимаю чего вам не нравится в нем?

Это потому что вы как и предыдущий отвечающий не прочитали или не задумались над вопросом.

Можно посчитать доверительные интервалы при известных точках. Но что делать если сами точки не известны, а известны лишь области доверительных интервалов их нахождения?

Я впринципе наполовину прикинул как считать, но пока что на половину. Нужно сначала группу посчитать исходя из того что точки известны. Откуда будут доверительные интервалы для желаемых N точек. А после для того же расчета при состоянии N добавлять одну вероятностную точку, и смотреть, при котором разбросе у вероятностной точки, область группы при N+1 будет не лучше чем у группы при N. Т.е. точки с большим разбросом добавлять уже не имеет смысл.

Ну а после искать зависимость разброс группы + разброс точки, какой получится из этого разброс.

После на практике, сортируем точки по возрастанию их области, и начинаем считать область группы, как только предполагаемая область следующего шага будет не меньше чем область текущего шага, то все точки с большей областью отбрасываем.

victor79 ()
Ответ на: комментарий от victor79

И что из пальца высосаны эти «известные доверительные интервалы нахождения точек»? Или только максимум и минимум мегаучет сохраняет вместо полной выборки? Ну так это никак не «доверительный интервал».

Если же выборка точек сохраняется в учете, то не делайте голову нам, и считайте бутстрепом (ну почитайте, может параметрический вариант кто то под именно такие данные делал).

psv1967 ★★★★★ ()
Ответ на: комментарий от psv1967

то не делайте голову нам, и считайте бутстрепом

Да не, я не просил меня вразумлять. Я лишь спросил указать описания по конкретно этой теме, если таковы есть. Просто любопытно, вроде тема которая может быть повсеместно применяться, но никаких точных описаний, кроме бутстрепа да и то не по теме, а то же общее, нет.

victor79 ()
Закрыто добавление комментариев для недавно зарегистрированных пользователей (со score < 50)