Что показывает доверительная вероятность
Доверительная вероятность и доверительный интервал.
Вероятность того, что истинное значение измеряемой величины лежит внутри некоторого интервала, называется доверительной вероятностью, или коэффициентом надежности,а сам интервал — доверительным интервалом.
.
на так называемый коэффициент Стьюдента. Коэффициенты Стьюдента для ряда значений
и n приведены в таблице.
Число измерений n | Доверительная вероятность y | ||
0,67 | 0,90 | 0,95 | 0,99 |
2,0 | 6,3 | 12,7 | 63,7 |
1,3 | 2,4 | 3,2 | 5,8 |
1,2 | 2,1 | 2,8 | 4,6 |
1,2 | 2,0 | 2,6 | 4,0 |
1,1 | 1,8 | 2,3 | 3,3 |
1,0 | 1,7 | 2,0 | 2,6 |
Окончательно, для измеряемой величины y при заданной доверительной вероятности y и числе измерений n получается условие
Величину мы будем называть случайной погрешностьювеличины y.
Пример: см. лекцию №5 – ряд чисел.
При числе измерений – 45 и доверительной вероятности – 0,95 получим, что коэффициент Стьюдента приблизительно равен 2,15. Тогда доверительный интервал для данного ряда измерений равен 62,6.
Источником грубых погрешностей нередко бывают резкие изменения условий измерения и ошибки, допущенные оператором:
— неправильный отсчет по шкале измерительного прибора, происходящий из-за неверного учета цены малых делений шкалы;
— неправильная запись результата наблюдений, значений отдельных мер использованного набора, например, гирь;
— хаотические изменения параметров напряжения, питающего средства измерения, например, его амплитуды или частоты.
Доверительные интервалы и доверительная вероятность
Точечные оценки имеют тот недостаток, что по ним нельзя судить о точности полученных оценок. Поэтому возникает задача определения на основании выборочных значений такого интервала, который покрывал бы неизвестной значение параметра с заданной вероятностью.
В отличие от точечной оценки, интервальная оценка позволяет получить вероятностную характеристику точности оцениваемого параметра.
Выборочные параметры являются случайными величинами, их отклонения от генеральных (т.е. погрешности их определения) также будут случайными. Оценка этих отклонений носит вероятностный характер – можно лишь указать вероятность той или иной погрешности. Для этого в математической статистике пользуются доверительными интервалами и доверительными вероятностями.
Доверительный интервал – интервал, который с заданной вероятностью накроет неизвестное значение оцениваемого параметра распределения.
Доверительная вероятность – вероятность того, что доверительный интервал накроет действительное значение параметра, оцениваемого по выборочным данным.
Оценивание с помощью доверительного интервала – способ оценки, при котором с заданной доверительной вероятностью устанавливают границы доверительного интервала.
Пусть для генерального параметра a получена из опыта несмещенная оценка a*. Нужно оценить возможную при этом ошибку. Назначим достаточно большую вероятность β – такую, что событие с этой вероятностью можно считать практически достоверным, и найдем такое значение ε для которого
(5.8.1)
называемой уровнем значимости или риском. Уровень значимости часто выражают в процентах. Иначе формулу ( (5.8.1* ) можно интерпретировать как вероятность того, что истинное значение параметра а лежит в пределах
Вероятность β называется доверительной вероятностью, доверительным уровнем или надежностью, т.к. она характеризует надежность полученной оценки.
Интервал называется доверительным интервалом. Границы интервала
и
доверительными границами. Доверительный интервал при данной доверительной вероятности определяет точность оценки параметра.
При этом отметим следующее. Ранее мы рассматривали вероятность попадания случайной величины на заданный (неслучайный) интервал. В данном случае дело обстоит иначе: величина ане случайна, зато случаен интервал I b . Случайно его положение на числовой прямой, определяемое его центром а * , случайна и длина интервала 2 e, так как величина e вычисляется, как правило, по опытным данным, т.е. по результатам эксперимента. Поэтому в рассматриваемом случае удобно толковать интервал I как вероятность того, что случайный интервал I b накроет величину а.
Величина доверительного интервала зависит от доверительной вероятности, с которой гарантируется нахождение параметра внутри доверительного интервала: чем больше величина β, тем больше и ε (т.е. с чем большей вероятностью мы хотим гарантировать полученный результат, тем в большем интервале он должен находиться).
Увеличение числа опытов проявляется в сокращении доверительного интервала при постоянной доверительной вероятности или в повышении доверительной вероятности при сохранении доверительного интервала.
ППри построении доверительного интервала решается задача об абсолютном отклонении:
(5.8.2.)
Таким образом, если известен закон распределения оценки a*, то задача определения доверительного интервала решается довольно просто.
Рассмотрим построение доверительного интервала для математического ожидания нормально распределенной случайной величины с известным генеральным стандартом σх.
Понятие генерального стандарта тесно связано с понятием точности прибора. Класс точности прибора – это выраженная в процентах относительная предельная погрешность измерения величины, равной пределу измерения прибора. В измерительной технике в большинстве отраслей промышленности под предельной погрешностью понимается величина, равная двум среднеквадратическим отклонениям
Пусть имеется выборка объема n значений случайной величины. Оценкой mx является среднее выборки:
Для построения доверительного интервала необходимо знать распределение этой оценки. Для выборок из генеральной совокупности, распределенной нормально можно показать, что также имеет нормальное распределение с математическим ожиданием mx и средним квадратическим отклонением
. Тогда
. (5.8.3.)
Задавшись доверительной вероятностью, определим по таблице значение функции Лапласа . Тогда доверительный интервал для математического ожидания будет иметь вид
или
Из оценки видно, что уменьшение доверительного интервала обратно пропорционально квадратному корню из числа наблюдений. Следовательно, если надо уменьшить возможную ошибку в два раза надо увеличить число наблюдений в 4 раза.
Если закон распределения оценки не известен, то в математической статистике применяют обычно два метода:
1) приближенный – при n более 50 заменяют неизвестные параметры их оценками;
2) от случайной величины a * переходят к другой случайной величине, закон распределения которой не зависит от оцениваемого параметра а, а зависит только от объема выборки n и от вида распределения величины Х. Такого рода величины наиболее подробно изучены для нормального закона. В качестве доверительных границ берут симметричные квантили
,
Если выразить через р,
.
На практике, как правило, число измерений конечно и не превышает 10…30. При малом числе измерений фактическая дисперсия неизвестна, поэтому для построения доверительного интервала математического ожидания используют выборочную дисперсию
и приведенную случайную величину:
t – случайная величина, имеющая распределение, отличное от нормального, зависящее от числа степеней свободы(t – распределение или распределение Стьюдента). При больших значениях n распределение Стьюдента приближается к стандартному нормальному распределению. И, по аналогии, получаем построение доверительного интервала
Дата добавления: 2020-12-22 ; просмотров: 456 ; Мы поможем в написании вашей работы!
Доверительный интервал — формула и примеры определения вероятности
В математической статистике при анализе и систематизации различных данных для подведения практических выводов часто используют метод доверительных интервалов. С его помощью выполняют определённую выборку среднего или доли с учётом стандартной ошибки. Благодаря этому достоверность вероятности увеличивается, так как оценка расширяется в обе стороны от исследуемой величины.
Общая схема построения
По сути, метод основан на модели классической математической статистики, подразумевающей бесконечно возможные выборки в генеральной совокупности. Пусть имеется главная выборка эпсилон с функцией распределения известной до некого параметра тау (Fe (x, τ)). Из этой генеральной совокупности получена выборка объёмом эн, включающая диапазон от x1 до xn. Этот параметр можно считать одномерным и принадлежащим диапазону от τ до R. Математически такое положение описывают как τ є T c R.
Если предположить, что для некоторого интервала йод, лежащего от нуля до единицы, существуют статистики S-(X|n|, J) и S+(X|n|, J), при этом им соответствует неравенство P< S-(X|n|, J) Свойство статистики и распределения
Таким образом, определить доверительную вероятность попадания тэта в интервал от S- до S+ можно от значения обратной функции в точках, равняющихся квантили статистики игрек порядка j/2 и 1 — j/2. При этом когда рассматриваемая функция монотонно убывает, знаки в неравенстве меняются на противоположные.
Пользуясь общим подходом расчёта доверительных интервалов, можно посчитать вероятность для нормальной генеральной совокупности, опираясь на ряд утверждений. Пусть известна выборка X|n,| взятая из совокупности E
N (j, ς 2 ), то есть имеющей нормальный закон распределения с математическим ожиданием j и дисперсией сигма в квадрате. Для такого состояния справедливо следующее:
Точный интервал
Существует ряд правил, позволяющих построить точные интервалы для математического ожидания и дисперсии нормально распределённой случайной величины. Есть два случая — при одном дисперсия может быть известной, а при другом нет. Следует обратить внимание, что точная доверительная вероятность строится с помощью общей схемы. Используют следующие правила для предоставления точных прогнозов:
Асимптотическое приближение
Однако не всегда можно рассчитать точный доверительный интервал. В этом случае строится приближённая вероятность — асимптотическая. Пусть для некоторого j Є (0,1) существует набор статистик S-(X|n|, j) и S-(X|n|, j), причём такие, что lim P< S-(X|n|, j) Примеры решения задач
Отсюда получают оценку: p = m / n. Теперь нужно убедиться, что p максимизирует функцию правдоподобия. То есть d2LnL / dp2 = — m / p2 — (n — m) / (1 — p)2 Использование онлайн-калькулятора
На практике довольно часто вычислить доверительную область не так уж и просто. Всё дело в том, что высокая вероятность часто находится в выборке большого объёма, поэтому приходится выполнять громоздкие вычисления. Учитывая, что доверительная вероятность определяет точность полученных результатов, другими словами, показывает, с какой вероятностью неправильное решение попадает в найденный интервал, обычно используют процент выборки от 95 до 99,9%.
Для высокой точности получения диапазона как раз и используют сервисы, которые в последнее время начали называться онлайн-калькуляторами. Это специализированные сайты, умеющие в автоматическом режиме решать различные математические задания. Особенность этих сайтов в том, что они предоставляют услуги бесплатно, при этом от их пользователей не требуется никаких знаний.
Всё что им нужно — это ввести в пролагаемую форму данные и нажать кнопку «Рассчитать». Система автоматически вычислит ответ и выведет его на экран. Из наиболее популярных можно отметить следующие сервисы:
Они доступны на русском языке, их интерфейс интуитивно понятен, поэтому воспользоваться их услугами сможет любой заинтересованный, имеющий доступ к интернету. Автоматический расчёт занимает буквально секунды, что составляет существенную разность по сравнению с затратой времени при самостоятельном вычислении.
Доверительные вероятности и уровни значимости.
По выборочным характеристикам можно построить интервал, в котором с той или иной вероятностью находится генеральный параметр. Вероятности, признанные достаточными для уверенного суждения о генеральных параметрах на основании выборочных показателей, называют доверительными.
Понятие о доверительных вероятностях вытекает из принципа, что маловероятные события считаются практически невозможными, а события, вероятность которых близка к единице, принимают за почти достоверные. Обычно в качестве доверительных используют вероятности Р1 = 0.95, Р2 = 0.99, Р3 = 0.999. Определенным значениям вероятностей соответствуют уровни значимости, под которыми понимают разность α = 1–Р. Вероятности 0.95 соответствует уровень значимости α1= 0.05 (5%), вероятности 0.99 – α2 = 0.01 (1%), вероятности 0.999 – α3 = 0.001 (0.1%).
Это означает, что при оценке генеральных параметров по выборочным показателям существует риск ошибиться в первом случае 1 раз на 20 испытаний, т.е. в 5% случаев; во втором – 1 раз на 100 испытаний, т.е. в 1% случаев; в третьем – 1 раз на 1000 испытаний, т.е. в 0.1% случаев. Таким образом, уровень значимости обозначает вероятность получения случайного отклонения от установленных с определенной вероятностью результатов. Вероятности, принятые как доверительные, определяют доверительный интервал между ними. На них можно основывать оценку той или иной величины и те границы, в которых она может находиться при разных вероятностях.
Для различных вероятностей доверительные интервалы будут следующими:
— Р1 = 0.95 интервал – 1.96σ до + 1.96σ (рис. 5)
— Р2 = 0.99 интервал – 2.58σ до + 2.58σ
— Р3 = 0.999 интервал – 3.03σ до + 3.03σ
Доверительным вероятностям соответствуют следующие величины нормированных отклонений:
— вероятности Р1 = 0.95 соответствует t1 = 1.96σ
— вероятности Р2 = 0.99 соответствует t2 = 2.58σ
— вероятности Р3 = 0.999 соответствует t3 = 3.03σ
Выбор того или иного порога доверительной вероятности осуществляют исходя из важности события. Уровень значимости в таком случае – эта та вероятность, которой решено пренебрегать в данной исследовании или явлении.
Средняя ошибка
(m), или ошибка репрезентативности.
Выборочные характеристика, как правило, не совпадают по абсолютной величине с соответствующими генеральными параметрами. Величину отклонения выборочного показателя от его генерального параметра называют статистической ошибкой, или ошибкой репрезентативности. Статистические ошибки присущи только выборочным характеристикам, они возникают в процессе отбора вариант из генеральной совокупности.
Средняя ошибка вычисляется по формуле:
(5) ,
где σ – среднее квадратическое отклонение,
n – количество измерений (объем выборки).
Выражается в тех же единицах измерения, что и .
Величина средней ошибки обратно пропорциональна численности выборочной совокупности. Чем больше размеры выборки, тем меньше средняя ошибка, а следовательно, меньше расхождение между значениями признаков в выборочных и генеральной совокупностях.
Среднюю ошибку выборки можно использовать для оценки генеральной средней согласно закону нормального распределения. Так, в пределах ±1 находится 68.3% всех выборочных средних арифметических
, в пределах ±2
– 95.5% всех выборочных средних
, в пределах ±3
– 99.7% всех выборочных средних
.
Поэтому, зная среднюю арифметическую выборки и среднюю ошибку выборки
, можно с определенной степенью вероятности судить о пределах, в которых заключены возможные величины выборочных средних. Средняя арифметическая выборки с учетом средней ошибки записывают с виде
±
, либо
±2
, либо
±3
в зависимости от значений лимитов (Хmax и Хmin). Лимиты при нормальной распределении не должны отклоняться за пределы 3
.
Доверительная вероятность
3.3 доверительная вероятность: Вероятность того, что доверительный интервал накроет неизвестное истинное значение параметра, оцениваемого по выборочным данным.
* Вероятность того, что доверительный интервал накроет истинное значение оцениваемого параметра.
Величина, показывающая вероятность того, что действительное значение исследуемой переменной находится в принятом диапазоне значений
2.40. Доверительная вероятность
2.59. доверительная вероятность; уровень доверия
Полезное
Смотреть что такое «Доверительная вероятность» в других словарях:
доверительная вероятность — — [http://www.iks media.ru/glossary/index.html?glossid=2400324] Тематики электросвязь, основные понятия EN confidence coefficient … Справочник технического переводчика
ДОВЕРИТЕЛЬНАЯ ВЕРОЯТНОСТЬ — см. Доверительное оценивание … Математическая энциклопедия
доверительная вероятность, уровень доверия — 3.9 доверительная вероятность, уровень доверия (confidence coefficient, confidence level): Величина (1 a) вероятность, связанная с доверительным интервалом или со статистически накрывающим интервалом. Примечание Величину (1 a) часто выражают в… … Словарь-справочник терминов нормативно-технической документации
Односторонняя доверительная вероятность — вероятность того, что неизвестное истинное значение параметра не выйдет за пределы нижней (или верхней) границы доверительного интервала. Источник: ГОСТ 20522 96: Грунты. Методы статистической обработки результатов испытаний … Словарь-справочник терминов нормативно-технической документации
доверительная граница — 2.60. доверительная граница Каждая из границ, нижняя T1, верхняя T2 для двустороннего доверительного интервала или граница Т для одностороннего интервала Источник: ГОСТ Р 50779.10 2000: Статистические методы. Вероятность и основы статистики.… … Словарь-справочник терминов нормативно-технической документации
Доверительная зона — Теорема Колмогорова в математической статистике уточняет скорость сходимости выборочной функции распределения к её теоретическому аналогу. Содержание 1 Формулировка 1.1 Замечание 2 … Википедия
ГОСТ Р 50779.10-2000: Статистические методы. Вероятность и основы статистики. Термины и определения — Терминология ГОСТ Р 50779.10 2000: Статистические методы. Вероятность и основы статистики. Термины и определения оригинал документа: 2.3. (генеральная) совокупность Множество всех рассматриваемых единиц. Примечание Для случайной величины… … Словарь-справочник терминов нормативно-технической документации
ГОСТ 20522-96: Грунты. Методы статистической обработки результатов испытаний — Терминология ГОСТ 20522 96: Грунты. Методы статистической обработки результатов испытаний оригинал документа: Вероятность числовая характеристика степени возможности появления какого либо определенного события в тех или иных определенных условиях … Словарь-справочник терминов нормативно-технической документации
ГОСТ 20522-2012: Грунты. Методы статистической обработки результатов испытаний — Терминология ГОСТ 20522 2012: Грунты. Методы статистической обработки результатов испытаний оригинал документа: 3.1 вероятность: Числовая характеристика возможности появления какого либо определенного события в тех или иных определенных условиях … Словарь-справочник терминов нормативно-технической документации