Что означает многоугольник или полигон распределения дискретной случайной величины
Закон распределения дискретной случайной величины. Многоугольник (полигон) распределения.
Случайные величины: дискретные и непрерывные.
При проведении стохастического эксперимента формируется пространство элементарных событий – возможных исходов этого эксперимента. Считают, что на этом пространстве элементарных событий задана случайная величина X, если задан закон (правило) по которому каждому элементарному событию сопоставляется число. Таким образом, случайную величину X можно рассматривать, как функцию, заданную на пространстве элементарных событий.
■ Дискретная случайная величина – случайная величина, которая принимает отдельные, изолированные возможные значения с определенными вероятностями. Число возможных значений дискретной случайной величины может быть конечным и бесконечным.
■ Непрерывная случайная величина – случайная величина, которая может принимать все значения из некоторого конечного или бесконечного промежутка. Число возможных значений непрерывной случайной величины – бесконечно.
Закон распределения случайной величины – соответствие между возможными значениями случайной величины и их вероятностями, т.е. каждому возможному значению xi ставится в соответствие вероятность pi, с которой случайная величина может принять это значение. Закон распределения случайной величины может быть задан таблично (в форме таблицы), аналитически (в виде формулы) играфически.
Пусть дискретная случайная величина X принимает значения x1, x2, …, xn с вероятностями p1, p2, …, pnсоответственно, т.е. P(X=x1) = p1, P(X=x2) = p2, …, P(X=xn) = pn. При табличном задании закона распределения этой величины первая строка таблицы содержит возможные значения x1, x2, …, xn, а вторая – их вероятности
В результате испытания дискретная случайная величина X принимает одно и только одно из возможных значений, поэтому события X=x1, X=x2, …, X=xn образуют полную группу попарно несовместных событий, и, значит, сумма вероятностей этих событий равна единице, т.е. p1 + p2 +… + pn =1.
Закон распределения дискретной случайной величины. Многоугольник (полигон) распределения.
Как известно, случайной величиной называется переменная величина, которая может принимать те или иные значения в зависимости от случая. Случайные величины обозначают заглавными буквами латинского алфавита (X, Y, Z), а их значения – соответствующими строчными буквами (x, y, z). Случайные величины делятся на прерывные (дискретные) и непрерывные.
Дискретной случайной величиной называется случайная величина, принимающая лишь конечное или бесконечное (счетное) множество значений с определенными ненулевыми вероятностями.
Законом распределения дискретной случайной величины называется функция, связывающая значения случайной величины с соответствующими им вероятностями. Закон распределения может быть задан одним из следующих способов.
1. Закон распределения может быть задан таблицей:
Значения xi | x1 | x2 | x3 | . | xn |
Вероятности pi | p1 | p2 | p3 | . | pn |
События X = xi (i = 1, 2, 3,…,n) являются несовместными и единственно возможными, т.е. они образуют полную систему событий. Поэтому сумма их вероятностей равна единице: р1+р2+р3+…+рn = ∑pi =1
2. Закон распределения может быть задан аналитически (формулой) P(X = xi) = ϕ(xi). Например:
· Для наглядности представления вариационного ряда большое значение имеют его графические изображения. Графически вариационный ряд может быть изображён в виде полигона, гистограммы и кумуляты.
· Полигон распределения (дословно – многоугольник распределения) называют ломанную, которая строится в прямоугольной системе координат. Величина признака откладывается на оси абсцисс, соответствующие частоты
(или относительные частоты
) – по оси ординат. Точки
(или
) соединяют отрезками прямых и получают полигон распределения. Чаще всего полигоны применяются для изображения дискретных вариационных рядов, но их можно применять также и для интервальных рядов. В этом случае на оси абсцисс откладываются точки, соответствующие серединам данных интервалов.
· Гистограммой распределения называют ступенчатую фигуру[26], состоящую из прямоугольников, основанием которых служат частичные интервалы длиною , а высоты пропорциональны частотам (или относительным частотам) и равны
– плотность частоты (или
– плотность относительной частоты). Для построения гистограммы на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии
(или
). Заметим, что площадь гистограммы частот (относительных частот) равна сумме всех частот (относительных частот), то есть, равна объему выборки (то есть – единице).
Содержание:
Законы распределения:
Распределение случайных переменных: Каждая из случайных переменных имеет ряд возможных значений, могущих возникнуть с определенной вероятностью.
Случайные переменные величины могут носить прерывный (дискретный) и непрерывный характер. Возможные значения прерывной случайной переменной отделены друг от друга конечными интервалами. Возможные значения непрерывной случайной переменной не могут быть заранее перечислены и непрерывно заполняют некоторый промежуток.
Примерами прерывных случайных переменных могут служить:
Примеры непрерывных случайных переменных:
Если перечислить все возможные значения случайной переменной и указать вероятности этих значений, то получится распределение случайной переменной. Распределение случайной переменной указывает на соотношение между отдельными значениями случайной величины и их вероятностями.
Распределение случайной переменной будет задано законом распределения, если точно указать, какой вероятностью обладает каждое значение случайной переменной.
Такая таблица называется также рядом распределения случайной переменной.
Для наглядности ряд распределения изображают графически, откладывая на прямоугольной системе координат по оси абсцисс возможные значения случайной переменной, а по оси ординат — их вероятности. В результате графического изображения получается многоугольник или полигон распределения (график 1). Многоугольник распределения является одной из форм закона распределения.
Функция распределения
Ряд распределения является исчерпывающей характеристикой прерывной случайной перемен-
Вероятность того, что Х
При копировании любых материалов с сайта evkova.org обязательна активная ссылка на сайт www.evkova.org
Сайт создан коллективом преподавателей на некоммерческой основе для дополнительного образования молодежи
Сайт пишется, поддерживается и управляется коллективом преподавателей
Whatsapp и логотип whatsapp являются товарными знаками корпорации WhatsApp LLC.
Cайт носит информационный характер и ни при каких условиях не является публичной офертой, которая определяется положениями статьи 437 Гражданского кодекса РФ. Анна Евкова не оказывает никаких услуг.
Ряд распределения. Многоугольник распределения.
Случайной величиной называется величина, которая в результате опыта может принять то или иное значение, не известное заранее. Случайные величины бывают прерывного (дискретного) и непрерывного типа. Возможные значения прерывных величин заранее могут быть перечислены. Возможные значения непрерывных величин не могут быть заранее перечислены и непрерывно заполняют некоторый промежуток.
Пример дискретных случайных величин:
1) Число появления герба при трех бросаниях монеты. (возможны значения 0;1;2;3)
2) Частота появления герба в том же опыте. (возможные значения )
3) Число отказавших элементов в приборе, состоящем из пяти элементов. (Возможные значения величин 0;1;2;3;4;5)
Примеры непрерывных случайных величин:
1) Абсцисса (ордината) точки попадания при выстреле.
2) Расстояние от точки попадания до центра мишени.
3) Время безотказной работы прибора (радиолампы).
Случайны величины обозначаются большими буквами, а их возможные значения – соответствующими малыми буквами. Например, X – число попаданий при трех выстрелах; возможные значения: X1=0,Х2=1, Х3=2, Х4=3.
Обозначим вероятности этих событий буквами p с соответствующими индексами:
Так как несовместные события образуют полную группу, то
,
то есть сумма вероятности всех возможных значений случайной величины равна 1. Эта суммарная вероятность каким-то образом распределена между отдельными значениями. Случайная величина будет полностью описана с вероятностной точки зрения, если мы зададим это распределение, то есть в точности укажем какой вероятностью обладает каждое из событий. (Этим мы установим так называемый закон распределения случайных величин.)
Законом распределения случайной величины называется всякое соотношение, устанавливающее связь между возможными значениями случайной величины и соответствующей им вероятности. (Про случайную величину мы будем говорить, что она подчинена данному закону распределения)
Простейшей формой задания закона распределения случайной величины является таблица, в которой перечислены возможные значения случайной величины и соответствующие им вероятности.
Xi | X1 | X2 | … | Xn |
Pi | P1 | P2 | … | Pn |
Такую таблицу называют рядом распределения случайных величин.
Чтобы придать ряду распределения более наглядный вид прибегают к его графическому изображению: по оси абсцисс откладывают возможные значения случайной величины, а по оси ординат – вероятности этих значений. (Для наглядности полученные точки соединяют отрезками прямых.)
Рисунок 1 – многоугольник распределения
Такая фигура называется многоугольником распределения. Многоугольник распределения, так же как и ряд распределения, полностью характеризует случайную величину; он является одной из форм закона распределения.
производится один опыт, в котором может появиться или не появиться событие А. Вероятность события А=0,3. Рассматривается случайная величина Х – число появлений события А в данном опыте. Необходимо построить ряд и многоугольник распределения величины Х.
Функция распределения является универсальной характеристикой случайной величины. Она существует для всех случайных величин: как прерывных, так и не прерывных. Функция распределения полностью характеризует случайную величину с вероятностной точки зрения, то есть является одной из форм закона распределения.
Для количественной характеристики этого распределения вероятностей удобно воспользоваться не вероятностью события X=x, а вероятностью события X
2.2.6. Многоугольник распределения
Итак, пусть дискретная случайная величина задана своим законом распределения:
Многоугольником распределения вероятностей данной величины называют ломаную, звенья которой соединяют соседние точки . Иногда вместо «многоугольника» используют термин полигон, но этот вариант больше в ходу в математической статистике.
Задача 91
Построить многоугольник распределения вероятностей случайной величины
Решение: чертим прямоугольную систему координат, в которой по оси абсцисс отсчитываются – значения случайной величины, а по оси ординат
– их вероятности. Отмечаем на чертеже точки
, в данном случае их пять, и соединяем «соседей» отрезками:
При выполнении чертежа от руки по возможности придерживайтесь следующего масштаба:
горизонтальная ось: 1 ед. = 2 тетрадные клетки (1 см);
вертикальная ось: 0,1 = 2 тетрадные клетки.
Если значения достаточно велики, то ось абсцисс можно «разорвать» (не чертить её кусочек после единицы), и справа продолжить нумерацию, например, с 20.
Теперь обратите внимание на следующую важную вещь: помимо того, что дискретную случайную величину можно изобразить с помощью многоугольника – её ведь можно ещё и ЗАДАТЬ этим способом. До сих пор мы делали это с помощью таблички, но никто же не мешает использовать и чертёж!
Задача 92
Дискретная случайная величина задана своим многоугольником
Записать закон распределения данной случайной величины, выполнить проверку.
Это задание для самостоятельного решения. И тут мы, кстати, видим изъян графического способа: по чертежу не всегда понятны точные значения случайной величины и их вероятности.
На практике задачи с многоугольником встречаются довольно часто, но гораздо бОльшее распространение получила:
Также вы можете изучить эту тему подробнее – просто, доступно, весело и бесплатно!
С наилучшими пожеланиями, Александр Емелин
2. Дискретный вариационный ряд.
Полигон частот и эмпирическая функция распределения
На вводном уроке по математической статистике мы узнали, что такое математическая статистика, и теперь обо всём подробнее. Далее для удобства я буду нумеровать статьи и постараюсь делать их не слишком длинными. Потому что всё действительно просто, и главное, здесь научиться рациональной технике вычислений, на которую и будет сделан особый упор.
Интервальные и дискретные вариационные ряды почти сразу же встретились в предыдущей статье, и мы начинаем с дискретного случая, когда количественная эмпирическая величина может принимать лишь отдельные изолированные значения.
…что-то не понятно по терминам? Срочно изучать первый урок! (ссылка выше)
Дискретный вариационный ряд – это упорядоченное по возрастанию (как правило) множество вариант (значений величины
) и соответствующих им частот либо относительных частот.
Частоты выборочной совокупности обозначают через , частоты генеральной совокупности – через
. И сразу разбираемся с новым термином. Относительные частоты рассчитываются по формулам:
, где
– объем выборки, при этом, сумма всех относительных частот:
.
Аналогично для совокупности генеральной: , где
– её объем, и, очевидно:
И тут вспоминается Пример 2 об оценках по матанализу в группе из студентов:
– пожалуйста, пример дискретного вариационного ряда, где варианты – это оценки, а частоты
– количество студентов, получивших ту или иную оценку.
Для разминки найдём относительные частоты:
и непременно проконтролируем, что: .
Все вычисления обычно проводят на калькуляторе либо в Экселе, а результаты заносят в таблицу, при этом, в статистике данные чаще располагают не в строках, а в столбцах:
Такое расположение обусловлено тем, что количество вариант может быть достаточно велико, и они просто не вместятся в строчку. Не редкость, когда их 10-20, а бывает, и 100-200, что тоже и неоднократно встречалось в моей практике. И это не какие-то супер-пупер расчёты, а учебные задачи!
После сей позитивной новости продолжаем 🙂
Откуда берутся дискретные вариационные ряды? Такие ряды появляются в результате учёта дискретной характеристики статистической совокупности, причём, варианты ряда не отличаются большим разнообразием. Например, оценки (коих не так много) в примере выше.
И сейчас мы примем непосредственное участие в этом процессе:
По результатам выборочного исследования рабочих цеха были установлены их квалификационные разряды: 4, 5, 6, 4, 4, 2, 3, 5, 4, 4, 5, 2, 3, 3, 4, 5, 5, 2, 3, 6, 5, 4, 6, 4, 3. Требуется:
– составить вариационный ряд и построить полигон частот;
– найти относительные частоты и построить эмпирическую функцию распределения.
Чего томиться? – вся тема урока в одной задаче!
Решение: в условии прямо сказано о том, что перед нами выборка из генеральной совокупности (всех рабочих цеха), и первое, что логично сделать – подсчитать её объем, т.е. количество рабочих. В данном случае это легко сделать устно: .
Квалификационные разряды – есть величина дискретная, и поэтому нам предстоит составить дискретный вариационный ряд (обратите внимание, что в условии ничего не сказано о характере ряда).
Если у вас под рукой нет вычислительных программ, то вручную (Эксель разберём ниже). При этом оптимальным может быть следующий алгоритм: сначала окидываем взглядом все числа и определяем среди них минимальное (примерно) и максимальное (примерно). В данном случае ориентировочный диапазон – от 1 до 7. Записываем их в столбец на черновике и обводим в кружочки. Далее начинаем вычёркивать карандашом числа из исходного списка:
и делать около соответствующих кружков засечки:
После того, как все числа будут вычеркнуты, подсчитываем количество засечек в каждой строке:
И обязательно проверяем, получается ли у нас в сумме объём выборки :
, отлично, искомый ряд составлен, заносим полученные значения в таблицу на чистовик:
…ну что же, вполне и вполне логично – рабочих средней квалификации много, а учеников и мастеров – мало. Полученные результаты позволяют достаточно точно судить об уровне квалификации всего цеха (если, конечно, выборка представительна)
Построенный вариационный ряд также называют статистическим распределением выборки, причём, этот термин применИм не только для дискретного, но и для интервального ряда, который мы рассмотрим на следующем уроке.
Построим полигон частот. Это статистический аналог многоугольника распределения дискретной случайной величины (кто изучал). Полигон частот – это ломаная, соединяющая соседние точки :
…эх, ностальгия. Но, пятилетку-другую, думается, так решать ещё будут.
Теперь современный способ:
Решаем! – исходные данные с пошаговой инструкцией прилагаются.
Вторая часть задачи. Найдём относительные частоты , для этого каждую частоту
делим на
и результат заносим в дополнительный столбец, далее я перехожу к электронной версии:
– обязательно проверяем, что сумма относительных частот равна единице!
Иногда требуется построить полигон относительных частот. Как вы правильно догадываетесь – это ломаная, соединяющая соседние точки . Но такое задание больше характерно для интервального вариационного ряда.
А теперь посмотрим на относительные частоты и задумаемся, на что они похожи? …Правильно, на вероятности. Так, например, можно сказать, что – есть примерная вероятность того, что наугад выбранный рабочий цеха будет иметь 4-й разряд. «Примерная» – по той причине, что перед нами выборка.
А вот если учесть ВСЕХ рабочих цеха (всю генеральную совокупность), то рассчитанные относительные частоты – и есть в точности эти вероятности.
Построим эмпирическую функцию распределения . Это статистический аналог функции распределения из тервера. Данная функция определяется, как отношение:
, где
– количество вариант СТРОГО МЕНЬШИХ, чем
,
при этом «икс» «пробегает» все значения от «минус» до «плюс» бесконечности.
Очевидно, что на интервале , и, кроме того, функция равна нулю ещё и в точке
. Почему? Потому, что значение
определяет количество вариант, которые СТРОГО меньше двух, а это количество равно нулю.
На промежутке – и опять обратите внимание, что значение
не учитывает рабочих 3-го разряда, т.к. речь идёт о вариантах, которые СТРОГО меньше трёх.
На промежутке и далее процесс продолжается по принципу накопления частот:
– если , то
;
– если , то
;
– и, наконец, если , то
– и в самом деле, для ЛЮБОГО «икс» из интервала
ВСЕ частоты расположены СТРОГО левее этого «икс».
Накопленные относительные частоты удобно записывать в отдельный столбец таблицы, при этом алгоритм вычислений очень прост: сначала сносим слева 1-е значение (красная стрелка), а каждое следующее получаем как сумму предыдущего и относительной частоты из текущего левого столбца (зелёные обозначения):
Вот, кстати, ещё один довод за вертикальную ориентацию данных – справа по надобности можно приписывать дополнительные столбцы.
Саму функцию принято записывать в кусочном виде:
а её график представляет собой ступенчатую фигуру:
Эмпирическая функция распределения не убывает и принимает значения из промежутка , и если у вас вдруг получится не так, то ищите ошибку.
И сейчас мы автоматизируем процесс; видео, к сожалению, не вписалось по ширине, посему смотрим его на Ютубе:
Как построить эмпирическую функцию распределения?
Эмпирическая функция распределения строится по выборке и приближает теоретическую функцию распределения
. Легко догадаться, что последняя образуется на основании исследования всей генеральной совокупности, но если рабочих в цехе ещё пересчитать можно, то звёзды на небе – уже вряд ли. Вот поэтому и важнА именно эмпирическая функция, и ещё важнее, чтобы выборка была репрезентативна, дабы приближение было хорошим.
Миниатюрная задача для закрепления материала:
Дано статистическое распределение выборки
Составить эмпирическую функцию распределения, выполнить чертёж
Самостоятельно решить Пример 5 в Экселе, все числа и обозначения уже там.
Свериться с образцом можно ниже. По поводу красоты чертежа сильно не запаривайтесь, главное, чтобы было правильно – этого обычно достаточно для зачёта.
И я жду вас на третьем уроке, где речь пойдёт об интервальном вариационном ряде.
Пример 5. Решение: заполним расчётную таблицу:
Составим эмпирическую функцию распределения:
Выполним чертёж:
Автор: Емелин Александр
(Переход на главную страницу)
Zaochnik.com – профессиональная помощь студентам
cкидкa 15% на первый зaкaз, прoмoкoд: 5530-hihi5
Tutoronline.ru – онлайн репетиторы по математике и другим предметам