Что означает параметр а1 в однофакторной регрессионной модели а0 а1х
Корреляционно-регрессионный анализ: аналитическое выражение уравнения (прямолинейной, криволинейной) регрессии для однофакторной корреляционно-регрессионной модели
Применение корреляционно-регрессионного метода анализа явлений начнем с оценки парной корреляции и построения однофакторной модели зависимости результативного признака от факторного в виде уравнения корреляционной связи. Уравнение корреляционной связи часто называют уравнением регрессии, показывающим вид зависимости среднего значения результативного признака от факторного. Аналитическая связь между результативным и факторным признаками может описываться уравнениями:
прямой a0 + a1x ;
гиперболы a0 + a1/x ;
параболы порядка
a0 + a1x +a2x 2 ;
степенной функции и т.д.
Прежде чем приступить к построению модели – уравнения регрессии, необходимо выбрать тип функции, т.е. форму корреляционной связи. Некоторые данные о форме связи можно получить из графика эмпирической линии регрессии. Если на корреляционном поле соединить точки отрезками прямой, то получится ломаная линия с некоторой тенденцией к росту или снижению, которая и называется эмпирической линией регрессии. На рис. 8.2 представлена в качестве примера эмпирическая линия регрессии заработной платы почтовых работников (У) от их производительности труда (Х).
Рис. 8. 2. График корреляционной зависимости заработной платы (y)
и производительности труда (x). Графический способ подбора лучшей формы корреляционной зависимости между (y) и (x) по максимальному значению R².
Изломы эмпирической линии регрессии y обусловлены тем, что на результативный показатель оказывают влияние кроме х другие факторы. Если отвлечься (абстрагироваться) от влияния других факторов, кроме х, то можно сделать вывод о виде аналитической функции yx, в определенной степени отражающей характер зависимости между y и х. В данном случае можно склониться к прямолинейной форме связи. Внешний вид эмпирической линии регрессии позволяет зрительно установить теоретическую форму зависимости y от х.
Главной же в обосновании формы теоретической линии связи должна быть экономическая теория, определяющая сущность и природу изучаемых явлений и, следовательно, взаимосвязь между ними. В примере взаимосвязь между оплатой труда и выработкой в виде прямой линии может быть принята только условно, для каких-то узких целей. В соответствии с экономической теорией воспроизводства, рост производительности труда должен опережать рост зарплаты, т.е. зависимость должна быть криволинейной и иметь вид экспоненты. При таком подходе к выбору зависимости корреляционное уравнение может быть использовано не только для анализа состояния экономической системы, но и для прогнозирования и планирования результатов и факторов производства.
После выбора вида зависимости приступают к расчету параметров аналитического уравнения корреляционной связи (уравнения регрессии). Параметры находят на основе метода наименьших квадратов. Для нахождения параметров уравнения прямой = а0+а1х используется система нормальных уравнений вида:
a0n+a1Sx=Sy,
где n – объем исследуемой совокупности (число единиц наблюдения).
Решение этой системы относительно а0 и а1 позволяет определить параметры уравнения регрессии:
;
.
По уравнению регрессии можно найти выровненные теоретические значения результативного признака при соответствующих значениях фактора х. Отклонения фактических значений (y) от теоретических обусловлены тем, что регрессия (y) строилась только по одному фактору (х), в то время как в действительности (y) зависит от множества факторов.
Выбор теоретической формы корреляционной связи всегда несколько условен, так как в действительности зависимости между признаками лишь приблизительно соответствуют функциональным. Поэтому только при высокой тесноте связи между признаками линия регрессии имеет содержательный смысл и практическое значение.
Показателями тесноты корреляционной связи служат коэффициент и индекс корреляции. Теснота связи между признаками измеряется с помощью показателей вариации результативного признака y.
На рис. 8.3 изображены три линии: y – ломаная, называемая эмпирической линией регрессии, которая отражает фактические значения y при соответствующих значениях факторного признака х; – прямая линия, параллельная оси абсцисс, соответствующая среднему значению y при исключении влияния всех факторов;
– выравненная линия регрессии, характеризующая значения y при абстрагировании всех факторов, кроме фактора х. Поскольку на y помимо х оказывают влияние и другие факторы, то линия y не совпадает с линией
. Это несовпадение свидетельствует о неполной связи между yи х.
Чтобы измерить, насколько связь близка к функциональной, исчисляют показатели тесноты связи. Для этого необходимо оценить вариацию результативного признака y, вызванную только влиянием признака х, и остаточную его вариацию, обусловленную прочими факторами.
Общая дисперсия результативного признака характеризует вариацию y под влиянием всех факторов.
Средний квадрат отклонений от
измеряет вариацию y только под влиянием фактора х – это факторная дисперсия.
Средний квадрат отклонений y от = S(y–
) 2 /n характеризует остаточную вариацию y под влиянием всех остальных факторов. В математической статистике доказано, что s 2 y =
, т.е.
. Поэтому эту дисперсию называют остаточной дисперсией, она характеризует вариацию y за счет остальных факторов, не включенных в уравнение регрессии.
Пример построения однофакторной регрессионной модели связи
Уравнение парной линейной корреляционной связи имеет следующий вид:
,
где — расчетное теоретическое значение результативного признака Y, полученное по уравнению регрессии;
Гипотеза о линейной зависимости между признаками Х и Y выдвигается в том случае, если значения обоих признаков возрастают (или убывают) одинаково, примерно в арифметической прогрессии.
Уравнение парной линейной корреляции показывает среднее изменение результативного признака Y при изменении фактора Х на одну единицу его измерения, т.е. вариацию признака Y, которая приходится на единицу вариации фактора Х. Знак параметра указывает направление этого изменения.
Коэффициенты уравнения а0, а1отыскиваются методом наименьших квадратов (МНК). Как изложено в раздел II – Теоретические основы и методика корреляционно-регрессионного анализа данных (п.3 – Моделирование однофакторных корреляционных связей на основе функциональных зависимостей), в основу МНК положено требование минимальности сумм квадратов отклонений эмпирических значений yi от выровненных . При линейной зависимости критерий минимизации (7.4.1.) принимает вид:
7.4.1.
Для нахождения значений параметров а0, а1, при которых функция двух переменных Sможет достигнуть минимума, приравнивают к нулю частные производные Sпо а0, а1 и тем самым получают систему 2-х уравнений с двумя неизвестными а0, а1:
7.4.2.
Сократив каждое уравнение на –2, раскрыв скобки и перенеся члены с х в одну строку, а с y – в другую, для определения а0, а1 получают систему:
Эта система называется системой нормальных уравнений МНК для линейного уравнения регрессии.
Все суммы, необходимые для конкретизации нормальных уравнений, определяют по эмпирическим данным (xi, yi).
Решая полученную систему, находят искомые параметры а0, а1 – коэффициенты линейного уравнения регрессии.
Расчет коэффициента может быть выполнен по формулам:
; 7.4.3.
. 7.4.4.
Иногда эти коэффициенты удобнее вычислять по формулам:
7.4.5.
7.4.6.
где — среднее из произведения;
— среднее квадратов;
— произведение средних;
— квадрат средних.
Построив линейное уравнение регрессии, следует проанализировать качество синтезированной регрессионной модели, оценить адекватность и практическую пригодность модели, дать ее экономическую интерпретации. Как уже отмечалось, на этапе регрессионного анализа определяется теоретическое выражение связи между признаками (форма связи). Для построения и анализа теоретической линии, определяемой на базе эмпирического материала, необходимо знать параметры уравнения регрессии.
Рассмотрим более подробно определение параметров для линейного уравнения парной регрессии. Рассчитаем эти показатели:
Линейное уравнение парной регрессии имеет вид:
На базе данных таблицы
Вспомогательная таблица для расчета уравнения линейной регрессии
Номер предприятия | Кредитные вложения, млн.руб. | Прибыль банков, млн.руб | | | |
гр4=гр2*гр3 | гр5=гр2*гр2 | 33,739+0,33*х | |||
157,489 | |||||
160,459 | |||||
164,419 | |||||
175,309 | |||||
196,099 | |||||
206,329 | |||||
207,979 | |||||
210,949 | |||||
211,939 | |||||
212,929 | |||||
215,899 | |||||
216,889 | |||||
223,819 | |||||
228,109 | |||||
228,769 | |||||
232,729 | |||||
235,039 | |||||
236,359 | |||||
236,689 | |||||
237,679 | |||||
240,649 | |||||
245,599 | |||||
249,229 | |||||
258,469 | |||||
264,079 | |||||
266,059 | |||||
266,719 | |||||
279,259 | |||||
284,209 | |||||
296,089 | |||||
итого: | 6846,24 |
1. Для построения линейного уравнения регрессии необходимо определить параметры этого уравнения: свободный член уравнения ( ) и коэффициент регрессии (
). С этой целью построим вспомогательную таблицу.
Определим параметры уравнения линейной регрессии, n – количество банков
7.4.5.
7.4.6.
где — среднее из произведения;
— среднее квадратов;
— произведение средних;
— квадрат средних.
В уравнении регрессии параметр |
В нашем случае мы получили уравнение линейной зависимости
33,739+0,33*х
А0 а1
Коэффициент регрессии а1 0,33 показывает, что при увеличении факторного признака Кредитные вложения на 1 млн. руб. значение результативного признака «Прибыль банков» увеличивается в среднем на 0,33 млн руб.
Для построения теоретической линии зависимости рассчитаем этот показатель в таблице 7.4.1.
Теперь графически построим корреляционное поле – затем график с выводом формулы.
Затем ЭКО и ЭКД, см. тему 5.
В Excel- поставить мышь на множество точек корреляционного поля, правой клавишей – добавить Линию тренда, тип, параметры и по индексу детерминации выбрать наиболее адекватную линию регрессии.
Дата добавления: 2015-08-05 ; просмотров: 29 ; Нарушение авторских прав
Методика построения однофакторной регрессионной модели корреляционной связи. Анализ качества модели
При изучении корреляционной связи показателей анализу подвергаются сравнительно небольшие по составу единиц совокупности. При численности объектов анализа до 30 единиц возникает необходимость испытания параметров уравнения регрессии на их типичность. При этом осуществляется проверка, насколько вычисленные параметры характерны для отображаемого комплекса условий. Применительно к совокупностям, у которых п tтабл. В зависимости от того какой получится результат наша гипотеза принимается или отвергается.
18. Понятие ряда динамики. Графическое изображение рядов динамики. Виды динамических рядов, их особенности. Сопоставимость уровней рядов динамики. Смыкание уровней рядов динамики. Приведение динамических рядов к единому основанию.Ряд динамики представляет собой ряд расположенных в хронологической последовательности числовых значений статистического показателя, характеризующих изменение общественных явлений во времени. В каждом ряду динамики имеются 2 основных элемента: время t и конкретное значение показателя (уровень ряда) y. Уровни ряда – это показатели, числовые значения которых составляют динамический ряд. Время – это моменты или периоды, к которым относятся уровни. Построение и анализ рядов динамики позволяют выявить и измерить закономерности развития общественных явлений во времени. По времени, отраженному в динамических рядах, они разделяют на моментные и интервальные. Моментными называется ряд динамики, уровни которого характеризуют состояние явления на определенные даты. Интервальным рядом динамики называется такой ряд, уровни которого характеризуют размер явления за конкретный период времени. Интервальный ряд, где последовательные уровни могут суммироваться, можно представить как ряд с нарастающими итогами. При построении таких рядов производится последовательное суммирование смежных уровней. Уровни в динамическом ряду, могут быть представлены абсолютными, средними или относительными величинами. По расстоянию между уровнями ряды динамики подразделяются на ряды с равностоящими и неравностоящими уровнями по времени. Если в рядах динамики прерывающиеся или неравномерные интервалы времени, то такие ряды являются неравностоящими. Ряды динамики могут быть изображены графически. Графическое изображение позволяет наглядно представить развитие явления во времени и способствует проведению анализа уровней. Наиболее распространенным видом графического изображения для аналитических целей является линейная диаграмма, которая строится в прямоугольной системе координат: на оси абсцисс отмечается время, а на оси ординат – уровни ряда. Наряду с линейной диаграммой для графического изображения рядов динамики в целях популяризации широко используются столбиковая диаграмма и другие виды диаграмм (фигурные, квадратные, полосовые и т.п.). В ряде случаев несопоставимость может быть устранена путем обработки рядов динамики приемом, который носит название смыкание рядов динамики. Этот прием позволяет преодолеть несопоставимость данных, возникающую вследствие изменения во времени круга охватываемых объектов или методологии расчета показателей, и получить единый сравнимый ряд за весь период времени. Ряды динамики обычно приводят к одному основанию, если они не могут быть решены другими методами
Показатель интенсивности изменения единицы называется коэффициентом роста, а в процентах – темпом роста. Эти показатели интенсивности изменения отличаются только единицами измерения. Коэффициент роста показывает, во сколько раз сравниваемый уровень больше уровня, с которым производится сравнивание или какую часть уровня, с которым производится сравнение, составляет сравниваемый уровень. Темп роста всегда представляет собой положительное число.
Между цепными и базисными коэффициентами роста существует взаимосвязь: произведение последовательных цепных коэффициентов роста равно базисному коэффициенту роста за весь период, а частное от деления последующего базисного темпа роста на предыдущий равно соответствующему цепному темпу роста. Относительную оценку скорости измерения уровня ряда в единицу времени дают показатели темпа прироста. Темп прироста показывает, на сколько процентов сравниваемый уровень больше или меньше уровня, принятого за базу сравнения и вычисляется как отношение абсолютного прироста к абсолютному уровню, принятому за базу сравнения.
Чтобы правильно оценить значение полученного темпа прироста, его рассматривают в сопоставлении с показателем абсолютного прироста. Результат выражают показателем, который называют абсолютным значением одного процента прироста и рассчитывают как отношение абсолютного прироста за тот же период времени, %:
Абсолютное значение одного процента прироста равно сотой части предыдущего уровня. Оно показывает, какое абсолютное значение скрывается за относительным показателем – одним процентом прироста. Средний уровень ряда характеризует обобщенную величину абсолютных уровней. Он рассчитывается по средней хронологической, т.е. по средней исчисленной из значений, изменяющихся во времени. Коэффициент опережения показывает, во сколько раз быстрее растет уровень одного ряда динамики по сравнению с другим. При этом сравнении темпы должны характеризовать тенденцию одного направления. Коэффициент опережения могут быть исчислены на основе сравнения средних темпов роста (или прироста) 2-х динамических рядов за одинаковый период времени:
20. методы выявления основной тенденции развития уровней рядов динамики. Прогнозирование уровней динамических рядов в финансово – экономическом анализе.Одной из важнейших задач статистики является определение в рядах динамики общей тенденции развития явления. Основной тенденцией развития называется плавное и устойчивое изменение уровня явления во времени, свободное от случайных колебаний. Задача состоит в том, чтобы выявит общую тенденцию в изменении уровней ряда, освобожденную от действия различных случайных факторов. С этой целью ряды динамики подвергаются обработке методами укрупнения интервалов, скользящей средней и аналитического выравнивания. Одним из наиболее простых методов изучения основной тенденции в рядах динамики является укрупнение интервалов. Он основан на укрупнении периодов времени, к которым относятся уровни ряда динамики. Выявление основной тенденции может осуществляться также методом скользящей средней. Сущность его заключается в том, что исчисляется средний уровень из определенного числа, обычно нечетного, первых по счету уровней ряда, затем – из такого же числа уровней, но начиная со второго по счету, далее – начиная с третьего и т.д. Таким образом, средняя как бы «скользит» по ряду динамики, передвигаясь на один срок.
21. Статистическое изучение сезонных колебаний. Индексы сезонности, их применение в анализе и прогнозирование.При сравнении квартальных и месячных данных многих социально-экономических явлений часто обнаруживается периодические колебания, возникающие под влиянием смены времен года. Они являются результатом влияния природно-климатических условий, общих экономических факторов, а также многочисленных и разнообразных факторов, которые часто являются регулируемыми. В широком понимании к сезонным относятся все явления, которые обнаруживают в своем развитии отчетливо выраженную закономерность внутригодовых изменений, т.е. более или менее устойчиво повторяющиеся из года в год колебания уровней. В статистике периодические колебания, которые имеют определенный и постоянный период, равный годовому промежутку, носят название «сезонные колебания» или «сезонные волны», а динамический ряд в этом случае называют сезонным рядом динамики. В статистике существует ряд методов изучения и измерения сезонных колебаний. Самый простой заключается в построении специальных показателей, которые называют индексами сезонности Is. Совокупность этих показателей отражает сезонную волну. Индексами сезонности являются процентные отношения фактических внутригрупповых уровней к теоретическим уровням, выступающим в качестве базы сравнения. Для того чтобы выявить устойчивую сезонную волну, на которой не отражались бы случайные условия одного года, индексы сезонности вычисляют по данным за несколько лет, распределенным по месяцам. Если ряд динамики не содержит ярко выраженной тенденции в развитии, то индексы сезонности вычисляются непосредственно по эмпирическим данным без их предварительного выравнивания. Для каждого месяца рассчитывается средняя величина уровня. После чего определяется показатель сезонной волны – индекс сезонности Is как процентное отношение средних для каждого месяца к общему среднемесячному уровню ряда, %:
22. Понятие об экономических индексах в статистике. Сфера применения. Классификация индексов. Индивидуальные и общие индексы.Под индексом в статистике понимают относительный показатель, характеризующий изменение величины какого-либо явления во времени, пространстве или по сравнению с любым эталоном. При помощи индексов можно характеризовать изменение во времени самых различных показателей: ВВП, реальных располагаемых денежных доходов, численность работающих, уровня безработицы, цен акций предприятия региона, себестоимости, производительности труда и т.п. Индексы классифицируются по 3-м признакам: по характеру изучаемых объектов; степени охвата элементов совокупности; методам расчета общих индексов. По содержанию индексируемых величин индексы разделяют на индексы количественных и индексы качественных показателей. Индексы количественных показателей – индексы физического объема промышленной и сельскохозяйственной продукции, физического объема розничного товарооборота, национального дохода, потребления продаж иностранной валюты и др. Индексы качественных показателей – индексы курса валют, цен, себестоимости, производительности труда, средней заработной платы, урожайности и др. Индексируемые показатели этих индексов характеризуют уровень явления в расчете на количество измеримую единицу совокупности: цена за единицу продукции, себестоимость единицы продукции, выработка в единицу времени, заработная плата одного работника, урожайность с одного гектара и т.д. Такие показатели называются качественными. По степени охвата единиц совокупности индексы делятся на 2 класса: индивидуальные и общие. Индивидуальные индексы служат для характеристики изменения отдельных элементов сложного явления (например, изменение объема выпуска телевизоров определенной марки, рост или падение цен на акции в каком-либо акционерном обществе и т.д.). Общий индекс – отражает изменение всех элементов сложного явления. При этом под сложным явлением понимают такую статистическую совокупность, отдельные элементы которой непосредственно не подлежат суммированию. Индивидуальные индексы обозначаются i и снабжаются подстрочным знаком индексируемого показателя: iq – индивидуальный индекс объема произведенной продукции отдельного вида или количества проданного товара данного вида, ip – индивидуальный индекс цен и т.д. Общий индекс обозначается буквой I и также сопровождается подстрочным знаком индексируемого показателя: например, Ip – общий индекс цен, Iz – общий индекс себестоимости.
23. Агрегатный индекс как форма общего индекса. Выбор весов при построении общих индексов. Индексы цен Г. Пааше, Э. Ласпейреса, их практическое применение.Агрегатный индекс является основной формой индекса. «Агрегатным» он называется потому, что его числитель и знаменатель представляют собой набор – «агрегат» непосредственно несоизмеримых и не поддающихся суммированию элементов – сумму произведений 2-х величин, одна из которых меняется, а другая – остается неизменной в числителе и знаменателе. Вес индекса служит для соизмерения индексируемых величин. При построении индекса цен в сфере реализации в качестве весов индекса обычно берут количество товаров, проданных в текущем периоде. Это объясняется тем, что такое исчисление индекса цен позволяет определить не только относительное изменение цен, но и абсолютную экономию (-) или абсолютный перерасход (+) денежных средств покупателей в результате изменения цен на эти товары
Агрегатный индекс цен с отчетными весами, предложенный в 1874 г. немецким экономистом Г. Пааше, исчисляют
Предложенный в 1864 г. немецким экономистом Э. Ласпейресом
Итак, агрегатные индексы цен с текущими весами определяются по формуле Пааше, с базисными весами по формулу Ласпейреса для одних и тех же данных не совпадают, так как имеют различное экономическое содержание. Индекс Пааше характеризует изменение цен отчетного периода по сравнению с базисным по товарам, реализованным в отчетном периоде, и фактическую экономию от изменения цен, т.е. индекс Пааше показывает на сколько товары в отчетном периоде стали дороже (дешевле), чем в базисном. Индекс цен Ласпейреса показывает во сколько раз товары базисного периода подорожали (подешевели) из-за изменения цен на них в отчетном периоде. Поэтому применение формулы Ласпейреса ограничено особыми условиями исследования.
24. Индексный метод в исследовании изменения сложного экономического явления за счёт отдельных факторов. Взаимосвязь индексов.
Многие статистические показатели, характеризующие различные стороны общественных явлений, находятся между собой в определенной связи (часто в виде произведения). Форма взаимосвязи между такими показателями выявляется на основе теоретического анализа. Статистика характеризует эти взаимосвязи количественно. Связь между экономическими показателями находит отражение и во взаимосвязи характеризующих их индексов, поэтому многие экономические показатели тесно связаны между собой и образуют индексные системы. Принята следующая практика факторного анализа: если результативный показатель можно представить как произведение объемного и качественного факторов, то, определяя влияние объемного фактора на изменение результативного показателя, качественный фактор фиксируется на уровне базисного периода; если же определяется влияние качественного показателя, то объемный фактор фиксируется на уровне отчетного периода.Рассмотрим построение взаимосвязанных индексов на примере индексов цен, физического объема продукции (если речь идет об отпускных ценах) или физического объема товарооборота (если речь идет о розничных ценах) и индекса стоимости продукции (товарооборота в фактических ценах). Индексы физического объема и цен являются факторными по отношению к индексу стоимости продукции(товарооборота в фактических ценах): , или
. Таким образом, произведение индекса цен на индекс физического объема продукции дает индекс стоимости продукции (товарооборота в фактических ценах), т.е. образует индексную систему из этих трех индексов. Аналогичную взаимосвязь между индексом затрат на производство продукции, индексом себестоимости и индексом физического объема продукции можно записать в виде следующей системы индексов:
, или
. Индекс изменение общего фонда оплаты труда F в связи с изменением общей численности работающих Т и заработной платы х:
, или
.К числу взаимосвязанных индексов относятся и индексы переменного состава, постоянного состава и индексы структурных сдвигов. В этой системе динамика среднего показателя (индекса переменного состава) выступает как произведение двух индексов: индекса постоянного состава и индекса структурных сдвигов:
;
. Индексная система позволяет определить влияние отдельных факторов на формирование уровня результативного показателя, по двум известным значениям индексов найти значение третьего неизвестного.
25. Преобразование агрегатных индексов в средние. Средние арифметический и гармонический индексы. Их применение в изучении динамики цен и физического объёма производства.
.Помимо агрегатного способа расчета общих индексов существует и другой способ, который состоит в расчете общих индексов как средних из соответствующих индивидуальных индексов. К исчислению таких средневзвешенных индексов прибегают тогда, когда имеющаяся в распоряжении информация не позволяет рассчитать агрегатный индекс. Так, если неизвестны количества произведенных отдельных продуктов в натуральных измерителях, но известны индивидуальные индексы и стоимость продукции базисного периода (p0q0), можно определить средний арифметический индекс физического объема продукции. Исходной базой построения служит агрегатная форма:
. Из имеющихся данных можно получить только знаменатель этой формулы. Для нахождения числителя используется формула индивидуального индекса объема продукции, из которой следует, что q1=q0iq. Подставляя данное выражение в числитель агрегатной формы, получаем общий индекс физического объема в форме среднего арифметического индекса физического объема продукции, где весами служит стоимость отдельных видов продукции в базисном периоде (q0p0):
. Если известные данные позволяют вычислить только числитель агрегатного индекса физического объема, то, аналогично выражая продукцию базисного периода как
, производим замену в знаменателе. В результате получаем общий индекс физического объема в форме среднего гармонического взвешенного индекса физического объема продукции, где весами служит стоимость продукции отчетного периода в базисных ценах (q1p0):
. В форме средней гармонической взвешенной индекс физического объема используется только в аналитических целях. Т.о., применение той или иной формулы индекса физического объема (агрегатного или среднего арифметического или среднего гармонического) зависит от имеющихся в нашем распоряжении конкретных данных и цели исследования.
Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет