|
|
ЭконометрикаПостановка задачи Для многих явлений в природе и технике типичны случайные зависимости. Между двумя случайными величинами имеется стохастическая зависимость в общем случае тогда, когда существуют некоторые случайные величины, которые влияют на обе случайные величины, и некоторые факторы, действующие только на первую - или только на вторую случайную величину. Следовательно, если: X=f(Z1,...,Zm,X1,...Xj) Y=g(Z1,...,Zm,Y1,...Yk), то X и Y стохастически зависимы. В теории регрессионного анализа особое значение имеет задача: предсказание интересующей нас случайной величины Y, если другие случайные величины, от которых стохастически зависит Y, приняли конкретное значение. Составим модель регрессии на основе следующих данных: Пусть y = [95,97; 52,66; 18,52; 12,3; 15,4; 18,09; 20,66] - значения статистики, характеризующей показатели страхования хлеба в Тверской губернии ежегодно с 1992 по 1998 год. Значения выражены в миллионах рублей. t = [1; 2; 3; 4; 5; 6; 7] - является временной характеристикой, показывающий порядковый номер года с 1992 года по 1998 год. z = [6,4;5,1;4,5;4,4;4,3;4,2;4] - значение статистики, характеризующей показатели ВВП с 1992 по 1998 год. В поставленную задачу входит построение однофакторной и двухфакторных линейных зависимостей, а так же представление полученных уравнений в виде графиков. Кроме того, необходимо подсчитать множественный коэффициент корреляции, а также величину остаточной дисперсии. Составим следующую таблицу, используя входные данные: Y 95,97 52,66 18,52 12,3 15,4 18,09 20,66 T 1 2 3 4 5 6 7 Z 6,4 5,1 4,5 4,4 4,3 4,2 4 1. 1. Основные параметры статистики. Основным параметром статистики являются: а) - её "центр" (xср. , медиана, средний размах, мода) б)- разбросанность данных (размах R, среднее отношение, дисперсия сигма ). Центр статистики - это среднеарифметическое значение статистики. Как правило, центр статистики используется для замены всей статистики одним единственным значением. Величина является размахом, а величина Cср.раз. . Центр статистики может быть величиной размаха. Определим центр статистики для всех наших исходных параметров: 2. Факторные зависимости. Для подсчёта коэффициентов однофакторной и двухфакторной зависимостей необходимо подсчитать среднее для двух статистик: 3. Дисперсия. Величина есть мера рассеяния распределения статистики относительно математического ожидания. Свойства дисперсии: Дисперсия постоянной величины равна нулю. Дисперсия произведения постоянной величины на случайную величину есть произведение квадрата постоянной величины на дисперсию случайной величины. Дисперсия суммы постоянной и случайной величин есть дисперсия случайной величины. Дисперсия суммы двух независимых случайных величин равна сумме дисперсий этих величин. Определим значения дисперсии. Среднее отклонение , иначе . Дисперсия , а - средне квадратичное отношение; не имеет практического смысла, но важно для эконометрического. . Определим для наших данных: ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; ; . 4. Парная корреляция. Приступим к подсчёту корреляции. Коэффициент корреляции - показатель силы влияния фактора (y, t, z) на зависимый показатель y. значение: ; ; . Вообще, коэффициент корреляции имеет значение от 0 до 1, но бывает отрицательным, когда отрицателен знак у углового коэффициента "b" выражающей прямой (y = a + bt). Коэффициент корреляции показывает не только степень (силу) влияния x на y ,но также позволяет оценить надёжность выравнивания модели (достоверность закономерности). Когда коэффициент корреляции равен нулю, то он показывает полное отсутствие связи. В нашем случае имеем следующие коэффициенты корреляции: rzt= -0,8596; ryt= -0,75; rzy=0,96; т. е. все они по модулю достаточно близки к единице, что характеризует предполагаемые связи между статистикой страхования хлеба и значениями ВВП с 1992 по 1998 г.г., как достаточно сильные. Знак " - " в значениях двух коэффициентов корреляции обозначает то, что прямая, выражающая данную связь, имеет обратный наклон к оси абсцисс, т. е. знак углового коэффициента отрицателен. 5. Множественная корреляция. Зная коэффициент корреляции, можно подсчитать множественный коэффициент корреляции. Коэффициент корреляции оценивает силу двух показателей. Если Rtz=0, то показатели t и z независимы. И, наоборот, если Rtz=1, то связь самая сильная - функциональная. Кроме того, R>0, если z и t - зависимы. В нашем случае R>0 и равен 0,97, что говорит о наличии сильной связи между показателями страхования хлеба и значениями ВВП в период с 1992 по 1998 г.г. Достаточно сказать, что полученный коэффициент положителен, что само по себе уже говорит о присутствии зависимости исследуемых показателей. 6. Модель линейной регрессии. Построим однофакторную регрессионную модель и приведем ее графическое решение. Таким образом, имеем: . График модели однофакторной зависимости выглядит так: Графики представляют, во-первых, исходные значения статистики страхования хлеба, и, во-вторых, линейную регрессионную модель, построенную на исходных значениях. Данная модель есть функция, минимизирующая среднюю квадратичную ошибку предсказания значений страхования хлеба при известных значениях ВВП. 7. Достоверность надёжность. Помимо использования коэффициента корреляции r, как показателя связи зависимости, можно с его помощью оценивать погрешность выдавливания статистики фактических данных yi регрессионной зависимостью. Качество замены факта yi расчетными моделями зависит от величины погрешности. Если она мала, то модель надежна, достоверна, и это происходит когда r приблизительно равно R. Точность большая, а погрешность маленькая. Рассмотрим модель двухфакторной зависимости: Из полученных результатов подсчета видим, что модель достаточно достоверна и надежна, т. к. при подстановке конкретных значений t и z получаем довольно незначительную погрешность для y, которая в численном значении в среднем не превышает 10% . Т. о. функция регрессии есть функция, минимизирующая среднюю квадратичную ошибку величины предсказания y на основании значений t и z. 8. Остаточная дисперсия. Дисперсия - есть мера разброса данных. Является средним квадратом отклонения данных от среднего. Рассчитаем остаточную дисперсию. . В нашем случае имеем достаточно большой разброс данных в связи с неустойчивым положением в стране по страхованию в целом и страхованию хлеба в частности. Литература Эконометрика. Под. ред. Лонгерти И.А., М.: "Стема" , 1997. Статистика: Курс лекций / Харченко Л.П., Долженкова В.Г., Ионин В.Г. и др. - Новосибирск: Изд-во НГАЭиУ, М.: ИНФРА-М, 1998. - 310с. 1 2 Работа на этой странице представлена для Вашего ознакомления в текстовом (сокращенном) виде. Для того, чтобы получить полностью оформленную работу в формате Word, со всеми сносками, таблицами, рисунками, графиками, приложениями и т.д., достаточно просто её СКАЧАТЬ. |
|
Copyright © refbank.ru 2005-2025
Все права на представленные на сайте материалы принадлежат refbank.ru. Перепечатка, копирование материалов без разрешения администрации сайта запрещено. |
|