+ All Categories
Home > Documents > Эконометрика

Эконометрика

Date post: 08-Dec-2016
Category:
Upload: -
View: 218 times
Download: 1 times
Share this document with a friend
24
МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ НАЦИОНАЛЬНЫЙ ФОНД ПОДГОТОВКИ КАДРОВ ИННОВАЦИОННЫЙ ПРОЕКТ РАЗВИТИЯ ОБРАЗОВАНИЯ Программа «Совершенствование преподавания социально-экономических дисциплин в вузах» Международный институт экономики и финансов Государственный университет Высшая школа экономики Программа дисциплины Эконометрика Москва 2003
Transcript
Page 1: Эконометрика

МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ НАЦИОНАЛЬНЫЙ ФОНД ПОДГОТОВКИ КАДРОВ

ИННОВАЦИОННЫЙ ПРОЕКТ РАЗВИТИЯ ОБРАЗОВАНИЯ

Программа laquoСовершенствование преподавания социально-экономических дисциплин в вузахraquo

Международный институт экономики и финансов Государственный университет ndash Высшая школа экономики

Программа дисциплины

Эконометрика

Москва 2003

Программа дисциплины laquoЭконометрикаraquo составлена в соответствии с

требованиями (федеральный компонент) к обязательному минимуму содержания и уровню подготовки дипломированного специалиста (бакалавра магистра) по циклу laquoОбщие гуманитарные и социально-экономические дисциплиныraquo государственных образовательных стандартов высшего профессионального образования второго поколения а также требованиями предъявляемыми НФПК к новым и модернизированным программам учебных курсов разработанным в рамках программы laquoСовершенствование преподавания социально-экономических дисциплин в вузахraquo Инновационного проекта развития образования

Программа подготовлена при содействии НФПК ndash Национального Фонда

подготовки кадров в рамках программы laquoСовершенствование преподавания социально-экономических дисциплин в вузахraquo Инновационного проекта развития образования

Автор (составитель) Замков Олег Олегович кэн доцент МИЭФ ГУ-ВШЭ (ФИО ученая степень ученое звание вуз) Рецензенты __________________________________________________________________ (ФИО ученая степень ученое звание вуз)

I Организационно-методический раздел Введение в эконометрику - односеместровый курс для студентов 3-го года обучения МИЭФ Это - вводный курс эконометрики для студентов специализирующихся в области экономики Его пререквизиты - вводный курс математической и прикладной статистики а также курсы экономической теории и информатики Курс преподается на русском и английском языках поскольку часть студентов сдает внешний экзамен Лондонского университета Elements of Econometrics and Economic Statistics на английском языке Акцент в курсе делается на содержательном смысле фактов методов и подходов эконометрического анализа Выводы и доказательства даются для ряда базовых формул и моделей что позволяет студентам понять принципы построения эконометрической теории Главный акцент делается на экономической интерпретации и приложениях рассматриваемых эконометрических моделей Цель и задачи курса

Студенты должны получить базовые знания и навыки эконометрического анализа Они должны уметь применять их в исследовании экономических процессов а также понимать эконометрические методы идеи результаты и выводы встречаемые в большинстве экономических книг и статей В данном курсе студенты должны освоить традиционные эконометрические методы предназначенные в основном для работы с данными перекрестных выборок В то же время студенты должны понимать содержательные различия данных перекрестных выборок и временных рядов и те специфические эконометрические проблемы которые возникают при работе с данными этих типов Студенты должны приобрести навыки построения и развития моделей парной и множественной линейной регрессии познакомиться с некоторыми видами нелинейных моделей и специальными методами эконометрического анализа и оценивания понимая область и границы их применения в экономике Рассматриваемые методы и модели должны быть освоены на практике с использованием реальных массивов экономических данных и современного эконометрического программного обеспечения Методическая новизна курса (новые методики формы работы авторские приемы в преподавании курса) В курсе используются следующие методы и формы работы - Лекции (2 часа неделя) - Практические занятия в компьютерном классе (2 часа в неделю выполняются задания на компьютерах и обсуждаются основные вопросы домашних заданий) - консультации преподавателя - самостоятельная работа в компьютерном классе в том числе в Интернет (выполнение

домашних заданий с использованием программ Excel и Econometric Views работа с массивами экономических данных пособиями для студентов в Интернет просмотр комплектов слайдов по эконометрике)

- самостоятельная работа с литературой По курсу имеется большое количество различных методических материалов и пособий как авторских так и подготовленных зарубежными специалистами (прежде всего - КрДоугерти в ЛШЭ) Все методические материалы КрДоугерти доступны через Интернет (И-1 И-2) в том числе - пособия для студентов руководства для преподавателей базы данных и их описания и тд Кроме того в нашем курсе используется авторское пособие (ОЗ) и его перевод на английский язык задания для работы в классе и домашние задания и комментарии к ним Особенностью по сравнению с другими курсами является еженедельное проведение практических занятий в компьютерном классе с заранее раздаваемыми заданиями и выполнением на основе этого

еженедельных письменных домашних заданий с проведением расчетов на компьютере которые затем проверяются и разбираются преподавателем Экзаменационные задания включают вопросы двух типов это тесты множественного выбора и открытые вопросы Задания первого типа позволяют проверить знание студентом широкого круга вопросов в рамках курса задания второго типа - проверить умение проводить эконометрический анализ и строить логику исследования Новизна курса (научная содержательная сравнительный анализ с подобными курсами в России и за рубежом)

Данный курс является вводным курсом эконометрики поэтому с точки зрения его теоретического содержания он достаточно стандартен и близок например к курсу КрДоугерти в ЛШЭ В то же время особенностью курса является его интенсивность в других российских и зарубежных университетах изучение подобного курса эконометрики занимает как минимум год Этому способствует тот факт что студенты МИЭФ до курса эконометрики в течение двух лет изучают математичекскую и прикладную статистику В результате их статистическая подготовка а также высокий уровень знаний экономической теории позволяют в рамках данного курса рассматривать прежде всего эконометрические вопросы опираясь на глубокое понимание студентами концептуального аппарата статистики и экономики Кроме того курс ориентирован на содержательные вопросы а не на формальные выводы и доказательства что экономит массу времени по сравнению с курсами эконометрики в ряде российских вузов При этом даются доказательства и выводы лишь для важнейших и типовых формул и утверждений так что самим аппаратом выводов и доказательств в эконометрике студенты в итоге также овладевают Наконец освоение курса требует большого объема самостоятельной работы студентов превосходящей по объему как минимум вдвое их аудиторную работу

Очень важно то что студенты овладевают на практике применением всех методов подходов и моделей изучаемых в курсе выполняя практические задания в классе и дома Наряду с базовыми стандартными темами вводного курса эконометрики в курсе изучаются и такие более продвинутые вопросы как оценивание по методу максимума правдоподобия логит- и пробит-модели и тд В то же время в курсе не затрагиваются некоторые разделы моделирования нестационарных временных рядов широко используемые в современном эконометрическом анализе поскольку они изучаются в следующем за данным курсом курсе Анализ временных рядов II Содержание курса 1 Введение в эконометрику Статистическое исследование взаимосвязей экономических переменных Зависимости в экономике примеры проблемы оценивания и анализа (функции спроса функции заработка модели экономического роста) Направленность курса Базы данных Программное обеспечение Генеральная совокупность и выборка Описательные статистики ковариация дисперсия корреляция Определения свойства правила Истинные значения параметров и их оценки Обзор Глава 1 (CD-1 CD-2) L1 (OZ) 2 Модель парной линейной регрессии (ЛР) Свойства оценок в модели парной ЛР Предпосылки и обозначения модели ЛР Оценивание модели ЛР с помощью Метода наименьших квадратов (МНК) Формулы для оценок коэффициента наклона и свободного члена вывод и интерпретация Условия Гаусса-Маркова и свойства получаемых по МНК оценок Теорема Гаусса-Маркова (формулировка) Стандартные отклонения и стандартные ошибки оценок коэффициентов регрессии

Статистическая значимость оценок коэффициентов парной ЛР проверка гипотез с помощью t-статистик Построение и интерпретация доверительных интервалов Общее качество регрессии коэффициент детерминации R2 F-статистика и F-тест Связь R2 с коэффициентами корреляции Модель парной ЛР без свободного члена Глава 2 (21-27) Глава 3 (31-311) (CD-1 CD-2) L2 (OZ) 3 Преобразования переменных в регрессионном анализе Линеаризация нелинейных зависимостей и их оценивание с помощью МНК Спецификация случайного члена Интерпретация линейных логарифмических и линейно-логарифмических зависимостей Оценивание функций с постоянной эластичностью и экспоненциальных временных трендов Сравнение качества регрессионных зависимостей линейные и линейно-логарифмические функции Метод Зарембки Метод Бокса-Кокса Глава 4 (CD-1) Глава 5 (CD-2) L4 (ОЗ) 4 Модель множественной линейной регрессии (МЛР) две объясняющие переменные и k объясняющих переменных Описание и интерпретация модели с двумя и k объясняющими переменными Примеры функции спроса функции заработка производственные функции Оценивание по МНК модели с двумя объясняющими переменными Свойства коэффициентов модели Мультиколлинеарность Коэффициент детерминации R2 Скорректированный R2 Проверка гипотез с помощью t-статистик и F-статистик МНК-оценки модели с k объясняющими переменными в векторно-матьричной форме Свойства коэффициентов F-тест для групп переменных Оценивание производственных функций в объемной и темповой записи как моделей множественной регрессии Глава 5 (51-56CD-1) Глава 4 (41-45 CD-2) L24 (ОЗ) Глава 3 (МКП) 5 Спецификация модели линейной регрессии Последствия неправильной спецификации Невключение значимой объясняющей переменной Включение лишней объясняющей переменной Метод Монте-Карло в эконометрическом анализе общие принципы возможности применения и примеры Замещающие переменные Проверка выполнения линейных ограничений на параметры МЛР F-тест и t-тесты Роль и примеры линейных ограничений в исследовании экономических моделей Переменные с запаздыванием Глава 6 (61-67 CD-1) Глава 7 (71-76 CD-2) 6 Гетероскедастичность Понятие последствия обнаружение гетероскедастичности Тесты Голдфелда-Квандта Спирмена Глейзера Корректировка модели Взвешенный метод наименьших квадратов Глава 7 (71-73 7576 CD-1) Глава 8 (81-83 CD-2) 7 Автокоррелированность случайного члена Проявления и последствия автокоррелированности случайного члена в модели линейной регрессии Критерий Дарбина-Уотсона Свойства случайного члена и ошибки спецификации Корректировка модели Авторегрессионное преобразование процедура Кокрана-Оркатта поправка Прайса-Уинстена Модели AR MA и ARMA Глава 7 (75-79 CD-1) Глава 13 (131-136 CD-2) L3 (ОЗ) 8 Фиктивные переменные

Фиктивные (dummy) переменные в моделях линейной регрессии Типы фиктивных переменных Многожественные совокупности фиктивных переменных Тест Чоу Фиктивные переменные в экономических моделях функции заработка производственные функции Глава 9 (91-95 CD-1) Глава 6 (61-64 CD-2) 9 Стохастические объясняющие переменные Свойства получаемых оценок и тестовых статистик при стохастических объясняющих переменных Ошибки измерения Смещение оценок при ошибках измерения Критика Милтоном Фридменом оценивания функции потребления Инструментальные переменные Использование инструментальных переменных в модели потребления МФридмана и других экономических моделях Глава 8 (81-84 CD-1) Глава 9 (91-94 CD-2) 10 Системы одновременных уравнений Понятие системы одновременных уравнений Смещение и несостоятельность оценок при непосредственном оценивании Структурная и приведенная формы модели Модель спроса и предложения и простейшая кейнсианская модель равновесия как системы одновременных уравнений Методы оценивания Косвенный метод наименьших квадратов (КМНК) Инструментальные переменные Двухшаговый метод наименьших квадратов (ДМНК) Связь КМНК инструментальных переменных и ДМНК Модель ISLM пример оценивания модели одновременных уравнений Глава 11 (111-118 CD-1) Глава 10 (101-113 CD-2) L6 (ОЗ) 11 Моделирование с использованием данных временных рядов Модели динамических процессов Прогнозирование Распределенные лаги геометрический лаг полиномиальный лаг Преобразование Койка и непосредственное нелинейное оценивание параметров геометрического лага Частичная корректировка Адаптивные ожидания Модель постоянного дохода МФридмена Проблемы оценивания и анализа Построение прогнозов и пост-прогнозов Доверительные интервалы Метод Салкевера Тесты на устойчивость Показатели качества прогнозов Глава 10 (101-109 CD-1) Глава 12 (121-126 CD-2) L5 (ОЗ) 12 Модели двоичного выбора модели с ограничениями для зависимой переменной и оценивание по методу максимума правдоподобия Линейная вероятностная модель проблемы оценивания Логит-модель Пробит-модель Оценивание по методу максимума правдоподобия общие принципы и направления применения Использование для парной линейной регрессии логит-оценивания пробит-оценивания Характеристики качества оценивания (псевдо-R2 отношение правдоподобия) Цензурированные выборки Непосредственное и усеченное оценивание Тобит-модель Смещение при построении выборки Глава 11 (CD-2 И-2) III Распределение часов курса по темам и видам работ

пп

Наименование тем и разделов

ВСЕГО (часов)

Аудиторные занятия (час)

Самостоятельная

в том числе Лекции Практические

занятия

работа

1 Введение в эконометрику 12 2 2 8 2 Модель парной линейной регрессии (ЛР)

Свойства оценок в модели парной ЛР 24 4 4 16

3 Преобразования переменных в регрессионном анализе

12 2 2 8

4 Модель множественной линейной регрессии (МЛР) две объясняющие переменные и k объясняющих переменных

24 4 4 16

5 Спецификация модели линейной регрессии 24 4 4 16 6 Гетероскедастичность 12 2 2 8 7 Автокоррелированность случайного члена 12 2 2 8 8 Фиктивные переменные 12 2 2 8 9 Стохастические объясняющие переменные 12 2 2 8 10 Системы одновременных уравнений 24 4 4 16 11 Моделирование с использованием данных

временных рядов Модели динамических процессов Прогнозирование

24 4 4 16

12 Модели двоичного выбора модели с ограничениями для зависимой переменной и оценивание по методу максимума правдоподобия

24 4 4 16

ИТОГО 216 36 36 144 IV Формы промежуточного и итогового контроля Студенты сдают промежуточный письменный экзамен а также итоговый письменный экзамен в конце семестра Каждый экзамен включает вопросы множественного выбора и открытые вопросы (примеры экзаменационных работ прилагаются) Итоговый экзамен дает 50 конечной оценки промежуточный экзамен - 30 конечной оценки соответственно 20 дается за выполнение домашних заданий и работу на занятиях V Учебно-методическое обеспечение курса Основная литература 1 Dougherty Christopher Introduction to Econometrics Oxford University Press 1992 (1st

edition CD-1) 2002 (2nd edition CD-2) Доугерти Кр Введение в эконометрику Изд1 М ИНФРА-М 1997 1999 Изд2 М ИНФРА-М 2003 (готовится к выходу)

2 Dougherty Christopher Elements of econometrics and economic statistics Study Guide University of London 2002

3 Замков ОО Эконометрические методы в макроэкономическом анализе М ГУ-ВШЭ 2001 (на русском языке) Диалог-МГУ 1999 (на русском и английском языках) (ОЗ)

Дополнительная литература 1 Магнус ЯР Катышев ПК Пересецкий АА Эконометрика Начальный курс Изд 1-4

М Дело 1997-2000 (МКП) 2 Econometric Views 40 Users Guide Quantitative Micro Software LLC 3 Greene WH Econometric Analysis Prentice Hall int 1993 4 Kennedy P A Guide to Econometrics MIT Press 1992

Интернет-ресурсы 1 httpeconlseacukie (И-1) 2 httpwwwoupcomukbesttextbookseconomicsdougherty2e (И-2) 3 httpwwwworthpublisherscommankiw (И-3) 4 httpwwwrecepru (И-4) Компьютерные программы и массивы данных Основной компьютерной программой используемой в курсе является программа Econometric Views (версии 31 и последующие) Используются также электронные таблицы Excel Для выполнения заданий в классе и домашних заданий используются массивы данных данные курса КрДоугерти в ЛШЭ (данные для оценивания функций заработка по опросу NSLY в США данные о спросе располагаемом доходе и относительных ценах по товарным группам в США за 1959-1994гг - данные имеются на сайте И-1) Данные о погодовой динамике основных макроэкономических показателей в США за 1931-1998гг данные имеются на сайте И-3 Данные о помесячной динамике основных макроэкономических показателей России за 1992-2002гг данные имеются на сайте И-4 Данные об оценках ВНП затрат труда и капитала в экономике СССР за 1928-1987гг Данные о динамике инвестиций и вводе основных производственных фондов в Российской Федерации в 1956-1991гг

Приложение 1 Примеры промежуточных и итоговых экзаменационных работ

Промежуточный экзамен Часть 1 Тесты множественного выбора 30 минут В каждом вопросе обведите цифру номера правильного ответа 1 Если объясняющая переменная x в модели парной линейной регрессии принимает

среднее в выборке значение x =Σxin то 1) наблюдаемая величина зависимой переменной y равна y =Σyin 2) рассчитанная по уравнению регрессии величина зависимой переменной y равна y =Σyin 3) рассчитанная по уравнению регрессии величина зависимой переменной y равна y =Σyin

в среднем но не в каждом конкретном случае 4) равенство y =a+b x свидетельствует об отсутствии корреляции между отклонениями 5) равенство y =a+b x свидетельствует о выполнении условий Гаусса-Маркова 2 В модели парной линейной регрессии при использовании метода наименьших

квадратов верны следующие из перечисленных утверждений I Квадрат коэффициента корреляции между фактическими и теоретическими

значениями зависимой переменной в выборке равен R2 II Квадрат коэффициента корреляции между зависимой переменной и

объясняющей переменной в выборке равен R2 III Доля остаточной (необъясненной) дисперсии зависимой переменной равна R2 1) Только I 2) Только II 3) Только I и III 4) Только I и II 5) I II и III

3 Уравнение Y=α+βk+(1-β)l+u где Y - темп прироста выпуска k - темп прироста затрат капитала и l - темп прироста затрат труда может быть оценено как модель линейной регрессии

1) непосредственно с помощью обычного МНК как зависимость Y от k и l со свободным членом

2) непосредственно с помощью обычного МНК как зависимость Y от k и l без свободного члена

3) как линейную зависимость (Y-k) от (l-k) со свободным членом 4) как линейную зависимость (Y-k) от (l-k) без свободного члена 5) невозможно оценить данную зависимость с помощью обычного МНК

требуется нелинейный МНК 4 В модели множественной линейной регрессии с двумя объясняющими переменными Y=α+β1x1+β2x2+u оценка коэффициента β1 по методу наименьших квадратов для заданной выборки не зависит от 1) наблюденных значений переменной x1 2) наблюденных значений переменной x2 3) наблюденных значений переменной Y 4) значения постоянного члена α

5) ковариации между x1 и Y 5 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 (b) y зависит только от x1 и (c) y зависит только от x2 При оценивании регрессий для каждой из этих моделей величины R2 получились равными R2

a R2b и R2

c соответственно Какое из следующих утверждений верно 1) R2

a = R2b + R2

c 2) R2

a gt R2b + R2

c 3) R2

a = R2b - R2

c 4) R2

a lt R2b + R2

c 5) R2

a может быть больше а может быть меньше чем R2b + R2

c 6 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 без свободного члена (b) y зависит только от x1 со свободным членом и (c) y зависит только от x2 со свободным членом При оценивании регрессий для каждой из этих моделей величины RSS получились равными RSSa RSSb и RSSc соответственно Какое из следующих утверждений верно 1) RSSa gt maxRSSb RSSc 2) RSSa gt RSSb + RSSc 3) RSSa lt minRSSb RSSc 4) RSSa lt RSSb + RSSc 5) RSSa может быть больше а может быть меньше чем RSSb + RSSc

7 В модели множественной линейной регрессии высокая корреляция между двумя объясняющими переменными приводит к

1) смещенности оценок коэффициентов полученных по методу наименьших квадратов

2) несостоятельности оценок коэффициентов полученных по методу наименьших квадратов

3) неэффективности оценок коэффициентов полученных по методу наименьших квадратов

4) значительной дисперсии оценок коэффициентов полученных по методу наименьших квадратов

5) равенству нулю оценок коэффициентов полученных по методу наименьших квадратов

8 Переменная y определяется величинами x1 и x2 и случайным членом u по следующей формуле y = α + β1x1 + β2x2 + u По данным выборки оценено следующее уравнение регрессии 11ˆ xbay += Переменные x1 и x2 положительно коррелированы Величины β1 и β2 положительны

Тогда 1) b1 всегда меньше чем β1 2) b1 всегда больше чем β1 3) оценка b1 смещена в сторону завышения 4) оценка b1 смещена в сторону занижения 5) b1 является несмещенной оценкой β1

9 Введение линейного ограничения на параметры в регрессионную модель 1) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение значимо 2) приводит к значительному сокращению суммы квадратов отклонений если

ограничение значимо 3) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение незначимо 4) приводит к значительному сокращению суммы квадратов отклонений если

ограничение незначимо 5) все перечисленное неверно

10 Тест Голдфелда-Квандта в модели y = α + βx + u используется для 1) обнаружения гетероскедастичности любого вида 2) обнаружения гетероскедастичности вида σui=γ xi 3) обнаружения гетероскедастичности вида σui= δ + γ xi

μ 4) проверки на некоррелированность значений случайного члена между собой 5) проверки на некоррелированность значений случайного члена и объясняющей

переменной

11 Оценена линейная регрессионная зависимость величины заработка респондента y от совокупности факторов (x1x2hellipxn) Исследователь предполагает что величина заработка зависит также от места проживания респондента которое может принадлежать к одному из трех типов крупный город малый город сельская местность Для того чтобы учесть это в модели нужно 1) ввести фиктивную переменную которая может принимать три разных значения 2) ввести фиктивную переменную которая может принимать два разных значения 3) ввести две фиктивные переменные каждая из которых может принимать два

разных значения 4) ввести три фиктивные переменные каждая из которых может принимать два

разных значения 5) ввести две фиктивные переменные каждая из которых может принимать три

разных значения 12 Оценена регрессионная зависимость величины спроса потребителей на VideoCD (VCD) от их дохода (Y) и от уровня цен на VideoCD (Pvcd) в виде log(VCD) = α + β1log(Y) + β2log(Pvcd) + u В выборку включены только те потребители у которых имеется персональный компьютер Далее исследователь предполагает что эластичности спроса на VideoCD по доходу и по цене зависят от наличия у потребителей DVD-проигрывателя Для того чтобы учесть это в модели нужно

1) ввести фиктивную переменную для свободного члена 2) ввести две фиктивные переменные для свободного члена 3) ввести одну общую фиктивную переменную для коэффициентов наклона 4) ввести две фиктивные переменные для коэффициентов наклона 5) ввести две фиктивные переменные по одной для свободного члена и для

коэффициентов наклона

Часть 2 (1 час 30 минут) Ответьте письменно на любые два из следующих трех вопросов 1 Исследователь интересуется факторами определяющими динамику потребления мяса (B) в США в 1960 ndash 1987 годах (фунты в год на душу населения) В качестве факторов он

рассматривает цену P (центы за фунт) и личный располагаемый доход (тысячи долларов в год в расчете на душу населения) Y 11 Вначале он строит модель парной регрессии потребления мяса от личного располагаемого дохода

)111()79(260483377ˆ 2 =sdot+= RYB (1)

В скобках приведены стандартные ошибки Оцените качество модели приведя обоснование своих суждений и выводов на основе t-тестов и F-теста (F-статистику рассчитайте двумя разными способами) Дайте интерпретацию коэффициентов модели 12 Затем он строит парную регрессию по ценам

)1190()874(03011503102ˆ 2 =sdot+= RPB (2)

Дайте интерпретацию коэффициентов модели и выскажите свое суждение о качестве модели 13 Не удовлетворенный полученным результатом исследователь попытался построить модель множественной регрессии одновременно по обоим исследованным факторам

)160()761()0410(6608808911537ˆ 2 =sdotminussdot+= RPYB (3)

Охарактеризуйте значимость отдельных факторов модели и дайте интерпретацию коэффициентов модели В чем причина различия между значениями коэффициентов при величине дохода в моделях (1) и (3) Какое из значений следует считать более правильным и почему 14 Можно ли считать значимым вклад фактора цены в модели (3) по сравнению с моделью (1) Как согласуется Ваш вывод с оценкой значимости модели (2) 15 Скорректированный коэффициент детерминации модели (1) равен 23702 =R тогда как для модели (3) он составляет 6302 =R Поясните смысл скорректированного коэффициента детерминации и прокомментируйте эти числа и различие между ними 16 Наконец исследователь решает использовать логарифмы для всех переменных в уравнении множественной регрессии

)060()1480()410(710)ˆ(340)ˆ(071593)(ˆ 2 =sdotminussdot+= RPLOGYLOGBGLO (4)

Как изменится интерпретация коэффициентов модели (4) по сравнению с моделью (3) Каким видом товара является мясо в соответствии с этой моделью (предмет первой необходимости предмет роскоши нормальное благо худшее благо товар Гиффена и тп) 2 Фирма управляет двумя предприятиями величина месячной прибыли (в сотнях тысяч рублей) которых за год описывается переменными P1 P2 Общая прибыль фирмы P складывается из прибыли обоих предприятий за вычетом некоторых дополнительных постоянных издержек и возможно отчислений из прибыли каждого из предприятий Имеется 13 помесячных наблюдений за полный год и январь следующего года

21 Регрессионная модель зависимости общей прибыли от прибыли предприятий выглядит следующим образом

)590()690)(712(470280109145 2 =sdot+sdot+minus= RPPP

(1)

Дайте содержательную интерпретацию модели Охарактеризуйте значимость каждого из факторов на основе t-статистик и значимость модели в целом на основе F-критерия Там где нужно выполните односторонний тест и объясните причину его использования 22 Как можно объяснить на содержательном уровне очевидное противоречие между значимостью отдельных факторов и значимостью модели в целом (подробно опишите в чем заключается это противоречие) 23 Что выражает различие значений двух коэффициентов при независимых переменных Является ли их соотношение мерой различия вкладов обоих предприятий А мерой различия предельных вкладов предприятий Можно ли принять гипотезу что каждый из факторов входит в уравнение с коэффициентом равным единице 24 Ковариационная матрица для переменных модели выглядит следующим образом

P P1 P2 P 4584986 9997390 9699030 P1 9997390 5753368 2481317 P2 9699030 2481317 7788488

Определите коэффициенты корреляции между переменными модели взятыми попарно Какие дополнительные выводы можно сделать из этих данных 25 Далее была оценена парная регрессия

())112(3801733 2 =sdot+minus= RPP

(2)

Воспользовавшись имеющимися данными рассчитайте коэффициент наклона и стандартную ошибку в модели (2) Рассматривая модель (1) как правильную объясните смещение коэффициента наклона в модели (2) пользуясь ковариационной матрицей 26 Если сгенерировать новую переменную P0=P1+P2 то можно получить следующую регрессионную зависимость

)340()72(450006126 2 =sdot+minus= RPP

(3)

Сравните модель (3) с моделью (1) Сформулируйте введенное линейное ограничение и проверьте его значимость Что можно сказать о наличии общих постоянных издержек а также отчислений от прибыли каждого из предприятий до перечисления в общий фонд 3 Рассматривается зависимость совокупных расходов на косметику в США от совокупного личного располагаемого дохода за 1959-1983 гг С этой целью строится ряд линейных регрессий

31 Уравнение зависимости уровня расходов на косметику от логарифма личного располагаемого дохода получилось следующим

)290()951(950)log(160234 2 =sdot+minus= RDPICOSM

(1)

Дайте интерпретацию модели и ее коэффициентов Запишите уравнение не используя логарифмы 32 Если наоборот взять логарифм только от величины расходов то уравнение принимает вид

)000130()100(83000140770)log( 2 =sdot+= RDPICOSM

(2)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 33 Модель в двойных логарифмах принимает вид

)070()480(900)log(061205)log( 2 =sdot+minus= RDPICOSM

(3)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 34 Если выполнить преобразование Зарембки сформировав новую переменную COSMZ взамен COSM то получим следующее линейное уравнение

)000090()0010(8900010050 2 =sdot+= RDPICOSMZ

(4)

В чем состоит преобразование Зарембки и для чего оно используется 35 Значение суммы квадратов остатков для модели (4) составило 00877 тогда как для модели (3) оно равно 021 Сопоставимы ли значения RSS и R2 в этих двух моделях Можно ли утверждать что одна из моделей имеет преимущество перед другой Приведите статистическое обоснование своего вывода Можно ли выбрать наилучшую из моделей (1)-(4) 36 Известно что альтернативным методом к методу Зарембки является процедура Бокса-Кокса Опишите ее смысл и последовательность действий для рассматриваемого примера

Заключительный экзамен Часть 1 (30 минут) В каждом из 12 вопросов обведите кружком ровно один ответ который вы считаете правильным 1 Укажите среди названных здесь статистических тестов те тесты которые могут

выполняться только для больших выборок I Тест Чоу на неудачу предсказания II Тест Спирмена на ранговую корреляцию III Тест χ2 для LR-статистики при оценивании по методу максимума

правдоподобия IV Тест Дарбина для уравнения с лаговой объясняющей переменной V Тест Голдфелда-Квандта

1) Только II III IV 2) Только II IV 3) Только I III 4) Только IV V 5) Только I II IV

2 Гипотеза о том что случайный член не подвержен автокорреляции первого порядка отвергается в пользу односторонней альтернативной гипотезы о его отрицательной автокоррелированности если 1) статистика Дарбина-Уотсона d близка к 2 2) статистика Дарбина-Уотсона d близка к 1 3) статистика Дарбина-Уотсона d близка к 0 или 4 4) статистика Дарбина-Уотсона d близка к 4 но не к 0 5) статистика Дарбина-Уотсона d близка к 0 но не к 4 3 Переменная yt зависит от переменной xt yt=α+βxt+ut Оценивается зависимость yt от переменной zt yt=a+bzt+et где zt=xt+vt (vt ndash ошибка измерения являющаяся случайной величиной с нулевым математическим ожиданием и постоянной дисперсией) Если истинное значение β равно 04 а теоретическая дисперсия xt в три раза больше теоретической дисперсии vt то предел по вероятности оценки b равен 1) 01 2) 02 3) 0267 4) 03 5) 0333 4 После преобразования Койка модель геометрически распределенного лага yt = α + βxt + βδxt-1 + βδ2xt-2 + βδ3xt-3 ++ ut приобретает вид

1) yt - δyt-1 = α (1-δ) + βxt + ut - δut-1 2) yt = α (1-δ) + βxt + ut - δut-1 3) yt = α + βxt + ut - δut-1 4) yt - δyt-1 = α + βxt-1 + ut-1 5) ни один из перечисленных

5 По 39 точкам оценена следующая формула производственной функции в которой отдельно рассмотрены две составляющие затрат основного капитала K1 - здания и сооружения и K2 - машины и оборудование а также две составляющие затрат труда L1 - затраты квалифицированного труда и L2 - затраты неквалифицированного труда Y ndash выпуск ln(Y)=-43 + 035ln(K1) + 026ln(K2) + 063ln(L1) + 058ln(L2) R2 =092 DW=174 (14) (003) (005) (041) (038) (в скобках приведены стандартные ошибки коэффициентов) Какой из выводов и дальнейших шагов представляется Вам верным 1) Нужно исключить фактор L (переменные L1 и L2) тк он оказался незначимым 2) Имеет место мультиколлинеарность поэтому нужно объединить факторы K1 и K2 3) Имеет место мультиколлинеарность поэтому нужно объединить факторы L1 и L2 4) Отклонения ei автокоррелированы нужно изменить формулу зависимости 5) Формула зависимости приемлема по всем приведенным параметрам и изменения не

нужны

6 Эконометрическая модель описана следующими уравнениями (1) y1 = α + βy2 + γx1 + ϕx2 + u1 (2) y2 = δ + τx1 + λx2 + u2 где y1 и y2 ndash эндогенные переменные x1 и x2 ndash экзогенные переменные и u1 и u2 ndash случайные члены удовлетворяющие условиям Гаусса-Маркова Выберите неверное утверждение

1) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут несмещенными

2) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут несмещенными

3) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут состоятельными

4) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут состоятельными

5) косвенный метод наименьших квадратов позволяет получить несмещенные оценки коэффициентов обоих уравнений

7 Дана следующая макроэкономическая модель Y = C + I + G - макроэкономическое тождество C = a + bY - функция потребления I = d ndash emiddotR-1 + fY - функция инвестиций (MP) = gY ndash hR - уравнение денежного рынка где эндогенными переменными являются доход Y потребление C инвестиции I и процентная ставка R Переменные G (государственные расходы) и (MP) (реальная денежная масса) ndash экзогенные Выберите верное утверждение из следующих 1) функция инвестиций неидентифицируема 2) функция потребления неидентифицируема 3) функция потребления однозначно идентифицируема 4) функция инвестиций однозначно идентифицируема 5) функция инвестиций сверхидентифицируема

8 Коэффициент Тейла в виде 2

p+T2

p+T

2p+Tp+T

ym1y

m1

)y - y(m1

=UΣ+Σ

Σ

ˆ

ˆ позволяет сравнить качество

сделанного на период (T+1hellipT+m) прогноза pTy +ˆ с качеством следующего прогноза 1) pTy +ˆ =0 для всех p=1hellipm 2) pTy +ˆ =yT для всех p=1hellipm 3)прогнозом по линейной функции оцененной за период (1hellipT) 4) прогнозом по экспоненте оцененной за период (1hellipT) 5) прогнозом по логарифмической функции оцененной за период (1hellipT)

9 Введение фиктивных переменных DT+p p=1hellipm при прогнозировании (DT+p=1 при t=T+p DT+p=0 при всех других t) позволяет

I Рассчитать ошибки предсказания для t=T+1hellip T+m II Рассчитать стандартные ошибки предсказания для t=T+1hellip T+m

III Выполнить F-тест на стабильность коэффициентов

1) Верно только I 2) Верно только II 3) Верно только I и II 4) Верно только I и III 5) Верно I II и III 10 При оценивании линейной регрессии по методу максимума правдоподобия оценки коэффициентов совпадают с полученными по МНК при следующих условиях 1) всегда 2) если случайный член нормально распределен и выполнены условия Гаусса-Маркова 3) если случайный член нормально распределен независимо от выполнения условий

Гаусса-Маркова 4) если случайный член не автокоррелирован при любом его распределении 5) вообще говоря эти оценки не совпадают независимо от выполнения условий Гаусса-

Маркова и распределения случайного члена 11 Логит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-1196+0169ASVABC Вероятность получения академической степени (Degree=1) при ASVABC=60 равна

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) 1690))6016909611exp(1(

)6016909611exp(2 sdotsdot+minus+

sdotminus

3) (1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus)0169

4) 2))6016909611exp(1()6016909611exp(

sdot+minus+sdotminus

5) ))6016909611(21exp(

21 2sdotminusminusπ

12 Пробит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-5787+00782ASVABC Увеличение вероятности p(Degreei=1) при увеличении ASVABC на один пункт при ASVABC=60 равно здесь

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) ))60078207875(21exp(

21 2sdotminusminusπ

3) 07820))60078207875(21exp(

21 2 sdotsdotminusminusπ

4) F(-5787+0078260) где F ndash функция стандартного нормального распределения 5) F(-5787+0078260)00782 где F ndash функция стандартного нормального

распределения Часть 2 (1 час 30 минут) Ответьте письменно на два из трех следующих вопросов

1 Исследователь располагает данными о продолжительности обучения респондента HGC результатах теста на познавательные способности ASVABC и о продолжительности обучения матери респондента HGCM для выборки 570 индивидов Он предполагает что продолжительность обучения респондента зависит как от результатов теста на познавательные способности так и от продолжительности обучения матери респондента

uHGCMASVABCHGC +++= 21 ββα (11) и что познавательные способности в свою очередь являются функцией успехов в учебе

vHGCASVBC ++= 1δγ (12) 1a [2 балла] Объясните разницу между структурными уравнениями и уравнениями в приведенной форме в модели одновременных уравнений 1b [2 балла] Выведите приведенную форму уравнения для HGC 1c [6 баллов] Выведите выражение для смещения (для больших выборок) оценки 1δ предполагая что уравнение (12) было оценено обычным методом наименьших квадратов и определите вероятное направление смещения 1d [3 балла] Объясните почему HGCM может быть использована в качестве инструмента для HGC во втором уравнении 1e [6 баллов] Продемонстрируйте что оценка метода инструментальных переменных для

1δ использующая в качестве инструмента HGCM является состоятельной предполагая что модель корректно определена 1f [6 баллов] Предположим теперь что корректной спецификацией второго уравнения является

vHGCMHGCASVBC ++++= 21 δδγ (13) Продемонстрируйте что оценка метода инструментальных переменных для 1δ будет несостоятельной выведите смещение для случая большой выборки и установите его направление (Указание учтите что приведенная форма уравнения для HGC в этом случае изменится)

2а [8 баллов] Случайная переменная принимает два возможных значения 0 и 1 с неизвестной вероятностью p того что она равна 1 В выборке имеется всего три наблюдения первое наблюдение равно 1 второе также 1 а третье равно 0 Выведите оценку максимального правдоподобия для p Следующая информация относится к остальным вопросам этого задания Переменная WORKING определена равной 1 если респондент имеет работу и равной 0 в противном случае Для оценивания зависимости переменной WORKING от уровня образования респондента HGC (продолжительность обучения респондента) был использован метод логит-анализа Исследование было выполнено отдельно для мужчин и женщин (в приведенных ниже результатах расчетов первая таблица соответствует женщинам а вторая ndash мужчинам указание на число проведенных итераций не приводится) logit working hgc if male=0 Logit Estimates Number of obs = 2726

chi2(l) = 7042 Prob gt chi2 = 00000

Log Likelihood = ndash15865519 Pseudo R2 = 00217 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 1511872 0186177 8121 0000 1146971 1876773 cons 1 ndash1049543 2448064 ndash4287 0000 ndash1529355 ndash5697314 logit working hgc if male=1 Logit Estimates Number of obs = 2573

chi2(l) = 7503 Prob gt chi2 = 00000

Log Likelihood = ndash80265424 Pseudo R2 = 00446 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 2499295 0306482 8155 0000 1898601 3099989 cons 1 ndash9670268 ndash3775658 ndash2561 0010 ndash1707042 ndash2270113 95 процентов респондентов имеют значение HGC в диапазоне 9-18 лет со средним значением HGC равным 133 и 132 лет для женщин и мужчин соответственно Исходя из логит-анализа предельный эффект HGC на вероятность наличия работы в среднем оценивается как 0030 и 0020 для женщин и мужчин соответственно Оценка регрессии метода наименьших квадратов WORKING по HGC дает коэффициент наклона 0029 и 0020 для женщин и мужчин соответственно Логистическая функция F(z) и ее производная f(z) даются выражениями

izezF minus+

=1

1)( и 2)1()( z

z

eezf minus

minus

+=

где z является линейной функцией характеристик респондента На графиках (см следующую страницу) представлены вероятность наличия работы и предельное влияние HGC на вероятность наличия работы для мужчин и женщин

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 2: Эконометрика

Программа дисциплины laquoЭконометрикаraquo составлена в соответствии с

требованиями (федеральный компонент) к обязательному минимуму содержания и уровню подготовки дипломированного специалиста (бакалавра магистра) по циклу laquoОбщие гуманитарные и социально-экономические дисциплиныraquo государственных образовательных стандартов высшего профессионального образования второго поколения а также требованиями предъявляемыми НФПК к новым и модернизированным программам учебных курсов разработанным в рамках программы laquoСовершенствование преподавания социально-экономических дисциплин в вузахraquo Инновационного проекта развития образования

Программа подготовлена при содействии НФПК ndash Национального Фонда

подготовки кадров в рамках программы laquoСовершенствование преподавания социально-экономических дисциплин в вузахraquo Инновационного проекта развития образования

Автор (составитель) Замков Олег Олегович кэн доцент МИЭФ ГУ-ВШЭ (ФИО ученая степень ученое звание вуз) Рецензенты __________________________________________________________________ (ФИО ученая степень ученое звание вуз)

I Организационно-методический раздел Введение в эконометрику - односеместровый курс для студентов 3-го года обучения МИЭФ Это - вводный курс эконометрики для студентов специализирующихся в области экономики Его пререквизиты - вводный курс математической и прикладной статистики а также курсы экономической теории и информатики Курс преподается на русском и английском языках поскольку часть студентов сдает внешний экзамен Лондонского университета Elements of Econometrics and Economic Statistics на английском языке Акцент в курсе делается на содержательном смысле фактов методов и подходов эконометрического анализа Выводы и доказательства даются для ряда базовых формул и моделей что позволяет студентам понять принципы построения эконометрической теории Главный акцент делается на экономической интерпретации и приложениях рассматриваемых эконометрических моделей Цель и задачи курса

Студенты должны получить базовые знания и навыки эконометрического анализа Они должны уметь применять их в исследовании экономических процессов а также понимать эконометрические методы идеи результаты и выводы встречаемые в большинстве экономических книг и статей В данном курсе студенты должны освоить традиционные эконометрические методы предназначенные в основном для работы с данными перекрестных выборок В то же время студенты должны понимать содержательные различия данных перекрестных выборок и временных рядов и те специфические эконометрические проблемы которые возникают при работе с данными этих типов Студенты должны приобрести навыки построения и развития моделей парной и множественной линейной регрессии познакомиться с некоторыми видами нелинейных моделей и специальными методами эконометрического анализа и оценивания понимая область и границы их применения в экономике Рассматриваемые методы и модели должны быть освоены на практике с использованием реальных массивов экономических данных и современного эконометрического программного обеспечения Методическая новизна курса (новые методики формы работы авторские приемы в преподавании курса) В курсе используются следующие методы и формы работы - Лекции (2 часа неделя) - Практические занятия в компьютерном классе (2 часа в неделю выполняются задания на компьютерах и обсуждаются основные вопросы домашних заданий) - консультации преподавателя - самостоятельная работа в компьютерном классе в том числе в Интернет (выполнение

домашних заданий с использованием программ Excel и Econometric Views работа с массивами экономических данных пособиями для студентов в Интернет просмотр комплектов слайдов по эконометрике)

- самостоятельная работа с литературой По курсу имеется большое количество различных методических материалов и пособий как авторских так и подготовленных зарубежными специалистами (прежде всего - КрДоугерти в ЛШЭ) Все методические материалы КрДоугерти доступны через Интернет (И-1 И-2) в том числе - пособия для студентов руководства для преподавателей базы данных и их описания и тд Кроме того в нашем курсе используется авторское пособие (ОЗ) и его перевод на английский язык задания для работы в классе и домашние задания и комментарии к ним Особенностью по сравнению с другими курсами является еженедельное проведение практических занятий в компьютерном классе с заранее раздаваемыми заданиями и выполнением на основе этого

еженедельных письменных домашних заданий с проведением расчетов на компьютере которые затем проверяются и разбираются преподавателем Экзаменационные задания включают вопросы двух типов это тесты множественного выбора и открытые вопросы Задания первого типа позволяют проверить знание студентом широкого круга вопросов в рамках курса задания второго типа - проверить умение проводить эконометрический анализ и строить логику исследования Новизна курса (научная содержательная сравнительный анализ с подобными курсами в России и за рубежом)

Данный курс является вводным курсом эконометрики поэтому с точки зрения его теоретического содержания он достаточно стандартен и близок например к курсу КрДоугерти в ЛШЭ В то же время особенностью курса является его интенсивность в других российских и зарубежных университетах изучение подобного курса эконометрики занимает как минимум год Этому способствует тот факт что студенты МИЭФ до курса эконометрики в течение двух лет изучают математичекскую и прикладную статистику В результате их статистическая подготовка а также высокий уровень знаний экономической теории позволяют в рамках данного курса рассматривать прежде всего эконометрические вопросы опираясь на глубокое понимание студентами концептуального аппарата статистики и экономики Кроме того курс ориентирован на содержательные вопросы а не на формальные выводы и доказательства что экономит массу времени по сравнению с курсами эконометрики в ряде российских вузов При этом даются доказательства и выводы лишь для важнейших и типовых формул и утверждений так что самим аппаратом выводов и доказательств в эконометрике студенты в итоге также овладевают Наконец освоение курса требует большого объема самостоятельной работы студентов превосходящей по объему как минимум вдвое их аудиторную работу

Очень важно то что студенты овладевают на практике применением всех методов подходов и моделей изучаемых в курсе выполняя практические задания в классе и дома Наряду с базовыми стандартными темами вводного курса эконометрики в курсе изучаются и такие более продвинутые вопросы как оценивание по методу максимума правдоподобия логит- и пробит-модели и тд В то же время в курсе не затрагиваются некоторые разделы моделирования нестационарных временных рядов широко используемые в современном эконометрическом анализе поскольку они изучаются в следующем за данным курсом курсе Анализ временных рядов II Содержание курса 1 Введение в эконометрику Статистическое исследование взаимосвязей экономических переменных Зависимости в экономике примеры проблемы оценивания и анализа (функции спроса функции заработка модели экономического роста) Направленность курса Базы данных Программное обеспечение Генеральная совокупность и выборка Описательные статистики ковариация дисперсия корреляция Определения свойства правила Истинные значения параметров и их оценки Обзор Глава 1 (CD-1 CD-2) L1 (OZ) 2 Модель парной линейной регрессии (ЛР) Свойства оценок в модели парной ЛР Предпосылки и обозначения модели ЛР Оценивание модели ЛР с помощью Метода наименьших квадратов (МНК) Формулы для оценок коэффициента наклона и свободного члена вывод и интерпретация Условия Гаусса-Маркова и свойства получаемых по МНК оценок Теорема Гаусса-Маркова (формулировка) Стандартные отклонения и стандартные ошибки оценок коэффициентов регрессии

Статистическая значимость оценок коэффициентов парной ЛР проверка гипотез с помощью t-статистик Построение и интерпретация доверительных интервалов Общее качество регрессии коэффициент детерминации R2 F-статистика и F-тест Связь R2 с коэффициентами корреляции Модель парной ЛР без свободного члена Глава 2 (21-27) Глава 3 (31-311) (CD-1 CD-2) L2 (OZ) 3 Преобразования переменных в регрессионном анализе Линеаризация нелинейных зависимостей и их оценивание с помощью МНК Спецификация случайного члена Интерпретация линейных логарифмических и линейно-логарифмических зависимостей Оценивание функций с постоянной эластичностью и экспоненциальных временных трендов Сравнение качества регрессионных зависимостей линейные и линейно-логарифмические функции Метод Зарембки Метод Бокса-Кокса Глава 4 (CD-1) Глава 5 (CD-2) L4 (ОЗ) 4 Модель множественной линейной регрессии (МЛР) две объясняющие переменные и k объясняющих переменных Описание и интерпретация модели с двумя и k объясняющими переменными Примеры функции спроса функции заработка производственные функции Оценивание по МНК модели с двумя объясняющими переменными Свойства коэффициентов модели Мультиколлинеарность Коэффициент детерминации R2 Скорректированный R2 Проверка гипотез с помощью t-статистик и F-статистик МНК-оценки модели с k объясняющими переменными в векторно-матьричной форме Свойства коэффициентов F-тест для групп переменных Оценивание производственных функций в объемной и темповой записи как моделей множественной регрессии Глава 5 (51-56CD-1) Глава 4 (41-45 CD-2) L24 (ОЗ) Глава 3 (МКП) 5 Спецификация модели линейной регрессии Последствия неправильной спецификации Невключение значимой объясняющей переменной Включение лишней объясняющей переменной Метод Монте-Карло в эконометрическом анализе общие принципы возможности применения и примеры Замещающие переменные Проверка выполнения линейных ограничений на параметры МЛР F-тест и t-тесты Роль и примеры линейных ограничений в исследовании экономических моделей Переменные с запаздыванием Глава 6 (61-67 CD-1) Глава 7 (71-76 CD-2) 6 Гетероскедастичность Понятие последствия обнаружение гетероскедастичности Тесты Голдфелда-Квандта Спирмена Глейзера Корректировка модели Взвешенный метод наименьших квадратов Глава 7 (71-73 7576 CD-1) Глава 8 (81-83 CD-2) 7 Автокоррелированность случайного члена Проявления и последствия автокоррелированности случайного члена в модели линейной регрессии Критерий Дарбина-Уотсона Свойства случайного члена и ошибки спецификации Корректировка модели Авторегрессионное преобразование процедура Кокрана-Оркатта поправка Прайса-Уинстена Модели AR MA и ARMA Глава 7 (75-79 CD-1) Глава 13 (131-136 CD-2) L3 (ОЗ) 8 Фиктивные переменные

Фиктивные (dummy) переменные в моделях линейной регрессии Типы фиктивных переменных Многожественные совокупности фиктивных переменных Тест Чоу Фиктивные переменные в экономических моделях функции заработка производственные функции Глава 9 (91-95 CD-1) Глава 6 (61-64 CD-2) 9 Стохастические объясняющие переменные Свойства получаемых оценок и тестовых статистик при стохастических объясняющих переменных Ошибки измерения Смещение оценок при ошибках измерения Критика Милтоном Фридменом оценивания функции потребления Инструментальные переменные Использование инструментальных переменных в модели потребления МФридмана и других экономических моделях Глава 8 (81-84 CD-1) Глава 9 (91-94 CD-2) 10 Системы одновременных уравнений Понятие системы одновременных уравнений Смещение и несостоятельность оценок при непосредственном оценивании Структурная и приведенная формы модели Модель спроса и предложения и простейшая кейнсианская модель равновесия как системы одновременных уравнений Методы оценивания Косвенный метод наименьших квадратов (КМНК) Инструментальные переменные Двухшаговый метод наименьших квадратов (ДМНК) Связь КМНК инструментальных переменных и ДМНК Модель ISLM пример оценивания модели одновременных уравнений Глава 11 (111-118 CD-1) Глава 10 (101-113 CD-2) L6 (ОЗ) 11 Моделирование с использованием данных временных рядов Модели динамических процессов Прогнозирование Распределенные лаги геометрический лаг полиномиальный лаг Преобразование Койка и непосредственное нелинейное оценивание параметров геометрического лага Частичная корректировка Адаптивные ожидания Модель постоянного дохода МФридмена Проблемы оценивания и анализа Построение прогнозов и пост-прогнозов Доверительные интервалы Метод Салкевера Тесты на устойчивость Показатели качества прогнозов Глава 10 (101-109 CD-1) Глава 12 (121-126 CD-2) L5 (ОЗ) 12 Модели двоичного выбора модели с ограничениями для зависимой переменной и оценивание по методу максимума правдоподобия Линейная вероятностная модель проблемы оценивания Логит-модель Пробит-модель Оценивание по методу максимума правдоподобия общие принципы и направления применения Использование для парной линейной регрессии логит-оценивания пробит-оценивания Характеристики качества оценивания (псевдо-R2 отношение правдоподобия) Цензурированные выборки Непосредственное и усеченное оценивание Тобит-модель Смещение при построении выборки Глава 11 (CD-2 И-2) III Распределение часов курса по темам и видам работ

пп

Наименование тем и разделов

ВСЕГО (часов)

Аудиторные занятия (час)

Самостоятельная

в том числе Лекции Практические

занятия

работа

1 Введение в эконометрику 12 2 2 8 2 Модель парной линейной регрессии (ЛР)

Свойства оценок в модели парной ЛР 24 4 4 16

3 Преобразования переменных в регрессионном анализе

12 2 2 8

4 Модель множественной линейной регрессии (МЛР) две объясняющие переменные и k объясняющих переменных

24 4 4 16

5 Спецификация модели линейной регрессии 24 4 4 16 6 Гетероскедастичность 12 2 2 8 7 Автокоррелированность случайного члена 12 2 2 8 8 Фиктивные переменные 12 2 2 8 9 Стохастические объясняющие переменные 12 2 2 8 10 Системы одновременных уравнений 24 4 4 16 11 Моделирование с использованием данных

временных рядов Модели динамических процессов Прогнозирование

24 4 4 16

12 Модели двоичного выбора модели с ограничениями для зависимой переменной и оценивание по методу максимума правдоподобия

24 4 4 16

ИТОГО 216 36 36 144 IV Формы промежуточного и итогового контроля Студенты сдают промежуточный письменный экзамен а также итоговый письменный экзамен в конце семестра Каждый экзамен включает вопросы множественного выбора и открытые вопросы (примеры экзаменационных работ прилагаются) Итоговый экзамен дает 50 конечной оценки промежуточный экзамен - 30 конечной оценки соответственно 20 дается за выполнение домашних заданий и работу на занятиях V Учебно-методическое обеспечение курса Основная литература 1 Dougherty Christopher Introduction to Econometrics Oxford University Press 1992 (1st

edition CD-1) 2002 (2nd edition CD-2) Доугерти Кр Введение в эконометрику Изд1 М ИНФРА-М 1997 1999 Изд2 М ИНФРА-М 2003 (готовится к выходу)

2 Dougherty Christopher Elements of econometrics and economic statistics Study Guide University of London 2002

3 Замков ОО Эконометрические методы в макроэкономическом анализе М ГУ-ВШЭ 2001 (на русском языке) Диалог-МГУ 1999 (на русском и английском языках) (ОЗ)

Дополнительная литература 1 Магнус ЯР Катышев ПК Пересецкий АА Эконометрика Начальный курс Изд 1-4

М Дело 1997-2000 (МКП) 2 Econometric Views 40 Users Guide Quantitative Micro Software LLC 3 Greene WH Econometric Analysis Prentice Hall int 1993 4 Kennedy P A Guide to Econometrics MIT Press 1992

Интернет-ресурсы 1 httpeconlseacukie (И-1) 2 httpwwwoupcomukbesttextbookseconomicsdougherty2e (И-2) 3 httpwwwworthpublisherscommankiw (И-3) 4 httpwwwrecepru (И-4) Компьютерные программы и массивы данных Основной компьютерной программой используемой в курсе является программа Econometric Views (версии 31 и последующие) Используются также электронные таблицы Excel Для выполнения заданий в классе и домашних заданий используются массивы данных данные курса КрДоугерти в ЛШЭ (данные для оценивания функций заработка по опросу NSLY в США данные о спросе располагаемом доходе и относительных ценах по товарным группам в США за 1959-1994гг - данные имеются на сайте И-1) Данные о погодовой динамике основных макроэкономических показателей в США за 1931-1998гг данные имеются на сайте И-3 Данные о помесячной динамике основных макроэкономических показателей России за 1992-2002гг данные имеются на сайте И-4 Данные об оценках ВНП затрат труда и капитала в экономике СССР за 1928-1987гг Данные о динамике инвестиций и вводе основных производственных фондов в Российской Федерации в 1956-1991гг

Приложение 1 Примеры промежуточных и итоговых экзаменационных работ

Промежуточный экзамен Часть 1 Тесты множественного выбора 30 минут В каждом вопросе обведите цифру номера правильного ответа 1 Если объясняющая переменная x в модели парной линейной регрессии принимает

среднее в выборке значение x =Σxin то 1) наблюдаемая величина зависимой переменной y равна y =Σyin 2) рассчитанная по уравнению регрессии величина зависимой переменной y равна y =Σyin 3) рассчитанная по уравнению регрессии величина зависимой переменной y равна y =Σyin

в среднем но не в каждом конкретном случае 4) равенство y =a+b x свидетельствует об отсутствии корреляции между отклонениями 5) равенство y =a+b x свидетельствует о выполнении условий Гаусса-Маркова 2 В модели парной линейной регрессии при использовании метода наименьших

квадратов верны следующие из перечисленных утверждений I Квадрат коэффициента корреляции между фактическими и теоретическими

значениями зависимой переменной в выборке равен R2 II Квадрат коэффициента корреляции между зависимой переменной и

объясняющей переменной в выборке равен R2 III Доля остаточной (необъясненной) дисперсии зависимой переменной равна R2 1) Только I 2) Только II 3) Только I и III 4) Только I и II 5) I II и III

3 Уравнение Y=α+βk+(1-β)l+u где Y - темп прироста выпуска k - темп прироста затрат капитала и l - темп прироста затрат труда может быть оценено как модель линейной регрессии

1) непосредственно с помощью обычного МНК как зависимость Y от k и l со свободным членом

2) непосредственно с помощью обычного МНК как зависимость Y от k и l без свободного члена

3) как линейную зависимость (Y-k) от (l-k) со свободным членом 4) как линейную зависимость (Y-k) от (l-k) без свободного члена 5) невозможно оценить данную зависимость с помощью обычного МНК

требуется нелинейный МНК 4 В модели множественной линейной регрессии с двумя объясняющими переменными Y=α+β1x1+β2x2+u оценка коэффициента β1 по методу наименьших квадратов для заданной выборки не зависит от 1) наблюденных значений переменной x1 2) наблюденных значений переменной x2 3) наблюденных значений переменной Y 4) значения постоянного члена α

5) ковариации между x1 и Y 5 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 (b) y зависит только от x1 и (c) y зависит только от x2 При оценивании регрессий для каждой из этих моделей величины R2 получились равными R2

a R2b и R2

c соответственно Какое из следующих утверждений верно 1) R2

a = R2b + R2

c 2) R2

a gt R2b + R2

c 3) R2

a = R2b - R2

c 4) R2

a lt R2b + R2

c 5) R2

a может быть больше а может быть меньше чем R2b + R2

c 6 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 без свободного члена (b) y зависит только от x1 со свободным членом и (c) y зависит только от x2 со свободным членом При оценивании регрессий для каждой из этих моделей величины RSS получились равными RSSa RSSb и RSSc соответственно Какое из следующих утверждений верно 1) RSSa gt maxRSSb RSSc 2) RSSa gt RSSb + RSSc 3) RSSa lt minRSSb RSSc 4) RSSa lt RSSb + RSSc 5) RSSa может быть больше а может быть меньше чем RSSb + RSSc

7 В модели множественной линейной регрессии высокая корреляция между двумя объясняющими переменными приводит к

1) смещенности оценок коэффициентов полученных по методу наименьших квадратов

2) несостоятельности оценок коэффициентов полученных по методу наименьших квадратов

3) неэффективности оценок коэффициентов полученных по методу наименьших квадратов

4) значительной дисперсии оценок коэффициентов полученных по методу наименьших квадратов

5) равенству нулю оценок коэффициентов полученных по методу наименьших квадратов

8 Переменная y определяется величинами x1 и x2 и случайным членом u по следующей формуле y = α + β1x1 + β2x2 + u По данным выборки оценено следующее уравнение регрессии 11ˆ xbay += Переменные x1 и x2 положительно коррелированы Величины β1 и β2 положительны

Тогда 1) b1 всегда меньше чем β1 2) b1 всегда больше чем β1 3) оценка b1 смещена в сторону завышения 4) оценка b1 смещена в сторону занижения 5) b1 является несмещенной оценкой β1

9 Введение линейного ограничения на параметры в регрессионную модель 1) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение значимо 2) приводит к значительному сокращению суммы квадратов отклонений если

ограничение значимо 3) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение незначимо 4) приводит к значительному сокращению суммы квадратов отклонений если

ограничение незначимо 5) все перечисленное неверно

10 Тест Голдфелда-Квандта в модели y = α + βx + u используется для 1) обнаружения гетероскедастичности любого вида 2) обнаружения гетероскедастичности вида σui=γ xi 3) обнаружения гетероскедастичности вида σui= δ + γ xi

μ 4) проверки на некоррелированность значений случайного члена между собой 5) проверки на некоррелированность значений случайного члена и объясняющей

переменной

11 Оценена линейная регрессионная зависимость величины заработка респондента y от совокупности факторов (x1x2hellipxn) Исследователь предполагает что величина заработка зависит также от места проживания респондента которое может принадлежать к одному из трех типов крупный город малый город сельская местность Для того чтобы учесть это в модели нужно 1) ввести фиктивную переменную которая может принимать три разных значения 2) ввести фиктивную переменную которая может принимать два разных значения 3) ввести две фиктивные переменные каждая из которых может принимать два

разных значения 4) ввести три фиктивные переменные каждая из которых может принимать два

разных значения 5) ввести две фиктивные переменные каждая из которых может принимать три

разных значения 12 Оценена регрессионная зависимость величины спроса потребителей на VideoCD (VCD) от их дохода (Y) и от уровня цен на VideoCD (Pvcd) в виде log(VCD) = α + β1log(Y) + β2log(Pvcd) + u В выборку включены только те потребители у которых имеется персональный компьютер Далее исследователь предполагает что эластичности спроса на VideoCD по доходу и по цене зависят от наличия у потребителей DVD-проигрывателя Для того чтобы учесть это в модели нужно

1) ввести фиктивную переменную для свободного члена 2) ввести две фиктивные переменные для свободного члена 3) ввести одну общую фиктивную переменную для коэффициентов наклона 4) ввести две фиктивные переменные для коэффициентов наклона 5) ввести две фиктивные переменные по одной для свободного члена и для

коэффициентов наклона

Часть 2 (1 час 30 минут) Ответьте письменно на любые два из следующих трех вопросов 1 Исследователь интересуется факторами определяющими динамику потребления мяса (B) в США в 1960 ndash 1987 годах (фунты в год на душу населения) В качестве факторов он

рассматривает цену P (центы за фунт) и личный располагаемый доход (тысячи долларов в год в расчете на душу населения) Y 11 Вначале он строит модель парной регрессии потребления мяса от личного располагаемого дохода

)111()79(260483377ˆ 2 =sdot+= RYB (1)

В скобках приведены стандартные ошибки Оцените качество модели приведя обоснование своих суждений и выводов на основе t-тестов и F-теста (F-статистику рассчитайте двумя разными способами) Дайте интерпретацию коэффициентов модели 12 Затем он строит парную регрессию по ценам

)1190()874(03011503102ˆ 2 =sdot+= RPB (2)

Дайте интерпретацию коэффициентов модели и выскажите свое суждение о качестве модели 13 Не удовлетворенный полученным результатом исследователь попытался построить модель множественной регрессии одновременно по обоим исследованным факторам

)160()761()0410(6608808911537ˆ 2 =sdotminussdot+= RPYB (3)

Охарактеризуйте значимость отдельных факторов модели и дайте интерпретацию коэффициентов модели В чем причина различия между значениями коэффициентов при величине дохода в моделях (1) и (3) Какое из значений следует считать более правильным и почему 14 Можно ли считать значимым вклад фактора цены в модели (3) по сравнению с моделью (1) Как согласуется Ваш вывод с оценкой значимости модели (2) 15 Скорректированный коэффициент детерминации модели (1) равен 23702 =R тогда как для модели (3) он составляет 6302 =R Поясните смысл скорректированного коэффициента детерминации и прокомментируйте эти числа и различие между ними 16 Наконец исследователь решает использовать логарифмы для всех переменных в уравнении множественной регрессии

)060()1480()410(710)ˆ(340)ˆ(071593)(ˆ 2 =sdotminussdot+= RPLOGYLOGBGLO (4)

Как изменится интерпретация коэффициентов модели (4) по сравнению с моделью (3) Каким видом товара является мясо в соответствии с этой моделью (предмет первой необходимости предмет роскоши нормальное благо худшее благо товар Гиффена и тп) 2 Фирма управляет двумя предприятиями величина месячной прибыли (в сотнях тысяч рублей) которых за год описывается переменными P1 P2 Общая прибыль фирмы P складывается из прибыли обоих предприятий за вычетом некоторых дополнительных постоянных издержек и возможно отчислений из прибыли каждого из предприятий Имеется 13 помесячных наблюдений за полный год и январь следующего года

21 Регрессионная модель зависимости общей прибыли от прибыли предприятий выглядит следующим образом

)590()690)(712(470280109145 2 =sdot+sdot+minus= RPPP

(1)

Дайте содержательную интерпретацию модели Охарактеризуйте значимость каждого из факторов на основе t-статистик и значимость модели в целом на основе F-критерия Там где нужно выполните односторонний тест и объясните причину его использования 22 Как можно объяснить на содержательном уровне очевидное противоречие между значимостью отдельных факторов и значимостью модели в целом (подробно опишите в чем заключается это противоречие) 23 Что выражает различие значений двух коэффициентов при независимых переменных Является ли их соотношение мерой различия вкладов обоих предприятий А мерой различия предельных вкладов предприятий Можно ли принять гипотезу что каждый из факторов входит в уравнение с коэффициентом равным единице 24 Ковариационная матрица для переменных модели выглядит следующим образом

P P1 P2 P 4584986 9997390 9699030 P1 9997390 5753368 2481317 P2 9699030 2481317 7788488

Определите коэффициенты корреляции между переменными модели взятыми попарно Какие дополнительные выводы можно сделать из этих данных 25 Далее была оценена парная регрессия

())112(3801733 2 =sdot+minus= RPP

(2)

Воспользовавшись имеющимися данными рассчитайте коэффициент наклона и стандартную ошибку в модели (2) Рассматривая модель (1) как правильную объясните смещение коэффициента наклона в модели (2) пользуясь ковариационной матрицей 26 Если сгенерировать новую переменную P0=P1+P2 то можно получить следующую регрессионную зависимость

)340()72(450006126 2 =sdot+minus= RPP

(3)

Сравните модель (3) с моделью (1) Сформулируйте введенное линейное ограничение и проверьте его значимость Что можно сказать о наличии общих постоянных издержек а также отчислений от прибыли каждого из предприятий до перечисления в общий фонд 3 Рассматривается зависимость совокупных расходов на косметику в США от совокупного личного располагаемого дохода за 1959-1983 гг С этой целью строится ряд линейных регрессий

31 Уравнение зависимости уровня расходов на косметику от логарифма личного располагаемого дохода получилось следующим

)290()951(950)log(160234 2 =sdot+minus= RDPICOSM

(1)

Дайте интерпретацию модели и ее коэффициентов Запишите уравнение не используя логарифмы 32 Если наоборот взять логарифм только от величины расходов то уравнение принимает вид

)000130()100(83000140770)log( 2 =sdot+= RDPICOSM

(2)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 33 Модель в двойных логарифмах принимает вид

)070()480(900)log(061205)log( 2 =sdot+minus= RDPICOSM

(3)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 34 Если выполнить преобразование Зарембки сформировав новую переменную COSMZ взамен COSM то получим следующее линейное уравнение

)000090()0010(8900010050 2 =sdot+= RDPICOSMZ

(4)

В чем состоит преобразование Зарембки и для чего оно используется 35 Значение суммы квадратов остатков для модели (4) составило 00877 тогда как для модели (3) оно равно 021 Сопоставимы ли значения RSS и R2 в этих двух моделях Можно ли утверждать что одна из моделей имеет преимущество перед другой Приведите статистическое обоснование своего вывода Можно ли выбрать наилучшую из моделей (1)-(4) 36 Известно что альтернативным методом к методу Зарембки является процедура Бокса-Кокса Опишите ее смысл и последовательность действий для рассматриваемого примера

Заключительный экзамен Часть 1 (30 минут) В каждом из 12 вопросов обведите кружком ровно один ответ который вы считаете правильным 1 Укажите среди названных здесь статистических тестов те тесты которые могут

выполняться только для больших выборок I Тест Чоу на неудачу предсказания II Тест Спирмена на ранговую корреляцию III Тест χ2 для LR-статистики при оценивании по методу максимума

правдоподобия IV Тест Дарбина для уравнения с лаговой объясняющей переменной V Тест Голдфелда-Квандта

1) Только II III IV 2) Только II IV 3) Только I III 4) Только IV V 5) Только I II IV

2 Гипотеза о том что случайный член не подвержен автокорреляции первого порядка отвергается в пользу односторонней альтернативной гипотезы о его отрицательной автокоррелированности если 1) статистика Дарбина-Уотсона d близка к 2 2) статистика Дарбина-Уотсона d близка к 1 3) статистика Дарбина-Уотсона d близка к 0 или 4 4) статистика Дарбина-Уотсона d близка к 4 но не к 0 5) статистика Дарбина-Уотсона d близка к 0 но не к 4 3 Переменная yt зависит от переменной xt yt=α+βxt+ut Оценивается зависимость yt от переменной zt yt=a+bzt+et где zt=xt+vt (vt ndash ошибка измерения являющаяся случайной величиной с нулевым математическим ожиданием и постоянной дисперсией) Если истинное значение β равно 04 а теоретическая дисперсия xt в три раза больше теоретической дисперсии vt то предел по вероятности оценки b равен 1) 01 2) 02 3) 0267 4) 03 5) 0333 4 После преобразования Койка модель геометрически распределенного лага yt = α + βxt + βδxt-1 + βδ2xt-2 + βδ3xt-3 ++ ut приобретает вид

1) yt - δyt-1 = α (1-δ) + βxt + ut - δut-1 2) yt = α (1-δ) + βxt + ut - δut-1 3) yt = α + βxt + ut - δut-1 4) yt - δyt-1 = α + βxt-1 + ut-1 5) ни один из перечисленных

5 По 39 точкам оценена следующая формула производственной функции в которой отдельно рассмотрены две составляющие затрат основного капитала K1 - здания и сооружения и K2 - машины и оборудование а также две составляющие затрат труда L1 - затраты квалифицированного труда и L2 - затраты неквалифицированного труда Y ndash выпуск ln(Y)=-43 + 035ln(K1) + 026ln(K2) + 063ln(L1) + 058ln(L2) R2 =092 DW=174 (14) (003) (005) (041) (038) (в скобках приведены стандартные ошибки коэффициентов) Какой из выводов и дальнейших шагов представляется Вам верным 1) Нужно исключить фактор L (переменные L1 и L2) тк он оказался незначимым 2) Имеет место мультиколлинеарность поэтому нужно объединить факторы K1 и K2 3) Имеет место мультиколлинеарность поэтому нужно объединить факторы L1 и L2 4) Отклонения ei автокоррелированы нужно изменить формулу зависимости 5) Формула зависимости приемлема по всем приведенным параметрам и изменения не

нужны

6 Эконометрическая модель описана следующими уравнениями (1) y1 = α + βy2 + γx1 + ϕx2 + u1 (2) y2 = δ + τx1 + λx2 + u2 где y1 и y2 ndash эндогенные переменные x1 и x2 ndash экзогенные переменные и u1 и u2 ndash случайные члены удовлетворяющие условиям Гаусса-Маркова Выберите неверное утверждение

1) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут несмещенными

2) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут несмещенными

3) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут состоятельными

4) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут состоятельными

5) косвенный метод наименьших квадратов позволяет получить несмещенные оценки коэффициентов обоих уравнений

7 Дана следующая макроэкономическая модель Y = C + I + G - макроэкономическое тождество C = a + bY - функция потребления I = d ndash emiddotR-1 + fY - функция инвестиций (MP) = gY ndash hR - уравнение денежного рынка где эндогенными переменными являются доход Y потребление C инвестиции I и процентная ставка R Переменные G (государственные расходы) и (MP) (реальная денежная масса) ndash экзогенные Выберите верное утверждение из следующих 1) функция инвестиций неидентифицируема 2) функция потребления неидентифицируема 3) функция потребления однозначно идентифицируема 4) функция инвестиций однозначно идентифицируема 5) функция инвестиций сверхидентифицируема

8 Коэффициент Тейла в виде 2

p+T2

p+T

2p+Tp+T

ym1y

m1

)y - y(m1

=UΣ+Σ

Σ

ˆ

ˆ позволяет сравнить качество

сделанного на период (T+1hellipT+m) прогноза pTy +ˆ с качеством следующего прогноза 1) pTy +ˆ =0 для всех p=1hellipm 2) pTy +ˆ =yT для всех p=1hellipm 3)прогнозом по линейной функции оцененной за период (1hellipT) 4) прогнозом по экспоненте оцененной за период (1hellipT) 5) прогнозом по логарифмической функции оцененной за период (1hellipT)

9 Введение фиктивных переменных DT+p p=1hellipm при прогнозировании (DT+p=1 при t=T+p DT+p=0 при всех других t) позволяет

I Рассчитать ошибки предсказания для t=T+1hellip T+m II Рассчитать стандартные ошибки предсказания для t=T+1hellip T+m

III Выполнить F-тест на стабильность коэффициентов

1) Верно только I 2) Верно только II 3) Верно только I и II 4) Верно только I и III 5) Верно I II и III 10 При оценивании линейной регрессии по методу максимума правдоподобия оценки коэффициентов совпадают с полученными по МНК при следующих условиях 1) всегда 2) если случайный член нормально распределен и выполнены условия Гаусса-Маркова 3) если случайный член нормально распределен независимо от выполнения условий

Гаусса-Маркова 4) если случайный член не автокоррелирован при любом его распределении 5) вообще говоря эти оценки не совпадают независимо от выполнения условий Гаусса-

Маркова и распределения случайного члена 11 Логит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-1196+0169ASVABC Вероятность получения академической степени (Degree=1) при ASVABC=60 равна

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) 1690))6016909611exp(1(

)6016909611exp(2 sdotsdot+minus+

sdotminus

3) (1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus)0169

4) 2))6016909611exp(1()6016909611exp(

sdot+minus+sdotminus

5) ))6016909611(21exp(

21 2sdotminusminusπ

12 Пробит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-5787+00782ASVABC Увеличение вероятности p(Degreei=1) при увеличении ASVABC на один пункт при ASVABC=60 равно здесь

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) ))60078207875(21exp(

21 2sdotminusminusπ

3) 07820))60078207875(21exp(

21 2 sdotsdotminusminusπ

4) F(-5787+0078260) где F ndash функция стандартного нормального распределения 5) F(-5787+0078260)00782 где F ndash функция стандартного нормального

распределения Часть 2 (1 час 30 минут) Ответьте письменно на два из трех следующих вопросов

1 Исследователь располагает данными о продолжительности обучения респондента HGC результатах теста на познавательные способности ASVABC и о продолжительности обучения матери респондента HGCM для выборки 570 индивидов Он предполагает что продолжительность обучения респондента зависит как от результатов теста на познавательные способности так и от продолжительности обучения матери респондента

uHGCMASVABCHGC +++= 21 ββα (11) и что познавательные способности в свою очередь являются функцией успехов в учебе

vHGCASVBC ++= 1δγ (12) 1a [2 балла] Объясните разницу между структурными уравнениями и уравнениями в приведенной форме в модели одновременных уравнений 1b [2 балла] Выведите приведенную форму уравнения для HGC 1c [6 баллов] Выведите выражение для смещения (для больших выборок) оценки 1δ предполагая что уравнение (12) было оценено обычным методом наименьших квадратов и определите вероятное направление смещения 1d [3 балла] Объясните почему HGCM может быть использована в качестве инструмента для HGC во втором уравнении 1e [6 баллов] Продемонстрируйте что оценка метода инструментальных переменных для

1δ использующая в качестве инструмента HGCM является состоятельной предполагая что модель корректно определена 1f [6 баллов] Предположим теперь что корректной спецификацией второго уравнения является

vHGCMHGCASVBC ++++= 21 δδγ (13) Продемонстрируйте что оценка метода инструментальных переменных для 1δ будет несостоятельной выведите смещение для случая большой выборки и установите его направление (Указание учтите что приведенная форма уравнения для HGC в этом случае изменится)

2а [8 баллов] Случайная переменная принимает два возможных значения 0 и 1 с неизвестной вероятностью p того что она равна 1 В выборке имеется всего три наблюдения первое наблюдение равно 1 второе также 1 а третье равно 0 Выведите оценку максимального правдоподобия для p Следующая информация относится к остальным вопросам этого задания Переменная WORKING определена равной 1 если респондент имеет работу и равной 0 в противном случае Для оценивания зависимости переменной WORKING от уровня образования респондента HGC (продолжительность обучения респондента) был использован метод логит-анализа Исследование было выполнено отдельно для мужчин и женщин (в приведенных ниже результатах расчетов первая таблица соответствует женщинам а вторая ndash мужчинам указание на число проведенных итераций не приводится) logit working hgc if male=0 Logit Estimates Number of obs = 2726

chi2(l) = 7042 Prob gt chi2 = 00000

Log Likelihood = ndash15865519 Pseudo R2 = 00217 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 1511872 0186177 8121 0000 1146971 1876773 cons 1 ndash1049543 2448064 ndash4287 0000 ndash1529355 ndash5697314 logit working hgc if male=1 Logit Estimates Number of obs = 2573

chi2(l) = 7503 Prob gt chi2 = 00000

Log Likelihood = ndash80265424 Pseudo R2 = 00446 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 2499295 0306482 8155 0000 1898601 3099989 cons 1 ndash9670268 ndash3775658 ndash2561 0010 ndash1707042 ndash2270113 95 процентов респондентов имеют значение HGC в диапазоне 9-18 лет со средним значением HGC равным 133 и 132 лет для женщин и мужчин соответственно Исходя из логит-анализа предельный эффект HGC на вероятность наличия работы в среднем оценивается как 0030 и 0020 для женщин и мужчин соответственно Оценка регрессии метода наименьших квадратов WORKING по HGC дает коэффициент наклона 0029 и 0020 для женщин и мужчин соответственно Логистическая функция F(z) и ее производная f(z) даются выражениями

izezF minus+

=1

1)( и 2)1()( z

z

eezf minus

minus

+=

где z является линейной функцией характеристик респондента На графиках (см следующую страницу) представлены вероятность наличия работы и предельное влияние HGC на вероятность наличия работы для мужчин и женщин

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 3: Эконометрика

I Организационно-методический раздел Введение в эконометрику - односеместровый курс для студентов 3-го года обучения МИЭФ Это - вводный курс эконометрики для студентов специализирующихся в области экономики Его пререквизиты - вводный курс математической и прикладной статистики а также курсы экономической теории и информатики Курс преподается на русском и английском языках поскольку часть студентов сдает внешний экзамен Лондонского университета Elements of Econometrics and Economic Statistics на английском языке Акцент в курсе делается на содержательном смысле фактов методов и подходов эконометрического анализа Выводы и доказательства даются для ряда базовых формул и моделей что позволяет студентам понять принципы построения эконометрической теории Главный акцент делается на экономической интерпретации и приложениях рассматриваемых эконометрических моделей Цель и задачи курса

Студенты должны получить базовые знания и навыки эконометрического анализа Они должны уметь применять их в исследовании экономических процессов а также понимать эконометрические методы идеи результаты и выводы встречаемые в большинстве экономических книг и статей В данном курсе студенты должны освоить традиционные эконометрические методы предназначенные в основном для работы с данными перекрестных выборок В то же время студенты должны понимать содержательные различия данных перекрестных выборок и временных рядов и те специфические эконометрические проблемы которые возникают при работе с данными этих типов Студенты должны приобрести навыки построения и развития моделей парной и множественной линейной регрессии познакомиться с некоторыми видами нелинейных моделей и специальными методами эконометрического анализа и оценивания понимая область и границы их применения в экономике Рассматриваемые методы и модели должны быть освоены на практике с использованием реальных массивов экономических данных и современного эконометрического программного обеспечения Методическая новизна курса (новые методики формы работы авторские приемы в преподавании курса) В курсе используются следующие методы и формы работы - Лекции (2 часа неделя) - Практические занятия в компьютерном классе (2 часа в неделю выполняются задания на компьютерах и обсуждаются основные вопросы домашних заданий) - консультации преподавателя - самостоятельная работа в компьютерном классе в том числе в Интернет (выполнение

домашних заданий с использованием программ Excel и Econometric Views работа с массивами экономических данных пособиями для студентов в Интернет просмотр комплектов слайдов по эконометрике)

- самостоятельная работа с литературой По курсу имеется большое количество различных методических материалов и пособий как авторских так и подготовленных зарубежными специалистами (прежде всего - КрДоугерти в ЛШЭ) Все методические материалы КрДоугерти доступны через Интернет (И-1 И-2) в том числе - пособия для студентов руководства для преподавателей базы данных и их описания и тд Кроме того в нашем курсе используется авторское пособие (ОЗ) и его перевод на английский язык задания для работы в классе и домашние задания и комментарии к ним Особенностью по сравнению с другими курсами является еженедельное проведение практических занятий в компьютерном классе с заранее раздаваемыми заданиями и выполнением на основе этого

еженедельных письменных домашних заданий с проведением расчетов на компьютере которые затем проверяются и разбираются преподавателем Экзаменационные задания включают вопросы двух типов это тесты множественного выбора и открытые вопросы Задания первого типа позволяют проверить знание студентом широкого круга вопросов в рамках курса задания второго типа - проверить умение проводить эконометрический анализ и строить логику исследования Новизна курса (научная содержательная сравнительный анализ с подобными курсами в России и за рубежом)

Данный курс является вводным курсом эконометрики поэтому с точки зрения его теоретического содержания он достаточно стандартен и близок например к курсу КрДоугерти в ЛШЭ В то же время особенностью курса является его интенсивность в других российских и зарубежных университетах изучение подобного курса эконометрики занимает как минимум год Этому способствует тот факт что студенты МИЭФ до курса эконометрики в течение двух лет изучают математичекскую и прикладную статистику В результате их статистическая подготовка а также высокий уровень знаний экономической теории позволяют в рамках данного курса рассматривать прежде всего эконометрические вопросы опираясь на глубокое понимание студентами концептуального аппарата статистики и экономики Кроме того курс ориентирован на содержательные вопросы а не на формальные выводы и доказательства что экономит массу времени по сравнению с курсами эконометрики в ряде российских вузов При этом даются доказательства и выводы лишь для важнейших и типовых формул и утверждений так что самим аппаратом выводов и доказательств в эконометрике студенты в итоге также овладевают Наконец освоение курса требует большого объема самостоятельной работы студентов превосходящей по объему как минимум вдвое их аудиторную работу

Очень важно то что студенты овладевают на практике применением всех методов подходов и моделей изучаемых в курсе выполняя практические задания в классе и дома Наряду с базовыми стандартными темами вводного курса эконометрики в курсе изучаются и такие более продвинутые вопросы как оценивание по методу максимума правдоподобия логит- и пробит-модели и тд В то же время в курсе не затрагиваются некоторые разделы моделирования нестационарных временных рядов широко используемые в современном эконометрическом анализе поскольку они изучаются в следующем за данным курсом курсе Анализ временных рядов II Содержание курса 1 Введение в эконометрику Статистическое исследование взаимосвязей экономических переменных Зависимости в экономике примеры проблемы оценивания и анализа (функции спроса функции заработка модели экономического роста) Направленность курса Базы данных Программное обеспечение Генеральная совокупность и выборка Описательные статистики ковариация дисперсия корреляция Определения свойства правила Истинные значения параметров и их оценки Обзор Глава 1 (CD-1 CD-2) L1 (OZ) 2 Модель парной линейной регрессии (ЛР) Свойства оценок в модели парной ЛР Предпосылки и обозначения модели ЛР Оценивание модели ЛР с помощью Метода наименьших квадратов (МНК) Формулы для оценок коэффициента наклона и свободного члена вывод и интерпретация Условия Гаусса-Маркова и свойства получаемых по МНК оценок Теорема Гаусса-Маркова (формулировка) Стандартные отклонения и стандартные ошибки оценок коэффициентов регрессии

Статистическая значимость оценок коэффициентов парной ЛР проверка гипотез с помощью t-статистик Построение и интерпретация доверительных интервалов Общее качество регрессии коэффициент детерминации R2 F-статистика и F-тест Связь R2 с коэффициентами корреляции Модель парной ЛР без свободного члена Глава 2 (21-27) Глава 3 (31-311) (CD-1 CD-2) L2 (OZ) 3 Преобразования переменных в регрессионном анализе Линеаризация нелинейных зависимостей и их оценивание с помощью МНК Спецификация случайного члена Интерпретация линейных логарифмических и линейно-логарифмических зависимостей Оценивание функций с постоянной эластичностью и экспоненциальных временных трендов Сравнение качества регрессионных зависимостей линейные и линейно-логарифмические функции Метод Зарембки Метод Бокса-Кокса Глава 4 (CD-1) Глава 5 (CD-2) L4 (ОЗ) 4 Модель множественной линейной регрессии (МЛР) две объясняющие переменные и k объясняющих переменных Описание и интерпретация модели с двумя и k объясняющими переменными Примеры функции спроса функции заработка производственные функции Оценивание по МНК модели с двумя объясняющими переменными Свойства коэффициентов модели Мультиколлинеарность Коэффициент детерминации R2 Скорректированный R2 Проверка гипотез с помощью t-статистик и F-статистик МНК-оценки модели с k объясняющими переменными в векторно-матьричной форме Свойства коэффициентов F-тест для групп переменных Оценивание производственных функций в объемной и темповой записи как моделей множественной регрессии Глава 5 (51-56CD-1) Глава 4 (41-45 CD-2) L24 (ОЗ) Глава 3 (МКП) 5 Спецификация модели линейной регрессии Последствия неправильной спецификации Невключение значимой объясняющей переменной Включение лишней объясняющей переменной Метод Монте-Карло в эконометрическом анализе общие принципы возможности применения и примеры Замещающие переменные Проверка выполнения линейных ограничений на параметры МЛР F-тест и t-тесты Роль и примеры линейных ограничений в исследовании экономических моделей Переменные с запаздыванием Глава 6 (61-67 CD-1) Глава 7 (71-76 CD-2) 6 Гетероскедастичность Понятие последствия обнаружение гетероскедастичности Тесты Голдфелда-Квандта Спирмена Глейзера Корректировка модели Взвешенный метод наименьших квадратов Глава 7 (71-73 7576 CD-1) Глава 8 (81-83 CD-2) 7 Автокоррелированность случайного члена Проявления и последствия автокоррелированности случайного члена в модели линейной регрессии Критерий Дарбина-Уотсона Свойства случайного члена и ошибки спецификации Корректировка модели Авторегрессионное преобразование процедура Кокрана-Оркатта поправка Прайса-Уинстена Модели AR MA и ARMA Глава 7 (75-79 CD-1) Глава 13 (131-136 CD-2) L3 (ОЗ) 8 Фиктивные переменные

Фиктивные (dummy) переменные в моделях линейной регрессии Типы фиктивных переменных Многожественные совокупности фиктивных переменных Тест Чоу Фиктивные переменные в экономических моделях функции заработка производственные функции Глава 9 (91-95 CD-1) Глава 6 (61-64 CD-2) 9 Стохастические объясняющие переменные Свойства получаемых оценок и тестовых статистик при стохастических объясняющих переменных Ошибки измерения Смещение оценок при ошибках измерения Критика Милтоном Фридменом оценивания функции потребления Инструментальные переменные Использование инструментальных переменных в модели потребления МФридмана и других экономических моделях Глава 8 (81-84 CD-1) Глава 9 (91-94 CD-2) 10 Системы одновременных уравнений Понятие системы одновременных уравнений Смещение и несостоятельность оценок при непосредственном оценивании Структурная и приведенная формы модели Модель спроса и предложения и простейшая кейнсианская модель равновесия как системы одновременных уравнений Методы оценивания Косвенный метод наименьших квадратов (КМНК) Инструментальные переменные Двухшаговый метод наименьших квадратов (ДМНК) Связь КМНК инструментальных переменных и ДМНК Модель ISLM пример оценивания модели одновременных уравнений Глава 11 (111-118 CD-1) Глава 10 (101-113 CD-2) L6 (ОЗ) 11 Моделирование с использованием данных временных рядов Модели динамических процессов Прогнозирование Распределенные лаги геометрический лаг полиномиальный лаг Преобразование Койка и непосредственное нелинейное оценивание параметров геометрического лага Частичная корректировка Адаптивные ожидания Модель постоянного дохода МФридмена Проблемы оценивания и анализа Построение прогнозов и пост-прогнозов Доверительные интервалы Метод Салкевера Тесты на устойчивость Показатели качества прогнозов Глава 10 (101-109 CD-1) Глава 12 (121-126 CD-2) L5 (ОЗ) 12 Модели двоичного выбора модели с ограничениями для зависимой переменной и оценивание по методу максимума правдоподобия Линейная вероятностная модель проблемы оценивания Логит-модель Пробит-модель Оценивание по методу максимума правдоподобия общие принципы и направления применения Использование для парной линейной регрессии логит-оценивания пробит-оценивания Характеристики качества оценивания (псевдо-R2 отношение правдоподобия) Цензурированные выборки Непосредственное и усеченное оценивание Тобит-модель Смещение при построении выборки Глава 11 (CD-2 И-2) III Распределение часов курса по темам и видам работ

пп

Наименование тем и разделов

ВСЕГО (часов)

Аудиторные занятия (час)

Самостоятельная

в том числе Лекции Практические

занятия

работа

1 Введение в эконометрику 12 2 2 8 2 Модель парной линейной регрессии (ЛР)

Свойства оценок в модели парной ЛР 24 4 4 16

3 Преобразования переменных в регрессионном анализе

12 2 2 8

4 Модель множественной линейной регрессии (МЛР) две объясняющие переменные и k объясняющих переменных

24 4 4 16

5 Спецификация модели линейной регрессии 24 4 4 16 6 Гетероскедастичность 12 2 2 8 7 Автокоррелированность случайного члена 12 2 2 8 8 Фиктивные переменные 12 2 2 8 9 Стохастические объясняющие переменные 12 2 2 8 10 Системы одновременных уравнений 24 4 4 16 11 Моделирование с использованием данных

временных рядов Модели динамических процессов Прогнозирование

24 4 4 16

12 Модели двоичного выбора модели с ограничениями для зависимой переменной и оценивание по методу максимума правдоподобия

24 4 4 16

ИТОГО 216 36 36 144 IV Формы промежуточного и итогового контроля Студенты сдают промежуточный письменный экзамен а также итоговый письменный экзамен в конце семестра Каждый экзамен включает вопросы множественного выбора и открытые вопросы (примеры экзаменационных работ прилагаются) Итоговый экзамен дает 50 конечной оценки промежуточный экзамен - 30 конечной оценки соответственно 20 дается за выполнение домашних заданий и работу на занятиях V Учебно-методическое обеспечение курса Основная литература 1 Dougherty Christopher Introduction to Econometrics Oxford University Press 1992 (1st

edition CD-1) 2002 (2nd edition CD-2) Доугерти Кр Введение в эконометрику Изд1 М ИНФРА-М 1997 1999 Изд2 М ИНФРА-М 2003 (готовится к выходу)

2 Dougherty Christopher Elements of econometrics and economic statistics Study Guide University of London 2002

3 Замков ОО Эконометрические методы в макроэкономическом анализе М ГУ-ВШЭ 2001 (на русском языке) Диалог-МГУ 1999 (на русском и английском языках) (ОЗ)

Дополнительная литература 1 Магнус ЯР Катышев ПК Пересецкий АА Эконометрика Начальный курс Изд 1-4

М Дело 1997-2000 (МКП) 2 Econometric Views 40 Users Guide Quantitative Micro Software LLC 3 Greene WH Econometric Analysis Prentice Hall int 1993 4 Kennedy P A Guide to Econometrics MIT Press 1992

Интернет-ресурсы 1 httpeconlseacukie (И-1) 2 httpwwwoupcomukbesttextbookseconomicsdougherty2e (И-2) 3 httpwwwworthpublisherscommankiw (И-3) 4 httpwwwrecepru (И-4) Компьютерные программы и массивы данных Основной компьютерной программой используемой в курсе является программа Econometric Views (версии 31 и последующие) Используются также электронные таблицы Excel Для выполнения заданий в классе и домашних заданий используются массивы данных данные курса КрДоугерти в ЛШЭ (данные для оценивания функций заработка по опросу NSLY в США данные о спросе располагаемом доходе и относительных ценах по товарным группам в США за 1959-1994гг - данные имеются на сайте И-1) Данные о погодовой динамике основных макроэкономических показателей в США за 1931-1998гг данные имеются на сайте И-3 Данные о помесячной динамике основных макроэкономических показателей России за 1992-2002гг данные имеются на сайте И-4 Данные об оценках ВНП затрат труда и капитала в экономике СССР за 1928-1987гг Данные о динамике инвестиций и вводе основных производственных фондов в Российской Федерации в 1956-1991гг

Приложение 1 Примеры промежуточных и итоговых экзаменационных работ

Промежуточный экзамен Часть 1 Тесты множественного выбора 30 минут В каждом вопросе обведите цифру номера правильного ответа 1 Если объясняющая переменная x в модели парной линейной регрессии принимает

среднее в выборке значение x =Σxin то 1) наблюдаемая величина зависимой переменной y равна y =Σyin 2) рассчитанная по уравнению регрессии величина зависимой переменной y равна y =Σyin 3) рассчитанная по уравнению регрессии величина зависимой переменной y равна y =Σyin

в среднем но не в каждом конкретном случае 4) равенство y =a+b x свидетельствует об отсутствии корреляции между отклонениями 5) равенство y =a+b x свидетельствует о выполнении условий Гаусса-Маркова 2 В модели парной линейной регрессии при использовании метода наименьших

квадратов верны следующие из перечисленных утверждений I Квадрат коэффициента корреляции между фактическими и теоретическими

значениями зависимой переменной в выборке равен R2 II Квадрат коэффициента корреляции между зависимой переменной и

объясняющей переменной в выборке равен R2 III Доля остаточной (необъясненной) дисперсии зависимой переменной равна R2 1) Только I 2) Только II 3) Только I и III 4) Только I и II 5) I II и III

3 Уравнение Y=α+βk+(1-β)l+u где Y - темп прироста выпуска k - темп прироста затрат капитала и l - темп прироста затрат труда может быть оценено как модель линейной регрессии

1) непосредственно с помощью обычного МНК как зависимость Y от k и l со свободным членом

2) непосредственно с помощью обычного МНК как зависимость Y от k и l без свободного члена

3) как линейную зависимость (Y-k) от (l-k) со свободным членом 4) как линейную зависимость (Y-k) от (l-k) без свободного члена 5) невозможно оценить данную зависимость с помощью обычного МНК

требуется нелинейный МНК 4 В модели множественной линейной регрессии с двумя объясняющими переменными Y=α+β1x1+β2x2+u оценка коэффициента β1 по методу наименьших квадратов для заданной выборки не зависит от 1) наблюденных значений переменной x1 2) наблюденных значений переменной x2 3) наблюденных значений переменной Y 4) значения постоянного члена α

5) ковариации между x1 и Y 5 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 (b) y зависит только от x1 и (c) y зависит только от x2 При оценивании регрессий для каждой из этих моделей величины R2 получились равными R2

a R2b и R2

c соответственно Какое из следующих утверждений верно 1) R2

a = R2b + R2

c 2) R2

a gt R2b + R2

c 3) R2

a = R2b - R2

c 4) R2

a lt R2b + R2

c 5) R2

a может быть больше а может быть меньше чем R2b + R2

c 6 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 без свободного члена (b) y зависит только от x1 со свободным членом и (c) y зависит только от x2 со свободным членом При оценивании регрессий для каждой из этих моделей величины RSS получились равными RSSa RSSb и RSSc соответственно Какое из следующих утверждений верно 1) RSSa gt maxRSSb RSSc 2) RSSa gt RSSb + RSSc 3) RSSa lt minRSSb RSSc 4) RSSa lt RSSb + RSSc 5) RSSa может быть больше а может быть меньше чем RSSb + RSSc

7 В модели множественной линейной регрессии высокая корреляция между двумя объясняющими переменными приводит к

1) смещенности оценок коэффициентов полученных по методу наименьших квадратов

2) несостоятельности оценок коэффициентов полученных по методу наименьших квадратов

3) неэффективности оценок коэффициентов полученных по методу наименьших квадратов

4) значительной дисперсии оценок коэффициентов полученных по методу наименьших квадратов

5) равенству нулю оценок коэффициентов полученных по методу наименьших квадратов

8 Переменная y определяется величинами x1 и x2 и случайным членом u по следующей формуле y = α + β1x1 + β2x2 + u По данным выборки оценено следующее уравнение регрессии 11ˆ xbay += Переменные x1 и x2 положительно коррелированы Величины β1 и β2 положительны

Тогда 1) b1 всегда меньше чем β1 2) b1 всегда больше чем β1 3) оценка b1 смещена в сторону завышения 4) оценка b1 смещена в сторону занижения 5) b1 является несмещенной оценкой β1

9 Введение линейного ограничения на параметры в регрессионную модель 1) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение значимо 2) приводит к значительному сокращению суммы квадратов отклонений если

ограничение значимо 3) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение незначимо 4) приводит к значительному сокращению суммы квадратов отклонений если

ограничение незначимо 5) все перечисленное неверно

10 Тест Голдфелда-Квандта в модели y = α + βx + u используется для 1) обнаружения гетероскедастичности любого вида 2) обнаружения гетероскедастичности вида σui=γ xi 3) обнаружения гетероскедастичности вида σui= δ + γ xi

μ 4) проверки на некоррелированность значений случайного члена между собой 5) проверки на некоррелированность значений случайного члена и объясняющей

переменной

11 Оценена линейная регрессионная зависимость величины заработка респондента y от совокупности факторов (x1x2hellipxn) Исследователь предполагает что величина заработка зависит также от места проживания респондента которое может принадлежать к одному из трех типов крупный город малый город сельская местность Для того чтобы учесть это в модели нужно 1) ввести фиктивную переменную которая может принимать три разных значения 2) ввести фиктивную переменную которая может принимать два разных значения 3) ввести две фиктивные переменные каждая из которых может принимать два

разных значения 4) ввести три фиктивные переменные каждая из которых может принимать два

разных значения 5) ввести две фиктивные переменные каждая из которых может принимать три

разных значения 12 Оценена регрессионная зависимость величины спроса потребителей на VideoCD (VCD) от их дохода (Y) и от уровня цен на VideoCD (Pvcd) в виде log(VCD) = α + β1log(Y) + β2log(Pvcd) + u В выборку включены только те потребители у которых имеется персональный компьютер Далее исследователь предполагает что эластичности спроса на VideoCD по доходу и по цене зависят от наличия у потребителей DVD-проигрывателя Для того чтобы учесть это в модели нужно

1) ввести фиктивную переменную для свободного члена 2) ввести две фиктивные переменные для свободного члена 3) ввести одну общую фиктивную переменную для коэффициентов наклона 4) ввести две фиктивные переменные для коэффициентов наклона 5) ввести две фиктивные переменные по одной для свободного члена и для

коэффициентов наклона

Часть 2 (1 час 30 минут) Ответьте письменно на любые два из следующих трех вопросов 1 Исследователь интересуется факторами определяющими динамику потребления мяса (B) в США в 1960 ndash 1987 годах (фунты в год на душу населения) В качестве факторов он

рассматривает цену P (центы за фунт) и личный располагаемый доход (тысячи долларов в год в расчете на душу населения) Y 11 Вначале он строит модель парной регрессии потребления мяса от личного располагаемого дохода

)111()79(260483377ˆ 2 =sdot+= RYB (1)

В скобках приведены стандартные ошибки Оцените качество модели приведя обоснование своих суждений и выводов на основе t-тестов и F-теста (F-статистику рассчитайте двумя разными способами) Дайте интерпретацию коэффициентов модели 12 Затем он строит парную регрессию по ценам

)1190()874(03011503102ˆ 2 =sdot+= RPB (2)

Дайте интерпретацию коэффициентов модели и выскажите свое суждение о качестве модели 13 Не удовлетворенный полученным результатом исследователь попытался построить модель множественной регрессии одновременно по обоим исследованным факторам

)160()761()0410(6608808911537ˆ 2 =sdotminussdot+= RPYB (3)

Охарактеризуйте значимость отдельных факторов модели и дайте интерпретацию коэффициентов модели В чем причина различия между значениями коэффициентов при величине дохода в моделях (1) и (3) Какое из значений следует считать более правильным и почему 14 Можно ли считать значимым вклад фактора цены в модели (3) по сравнению с моделью (1) Как согласуется Ваш вывод с оценкой значимости модели (2) 15 Скорректированный коэффициент детерминации модели (1) равен 23702 =R тогда как для модели (3) он составляет 6302 =R Поясните смысл скорректированного коэффициента детерминации и прокомментируйте эти числа и различие между ними 16 Наконец исследователь решает использовать логарифмы для всех переменных в уравнении множественной регрессии

)060()1480()410(710)ˆ(340)ˆ(071593)(ˆ 2 =sdotminussdot+= RPLOGYLOGBGLO (4)

Как изменится интерпретация коэффициентов модели (4) по сравнению с моделью (3) Каким видом товара является мясо в соответствии с этой моделью (предмет первой необходимости предмет роскоши нормальное благо худшее благо товар Гиффена и тп) 2 Фирма управляет двумя предприятиями величина месячной прибыли (в сотнях тысяч рублей) которых за год описывается переменными P1 P2 Общая прибыль фирмы P складывается из прибыли обоих предприятий за вычетом некоторых дополнительных постоянных издержек и возможно отчислений из прибыли каждого из предприятий Имеется 13 помесячных наблюдений за полный год и январь следующего года

21 Регрессионная модель зависимости общей прибыли от прибыли предприятий выглядит следующим образом

)590()690)(712(470280109145 2 =sdot+sdot+minus= RPPP

(1)

Дайте содержательную интерпретацию модели Охарактеризуйте значимость каждого из факторов на основе t-статистик и значимость модели в целом на основе F-критерия Там где нужно выполните односторонний тест и объясните причину его использования 22 Как можно объяснить на содержательном уровне очевидное противоречие между значимостью отдельных факторов и значимостью модели в целом (подробно опишите в чем заключается это противоречие) 23 Что выражает различие значений двух коэффициентов при независимых переменных Является ли их соотношение мерой различия вкладов обоих предприятий А мерой различия предельных вкладов предприятий Можно ли принять гипотезу что каждый из факторов входит в уравнение с коэффициентом равным единице 24 Ковариационная матрица для переменных модели выглядит следующим образом

P P1 P2 P 4584986 9997390 9699030 P1 9997390 5753368 2481317 P2 9699030 2481317 7788488

Определите коэффициенты корреляции между переменными модели взятыми попарно Какие дополнительные выводы можно сделать из этих данных 25 Далее была оценена парная регрессия

())112(3801733 2 =sdot+minus= RPP

(2)

Воспользовавшись имеющимися данными рассчитайте коэффициент наклона и стандартную ошибку в модели (2) Рассматривая модель (1) как правильную объясните смещение коэффициента наклона в модели (2) пользуясь ковариационной матрицей 26 Если сгенерировать новую переменную P0=P1+P2 то можно получить следующую регрессионную зависимость

)340()72(450006126 2 =sdot+minus= RPP

(3)

Сравните модель (3) с моделью (1) Сформулируйте введенное линейное ограничение и проверьте его значимость Что можно сказать о наличии общих постоянных издержек а также отчислений от прибыли каждого из предприятий до перечисления в общий фонд 3 Рассматривается зависимость совокупных расходов на косметику в США от совокупного личного располагаемого дохода за 1959-1983 гг С этой целью строится ряд линейных регрессий

31 Уравнение зависимости уровня расходов на косметику от логарифма личного располагаемого дохода получилось следующим

)290()951(950)log(160234 2 =sdot+minus= RDPICOSM

(1)

Дайте интерпретацию модели и ее коэффициентов Запишите уравнение не используя логарифмы 32 Если наоборот взять логарифм только от величины расходов то уравнение принимает вид

)000130()100(83000140770)log( 2 =sdot+= RDPICOSM

(2)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 33 Модель в двойных логарифмах принимает вид

)070()480(900)log(061205)log( 2 =sdot+minus= RDPICOSM

(3)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 34 Если выполнить преобразование Зарембки сформировав новую переменную COSMZ взамен COSM то получим следующее линейное уравнение

)000090()0010(8900010050 2 =sdot+= RDPICOSMZ

(4)

В чем состоит преобразование Зарембки и для чего оно используется 35 Значение суммы квадратов остатков для модели (4) составило 00877 тогда как для модели (3) оно равно 021 Сопоставимы ли значения RSS и R2 в этих двух моделях Можно ли утверждать что одна из моделей имеет преимущество перед другой Приведите статистическое обоснование своего вывода Можно ли выбрать наилучшую из моделей (1)-(4) 36 Известно что альтернативным методом к методу Зарембки является процедура Бокса-Кокса Опишите ее смысл и последовательность действий для рассматриваемого примера

Заключительный экзамен Часть 1 (30 минут) В каждом из 12 вопросов обведите кружком ровно один ответ который вы считаете правильным 1 Укажите среди названных здесь статистических тестов те тесты которые могут

выполняться только для больших выборок I Тест Чоу на неудачу предсказания II Тест Спирмена на ранговую корреляцию III Тест χ2 для LR-статистики при оценивании по методу максимума

правдоподобия IV Тест Дарбина для уравнения с лаговой объясняющей переменной V Тест Голдфелда-Квандта

1) Только II III IV 2) Только II IV 3) Только I III 4) Только IV V 5) Только I II IV

2 Гипотеза о том что случайный член не подвержен автокорреляции первого порядка отвергается в пользу односторонней альтернативной гипотезы о его отрицательной автокоррелированности если 1) статистика Дарбина-Уотсона d близка к 2 2) статистика Дарбина-Уотсона d близка к 1 3) статистика Дарбина-Уотсона d близка к 0 или 4 4) статистика Дарбина-Уотсона d близка к 4 но не к 0 5) статистика Дарбина-Уотсона d близка к 0 но не к 4 3 Переменная yt зависит от переменной xt yt=α+βxt+ut Оценивается зависимость yt от переменной zt yt=a+bzt+et где zt=xt+vt (vt ndash ошибка измерения являющаяся случайной величиной с нулевым математическим ожиданием и постоянной дисперсией) Если истинное значение β равно 04 а теоретическая дисперсия xt в три раза больше теоретической дисперсии vt то предел по вероятности оценки b равен 1) 01 2) 02 3) 0267 4) 03 5) 0333 4 После преобразования Койка модель геометрически распределенного лага yt = α + βxt + βδxt-1 + βδ2xt-2 + βδ3xt-3 ++ ut приобретает вид

1) yt - δyt-1 = α (1-δ) + βxt + ut - δut-1 2) yt = α (1-δ) + βxt + ut - δut-1 3) yt = α + βxt + ut - δut-1 4) yt - δyt-1 = α + βxt-1 + ut-1 5) ни один из перечисленных

5 По 39 точкам оценена следующая формула производственной функции в которой отдельно рассмотрены две составляющие затрат основного капитала K1 - здания и сооружения и K2 - машины и оборудование а также две составляющие затрат труда L1 - затраты квалифицированного труда и L2 - затраты неквалифицированного труда Y ndash выпуск ln(Y)=-43 + 035ln(K1) + 026ln(K2) + 063ln(L1) + 058ln(L2) R2 =092 DW=174 (14) (003) (005) (041) (038) (в скобках приведены стандартные ошибки коэффициентов) Какой из выводов и дальнейших шагов представляется Вам верным 1) Нужно исключить фактор L (переменные L1 и L2) тк он оказался незначимым 2) Имеет место мультиколлинеарность поэтому нужно объединить факторы K1 и K2 3) Имеет место мультиколлинеарность поэтому нужно объединить факторы L1 и L2 4) Отклонения ei автокоррелированы нужно изменить формулу зависимости 5) Формула зависимости приемлема по всем приведенным параметрам и изменения не

нужны

6 Эконометрическая модель описана следующими уравнениями (1) y1 = α + βy2 + γx1 + ϕx2 + u1 (2) y2 = δ + τx1 + λx2 + u2 где y1 и y2 ndash эндогенные переменные x1 и x2 ndash экзогенные переменные и u1 и u2 ndash случайные члены удовлетворяющие условиям Гаусса-Маркова Выберите неверное утверждение

1) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут несмещенными

2) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут несмещенными

3) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут состоятельными

4) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут состоятельными

5) косвенный метод наименьших квадратов позволяет получить несмещенные оценки коэффициентов обоих уравнений

7 Дана следующая макроэкономическая модель Y = C + I + G - макроэкономическое тождество C = a + bY - функция потребления I = d ndash emiddotR-1 + fY - функция инвестиций (MP) = gY ndash hR - уравнение денежного рынка где эндогенными переменными являются доход Y потребление C инвестиции I и процентная ставка R Переменные G (государственные расходы) и (MP) (реальная денежная масса) ndash экзогенные Выберите верное утверждение из следующих 1) функция инвестиций неидентифицируема 2) функция потребления неидентифицируема 3) функция потребления однозначно идентифицируема 4) функция инвестиций однозначно идентифицируема 5) функция инвестиций сверхидентифицируема

8 Коэффициент Тейла в виде 2

p+T2

p+T

2p+Tp+T

ym1y

m1

)y - y(m1

=UΣ+Σ

Σ

ˆ

ˆ позволяет сравнить качество

сделанного на период (T+1hellipT+m) прогноза pTy +ˆ с качеством следующего прогноза 1) pTy +ˆ =0 для всех p=1hellipm 2) pTy +ˆ =yT для всех p=1hellipm 3)прогнозом по линейной функции оцененной за период (1hellipT) 4) прогнозом по экспоненте оцененной за период (1hellipT) 5) прогнозом по логарифмической функции оцененной за период (1hellipT)

9 Введение фиктивных переменных DT+p p=1hellipm при прогнозировании (DT+p=1 при t=T+p DT+p=0 при всех других t) позволяет

I Рассчитать ошибки предсказания для t=T+1hellip T+m II Рассчитать стандартные ошибки предсказания для t=T+1hellip T+m

III Выполнить F-тест на стабильность коэффициентов

1) Верно только I 2) Верно только II 3) Верно только I и II 4) Верно только I и III 5) Верно I II и III 10 При оценивании линейной регрессии по методу максимума правдоподобия оценки коэффициентов совпадают с полученными по МНК при следующих условиях 1) всегда 2) если случайный член нормально распределен и выполнены условия Гаусса-Маркова 3) если случайный член нормально распределен независимо от выполнения условий

Гаусса-Маркова 4) если случайный член не автокоррелирован при любом его распределении 5) вообще говоря эти оценки не совпадают независимо от выполнения условий Гаусса-

Маркова и распределения случайного члена 11 Логит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-1196+0169ASVABC Вероятность получения академической степени (Degree=1) при ASVABC=60 равна

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) 1690))6016909611exp(1(

)6016909611exp(2 sdotsdot+minus+

sdotminus

3) (1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus)0169

4) 2))6016909611exp(1()6016909611exp(

sdot+minus+sdotminus

5) ))6016909611(21exp(

21 2sdotminusminusπ

12 Пробит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-5787+00782ASVABC Увеличение вероятности p(Degreei=1) при увеличении ASVABC на один пункт при ASVABC=60 равно здесь

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) ))60078207875(21exp(

21 2sdotminusminusπ

3) 07820))60078207875(21exp(

21 2 sdotsdotminusminusπ

4) F(-5787+0078260) где F ndash функция стандартного нормального распределения 5) F(-5787+0078260)00782 где F ndash функция стандартного нормального

распределения Часть 2 (1 час 30 минут) Ответьте письменно на два из трех следующих вопросов

1 Исследователь располагает данными о продолжительности обучения респондента HGC результатах теста на познавательные способности ASVABC и о продолжительности обучения матери респондента HGCM для выборки 570 индивидов Он предполагает что продолжительность обучения респондента зависит как от результатов теста на познавательные способности так и от продолжительности обучения матери респондента

uHGCMASVABCHGC +++= 21 ββα (11) и что познавательные способности в свою очередь являются функцией успехов в учебе

vHGCASVBC ++= 1δγ (12) 1a [2 балла] Объясните разницу между структурными уравнениями и уравнениями в приведенной форме в модели одновременных уравнений 1b [2 балла] Выведите приведенную форму уравнения для HGC 1c [6 баллов] Выведите выражение для смещения (для больших выборок) оценки 1δ предполагая что уравнение (12) было оценено обычным методом наименьших квадратов и определите вероятное направление смещения 1d [3 балла] Объясните почему HGCM может быть использована в качестве инструмента для HGC во втором уравнении 1e [6 баллов] Продемонстрируйте что оценка метода инструментальных переменных для

1δ использующая в качестве инструмента HGCM является состоятельной предполагая что модель корректно определена 1f [6 баллов] Предположим теперь что корректной спецификацией второго уравнения является

vHGCMHGCASVBC ++++= 21 δδγ (13) Продемонстрируйте что оценка метода инструментальных переменных для 1δ будет несостоятельной выведите смещение для случая большой выборки и установите его направление (Указание учтите что приведенная форма уравнения для HGC в этом случае изменится)

2а [8 баллов] Случайная переменная принимает два возможных значения 0 и 1 с неизвестной вероятностью p того что она равна 1 В выборке имеется всего три наблюдения первое наблюдение равно 1 второе также 1 а третье равно 0 Выведите оценку максимального правдоподобия для p Следующая информация относится к остальным вопросам этого задания Переменная WORKING определена равной 1 если респондент имеет работу и равной 0 в противном случае Для оценивания зависимости переменной WORKING от уровня образования респондента HGC (продолжительность обучения респондента) был использован метод логит-анализа Исследование было выполнено отдельно для мужчин и женщин (в приведенных ниже результатах расчетов первая таблица соответствует женщинам а вторая ndash мужчинам указание на число проведенных итераций не приводится) logit working hgc if male=0 Logit Estimates Number of obs = 2726

chi2(l) = 7042 Prob gt chi2 = 00000

Log Likelihood = ndash15865519 Pseudo R2 = 00217 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 1511872 0186177 8121 0000 1146971 1876773 cons 1 ndash1049543 2448064 ndash4287 0000 ndash1529355 ndash5697314 logit working hgc if male=1 Logit Estimates Number of obs = 2573

chi2(l) = 7503 Prob gt chi2 = 00000

Log Likelihood = ndash80265424 Pseudo R2 = 00446 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 2499295 0306482 8155 0000 1898601 3099989 cons 1 ndash9670268 ndash3775658 ndash2561 0010 ndash1707042 ndash2270113 95 процентов респондентов имеют значение HGC в диапазоне 9-18 лет со средним значением HGC равным 133 и 132 лет для женщин и мужчин соответственно Исходя из логит-анализа предельный эффект HGC на вероятность наличия работы в среднем оценивается как 0030 и 0020 для женщин и мужчин соответственно Оценка регрессии метода наименьших квадратов WORKING по HGC дает коэффициент наклона 0029 и 0020 для женщин и мужчин соответственно Логистическая функция F(z) и ее производная f(z) даются выражениями

izezF minus+

=1

1)( и 2)1()( z

z

eezf minus

minus

+=

где z является линейной функцией характеристик респондента На графиках (см следующую страницу) представлены вероятность наличия работы и предельное влияние HGC на вероятность наличия работы для мужчин и женщин

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 4: Эконометрика

еженедельных письменных домашних заданий с проведением расчетов на компьютере которые затем проверяются и разбираются преподавателем Экзаменационные задания включают вопросы двух типов это тесты множественного выбора и открытые вопросы Задания первого типа позволяют проверить знание студентом широкого круга вопросов в рамках курса задания второго типа - проверить умение проводить эконометрический анализ и строить логику исследования Новизна курса (научная содержательная сравнительный анализ с подобными курсами в России и за рубежом)

Данный курс является вводным курсом эконометрики поэтому с точки зрения его теоретического содержания он достаточно стандартен и близок например к курсу КрДоугерти в ЛШЭ В то же время особенностью курса является его интенсивность в других российских и зарубежных университетах изучение подобного курса эконометрики занимает как минимум год Этому способствует тот факт что студенты МИЭФ до курса эконометрики в течение двух лет изучают математичекскую и прикладную статистику В результате их статистическая подготовка а также высокий уровень знаний экономической теории позволяют в рамках данного курса рассматривать прежде всего эконометрические вопросы опираясь на глубокое понимание студентами концептуального аппарата статистики и экономики Кроме того курс ориентирован на содержательные вопросы а не на формальные выводы и доказательства что экономит массу времени по сравнению с курсами эконометрики в ряде российских вузов При этом даются доказательства и выводы лишь для важнейших и типовых формул и утверждений так что самим аппаратом выводов и доказательств в эконометрике студенты в итоге также овладевают Наконец освоение курса требует большого объема самостоятельной работы студентов превосходящей по объему как минимум вдвое их аудиторную работу

Очень важно то что студенты овладевают на практике применением всех методов подходов и моделей изучаемых в курсе выполняя практические задания в классе и дома Наряду с базовыми стандартными темами вводного курса эконометрики в курсе изучаются и такие более продвинутые вопросы как оценивание по методу максимума правдоподобия логит- и пробит-модели и тд В то же время в курсе не затрагиваются некоторые разделы моделирования нестационарных временных рядов широко используемые в современном эконометрическом анализе поскольку они изучаются в следующем за данным курсом курсе Анализ временных рядов II Содержание курса 1 Введение в эконометрику Статистическое исследование взаимосвязей экономических переменных Зависимости в экономике примеры проблемы оценивания и анализа (функции спроса функции заработка модели экономического роста) Направленность курса Базы данных Программное обеспечение Генеральная совокупность и выборка Описательные статистики ковариация дисперсия корреляция Определения свойства правила Истинные значения параметров и их оценки Обзор Глава 1 (CD-1 CD-2) L1 (OZ) 2 Модель парной линейной регрессии (ЛР) Свойства оценок в модели парной ЛР Предпосылки и обозначения модели ЛР Оценивание модели ЛР с помощью Метода наименьших квадратов (МНК) Формулы для оценок коэффициента наклона и свободного члена вывод и интерпретация Условия Гаусса-Маркова и свойства получаемых по МНК оценок Теорема Гаусса-Маркова (формулировка) Стандартные отклонения и стандартные ошибки оценок коэффициентов регрессии

Статистическая значимость оценок коэффициентов парной ЛР проверка гипотез с помощью t-статистик Построение и интерпретация доверительных интервалов Общее качество регрессии коэффициент детерминации R2 F-статистика и F-тест Связь R2 с коэффициентами корреляции Модель парной ЛР без свободного члена Глава 2 (21-27) Глава 3 (31-311) (CD-1 CD-2) L2 (OZ) 3 Преобразования переменных в регрессионном анализе Линеаризация нелинейных зависимостей и их оценивание с помощью МНК Спецификация случайного члена Интерпретация линейных логарифмических и линейно-логарифмических зависимостей Оценивание функций с постоянной эластичностью и экспоненциальных временных трендов Сравнение качества регрессионных зависимостей линейные и линейно-логарифмические функции Метод Зарембки Метод Бокса-Кокса Глава 4 (CD-1) Глава 5 (CD-2) L4 (ОЗ) 4 Модель множественной линейной регрессии (МЛР) две объясняющие переменные и k объясняющих переменных Описание и интерпретация модели с двумя и k объясняющими переменными Примеры функции спроса функции заработка производственные функции Оценивание по МНК модели с двумя объясняющими переменными Свойства коэффициентов модели Мультиколлинеарность Коэффициент детерминации R2 Скорректированный R2 Проверка гипотез с помощью t-статистик и F-статистик МНК-оценки модели с k объясняющими переменными в векторно-матьричной форме Свойства коэффициентов F-тест для групп переменных Оценивание производственных функций в объемной и темповой записи как моделей множественной регрессии Глава 5 (51-56CD-1) Глава 4 (41-45 CD-2) L24 (ОЗ) Глава 3 (МКП) 5 Спецификация модели линейной регрессии Последствия неправильной спецификации Невключение значимой объясняющей переменной Включение лишней объясняющей переменной Метод Монте-Карло в эконометрическом анализе общие принципы возможности применения и примеры Замещающие переменные Проверка выполнения линейных ограничений на параметры МЛР F-тест и t-тесты Роль и примеры линейных ограничений в исследовании экономических моделей Переменные с запаздыванием Глава 6 (61-67 CD-1) Глава 7 (71-76 CD-2) 6 Гетероскедастичность Понятие последствия обнаружение гетероскедастичности Тесты Голдфелда-Квандта Спирмена Глейзера Корректировка модели Взвешенный метод наименьших квадратов Глава 7 (71-73 7576 CD-1) Глава 8 (81-83 CD-2) 7 Автокоррелированность случайного члена Проявления и последствия автокоррелированности случайного члена в модели линейной регрессии Критерий Дарбина-Уотсона Свойства случайного члена и ошибки спецификации Корректировка модели Авторегрессионное преобразование процедура Кокрана-Оркатта поправка Прайса-Уинстена Модели AR MA и ARMA Глава 7 (75-79 CD-1) Глава 13 (131-136 CD-2) L3 (ОЗ) 8 Фиктивные переменные

Фиктивные (dummy) переменные в моделях линейной регрессии Типы фиктивных переменных Многожественные совокупности фиктивных переменных Тест Чоу Фиктивные переменные в экономических моделях функции заработка производственные функции Глава 9 (91-95 CD-1) Глава 6 (61-64 CD-2) 9 Стохастические объясняющие переменные Свойства получаемых оценок и тестовых статистик при стохастических объясняющих переменных Ошибки измерения Смещение оценок при ошибках измерения Критика Милтоном Фридменом оценивания функции потребления Инструментальные переменные Использование инструментальных переменных в модели потребления МФридмана и других экономических моделях Глава 8 (81-84 CD-1) Глава 9 (91-94 CD-2) 10 Системы одновременных уравнений Понятие системы одновременных уравнений Смещение и несостоятельность оценок при непосредственном оценивании Структурная и приведенная формы модели Модель спроса и предложения и простейшая кейнсианская модель равновесия как системы одновременных уравнений Методы оценивания Косвенный метод наименьших квадратов (КМНК) Инструментальные переменные Двухшаговый метод наименьших квадратов (ДМНК) Связь КМНК инструментальных переменных и ДМНК Модель ISLM пример оценивания модели одновременных уравнений Глава 11 (111-118 CD-1) Глава 10 (101-113 CD-2) L6 (ОЗ) 11 Моделирование с использованием данных временных рядов Модели динамических процессов Прогнозирование Распределенные лаги геометрический лаг полиномиальный лаг Преобразование Койка и непосредственное нелинейное оценивание параметров геометрического лага Частичная корректировка Адаптивные ожидания Модель постоянного дохода МФридмена Проблемы оценивания и анализа Построение прогнозов и пост-прогнозов Доверительные интервалы Метод Салкевера Тесты на устойчивость Показатели качества прогнозов Глава 10 (101-109 CD-1) Глава 12 (121-126 CD-2) L5 (ОЗ) 12 Модели двоичного выбора модели с ограничениями для зависимой переменной и оценивание по методу максимума правдоподобия Линейная вероятностная модель проблемы оценивания Логит-модель Пробит-модель Оценивание по методу максимума правдоподобия общие принципы и направления применения Использование для парной линейной регрессии логит-оценивания пробит-оценивания Характеристики качества оценивания (псевдо-R2 отношение правдоподобия) Цензурированные выборки Непосредственное и усеченное оценивание Тобит-модель Смещение при построении выборки Глава 11 (CD-2 И-2) III Распределение часов курса по темам и видам работ

пп

Наименование тем и разделов

ВСЕГО (часов)

Аудиторные занятия (час)

Самостоятельная

в том числе Лекции Практические

занятия

работа

1 Введение в эконометрику 12 2 2 8 2 Модель парной линейной регрессии (ЛР)

Свойства оценок в модели парной ЛР 24 4 4 16

3 Преобразования переменных в регрессионном анализе

12 2 2 8

4 Модель множественной линейной регрессии (МЛР) две объясняющие переменные и k объясняющих переменных

24 4 4 16

5 Спецификация модели линейной регрессии 24 4 4 16 6 Гетероскедастичность 12 2 2 8 7 Автокоррелированность случайного члена 12 2 2 8 8 Фиктивные переменные 12 2 2 8 9 Стохастические объясняющие переменные 12 2 2 8 10 Системы одновременных уравнений 24 4 4 16 11 Моделирование с использованием данных

временных рядов Модели динамических процессов Прогнозирование

24 4 4 16

12 Модели двоичного выбора модели с ограничениями для зависимой переменной и оценивание по методу максимума правдоподобия

24 4 4 16

ИТОГО 216 36 36 144 IV Формы промежуточного и итогового контроля Студенты сдают промежуточный письменный экзамен а также итоговый письменный экзамен в конце семестра Каждый экзамен включает вопросы множественного выбора и открытые вопросы (примеры экзаменационных работ прилагаются) Итоговый экзамен дает 50 конечной оценки промежуточный экзамен - 30 конечной оценки соответственно 20 дается за выполнение домашних заданий и работу на занятиях V Учебно-методическое обеспечение курса Основная литература 1 Dougherty Christopher Introduction to Econometrics Oxford University Press 1992 (1st

edition CD-1) 2002 (2nd edition CD-2) Доугерти Кр Введение в эконометрику Изд1 М ИНФРА-М 1997 1999 Изд2 М ИНФРА-М 2003 (готовится к выходу)

2 Dougherty Christopher Elements of econometrics and economic statistics Study Guide University of London 2002

3 Замков ОО Эконометрические методы в макроэкономическом анализе М ГУ-ВШЭ 2001 (на русском языке) Диалог-МГУ 1999 (на русском и английском языках) (ОЗ)

Дополнительная литература 1 Магнус ЯР Катышев ПК Пересецкий АА Эконометрика Начальный курс Изд 1-4

М Дело 1997-2000 (МКП) 2 Econometric Views 40 Users Guide Quantitative Micro Software LLC 3 Greene WH Econometric Analysis Prentice Hall int 1993 4 Kennedy P A Guide to Econometrics MIT Press 1992

Интернет-ресурсы 1 httpeconlseacukie (И-1) 2 httpwwwoupcomukbesttextbookseconomicsdougherty2e (И-2) 3 httpwwwworthpublisherscommankiw (И-3) 4 httpwwwrecepru (И-4) Компьютерные программы и массивы данных Основной компьютерной программой используемой в курсе является программа Econometric Views (версии 31 и последующие) Используются также электронные таблицы Excel Для выполнения заданий в классе и домашних заданий используются массивы данных данные курса КрДоугерти в ЛШЭ (данные для оценивания функций заработка по опросу NSLY в США данные о спросе располагаемом доходе и относительных ценах по товарным группам в США за 1959-1994гг - данные имеются на сайте И-1) Данные о погодовой динамике основных макроэкономических показателей в США за 1931-1998гг данные имеются на сайте И-3 Данные о помесячной динамике основных макроэкономических показателей России за 1992-2002гг данные имеются на сайте И-4 Данные об оценках ВНП затрат труда и капитала в экономике СССР за 1928-1987гг Данные о динамике инвестиций и вводе основных производственных фондов в Российской Федерации в 1956-1991гг

Приложение 1 Примеры промежуточных и итоговых экзаменационных работ

Промежуточный экзамен Часть 1 Тесты множественного выбора 30 минут В каждом вопросе обведите цифру номера правильного ответа 1 Если объясняющая переменная x в модели парной линейной регрессии принимает

среднее в выборке значение x =Σxin то 1) наблюдаемая величина зависимой переменной y равна y =Σyin 2) рассчитанная по уравнению регрессии величина зависимой переменной y равна y =Σyin 3) рассчитанная по уравнению регрессии величина зависимой переменной y равна y =Σyin

в среднем но не в каждом конкретном случае 4) равенство y =a+b x свидетельствует об отсутствии корреляции между отклонениями 5) равенство y =a+b x свидетельствует о выполнении условий Гаусса-Маркова 2 В модели парной линейной регрессии при использовании метода наименьших

квадратов верны следующие из перечисленных утверждений I Квадрат коэффициента корреляции между фактическими и теоретическими

значениями зависимой переменной в выборке равен R2 II Квадрат коэффициента корреляции между зависимой переменной и

объясняющей переменной в выборке равен R2 III Доля остаточной (необъясненной) дисперсии зависимой переменной равна R2 1) Только I 2) Только II 3) Только I и III 4) Только I и II 5) I II и III

3 Уравнение Y=α+βk+(1-β)l+u где Y - темп прироста выпуска k - темп прироста затрат капитала и l - темп прироста затрат труда может быть оценено как модель линейной регрессии

1) непосредственно с помощью обычного МНК как зависимость Y от k и l со свободным членом

2) непосредственно с помощью обычного МНК как зависимость Y от k и l без свободного члена

3) как линейную зависимость (Y-k) от (l-k) со свободным членом 4) как линейную зависимость (Y-k) от (l-k) без свободного члена 5) невозможно оценить данную зависимость с помощью обычного МНК

требуется нелинейный МНК 4 В модели множественной линейной регрессии с двумя объясняющими переменными Y=α+β1x1+β2x2+u оценка коэффициента β1 по методу наименьших квадратов для заданной выборки не зависит от 1) наблюденных значений переменной x1 2) наблюденных значений переменной x2 3) наблюденных значений переменной Y 4) значения постоянного члена α

5) ковариации между x1 и Y 5 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 (b) y зависит только от x1 и (c) y зависит только от x2 При оценивании регрессий для каждой из этих моделей величины R2 получились равными R2

a R2b и R2

c соответственно Какое из следующих утверждений верно 1) R2

a = R2b + R2

c 2) R2

a gt R2b + R2

c 3) R2

a = R2b - R2

c 4) R2

a lt R2b + R2

c 5) R2

a может быть больше а может быть меньше чем R2b + R2

c 6 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 без свободного члена (b) y зависит только от x1 со свободным членом и (c) y зависит только от x2 со свободным членом При оценивании регрессий для каждой из этих моделей величины RSS получились равными RSSa RSSb и RSSc соответственно Какое из следующих утверждений верно 1) RSSa gt maxRSSb RSSc 2) RSSa gt RSSb + RSSc 3) RSSa lt minRSSb RSSc 4) RSSa lt RSSb + RSSc 5) RSSa может быть больше а может быть меньше чем RSSb + RSSc

7 В модели множественной линейной регрессии высокая корреляция между двумя объясняющими переменными приводит к

1) смещенности оценок коэффициентов полученных по методу наименьших квадратов

2) несостоятельности оценок коэффициентов полученных по методу наименьших квадратов

3) неэффективности оценок коэффициентов полученных по методу наименьших квадратов

4) значительной дисперсии оценок коэффициентов полученных по методу наименьших квадратов

5) равенству нулю оценок коэффициентов полученных по методу наименьших квадратов

8 Переменная y определяется величинами x1 и x2 и случайным членом u по следующей формуле y = α + β1x1 + β2x2 + u По данным выборки оценено следующее уравнение регрессии 11ˆ xbay += Переменные x1 и x2 положительно коррелированы Величины β1 и β2 положительны

Тогда 1) b1 всегда меньше чем β1 2) b1 всегда больше чем β1 3) оценка b1 смещена в сторону завышения 4) оценка b1 смещена в сторону занижения 5) b1 является несмещенной оценкой β1

9 Введение линейного ограничения на параметры в регрессионную модель 1) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение значимо 2) приводит к значительному сокращению суммы квадратов отклонений если

ограничение значимо 3) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение незначимо 4) приводит к значительному сокращению суммы квадратов отклонений если

ограничение незначимо 5) все перечисленное неверно

10 Тест Голдфелда-Квандта в модели y = α + βx + u используется для 1) обнаружения гетероскедастичности любого вида 2) обнаружения гетероскедастичности вида σui=γ xi 3) обнаружения гетероскедастичности вида σui= δ + γ xi

μ 4) проверки на некоррелированность значений случайного члена между собой 5) проверки на некоррелированность значений случайного члена и объясняющей

переменной

11 Оценена линейная регрессионная зависимость величины заработка респондента y от совокупности факторов (x1x2hellipxn) Исследователь предполагает что величина заработка зависит также от места проживания респондента которое может принадлежать к одному из трех типов крупный город малый город сельская местность Для того чтобы учесть это в модели нужно 1) ввести фиктивную переменную которая может принимать три разных значения 2) ввести фиктивную переменную которая может принимать два разных значения 3) ввести две фиктивные переменные каждая из которых может принимать два

разных значения 4) ввести три фиктивные переменные каждая из которых может принимать два

разных значения 5) ввести две фиктивные переменные каждая из которых может принимать три

разных значения 12 Оценена регрессионная зависимость величины спроса потребителей на VideoCD (VCD) от их дохода (Y) и от уровня цен на VideoCD (Pvcd) в виде log(VCD) = α + β1log(Y) + β2log(Pvcd) + u В выборку включены только те потребители у которых имеется персональный компьютер Далее исследователь предполагает что эластичности спроса на VideoCD по доходу и по цене зависят от наличия у потребителей DVD-проигрывателя Для того чтобы учесть это в модели нужно

1) ввести фиктивную переменную для свободного члена 2) ввести две фиктивные переменные для свободного члена 3) ввести одну общую фиктивную переменную для коэффициентов наклона 4) ввести две фиктивные переменные для коэффициентов наклона 5) ввести две фиктивные переменные по одной для свободного члена и для

коэффициентов наклона

Часть 2 (1 час 30 минут) Ответьте письменно на любые два из следующих трех вопросов 1 Исследователь интересуется факторами определяющими динамику потребления мяса (B) в США в 1960 ndash 1987 годах (фунты в год на душу населения) В качестве факторов он

рассматривает цену P (центы за фунт) и личный располагаемый доход (тысячи долларов в год в расчете на душу населения) Y 11 Вначале он строит модель парной регрессии потребления мяса от личного располагаемого дохода

)111()79(260483377ˆ 2 =sdot+= RYB (1)

В скобках приведены стандартные ошибки Оцените качество модели приведя обоснование своих суждений и выводов на основе t-тестов и F-теста (F-статистику рассчитайте двумя разными способами) Дайте интерпретацию коэффициентов модели 12 Затем он строит парную регрессию по ценам

)1190()874(03011503102ˆ 2 =sdot+= RPB (2)

Дайте интерпретацию коэффициентов модели и выскажите свое суждение о качестве модели 13 Не удовлетворенный полученным результатом исследователь попытался построить модель множественной регрессии одновременно по обоим исследованным факторам

)160()761()0410(6608808911537ˆ 2 =sdotminussdot+= RPYB (3)

Охарактеризуйте значимость отдельных факторов модели и дайте интерпретацию коэффициентов модели В чем причина различия между значениями коэффициентов при величине дохода в моделях (1) и (3) Какое из значений следует считать более правильным и почему 14 Можно ли считать значимым вклад фактора цены в модели (3) по сравнению с моделью (1) Как согласуется Ваш вывод с оценкой значимости модели (2) 15 Скорректированный коэффициент детерминации модели (1) равен 23702 =R тогда как для модели (3) он составляет 6302 =R Поясните смысл скорректированного коэффициента детерминации и прокомментируйте эти числа и различие между ними 16 Наконец исследователь решает использовать логарифмы для всех переменных в уравнении множественной регрессии

)060()1480()410(710)ˆ(340)ˆ(071593)(ˆ 2 =sdotminussdot+= RPLOGYLOGBGLO (4)

Как изменится интерпретация коэффициентов модели (4) по сравнению с моделью (3) Каким видом товара является мясо в соответствии с этой моделью (предмет первой необходимости предмет роскоши нормальное благо худшее благо товар Гиффена и тп) 2 Фирма управляет двумя предприятиями величина месячной прибыли (в сотнях тысяч рублей) которых за год описывается переменными P1 P2 Общая прибыль фирмы P складывается из прибыли обоих предприятий за вычетом некоторых дополнительных постоянных издержек и возможно отчислений из прибыли каждого из предприятий Имеется 13 помесячных наблюдений за полный год и январь следующего года

21 Регрессионная модель зависимости общей прибыли от прибыли предприятий выглядит следующим образом

)590()690)(712(470280109145 2 =sdot+sdot+minus= RPPP

(1)

Дайте содержательную интерпретацию модели Охарактеризуйте значимость каждого из факторов на основе t-статистик и значимость модели в целом на основе F-критерия Там где нужно выполните односторонний тест и объясните причину его использования 22 Как можно объяснить на содержательном уровне очевидное противоречие между значимостью отдельных факторов и значимостью модели в целом (подробно опишите в чем заключается это противоречие) 23 Что выражает различие значений двух коэффициентов при независимых переменных Является ли их соотношение мерой различия вкладов обоих предприятий А мерой различия предельных вкладов предприятий Можно ли принять гипотезу что каждый из факторов входит в уравнение с коэффициентом равным единице 24 Ковариационная матрица для переменных модели выглядит следующим образом

P P1 P2 P 4584986 9997390 9699030 P1 9997390 5753368 2481317 P2 9699030 2481317 7788488

Определите коэффициенты корреляции между переменными модели взятыми попарно Какие дополнительные выводы можно сделать из этих данных 25 Далее была оценена парная регрессия

())112(3801733 2 =sdot+minus= RPP

(2)

Воспользовавшись имеющимися данными рассчитайте коэффициент наклона и стандартную ошибку в модели (2) Рассматривая модель (1) как правильную объясните смещение коэффициента наклона в модели (2) пользуясь ковариационной матрицей 26 Если сгенерировать новую переменную P0=P1+P2 то можно получить следующую регрессионную зависимость

)340()72(450006126 2 =sdot+minus= RPP

(3)

Сравните модель (3) с моделью (1) Сформулируйте введенное линейное ограничение и проверьте его значимость Что можно сказать о наличии общих постоянных издержек а также отчислений от прибыли каждого из предприятий до перечисления в общий фонд 3 Рассматривается зависимость совокупных расходов на косметику в США от совокупного личного располагаемого дохода за 1959-1983 гг С этой целью строится ряд линейных регрессий

31 Уравнение зависимости уровня расходов на косметику от логарифма личного располагаемого дохода получилось следующим

)290()951(950)log(160234 2 =sdot+minus= RDPICOSM

(1)

Дайте интерпретацию модели и ее коэффициентов Запишите уравнение не используя логарифмы 32 Если наоборот взять логарифм только от величины расходов то уравнение принимает вид

)000130()100(83000140770)log( 2 =sdot+= RDPICOSM

(2)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 33 Модель в двойных логарифмах принимает вид

)070()480(900)log(061205)log( 2 =sdot+minus= RDPICOSM

(3)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 34 Если выполнить преобразование Зарембки сформировав новую переменную COSMZ взамен COSM то получим следующее линейное уравнение

)000090()0010(8900010050 2 =sdot+= RDPICOSMZ

(4)

В чем состоит преобразование Зарембки и для чего оно используется 35 Значение суммы квадратов остатков для модели (4) составило 00877 тогда как для модели (3) оно равно 021 Сопоставимы ли значения RSS и R2 в этих двух моделях Можно ли утверждать что одна из моделей имеет преимущество перед другой Приведите статистическое обоснование своего вывода Можно ли выбрать наилучшую из моделей (1)-(4) 36 Известно что альтернативным методом к методу Зарембки является процедура Бокса-Кокса Опишите ее смысл и последовательность действий для рассматриваемого примера

Заключительный экзамен Часть 1 (30 минут) В каждом из 12 вопросов обведите кружком ровно один ответ который вы считаете правильным 1 Укажите среди названных здесь статистических тестов те тесты которые могут

выполняться только для больших выборок I Тест Чоу на неудачу предсказания II Тест Спирмена на ранговую корреляцию III Тест χ2 для LR-статистики при оценивании по методу максимума

правдоподобия IV Тест Дарбина для уравнения с лаговой объясняющей переменной V Тест Голдфелда-Квандта

1) Только II III IV 2) Только II IV 3) Только I III 4) Только IV V 5) Только I II IV

2 Гипотеза о том что случайный член не подвержен автокорреляции первого порядка отвергается в пользу односторонней альтернативной гипотезы о его отрицательной автокоррелированности если 1) статистика Дарбина-Уотсона d близка к 2 2) статистика Дарбина-Уотсона d близка к 1 3) статистика Дарбина-Уотсона d близка к 0 или 4 4) статистика Дарбина-Уотсона d близка к 4 но не к 0 5) статистика Дарбина-Уотсона d близка к 0 но не к 4 3 Переменная yt зависит от переменной xt yt=α+βxt+ut Оценивается зависимость yt от переменной zt yt=a+bzt+et где zt=xt+vt (vt ndash ошибка измерения являющаяся случайной величиной с нулевым математическим ожиданием и постоянной дисперсией) Если истинное значение β равно 04 а теоретическая дисперсия xt в три раза больше теоретической дисперсии vt то предел по вероятности оценки b равен 1) 01 2) 02 3) 0267 4) 03 5) 0333 4 После преобразования Койка модель геометрически распределенного лага yt = α + βxt + βδxt-1 + βδ2xt-2 + βδ3xt-3 ++ ut приобретает вид

1) yt - δyt-1 = α (1-δ) + βxt + ut - δut-1 2) yt = α (1-δ) + βxt + ut - δut-1 3) yt = α + βxt + ut - δut-1 4) yt - δyt-1 = α + βxt-1 + ut-1 5) ни один из перечисленных

5 По 39 точкам оценена следующая формула производственной функции в которой отдельно рассмотрены две составляющие затрат основного капитала K1 - здания и сооружения и K2 - машины и оборудование а также две составляющие затрат труда L1 - затраты квалифицированного труда и L2 - затраты неквалифицированного труда Y ndash выпуск ln(Y)=-43 + 035ln(K1) + 026ln(K2) + 063ln(L1) + 058ln(L2) R2 =092 DW=174 (14) (003) (005) (041) (038) (в скобках приведены стандартные ошибки коэффициентов) Какой из выводов и дальнейших шагов представляется Вам верным 1) Нужно исключить фактор L (переменные L1 и L2) тк он оказался незначимым 2) Имеет место мультиколлинеарность поэтому нужно объединить факторы K1 и K2 3) Имеет место мультиколлинеарность поэтому нужно объединить факторы L1 и L2 4) Отклонения ei автокоррелированы нужно изменить формулу зависимости 5) Формула зависимости приемлема по всем приведенным параметрам и изменения не

нужны

6 Эконометрическая модель описана следующими уравнениями (1) y1 = α + βy2 + γx1 + ϕx2 + u1 (2) y2 = δ + τx1 + λx2 + u2 где y1 и y2 ndash эндогенные переменные x1 и x2 ndash экзогенные переменные и u1 и u2 ndash случайные члены удовлетворяющие условиям Гаусса-Маркова Выберите неверное утверждение

1) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут несмещенными

2) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут несмещенными

3) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут состоятельными

4) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут состоятельными

5) косвенный метод наименьших квадратов позволяет получить несмещенные оценки коэффициентов обоих уравнений

7 Дана следующая макроэкономическая модель Y = C + I + G - макроэкономическое тождество C = a + bY - функция потребления I = d ndash emiddotR-1 + fY - функция инвестиций (MP) = gY ndash hR - уравнение денежного рынка где эндогенными переменными являются доход Y потребление C инвестиции I и процентная ставка R Переменные G (государственные расходы) и (MP) (реальная денежная масса) ndash экзогенные Выберите верное утверждение из следующих 1) функция инвестиций неидентифицируема 2) функция потребления неидентифицируема 3) функция потребления однозначно идентифицируема 4) функция инвестиций однозначно идентифицируема 5) функция инвестиций сверхидентифицируема

8 Коэффициент Тейла в виде 2

p+T2

p+T

2p+Tp+T

ym1y

m1

)y - y(m1

=UΣ+Σ

Σ

ˆ

ˆ позволяет сравнить качество

сделанного на период (T+1hellipT+m) прогноза pTy +ˆ с качеством следующего прогноза 1) pTy +ˆ =0 для всех p=1hellipm 2) pTy +ˆ =yT для всех p=1hellipm 3)прогнозом по линейной функции оцененной за период (1hellipT) 4) прогнозом по экспоненте оцененной за период (1hellipT) 5) прогнозом по логарифмической функции оцененной за период (1hellipT)

9 Введение фиктивных переменных DT+p p=1hellipm при прогнозировании (DT+p=1 при t=T+p DT+p=0 при всех других t) позволяет

I Рассчитать ошибки предсказания для t=T+1hellip T+m II Рассчитать стандартные ошибки предсказания для t=T+1hellip T+m

III Выполнить F-тест на стабильность коэффициентов

1) Верно только I 2) Верно только II 3) Верно только I и II 4) Верно только I и III 5) Верно I II и III 10 При оценивании линейной регрессии по методу максимума правдоподобия оценки коэффициентов совпадают с полученными по МНК при следующих условиях 1) всегда 2) если случайный член нормально распределен и выполнены условия Гаусса-Маркова 3) если случайный член нормально распределен независимо от выполнения условий

Гаусса-Маркова 4) если случайный член не автокоррелирован при любом его распределении 5) вообще говоря эти оценки не совпадают независимо от выполнения условий Гаусса-

Маркова и распределения случайного члена 11 Логит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-1196+0169ASVABC Вероятность получения академической степени (Degree=1) при ASVABC=60 равна

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) 1690))6016909611exp(1(

)6016909611exp(2 sdotsdot+minus+

sdotminus

3) (1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus)0169

4) 2))6016909611exp(1()6016909611exp(

sdot+minus+sdotminus

5) ))6016909611(21exp(

21 2sdotminusminusπ

12 Пробит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-5787+00782ASVABC Увеличение вероятности p(Degreei=1) при увеличении ASVABC на один пункт при ASVABC=60 равно здесь

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) ))60078207875(21exp(

21 2sdotminusminusπ

3) 07820))60078207875(21exp(

21 2 sdotsdotminusminusπ

4) F(-5787+0078260) где F ndash функция стандартного нормального распределения 5) F(-5787+0078260)00782 где F ndash функция стандартного нормального

распределения Часть 2 (1 час 30 минут) Ответьте письменно на два из трех следующих вопросов

1 Исследователь располагает данными о продолжительности обучения респондента HGC результатах теста на познавательные способности ASVABC и о продолжительности обучения матери респондента HGCM для выборки 570 индивидов Он предполагает что продолжительность обучения респондента зависит как от результатов теста на познавательные способности так и от продолжительности обучения матери респондента

uHGCMASVABCHGC +++= 21 ββα (11) и что познавательные способности в свою очередь являются функцией успехов в учебе

vHGCASVBC ++= 1δγ (12) 1a [2 балла] Объясните разницу между структурными уравнениями и уравнениями в приведенной форме в модели одновременных уравнений 1b [2 балла] Выведите приведенную форму уравнения для HGC 1c [6 баллов] Выведите выражение для смещения (для больших выборок) оценки 1δ предполагая что уравнение (12) было оценено обычным методом наименьших квадратов и определите вероятное направление смещения 1d [3 балла] Объясните почему HGCM может быть использована в качестве инструмента для HGC во втором уравнении 1e [6 баллов] Продемонстрируйте что оценка метода инструментальных переменных для

1δ использующая в качестве инструмента HGCM является состоятельной предполагая что модель корректно определена 1f [6 баллов] Предположим теперь что корректной спецификацией второго уравнения является

vHGCMHGCASVBC ++++= 21 δδγ (13) Продемонстрируйте что оценка метода инструментальных переменных для 1δ будет несостоятельной выведите смещение для случая большой выборки и установите его направление (Указание учтите что приведенная форма уравнения для HGC в этом случае изменится)

2а [8 баллов] Случайная переменная принимает два возможных значения 0 и 1 с неизвестной вероятностью p того что она равна 1 В выборке имеется всего три наблюдения первое наблюдение равно 1 второе также 1 а третье равно 0 Выведите оценку максимального правдоподобия для p Следующая информация относится к остальным вопросам этого задания Переменная WORKING определена равной 1 если респондент имеет работу и равной 0 в противном случае Для оценивания зависимости переменной WORKING от уровня образования респондента HGC (продолжительность обучения респондента) был использован метод логит-анализа Исследование было выполнено отдельно для мужчин и женщин (в приведенных ниже результатах расчетов первая таблица соответствует женщинам а вторая ndash мужчинам указание на число проведенных итераций не приводится) logit working hgc if male=0 Logit Estimates Number of obs = 2726

chi2(l) = 7042 Prob gt chi2 = 00000

Log Likelihood = ndash15865519 Pseudo R2 = 00217 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 1511872 0186177 8121 0000 1146971 1876773 cons 1 ndash1049543 2448064 ndash4287 0000 ndash1529355 ndash5697314 logit working hgc if male=1 Logit Estimates Number of obs = 2573

chi2(l) = 7503 Prob gt chi2 = 00000

Log Likelihood = ndash80265424 Pseudo R2 = 00446 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 2499295 0306482 8155 0000 1898601 3099989 cons 1 ndash9670268 ndash3775658 ndash2561 0010 ndash1707042 ndash2270113 95 процентов респондентов имеют значение HGC в диапазоне 9-18 лет со средним значением HGC равным 133 и 132 лет для женщин и мужчин соответственно Исходя из логит-анализа предельный эффект HGC на вероятность наличия работы в среднем оценивается как 0030 и 0020 для женщин и мужчин соответственно Оценка регрессии метода наименьших квадратов WORKING по HGC дает коэффициент наклона 0029 и 0020 для женщин и мужчин соответственно Логистическая функция F(z) и ее производная f(z) даются выражениями

izezF minus+

=1

1)( и 2)1()( z

z

eezf minus

minus

+=

где z является линейной функцией характеристик респондента На графиках (см следующую страницу) представлены вероятность наличия работы и предельное влияние HGC на вероятность наличия работы для мужчин и женщин

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 5: Эконометрика

Статистическая значимость оценок коэффициентов парной ЛР проверка гипотез с помощью t-статистик Построение и интерпретация доверительных интервалов Общее качество регрессии коэффициент детерминации R2 F-статистика и F-тест Связь R2 с коэффициентами корреляции Модель парной ЛР без свободного члена Глава 2 (21-27) Глава 3 (31-311) (CD-1 CD-2) L2 (OZ) 3 Преобразования переменных в регрессионном анализе Линеаризация нелинейных зависимостей и их оценивание с помощью МНК Спецификация случайного члена Интерпретация линейных логарифмических и линейно-логарифмических зависимостей Оценивание функций с постоянной эластичностью и экспоненциальных временных трендов Сравнение качества регрессионных зависимостей линейные и линейно-логарифмические функции Метод Зарембки Метод Бокса-Кокса Глава 4 (CD-1) Глава 5 (CD-2) L4 (ОЗ) 4 Модель множественной линейной регрессии (МЛР) две объясняющие переменные и k объясняющих переменных Описание и интерпретация модели с двумя и k объясняющими переменными Примеры функции спроса функции заработка производственные функции Оценивание по МНК модели с двумя объясняющими переменными Свойства коэффициентов модели Мультиколлинеарность Коэффициент детерминации R2 Скорректированный R2 Проверка гипотез с помощью t-статистик и F-статистик МНК-оценки модели с k объясняющими переменными в векторно-матьричной форме Свойства коэффициентов F-тест для групп переменных Оценивание производственных функций в объемной и темповой записи как моделей множественной регрессии Глава 5 (51-56CD-1) Глава 4 (41-45 CD-2) L24 (ОЗ) Глава 3 (МКП) 5 Спецификация модели линейной регрессии Последствия неправильной спецификации Невключение значимой объясняющей переменной Включение лишней объясняющей переменной Метод Монте-Карло в эконометрическом анализе общие принципы возможности применения и примеры Замещающие переменные Проверка выполнения линейных ограничений на параметры МЛР F-тест и t-тесты Роль и примеры линейных ограничений в исследовании экономических моделей Переменные с запаздыванием Глава 6 (61-67 CD-1) Глава 7 (71-76 CD-2) 6 Гетероскедастичность Понятие последствия обнаружение гетероскедастичности Тесты Голдфелда-Квандта Спирмена Глейзера Корректировка модели Взвешенный метод наименьших квадратов Глава 7 (71-73 7576 CD-1) Глава 8 (81-83 CD-2) 7 Автокоррелированность случайного члена Проявления и последствия автокоррелированности случайного члена в модели линейной регрессии Критерий Дарбина-Уотсона Свойства случайного члена и ошибки спецификации Корректировка модели Авторегрессионное преобразование процедура Кокрана-Оркатта поправка Прайса-Уинстена Модели AR MA и ARMA Глава 7 (75-79 CD-1) Глава 13 (131-136 CD-2) L3 (ОЗ) 8 Фиктивные переменные

Фиктивные (dummy) переменные в моделях линейной регрессии Типы фиктивных переменных Многожественные совокупности фиктивных переменных Тест Чоу Фиктивные переменные в экономических моделях функции заработка производственные функции Глава 9 (91-95 CD-1) Глава 6 (61-64 CD-2) 9 Стохастические объясняющие переменные Свойства получаемых оценок и тестовых статистик при стохастических объясняющих переменных Ошибки измерения Смещение оценок при ошибках измерения Критика Милтоном Фридменом оценивания функции потребления Инструментальные переменные Использование инструментальных переменных в модели потребления МФридмана и других экономических моделях Глава 8 (81-84 CD-1) Глава 9 (91-94 CD-2) 10 Системы одновременных уравнений Понятие системы одновременных уравнений Смещение и несостоятельность оценок при непосредственном оценивании Структурная и приведенная формы модели Модель спроса и предложения и простейшая кейнсианская модель равновесия как системы одновременных уравнений Методы оценивания Косвенный метод наименьших квадратов (КМНК) Инструментальные переменные Двухшаговый метод наименьших квадратов (ДМНК) Связь КМНК инструментальных переменных и ДМНК Модель ISLM пример оценивания модели одновременных уравнений Глава 11 (111-118 CD-1) Глава 10 (101-113 CD-2) L6 (ОЗ) 11 Моделирование с использованием данных временных рядов Модели динамических процессов Прогнозирование Распределенные лаги геометрический лаг полиномиальный лаг Преобразование Койка и непосредственное нелинейное оценивание параметров геометрического лага Частичная корректировка Адаптивные ожидания Модель постоянного дохода МФридмена Проблемы оценивания и анализа Построение прогнозов и пост-прогнозов Доверительные интервалы Метод Салкевера Тесты на устойчивость Показатели качества прогнозов Глава 10 (101-109 CD-1) Глава 12 (121-126 CD-2) L5 (ОЗ) 12 Модели двоичного выбора модели с ограничениями для зависимой переменной и оценивание по методу максимума правдоподобия Линейная вероятностная модель проблемы оценивания Логит-модель Пробит-модель Оценивание по методу максимума правдоподобия общие принципы и направления применения Использование для парной линейной регрессии логит-оценивания пробит-оценивания Характеристики качества оценивания (псевдо-R2 отношение правдоподобия) Цензурированные выборки Непосредственное и усеченное оценивание Тобит-модель Смещение при построении выборки Глава 11 (CD-2 И-2) III Распределение часов курса по темам и видам работ

пп

Наименование тем и разделов

ВСЕГО (часов)

Аудиторные занятия (час)

Самостоятельная

в том числе Лекции Практические

занятия

работа

1 Введение в эконометрику 12 2 2 8 2 Модель парной линейной регрессии (ЛР)

Свойства оценок в модели парной ЛР 24 4 4 16

3 Преобразования переменных в регрессионном анализе

12 2 2 8

4 Модель множественной линейной регрессии (МЛР) две объясняющие переменные и k объясняющих переменных

24 4 4 16

5 Спецификация модели линейной регрессии 24 4 4 16 6 Гетероскедастичность 12 2 2 8 7 Автокоррелированность случайного члена 12 2 2 8 8 Фиктивные переменные 12 2 2 8 9 Стохастические объясняющие переменные 12 2 2 8 10 Системы одновременных уравнений 24 4 4 16 11 Моделирование с использованием данных

временных рядов Модели динамических процессов Прогнозирование

24 4 4 16

12 Модели двоичного выбора модели с ограничениями для зависимой переменной и оценивание по методу максимума правдоподобия

24 4 4 16

ИТОГО 216 36 36 144 IV Формы промежуточного и итогового контроля Студенты сдают промежуточный письменный экзамен а также итоговый письменный экзамен в конце семестра Каждый экзамен включает вопросы множественного выбора и открытые вопросы (примеры экзаменационных работ прилагаются) Итоговый экзамен дает 50 конечной оценки промежуточный экзамен - 30 конечной оценки соответственно 20 дается за выполнение домашних заданий и работу на занятиях V Учебно-методическое обеспечение курса Основная литература 1 Dougherty Christopher Introduction to Econometrics Oxford University Press 1992 (1st

edition CD-1) 2002 (2nd edition CD-2) Доугерти Кр Введение в эконометрику Изд1 М ИНФРА-М 1997 1999 Изд2 М ИНФРА-М 2003 (готовится к выходу)

2 Dougherty Christopher Elements of econometrics and economic statistics Study Guide University of London 2002

3 Замков ОО Эконометрические методы в макроэкономическом анализе М ГУ-ВШЭ 2001 (на русском языке) Диалог-МГУ 1999 (на русском и английском языках) (ОЗ)

Дополнительная литература 1 Магнус ЯР Катышев ПК Пересецкий АА Эконометрика Начальный курс Изд 1-4

М Дело 1997-2000 (МКП) 2 Econometric Views 40 Users Guide Quantitative Micro Software LLC 3 Greene WH Econometric Analysis Prentice Hall int 1993 4 Kennedy P A Guide to Econometrics MIT Press 1992

Интернет-ресурсы 1 httpeconlseacukie (И-1) 2 httpwwwoupcomukbesttextbookseconomicsdougherty2e (И-2) 3 httpwwwworthpublisherscommankiw (И-3) 4 httpwwwrecepru (И-4) Компьютерные программы и массивы данных Основной компьютерной программой используемой в курсе является программа Econometric Views (версии 31 и последующие) Используются также электронные таблицы Excel Для выполнения заданий в классе и домашних заданий используются массивы данных данные курса КрДоугерти в ЛШЭ (данные для оценивания функций заработка по опросу NSLY в США данные о спросе располагаемом доходе и относительных ценах по товарным группам в США за 1959-1994гг - данные имеются на сайте И-1) Данные о погодовой динамике основных макроэкономических показателей в США за 1931-1998гг данные имеются на сайте И-3 Данные о помесячной динамике основных макроэкономических показателей России за 1992-2002гг данные имеются на сайте И-4 Данные об оценках ВНП затрат труда и капитала в экономике СССР за 1928-1987гг Данные о динамике инвестиций и вводе основных производственных фондов в Российской Федерации в 1956-1991гг

Приложение 1 Примеры промежуточных и итоговых экзаменационных работ

Промежуточный экзамен Часть 1 Тесты множественного выбора 30 минут В каждом вопросе обведите цифру номера правильного ответа 1 Если объясняющая переменная x в модели парной линейной регрессии принимает

среднее в выборке значение x =Σxin то 1) наблюдаемая величина зависимой переменной y равна y =Σyin 2) рассчитанная по уравнению регрессии величина зависимой переменной y равна y =Σyin 3) рассчитанная по уравнению регрессии величина зависимой переменной y равна y =Σyin

в среднем но не в каждом конкретном случае 4) равенство y =a+b x свидетельствует об отсутствии корреляции между отклонениями 5) равенство y =a+b x свидетельствует о выполнении условий Гаусса-Маркова 2 В модели парной линейной регрессии при использовании метода наименьших

квадратов верны следующие из перечисленных утверждений I Квадрат коэффициента корреляции между фактическими и теоретическими

значениями зависимой переменной в выборке равен R2 II Квадрат коэффициента корреляции между зависимой переменной и

объясняющей переменной в выборке равен R2 III Доля остаточной (необъясненной) дисперсии зависимой переменной равна R2 1) Только I 2) Только II 3) Только I и III 4) Только I и II 5) I II и III

3 Уравнение Y=α+βk+(1-β)l+u где Y - темп прироста выпуска k - темп прироста затрат капитала и l - темп прироста затрат труда может быть оценено как модель линейной регрессии

1) непосредственно с помощью обычного МНК как зависимость Y от k и l со свободным членом

2) непосредственно с помощью обычного МНК как зависимость Y от k и l без свободного члена

3) как линейную зависимость (Y-k) от (l-k) со свободным членом 4) как линейную зависимость (Y-k) от (l-k) без свободного члена 5) невозможно оценить данную зависимость с помощью обычного МНК

требуется нелинейный МНК 4 В модели множественной линейной регрессии с двумя объясняющими переменными Y=α+β1x1+β2x2+u оценка коэффициента β1 по методу наименьших квадратов для заданной выборки не зависит от 1) наблюденных значений переменной x1 2) наблюденных значений переменной x2 3) наблюденных значений переменной Y 4) значения постоянного члена α

5) ковариации между x1 и Y 5 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 (b) y зависит только от x1 и (c) y зависит только от x2 При оценивании регрессий для каждой из этих моделей величины R2 получились равными R2

a R2b и R2

c соответственно Какое из следующих утверждений верно 1) R2

a = R2b + R2

c 2) R2

a gt R2b + R2

c 3) R2

a = R2b - R2

c 4) R2

a lt R2b + R2

c 5) R2

a может быть больше а может быть меньше чем R2b + R2

c 6 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 без свободного члена (b) y зависит только от x1 со свободным членом и (c) y зависит только от x2 со свободным членом При оценивании регрессий для каждой из этих моделей величины RSS получились равными RSSa RSSb и RSSc соответственно Какое из следующих утверждений верно 1) RSSa gt maxRSSb RSSc 2) RSSa gt RSSb + RSSc 3) RSSa lt minRSSb RSSc 4) RSSa lt RSSb + RSSc 5) RSSa может быть больше а может быть меньше чем RSSb + RSSc

7 В модели множественной линейной регрессии высокая корреляция между двумя объясняющими переменными приводит к

1) смещенности оценок коэффициентов полученных по методу наименьших квадратов

2) несостоятельности оценок коэффициентов полученных по методу наименьших квадратов

3) неэффективности оценок коэффициентов полученных по методу наименьших квадратов

4) значительной дисперсии оценок коэффициентов полученных по методу наименьших квадратов

5) равенству нулю оценок коэффициентов полученных по методу наименьших квадратов

8 Переменная y определяется величинами x1 и x2 и случайным членом u по следующей формуле y = α + β1x1 + β2x2 + u По данным выборки оценено следующее уравнение регрессии 11ˆ xbay += Переменные x1 и x2 положительно коррелированы Величины β1 и β2 положительны

Тогда 1) b1 всегда меньше чем β1 2) b1 всегда больше чем β1 3) оценка b1 смещена в сторону завышения 4) оценка b1 смещена в сторону занижения 5) b1 является несмещенной оценкой β1

9 Введение линейного ограничения на параметры в регрессионную модель 1) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение значимо 2) приводит к значительному сокращению суммы квадратов отклонений если

ограничение значимо 3) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение незначимо 4) приводит к значительному сокращению суммы квадратов отклонений если

ограничение незначимо 5) все перечисленное неверно

10 Тест Голдфелда-Квандта в модели y = α + βx + u используется для 1) обнаружения гетероскедастичности любого вида 2) обнаружения гетероскедастичности вида σui=γ xi 3) обнаружения гетероскедастичности вида σui= δ + γ xi

μ 4) проверки на некоррелированность значений случайного члена между собой 5) проверки на некоррелированность значений случайного члена и объясняющей

переменной

11 Оценена линейная регрессионная зависимость величины заработка респондента y от совокупности факторов (x1x2hellipxn) Исследователь предполагает что величина заработка зависит также от места проживания респондента которое может принадлежать к одному из трех типов крупный город малый город сельская местность Для того чтобы учесть это в модели нужно 1) ввести фиктивную переменную которая может принимать три разных значения 2) ввести фиктивную переменную которая может принимать два разных значения 3) ввести две фиктивные переменные каждая из которых может принимать два

разных значения 4) ввести три фиктивные переменные каждая из которых может принимать два

разных значения 5) ввести две фиктивные переменные каждая из которых может принимать три

разных значения 12 Оценена регрессионная зависимость величины спроса потребителей на VideoCD (VCD) от их дохода (Y) и от уровня цен на VideoCD (Pvcd) в виде log(VCD) = α + β1log(Y) + β2log(Pvcd) + u В выборку включены только те потребители у которых имеется персональный компьютер Далее исследователь предполагает что эластичности спроса на VideoCD по доходу и по цене зависят от наличия у потребителей DVD-проигрывателя Для того чтобы учесть это в модели нужно

1) ввести фиктивную переменную для свободного члена 2) ввести две фиктивные переменные для свободного члена 3) ввести одну общую фиктивную переменную для коэффициентов наклона 4) ввести две фиктивные переменные для коэффициентов наклона 5) ввести две фиктивные переменные по одной для свободного члена и для

коэффициентов наклона

Часть 2 (1 час 30 минут) Ответьте письменно на любые два из следующих трех вопросов 1 Исследователь интересуется факторами определяющими динамику потребления мяса (B) в США в 1960 ndash 1987 годах (фунты в год на душу населения) В качестве факторов он

рассматривает цену P (центы за фунт) и личный располагаемый доход (тысячи долларов в год в расчете на душу населения) Y 11 Вначале он строит модель парной регрессии потребления мяса от личного располагаемого дохода

)111()79(260483377ˆ 2 =sdot+= RYB (1)

В скобках приведены стандартные ошибки Оцените качество модели приведя обоснование своих суждений и выводов на основе t-тестов и F-теста (F-статистику рассчитайте двумя разными способами) Дайте интерпретацию коэффициентов модели 12 Затем он строит парную регрессию по ценам

)1190()874(03011503102ˆ 2 =sdot+= RPB (2)

Дайте интерпретацию коэффициентов модели и выскажите свое суждение о качестве модели 13 Не удовлетворенный полученным результатом исследователь попытался построить модель множественной регрессии одновременно по обоим исследованным факторам

)160()761()0410(6608808911537ˆ 2 =sdotminussdot+= RPYB (3)

Охарактеризуйте значимость отдельных факторов модели и дайте интерпретацию коэффициентов модели В чем причина различия между значениями коэффициентов при величине дохода в моделях (1) и (3) Какое из значений следует считать более правильным и почему 14 Можно ли считать значимым вклад фактора цены в модели (3) по сравнению с моделью (1) Как согласуется Ваш вывод с оценкой значимости модели (2) 15 Скорректированный коэффициент детерминации модели (1) равен 23702 =R тогда как для модели (3) он составляет 6302 =R Поясните смысл скорректированного коэффициента детерминации и прокомментируйте эти числа и различие между ними 16 Наконец исследователь решает использовать логарифмы для всех переменных в уравнении множественной регрессии

)060()1480()410(710)ˆ(340)ˆ(071593)(ˆ 2 =sdotminussdot+= RPLOGYLOGBGLO (4)

Как изменится интерпретация коэффициентов модели (4) по сравнению с моделью (3) Каким видом товара является мясо в соответствии с этой моделью (предмет первой необходимости предмет роскоши нормальное благо худшее благо товар Гиффена и тп) 2 Фирма управляет двумя предприятиями величина месячной прибыли (в сотнях тысяч рублей) которых за год описывается переменными P1 P2 Общая прибыль фирмы P складывается из прибыли обоих предприятий за вычетом некоторых дополнительных постоянных издержек и возможно отчислений из прибыли каждого из предприятий Имеется 13 помесячных наблюдений за полный год и январь следующего года

21 Регрессионная модель зависимости общей прибыли от прибыли предприятий выглядит следующим образом

)590()690)(712(470280109145 2 =sdot+sdot+minus= RPPP

(1)

Дайте содержательную интерпретацию модели Охарактеризуйте значимость каждого из факторов на основе t-статистик и значимость модели в целом на основе F-критерия Там где нужно выполните односторонний тест и объясните причину его использования 22 Как можно объяснить на содержательном уровне очевидное противоречие между значимостью отдельных факторов и значимостью модели в целом (подробно опишите в чем заключается это противоречие) 23 Что выражает различие значений двух коэффициентов при независимых переменных Является ли их соотношение мерой различия вкладов обоих предприятий А мерой различия предельных вкладов предприятий Можно ли принять гипотезу что каждый из факторов входит в уравнение с коэффициентом равным единице 24 Ковариационная матрица для переменных модели выглядит следующим образом

P P1 P2 P 4584986 9997390 9699030 P1 9997390 5753368 2481317 P2 9699030 2481317 7788488

Определите коэффициенты корреляции между переменными модели взятыми попарно Какие дополнительные выводы можно сделать из этих данных 25 Далее была оценена парная регрессия

())112(3801733 2 =sdot+minus= RPP

(2)

Воспользовавшись имеющимися данными рассчитайте коэффициент наклона и стандартную ошибку в модели (2) Рассматривая модель (1) как правильную объясните смещение коэффициента наклона в модели (2) пользуясь ковариационной матрицей 26 Если сгенерировать новую переменную P0=P1+P2 то можно получить следующую регрессионную зависимость

)340()72(450006126 2 =sdot+minus= RPP

(3)

Сравните модель (3) с моделью (1) Сформулируйте введенное линейное ограничение и проверьте его значимость Что можно сказать о наличии общих постоянных издержек а также отчислений от прибыли каждого из предприятий до перечисления в общий фонд 3 Рассматривается зависимость совокупных расходов на косметику в США от совокупного личного располагаемого дохода за 1959-1983 гг С этой целью строится ряд линейных регрессий

31 Уравнение зависимости уровня расходов на косметику от логарифма личного располагаемого дохода получилось следующим

)290()951(950)log(160234 2 =sdot+minus= RDPICOSM

(1)

Дайте интерпретацию модели и ее коэффициентов Запишите уравнение не используя логарифмы 32 Если наоборот взять логарифм только от величины расходов то уравнение принимает вид

)000130()100(83000140770)log( 2 =sdot+= RDPICOSM

(2)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 33 Модель в двойных логарифмах принимает вид

)070()480(900)log(061205)log( 2 =sdot+minus= RDPICOSM

(3)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 34 Если выполнить преобразование Зарембки сформировав новую переменную COSMZ взамен COSM то получим следующее линейное уравнение

)000090()0010(8900010050 2 =sdot+= RDPICOSMZ

(4)

В чем состоит преобразование Зарембки и для чего оно используется 35 Значение суммы квадратов остатков для модели (4) составило 00877 тогда как для модели (3) оно равно 021 Сопоставимы ли значения RSS и R2 в этих двух моделях Можно ли утверждать что одна из моделей имеет преимущество перед другой Приведите статистическое обоснование своего вывода Можно ли выбрать наилучшую из моделей (1)-(4) 36 Известно что альтернативным методом к методу Зарембки является процедура Бокса-Кокса Опишите ее смысл и последовательность действий для рассматриваемого примера

Заключительный экзамен Часть 1 (30 минут) В каждом из 12 вопросов обведите кружком ровно один ответ который вы считаете правильным 1 Укажите среди названных здесь статистических тестов те тесты которые могут

выполняться только для больших выборок I Тест Чоу на неудачу предсказания II Тест Спирмена на ранговую корреляцию III Тест χ2 для LR-статистики при оценивании по методу максимума

правдоподобия IV Тест Дарбина для уравнения с лаговой объясняющей переменной V Тест Голдфелда-Квандта

1) Только II III IV 2) Только II IV 3) Только I III 4) Только IV V 5) Только I II IV

2 Гипотеза о том что случайный член не подвержен автокорреляции первого порядка отвергается в пользу односторонней альтернативной гипотезы о его отрицательной автокоррелированности если 1) статистика Дарбина-Уотсона d близка к 2 2) статистика Дарбина-Уотсона d близка к 1 3) статистика Дарбина-Уотсона d близка к 0 или 4 4) статистика Дарбина-Уотсона d близка к 4 но не к 0 5) статистика Дарбина-Уотсона d близка к 0 но не к 4 3 Переменная yt зависит от переменной xt yt=α+βxt+ut Оценивается зависимость yt от переменной zt yt=a+bzt+et где zt=xt+vt (vt ndash ошибка измерения являющаяся случайной величиной с нулевым математическим ожиданием и постоянной дисперсией) Если истинное значение β равно 04 а теоретическая дисперсия xt в три раза больше теоретической дисперсии vt то предел по вероятности оценки b равен 1) 01 2) 02 3) 0267 4) 03 5) 0333 4 После преобразования Койка модель геометрически распределенного лага yt = α + βxt + βδxt-1 + βδ2xt-2 + βδ3xt-3 ++ ut приобретает вид

1) yt - δyt-1 = α (1-δ) + βxt + ut - δut-1 2) yt = α (1-δ) + βxt + ut - δut-1 3) yt = α + βxt + ut - δut-1 4) yt - δyt-1 = α + βxt-1 + ut-1 5) ни один из перечисленных

5 По 39 точкам оценена следующая формула производственной функции в которой отдельно рассмотрены две составляющие затрат основного капитала K1 - здания и сооружения и K2 - машины и оборудование а также две составляющие затрат труда L1 - затраты квалифицированного труда и L2 - затраты неквалифицированного труда Y ndash выпуск ln(Y)=-43 + 035ln(K1) + 026ln(K2) + 063ln(L1) + 058ln(L2) R2 =092 DW=174 (14) (003) (005) (041) (038) (в скобках приведены стандартные ошибки коэффициентов) Какой из выводов и дальнейших шагов представляется Вам верным 1) Нужно исключить фактор L (переменные L1 и L2) тк он оказался незначимым 2) Имеет место мультиколлинеарность поэтому нужно объединить факторы K1 и K2 3) Имеет место мультиколлинеарность поэтому нужно объединить факторы L1 и L2 4) Отклонения ei автокоррелированы нужно изменить формулу зависимости 5) Формула зависимости приемлема по всем приведенным параметрам и изменения не

нужны

6 Эконометрическая модель описана следующими уравнениями (1) y1 = α + βy2 + γx1 + ϕx2 + u1 (2) y2 = δ + τx1 + λx2 + u2 где y1 и y2 ndash эндогенные переменные x1 и x2 ndash экзогенные переменные и u1 и u2 ndash случайные члены удовлетворяющие условиям Гаусса-Маркова Выберите неверное утверждение

1) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут несмещенными

2) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут несмещенными

3) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут состоятельными

4) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут состоятельными

5) косвенный метод наименьших квадратов позволяет получить несмещенные оценки коэффициентов обоих уравнений

7 Дана следующая макроэкономическая модель Y = C + I + G - макроэкономическое тождество C = a + bY - функция потребления I = d ndash emiddotR-1 + fY - функция инвестиций (MP) = gY ndash hR - уравнение денежного рынка где эндогенными переменными являются доход Y потребление C инвестиции I и процентная ставка R Переменные G (государственные расходы) и (MP) (реальная денежная масса) ndash экзогенные Выберите верное утверждение из следующих 1) функция инвестиций неидентифицируема 2) функция потребления неидентифицируема 3) функция потребления однозначно идентифицируема 4) функция инвестиций однозначно идентифицируема 5) функция инвестиций сверхидентифицируема

8 Коэффициент Тейла в виде 2

p+T2

p+T

2p+Tp+T

ym1y

m1

)y - y(m1

=UΣ+Σ

Σ

ˆ

ˆ позволяет сравнить качество

сделанного на период (T+1hellipT+m) прогноза pTy +ˆ с качеством следующего прогноза 1) pTy +ˆ =0 для всех p=1hellipm 2) pTy +ˆ =yT для всех p=1hellipm 3)прогнозом по линейной функции оцененной за период (1hellipT) 4) прогнозом по экспоненте оцененной за период (1hellipT) 5) прогнозом по логарифмической функции оцененной за период (1hellipT)

9 Введение фиктивных переменных DT+p p=1hellipm при прогнозировании (DT+p=1 при t=T+p DT+p=0 при всех других t) позволяет

I Рассчитать ошибки предсказания для t=T+1hellip T+m II Рассчитать стандартные ошибки предсказания для t=T+1hellip T+m

III Выполнить F-тест на стабильность коэффициентов

1) Верно только I 2) Верно только II 3) Верно только I и II 4) Верно только I и III 5) Верно I II и III 10 При оценивании линейной регрессии по методу максимума правдоподобия оценки коэффициентов совпадают с полученными по МНК при следующих условиях 1) всегда 2) если случайный член нормально распределен и выполнены условия Гаусса-Маркова 3) если случайный член нормально распределен независимо от выполнения условий

Гаусса-Маркова 4) если случайный член не автокоррелирован при любом его распределении 5) вообще говоря эти оценки не совпадают независимо от выполнения условий Гаусса-

Маркова и распределения случайного члена 11 Логит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-1196+0169ASVABC Вероятность получения академической степени (Degree=1) при ASVABC=60 равна

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) 1690))6016909611exp(1(

)6016909611exp(2 sdotsdot+minus+

sdotminus

3) (1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus)0169

4) 2))6016909611exp(1()6016909611exp(

sdot+minus+sdotminus

5) ))6016909611(21exp(

21 2sdotminusminusπ

12 Пробит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-5787+00782ASVABC Увеличение вероятности p(Degreei=1) при увеличении ASVABC на один пункт при ASVABC=60 равно здесь

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) ))60078207875(21exp(

21 2sdotminusminusπ

3) 07820))60078207875(21exp(

21 2 sdotsdotminusminusπ

4) F(-5787+0078260) где F ndash функция стандартного нормального распределения 5) F(-5787+0078260)00782 где F ndash функция стандартного нормального

распределения Часть 2 (1 час 30 минут) Ответьте письменно на два из трех следующих вопросов

1 Исследователь располагает данными о продолжительности обучения респондента HGC результатах теста на познавательные способности ASVABC и о продолжительности обучения матери респондента HGCM для выборки 570 индивидов Он предполагает что продолжительность обучения респондента зависит как от результатов теста на познавательные способности так и от продолжительности обучения матери респондента

uHGCMASVABCHGC +++= 21 ββα (11) и что познавательные способности в свою очередь являются функцией успехов в учебе

vHGCASVBC ++= 1δγ (12) 1a [2 балла] Объясните разницу между структурными уравнениями и уравнениями в приведенной форме в модели одновременных уравнений 1b [2 балла] Выведите приведенную форму уравнения для HGC 1c [6 баллов] Выведите выражение для смещения (для больших выборок) оценки 1δ предполагая что уравнение (12) было оценено обычным методом наименьших квадратов и определите вероятное направление смещения 1d [3 балла] Объясните почему HGCM может быть использована в качестве инструмента для HGC во втором уравнении 1e [6 баллов] Продемонстрируйте что оценка метода инструментальных переменных для

1δ использующая в качестве инструмента HGCM является состоятельной предполагая что модель корректно определена 1f [6 баллов] Предположим теперь что корректной спецификацией второго уравнения является

vHGCMHGCASVBC ++++= 21 δδγ (13) Продемонстрируйте что оценка метода инструментальных переменных для 1δ будет несостоятельной выведите смещение для случая большой выборки и установите его направление (Указание учтите что приведенная форма уравнения для HGC в этом случае изменится)

2а [8 баллов] Случайная переменная принимает два возможных значения 0 и 1 с неизвестной вероятностью p того что она равна 1 В выборке имеется всего три наблюдения первое наблюдение равно 1 второе также 1 а третье равно 0 Выведите оценку максимального правдоподобия для p Следующая информация относится к остальным вопросам этого задания Переменная WORKING определена равной 1 если респондент имеет работу и равной 0 в противном случае Для оценивания зависимости переменной WORKING от уровня образования респондента HGC (продолжительность обучения респондента) был использован метод логит-анализа Исследование было выполнено отдельно для мужчин и женщин (в приведенных ниже результатах расчетов первая таблица соответствует женщинам а вторая ndash мужчинам указание на число проведенных итераций не приводится) logit working hgc if male=0 Logit Estimates Number of obs = 2726

chi2(l) = 7042 Prob gt chi2 = 00000

Log Likelihood = ndash15865519 Pseudo R2 = 00217 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 1511872 0186177 8121 0000 1146971 1876773 cons 1 ndash1049543 2448064 ndash4287 0000 ndash1529355 ndash5697314 logit working hgc if male=1 Logit Estimates Number of obs = 2573

chi2(l) = 7503 Prob gt chi2 = 00000

Log Likelihood = ndash80265424 Pseudo R2 = 00446 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 2499295 0306482 8155 0000 1898601 3099989 cons 1 ndash9670268 ndash3775658 ndash2561 0010 ndash1707042 ndash2270113 95 процентов респондентов имеют значение HGC в диапазоне 9-18 лет со средним значением HGC равным 133 и 132 лет для женщин и мужчин соответственно Исходя из логит-анализа предельный эффект HGC на вероятность наличия работы в среднем оценивается как 0030 и 0020 для женщин и мужчин соответственно Оценка регрессии метода наименьших квадратов WORKING по HGC дает коэффициент наклона 0029 и 0020 для женщин и мужчин соответственно Логистическая функция F(z) и ее производная f(z) даются выражениями

izezF minus+

=1

1)( и 2)1()( z

z

eezf minus

minus

+=

где z является линейной функцией характеристик респондента На графиках (см следующую страницу) представлены вероятность наличия работы и предельное влияние HGC на вероятность наличия работы для мужчин и женщин

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 6: Эконометрика

Фиктивные (dummy) переменные в моделях линейной регрессии Типы фиктивных переменных Многожественные совокупности фиктивных переменных Тест Чоу Фиктивные переменные в экономических моделях функции заработка производственные функции Глава 9 (91-95 CD-1) Глава 6 (61-64 CD-2) 9 Стохастические объясняющие переменные Свойства получаемых оценок и тестовых статистик при стохастических объясняющих переменных Ошибки измерения Смещение оценок при ошибках измерения Критика Милтоном Фридменом оценивания функции потребления Инструментальные переменные Использование инструментальных переменных в модели потребления МФридмана и других экономических моделях Глава 8 (81-84 CD-1) Глава 9 (91-94 CD-2) 10 Системы одновременных уравнений Понятие системы одновременных уравнений Смещение и несостоятельность оценок при непосредственном оценивании Структурная и приведенная формы модели Модель спроса и предложения и простейшая кейнсианская модель равновесия как системы одновременных уравнений Методы оценивания Косвенный метод наименьших квадратов (КМНК) Инструментальные переменные Двухшаговый метод наименьших квадратов (ДМНК) Связь КМНК инструментальных переменных и ДМНК Модель ISLM пример оценивания модели одновременных уравнений Глава 11 (111-118 CD-1) Глава 10 (101-113 CD-2) L6 (ОЗ) 11 Моделирование с использованием данных временных рядов Модели динамических процессов Прогнозирование Распределенные лаги геометрический лаг полиномиальный лаг Преобразование Койка и непосредственное нелинейное оценивание параметров геометрического лага Частичная корректировка Адаптивные ожидания Модель постоянного дохода МФридмена Проблемы оценивания и анализа Построение прогнозов и пост-прогнозов Доверительные интервалы Метод Салкевера Тесты на устойчивость Показатели качества прогнозов Глава 10 (101-109 CD-1) Глава 12 (121-126 CD-2) L5 (ОЗ) 12 Модели двоичного выбора модели с ограничениями для зависимой переменной и оценивание по методу максимума правдоподобия Линейная вероятностная модель проблемы оценивания Логит-модель Пробит-модель Оценивание по методу максимума правдоподобия общие принципы и направления применения Использование для парной линейной регрессии логит-оценивания пробит-оценивания Характеристики качества оценивания (псевдо-R2 отношение правдоподобия) Цензурированные выборки Непосредственное и усеченное оценивание Тобит-модель Смещение при построении выборки Глава 11 (CD-2 И-2) III Распределение часов курса по темам и видам работ

пп

Наименование тем и разделов

ВСЕГО (часов)

Аудиторные занятия (час)

Самостоятельная

в том числе Лекции Практические

занятия

работа

1 Введение в эконометрику 12 2 2 8 2 Модель парной линейной регрессии (ЛР)

Свойства оценок в модели парной ЛР 24 4 4 16

3 Преобразования переменных в регрессионном анализе

12 2 2 8

4 Модель множественной линейной регрессии (МЛР) две объясняющие переменные и k объясняющих переменных

24 4 4 16

5 Спецификация модели линейной регрессии 24 4 4 16 6 Гетероскедастичность 12 2 2 8 7 Автокоррелированность случайного члена 12 2 2 8 8 Фиктивные переменные 12 2 2 8 9 Стохастические объясняющие переменные 12 2 2 8 10 Системы одновременных уравнений 24 4 4 16 11 Моделирование с использованием данных

временных рядов Модели динамических процессов Прогнозирование

24 4 4 16

12 Модели двоичного выбора модели с ограничениями для зависимой переменной и оценивание по методу максимума правдоподобия

24 4 4 16

ИТОГО 216 36 36 144 IV Формы промежуточного и итогового контроля Студенты сдают промежуточный письменный экзамен а также итоговый письменный экзамен в конце семестра Каждый экзамен включает вопросы множественного выбора и открытые вопросы (примеры экзаменационных работ прилагаются) Итоговый экзамен дает 50 конечной оценки промежуточный экзамен - 30 конечной оценки соответственно 20 дается за выполнение домашних заданий и работу на занятиях V Учебно-методическое обеспечение курса Основная литература 1 Dougherty Christopher Introduction to Econometrics Oxford University Press 1992 (1st

edition CD-1) 2002 (2nd edition CD-2) Доугерти Кр Введение в эконометрику Изд1 М ИНФРА-М 1997 1999 Изд2 М ИНФРА-М 2003 (готовится к выходу)

2 Dougherty Christopher Elements of econometrics and economic statistics Study Guide University of London 2002

3 Замков ОО Эконометрические методы в макроэкономическом анализе М ГУ-ВШЭ 2001 (на русском языке) Диалог-МГУ 1999 (на русском и английском языках) (ОЗ)

Дополнительная литература 1 Магнус ЯР Катышев ПК Пересецкий АА Эконометрика Начальный курс Изд 1-4

М Дело 1997-2000 (МКП) 2 Econometric Views 40 Users Guide Quantitative Micro Software LLC 3 Greene WH Econometric Analysis Prentice Hall int 1993 4 Kennedy P A Guide to Econometrics MIT Press 1992

Интернет-ресурсы 1 httpeconlseacukie (И-1) 2 httpwwwoupcomukbesttextbookseconomicsdougherty2e (И-2) 3 httpwwwworthpublisherscommankiw (И-3) 4 httpwwwrecepru (И-4) Компьютерные программы и массивы данных Основной компьютерной программой используемой в курсе является программа Econometric Views (версии 31 и последующие) Используются также электронные таблицы Excel Для выполнения заданий в классе и домашних заданий используются массивы данных данные курса КрДоугерти в ЛШЭ (данные для оценивания функций заработка по опросу NSLY в США данные о спросе располагаемом доходе и относительных ценах по товарным группам в США за 1959-1994гг - данные имеются на сайте И-1) Данные о погодовой динамике основных макроэкономических показателей в США за 1931-1998гг данные имеются на сайте И-3 Данные о помесячной динамике основных макроэкономических показателей России за 1992-2002гг данные имеются на сайте И-4 Данные об оценках ВНП затрат труда и капитала в экономике СССР за 1928-1987гг Данные о динамике инвестиций и вводе основных производственных фондов в Российской Федерации в 1956-1991гг

Приложение 1 Примеры промежуточных и итоговых экзаменационных работ

Промежуточный экзамен Часть 1 Тесты множественного выбора 30 минут В каждом вопросе обведите цифру номера правильного ответа 1 Если объясняющая переменная x в модели парной линейной регрессии принимает

среднее в выборке значение x =Σxin то 1) наблюдаемая величина зависимой переменной y равна y =Σyin 2) рассчитанная по уравнению регрессии величина зависимой переменной y равна y =Σyin 3) рассчитанная по уравнению регрессии величина зависимой переменной y равна y =Σyin

в среднем но не в каждом конкретном случае 4) равенство y =a+b x свидетельствует об отсутствии корреляции между отклонениями 5) равенство y =a+b x свидетельствует о выполнении условий Гаусса-Маркова 2 В модели парной линейной регрессии при использовании метода наименьших

квадратов верны следующие из перечисленных утверждений I Квадрат коэффициента корреляции между фактическими и теоретическими

значениями зависимой переменной в выборке равен R2 II Квадрат коэффициента корреляции между зависимой переменной и

объясняющей переменной в выборке равен R2 III Доля остаточной (необъясненной) дисперсии зависимой переменной равна R2 1) Только I 2) Только II 3) Только I и III 4) Только I и II 5) I II и III

3 Уравнение Y=α+βk+(1-β)l+u где Y - темп прироста выпуска k - темп прироста затрат капитала и l - темп прироста затрат труда может быть оценено как модель линейной регрессии

1) непосредственно с помощью обычного МНК как зависимость Y от k и l со свободным членом

2) непосредственно с помощью обычного МНК как зависимость Y от k и l без свободного члена

3) как линейную зависимость (Y-k) от (l-k) со свободным членом 4) как линейную зависимость (Y-k) от (l-k) без свободного члена 5) невозможно оценить данную зависимость с помощью обычного МНК

требуется нелинейный МНК 4 В модели множественной линейной регрессии с двумя объясняющими переменными Y=α+β1x1+β2x2+u оценка коэффициента β1 по методу наименьших квадратов для заданной выборки не зависит от 1) наблюденных значений переменной x1 2) наблюденных значений переменной x2 3) наблюденных значений переменной Y 4) значения постоянного члена α

5) ковариации между x1 и Y 5 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 (b) y зависит только от x1 и (c) y зависит только от x2 При оценивании регрессий для каждой из этих моделей величины R2 получились равными R2

a R2b и R2

c соответственно Какое из следующих утверждений верно 1) R2

a = R2b + R2

c 2) R2

a gt R2b + R2

c 3) R2

a = R2b - R2

c 4) R2

a lt R2b + R2

c 5) R2

a может быть больше а может быть меньше чем R2b + R2

c 6 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 без свободного члена (b) y зависит только от x1 со свободным членом и (c) y зависит только от x2 со свободным членом При оценивании регрессий для каждой из этих моделей величины RSS получились равными RSSa RSSb и RSSc соответственно Какое из следующих утверждений верно 1) RSSa gt maxRSSb RSSc 2) RSSa gt RSSb + RSSc 3) RSSa lt minRSSb RSSc 4) RSSa lt RSSb + RSSc 5) RSSa может быть больше а может быть меньше чем RSSb + RSSc

7 В модели множественной линейной регрессии высокая корреляция между двумя объясняющими переменными приводит к

1) смещенности оценок коэффициентов полученных по методу наименьших квадратов

2) несостоятельности оценок коэффициентов полученных по методу наименьших квадратов

3) неэффективности оценок коэффициентов полученных по методу наименьших квадратов

4) значительной дисперсии оценок коэффициентов полученных по методу наименьших квадратов

5) равенству нулю оценок коэффициентов полученных по методу наименьших квадратов

8 Переменная y определяется величинами x1 и x2 и случайным членом u по следующей формуле y = α + β1x1 + β2x2 + u По данным выборки оценено следующее уравнение регрессии 11ˆ xbay += Переменные x1 и x2 положительно коррелированы Величины β1 и β2 положительны

Тогда 1) b1 всегда меньше чем β1 2) b1 всегда больше чем β1 3) оценка b1 смещена в сторону завышения 4) оценка b1 смещена в сторону занижения 5) b1 является несмещенной оценкой β1

9 Введение линейного ограничения на параметры в регрессионную модель 1) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение значимо 2) приводит к значительному сокращению суммы квадратов отклонений если

ограничение значимо 3) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение незначимо 4) приводит к значительному сокращению суммы квадратов отклонений если

ограничение незначимо 5) все перечисленное неверно

10 Тест Голдфелда-Квандта в модели y = α + βx + u используется для 1) обнаружения гетероскедастичности любого вида 2) обнаружения гетероскедастичности вида σui=γ xi 3) обнаружения гетероскедастичности вида σui= δ + γ xi

μ 4) проверки на некоррелированность значений случайного члена между собой 5) проверки на некоррелированность значений случайного члена и объясняющей

переменной

11 Оценена линейная регрессионная зависимость величины заработка респондента y от совокупности факторов (x1x2hellipxn) Исследователь предполагает что величина заработка зависит также от места проживания респондента которое может принадлежать к одному из трех типов крупный город малый город сельская местность Для того чтобы учесть это в модели нужно 1) ввести фиктивную переменную которая может принимать три разных значения 2) ввести фиктивную переменную которая может принимать два разных значения 3) ввести две фиктивные переменные каждая из которых может принимать два

разных значения 4) ввести три фиктивные переменные каждая из которых может принимать два

разных значения 5) ввести две фиктивные переменные каждая из которых может принимать три

разных значения 12 Оценена регрессионная зависимость величины спроса потребителей на VideoCD (VCD) от их дохода (Y) и от уровня цен на VideoCD (Pvcd) в виде log(VCD) = α + β1log(Y) + β2log(Pvcd) + u В выборку включены только те потребители у которых имеется персональный компьютер Далее исследователь предполагает что эластичности спроса на VideoCD по доходу и по цене зависят от наличия у потребителей DVD-проигрывателя Для того чтобы учесть это в модели нужно

1) ввести фиктивную переменную для свободного члена 2) ввести две фиктивные переменные для свободного члена 3) ввести одну общую фиктивную переменную для коэффициентов наклона 4) ввести две фиктивные переменные для коэффициентов наклона 5) ввести две фиктивные переменные по одной для свободного члена и для

коэффициентов наклона

Часть 2 (1 час 30 минут) Ответьте письменно на любые два из следующих трех вопросов 1 Исследователь интересуется факторами определяющими динамику потребления мяса (B) в США в 1960 ndash 1987 годах (фунты в год на душу населения) В качестве факторов он

рассматривает цену P (центы за фунт) и личный располагаемый доход (тысячи долларов в год в расчете на душу населения) Y 11 Вначале он строит модель парной регрессии потребления мяса от личного располагаемого дохода

)111()79(260483377ˆ 2 =sdot+= RYB (1)

В скобках приведены стандартные ошибки Оцените качество модели приведя обоснование своих суждений и выводов на основе t-тестов и F-теста (F-статистику рассчитайте двумя разными способами) Дайте интерпретацию коэффициентов модели 12 Затем он строит парную регрессию по ценам

)1190()874(03011503102ˆ 2 =sdot+= RPB (2)

Дайте интерпретацию коэффициентов модели и выскажите свое суждение о качестве модели 13 Не удовлетворенный полученным результатом исследователь попытался построить модель множественной регрессии одновременно по обоим исследованным факторам

)160()761()0410(6608808911537ˆ 2 =sdotminussdot+= RPYB (3)

Охарактеризуйте значимость отдельных факторов модели и дайте интерпретацию коэффициентов модели В чем причина различия между значениями коэффициентов при величине дохода в моделях (1) и (3) Какое из значений следует считать более правильным и почему 14 Можно ли считать значимым вклад фактора цены в модели (3) по сравнению с моделью (1) Как согласуется Ваш вывод с оценкой значимости модели (2) 15 Скорректированный коэффициент детерминации модели (1) равен 23702 =R тогда как для модели (3) он составляет 6302 =R Поясните смысл скорректированного коэффициента детерминации и прокомментируйте эти числа и различие между ними 16 Наконец исследователь решает использовать логарифмы для всех переменных в уравнении множественной регрессии

)060()1480()410(710)ˆ(340)ˆ(071593)(ˆ 2 =sdotminussdot+= RPLOGYLOGBGLO (4)

Как изменится интерпретация коэффициентов модели (4) по сравнению с моделью (3) Каким видом товара является мясо в соответствии с этой моделью (предмет первой необходимости предмет роскоши нормальное благо худшее благо товар Гиффена и тп) 2 Фирма управляет двумя предприятиями величина месячной прибыли (в сотнях тысяч рублей) которых за год описывается переменными P1 P2 Общая прибыль фирмы P складывается из прибыли обоих предприятий за вычетом некоторых дополнительных постоянных издержек и возможно отчислений из прибыли каждого из предприятий Имеется 13 помесячных наблюдений за полный год и январь следующего года

21 Регрессионная модель зависимости общей прибыли от прибыли предприятий выглядит следующим образом

)590()690)(712(470280109145 2 =sdot+sdot+minus= RPPP

(1)

Дайте содержательную интерпретацию модели Охарактеризуйте значимость каждого из факторов на основе t-статистик и значимость модели в целом на основе F-критерия Там где нужно выполните односторонний тест и объясните причину его использования 22 Как можно объяснить на содержательном уровне очевидное противоречие между значимостью отдельных факторов и значимостью модели в целом (подробно опишите в чем заключается это противоречие) 23 Что выражает различие значений двух коэффициентов при независимых переменных Является ли их соотношение мерой различия вкладов обоих предприятий А мерой различия предельных вкладов предприятий Можно ли принять гипотезу что каждый из факторов входит в уравнение с коэффициентом равным единице 24 Ковариационная матрица для переменных модели выглядит следующим образом

P P1 P2 P 4584986 9997390 9699030 P1 9997390 5753368 2481317 P2 9699030 2481317 7788488

Определите коэффициенты корреляции между переменными модели взятыми попарно Какие дополнительные выводы можно сделать из этих данных 25 Далее была оценена парная регрессия

())112(3801733 2 =sdot+minus= RPP

(2)

Воспользовавшись имеющимися данными рассчитайте коэффициент наклона и стандартную ошибку в модели (2) Рассматривая модель (1) как правильную объясните смещение коэффициента наклона в модели (2) пользуясь ковариационной матрицей 26 Если сгенерировать новую переменную P0=P1+P2 то можно получить следующую регрессионную зависимость

)340()72(450006126 2 =sdot+minus= RPP

(3)

Сравните модель (3) с моделью (1) Сформулируйте введенное линейное ограничение и проверьте его значимость Что можно сказать о наличии общих постоянных издержек а также отчислений от прибыли каждого из предприятий до перечисления в общий фонд 3 Рассматривается зависимость совокупных расходов на косметику в США от совокупного личного располагаемого дохода за 1959-1983 гг С этой целью строится ряд линейных регрессий

31 Уравнение зависимости уровня расходов на косметику от логарифма личного располагаемого дохода получилось следующим

)290()951(950)log(160234 2 =sdot+minus= RDPICOSM

(1)

Дайте интерпретацию модели и ее коэффициентов Запишите уравнение не используя логарифмы 32 Если наоборот взять логарифм только от величины расходов то уравнение принимает вид

)000130()100(83000140770)log( 2 =sdot+= RDPICOSM

(2)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 33 Модель в двойных логарифмах принимает вид

)070()480(900)log(061205)log( 2 =sdot+minus= RDPICOSM

(3)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 34 Если выполнить преобразование Зарембки сформировав новую переменную COSMZ взамен COSM то получим следующее линейное уравнение

)000090()0010(8900010050 2 =sdot+= RDPICOSMZ

(4)

В чем состоит преобразование Зарембки и для чего оно используется 35 Значение суммы квадратов остатков для модели (4) составило 00877 тогда как для модели (3) оно равно 021 Сопоставимы ли значения RSS и R2 в этих двух моделях Можно ли утверждать что одна из моделей имеет преимущество перед другой Приведите статистическое обоснование своего вывода Можно ли выбрать наилучшую из моделей (1)-(4) 36 Известно что альтернативным методом к методу Зарембки является процедура Бокса-Кокса Опишите ее смысл и последовательность действий для рассматриваемого примера

Заключительный экзамен Часть 1 (30 минут) В каждом из 12 вопросов обведите кружком ровно один ответ который вы считаете правильным 1 Укажите среди названных здесь статистических тестов те тесты которые могут

выполняться только для больших выборок I Тест Чоу на неудачу предсказания II Тест Спирмена на ранговую корреляцию III Тест χ2 для LR-статистики при оценивании по методу максимума

правдоподобия IV Тест Дарбина для уравнения с лаговой объясняющей переменной V Тест Голдфелда-Квандта

1) Только II III IV 2) Только II IV 3) Только I III 4) Только IV V 5) Только I II IV

2 Гипотеза о том что случайный член не подвержен автокорреляции первого порядка отвергается в пользу односторонней альтернативной гипотезы о его отрицательной автокоррелированности если 1) статистика Дарбина-Уотсона d близка к 2 2) статистика Дарбина-Уотсона d близка к 1 3) статистика Дарбина-Уотсона d близка к 0 или 4 4) статистика Дарбина-Уотсона d близка к 4 но не к 0 5) статистика Дарбина-Уотсона d близка к 0 но не к 4 3 Переменная yt зависит от переменной xt yt=α+βxt+ut Оценивается зависимость yt от переменной zt yt=a+bzt+et где zt=xt+vt (vt ndash ошибка измерения являющаяся случайной величиной с нулевым математическим ожиданием и постоянной дисперсией) Если истинное значение β равно 04 а теоретическая дисперсия xt в три раза больше теоретической дисперсии vt то предел по вероятности оценки b равен 1) 01 2) 02 3) 0267 4) 03 5) 0333 4 После преобразования Койка модель геометрически распределенного лага yt = α + βxt + βδxt-1 + βδ2xt-2 + βδ3xt-3 ++ ut приобретает вид

1) yt - δyt-1 = α (1-δ) + βxt + ut - δut-1 2) yt = α (1-δ) + βxt + ut - δut-1 3) yt = α + βxt + ut - δut-1 4) yt - δyt-1 = α + βxt-1 + ut-1 5) ни один из перечисленных

5 По 39 точкам оценена следующая формула производственной функции в которой отдельно рассмотрены две составляющие затрат основного капитала K1 - здания и сооружения и K2 - машины и оборудование а также две составляющие затрат труда L1 - затраты квалифицированного труда и L2 - затраты неквалифицированного труда Y ndash выпуск ln(Y)=-43 + 035ln(K1) + 026ln(K2) + 063ln(L1) + 058ln(L2) R2 =092 DW=174 (14) (003) (005) (041) (038) (в скобках приведены стандартные ошибки коэффициентов) Какой из выводов и дальнейших шагов представляется Вам верным 1) Нужно исключить фактор L (переменные L1 и L2) тк он оказался незначимым 2) Имеет место мультиколлинеарность поэтому нужно объединить факторы K1 и K2 3) Имеет место мультиколлинеарность поэтому нужно объединить факторы L1 и L2 4) Отклонения ei автокоррелированы нужно изменить формулу зависимости 5) Формула зависимости приемлема по всем приведенным параметрам и изменения не

нужны

6 Эконометрическая модель описана следующими уравнениями (1) y1 = α + βy2 + γx1 + ϕx2 + u1 (2) y2 = δ + τx1 + λx2 + u2 где y1 и y2 ndash эндогенные переменные x1 и x2 ndash экзогенные переменные и u1 и u2 ndash случайные члены удовлетворяющие условиям Гаусса-Маркова Выберите неверное утверждение

1) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут несмещенными

2) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут несмещенными

3) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут состоятельными

4) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут состоятельными

5) косвенный метод наименьших квадратов позволяет получить несмещенные оценки коэффициентов обоих уравнений

7 Дана следующая макроэкономическая модель Y = C + I + G - макроэкономическое тождество C = a + bY - функция потребления I = d ndash emiddotR-1 + fY - функция инвестиций (MP) = gY ndash hR - уравнение денежного рынка где эндогенными переменными являются доход Y потребление C инвестиции I и процентная ставка R Переменные G (государственные расходы) и (MP) (реальная денежная масса) ndash экзогенные Выберите верное утверждение из следующих 1) функция инвестиций неидентифицируема 2) функция потребления неидентифицируема 3) функция потребления однозначно идентифицируема 4) функция инвестиций однозначно идентифицируема 5) функция инвестиций сверхидентифицируема

8 Коэффициент Тейла в виде 2

p+T2

p+T

2p+Tp+T

ym1y

m1

)y - y(m1

=UΣ+Σ

Σ

ˆ

ˆ позволяет сравнить качество

сделанного на период (T+1hellipT+m) прогноза pTy +ˆ с качеством следующего прогноза 1) pTy +ˆ =0 для всех p=1hellipm 2) pTy +ˆ =yT для всех p=1hellipm 3)прогнозом по линейной функции оцененной за период (1hellipT) 4) прогнозом по экспоненте оцененной за период (1hellipT) 5) прогнозом по логарифмической функции оцененной за период (1hellipT)

9 Введение фиктивных переменных DT+p p=1hellipm при прогнозировании (DT+p=1 при t=T+p DT+p=0 при всех других t) позволяет

I Рассчитать ошибки предсказания для t=T+1hellip T+m II Рассчитать стандартные ошибки предсказания для t=T+1hellip T+m

III Выполнить F-тест на стабильность коэффициентов

1) Верно только I 2) Верно только II 3) Верно только I и II 4) Верно только I и III 5) Верно I II и III 10 При оценивании линейной регрессии по методу максимума правдоподобия оценки коэффициентов совпадают с полученными по МНК при следующих условиях 1) всегда 2) если случайный член нормально распределен и выполнены условия Гаусса-Маркова 3) если случайный член нормально распределен независимо от выполнения условий

Гаусса-Маркова 4) если случайный член не автокоррелирован при любом его распределении 5) вообще говоря эти оценки не совпадают независимо от выполнения условий Гаусса-

Маркова и распределения случайного члена 11 Логит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-1196+0169ASVABC Вероятность получения академической степени (Degree=1) при ASVABC=60 равна

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) 1690))6016909611exp(1(

)6016909611exp(2 sdotsdot+minus+

sdotminus

3) (1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus)0169

4) 2))6016909611exp(1()6016909611exp(

sdot+minus+sdotminus

5) ))6016909611(21exp(

21 2sdotminusminusπ

12 Пробит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-5787+00782ASVABC Увеличение вероятности p(Degreei=1) при увеличении ASVABC на один пункт при ASVABC=60 равно здесь

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) ))60078207875(21exp(

21 2sdotminusminusπ

3) 07820))60078207875(21exp(

21 2 sdotsdotminusminusπ

4) F(-5787+0078260) где F ndash функция стандартного нормального распределения 5) F(-5787+0078260)00782 где F ndash функция стандартного нормального

распределения Часть 2 (1 час 30 минут) Ответьте письменно на два из трех следующих вопросов

1 Исследователь располагает данными о продолжительности обучения респондента HGC результатах теста на познавательные способности ASVABC и о продолжительности обучения матери респондента HGCM для выборки 570 индивидов Он предполагает что продолжительность обучения респондента зависит как от результатов теста на познавательные способности так и от продолжительности обучения матери респондента

uHGCMASVABCHGC +++= 21 ββα (11) и что познавательные способности в свою очередь являются функцией успехов в учебе

vHGCASVBC ++= 1δγ (12) 1a [2 балла] Объясните разницу между структурными уравнениями и уравнениями в приведенной форме в модели одновременных уравнений 1b [2 балла] Выведите приведенную форму уравнения для HGC 1c [6 баллов] Выведите выражение для смещения (для больших выборок) оценки 1δ предполагая что уравнение (12) было оценено обычным методом наименьших квадратов и определите вероятное направление смещения 1d [3 балла] Объясните почему HGCM может быть использована в качестве инструмента для HGC во втором уравнении 1e [6 баллов] Продемонстрируйте что оценка метода инструментальных переменных для

1δ использующая в качестве инструмента HGCM является состоятельной предполагая что модель корректно определена 1f [6 баллов] Предположим теперь что корректной спецификацией второго уравнения является

vHGCMHGCASVBC ++++= 21 δδγ (13) Продемонстрируйте что оценка метода инструментальных переменных для 1δ будет несостоятельной выведите смещение для случая большой выборки и установите его направление (Указание учтите что приведенная форма уравнения для HGC в этом случае изменится)

2а [8 баллов] Случайная переменная принимает два возможных значения 0 и 1 с неизвестной вероятностью p того что она равна 1 В выборке имеется всего три наблюдения первое наблюдение равно 1 второе также 1 а третье равно 0 Выведите оценку максимального правдоподобия для p Следующая информация относится к остальным вопросам этого задания Переменная WORKING определена равной 1 если респондент имеет работу и равной 0 в противном случае Для оценивания зависимости переменной WORKING от уровня образования респондента HGC (продолжительность обучения респондента) был использован метод логит-анализа Исследование было выполнено отдельно для мужчин и женщин (в приведенных ниже результатах расчетов первая таблица соответствует женщинам а вторая ndash мужчинам указание на число проведенных итераций не приводится) logit working hgc if male=0 Logit Estimates Number of obs = 2726

chi2(l) = 7042 Prob gt chi2 = 00000

Log Likelihood = ndash15865519 Pseudo R2 = 00217 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 1511872 0186177 8121 0000 1146971 1876773 cons 1 ndash1049543 2448064 ndash4287 0000 ndash1529355 ndash5697314 logit working hgc if male=1 Logit Estimates Number of obs = 2573

chi2(l) = 7503 Prob gt chi2 = 00000

Log Likelihood = ndash80265424 Pseudo R2 = 00446 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 2499295 0306482 8155 0000 1898601 3099989 cons 1 ndash9670268 ndash3775658 ndash2561 0010 ndash1707042 ndash2270113 95 процентов респондентов имеют значение HGC в диапазоне 9-18 лет со средним значением HGC равным 133 и 132 лет для женщин и мужчин соответственно Исходя из логит-анализа предельный эффект HGC на вероятность наличия работы в среднем оценивается как 0030 и 0020 для женщин и мужчин соответственно Оценка регрессии метода наименьших квадратов WORKING по HGC дает коэффициент наклона 0029 и 0020 для женщин и мужчин соответственно Логистическая функция F(z) и ее производная f(z) даются выражениями

izezF minus+

=1

1)( и 2)1()( z

z

eezf minus

minus

+=

где z является линейной функцией характеристик респондента На графиках (см следующую страницу) представлены вероятность наличия работы и предельное влияние HGC на вероятность наличия работы для мужчин и женщин

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 7: Эконометрика

в том числе Лекции Практические

занятия

работа

1 Введение в эконометрику 12 2 2 8 2 Модель парной линейной регрессии (ЛР)

Свойства оценок в модели парной ЛР 24 4 4 16

3 Преобразования переменных в регрессионном анализе

12 2 2 8

4 Модель множественной линейной регрессии (МЛР) две объясняющие переменные и k объясняющих переменных

24 4 4 16

5 Спецификация модели линейной регрессии 24 4 4 16 6 Гетероскедастичность 12 2 2 8 7 Автокоррелированность случайного члена 12 2 2 8 8 Фиктивные переменные 12 2 2 8 9 Стохастические объясняющие переменные 12 2 2 8 10 Системы одновременных уравнений 24 4 4 16 11 Моделирование с использованием данных

временных рядов Модели динамических процессов Прогнозирование

24 4 4 16

12 Модели двоичного выбора модели с ограничениями для зависимой переменной и оценивание по методу максимума правдоподобия

24 4 4 16

ИТОГО 216 36 36 144 IV Формы промежуточного и итогового контроля Студенты сдают промежуточный письменный экзамен а также итоговый письменный экзамен в конце семестра Каждый экзамен включает вопросы множественного выбора и открытые вопросы (примеры экзаменационных работ прилагаются) Итоговый экзамен дает 50 конечной оценки промежуточный экзамен - 30 конечной оценки соответственно 20 дается за выполнение домашних заданий и работу на занятиях V Учебно-методическое обеспечение курса Основная литература 1 Dougherty Christopher Introduction to Econometrics Oxford University Press 1992 (1st

edition CD-1) 2002 (2nd edition CD-2) Доугерти Кр Введение в эконометрику Изд1 М ИНФРА-М 1997 1999 Изд2 М ИНФРА-М 2003 (готовится к выходу)

2 Dougherty Christopher Elements of econometrics and economic statistics Study Guide University of London 2002

3 Замков ОО Эконометрические методы в макроэкономическом анализе М ГУ-ВШЭ 2001 (на русском языке) Диалог-МГУ 1999 (на русском и английском языках) (ОЗ)

Дополнительная литература 1 Магнус ЯР Катышев ПК Пересецкий АА Эконометрика Начальный курс Изд 1-4

М Дело 1997-2000 (МКП) 2 Econometric Views 40 Users Guide Quantitative Micro Software LLC 3 Greene WH Econometric Analysis Prentice Hall int 1993 4 Kennedy P A Guide to Econometrics MIT Press 1992

Интернет-ресурсы 1 httpeconlseacukie (И-1) 2 httpwwwoupcomukbesttextbookseconomicsdougherty2e (И-2) 3 httpwwwworthpublisherscommankiw (И-3) 4 httpwwwrecepru (И-4) Компьютерные программы и массивы данных Основной компьютерной программой используемой в курсе является программа Econometric Views (версии 31 и последующие) Используются также электронные таблицы Excel Для выполнения заданий в классе и домашних заданий используются массивы данных данные курса КрДоугерти в ЛШЭ (данные для оценивания функций заработка по опросу NSLY в США данные о спросе располагаемом доходе и относительных ценах по товарным группам в США за 1959-1994гг - данные имеются на сайте И-1) Данные о погодовой динамике основных макроэкономических показателей в США за 1931-1998гг данные имеются на сайте И-3 Данные о помесячной динамике основных макроэкономических показателей России за 1992-2002гг данные имеются на сайте И-4 Данные об оценках ВНП затрат труда и капитала в экономике СССР за 1928-1987гг Данные о динамике инвестиций и вводе основных производственных фондов в Российской Федерации в 1956-1991гг

Приложение 1 Примеры промежуточных и итоговых экзаменационных работ

Промежуточный экзамен Часть 1 Тесты множественного выбора 30 минут В каждом вопросе обведите цифру номера правильного ответа 1 Если объясняющая переменная x в модели парной линейной регрессии принимает

среднее в выборке значение x =Σxin то 1) наблюдаемая величина зависимой переменной y равна y =Σyin 2) рассчитанная по уравнению регрессии величина зависимой переменной y равна y =Σyin 3) рассчитанная по уравнению регрессии величина зависимой переменной y равна y =Σyin

в среднем но не в каждом конкретном случае 4) равенство y =a+b x свидетельствует об отсутствии корреляции между отклонениями 5) равенство y =a+b x свидетельствует о выполнении условий Гаусса-Маркова 2 В модели парной линейной регрессии при использовании метода наименьших

квадратов верны следующие из перечисленных утверждений I Квадрат коэффициента корреляции между фактическими и теоретическими

значениями зависимой переменной в выборке равен R2 II Квадрат коэффициента корреляции между зависимой переменной и

объясняющей переменной в выборке равен R2 III Доля остаточной (необъясненной) дисперсии зависимой переменной равна R2 1) Только I 2) Только II 3) Только I и III 4) Только I и II 5) I II и III

3 Уравнение Y=α+βk+(1-β)l+u где Y - темп прироста выпуска k - темп прироста затрат капитала и l - темп прироста затрат труда может быть оценено как модель линейной регрессии

1) непосредственно с помощью обычного МНК как зависимость Y от k и l со свободным членом

2) непосредственно с помощью обычного МНК как зависимость Y от k и l без свободного члена

3) как линейную зависимость (Y-k) от (l-k) со свободным членом 4) как линейную зависимость (Y-k) от (l-k) без свободного члена 5) невозможно оценить данную зависимость с помощью обычного МНК

требуется нелинейный МНК 4 В модели множественной линейной регрессии с двумя объясняющими переменными Y=α+β1x1+β2x2+u оценка коэффициента β1 по методу наименьших квадратов для заданной выборки не зависит от 1) наблюденных значений переменной x1 2) наблюденных значений переменной x2 3) наблюденных значений переменной Y 4) значения постоянного члена α

5) ковариации между x1 и Y 5 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 (b) y зависит только от x1 и (c) y зависит только от x2 При оценивании регрессий для каждой из этих моделей величины R2 получились равными R2

a R2b и R2

c соответственно Какое из следующих утверждений верно 1) R2

a = R2b + R2

c 2) R2

a gt R2b + R2

c 3) R2

a = R2b - R2

c 4) R2

a lt R2b + R2

c 5) R2

a может быть больше а может быть меньше чем R2b + R2

c 6 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 без свободного члена (b) y зависит только от x1 со свободным членом и (c) y зависит только от x2 со свободным членом При оценивании регрессий для каждой из этих моделей величины RSS получились равными RSSa RSSb и RSSc соответственно Какое из следующих утверждений верно 1) RSSa gt maxRSSb RSSc 2) RSSa gt RSSb + RSSc 3) RSSa lt minRSSb RSSc 4) RSSa lt RSSb + RSSc 5) RSSa может быть больше а может быть меньше чем RSSb + RSSc

7 В модели множественной линейной регрессии высокая корреляция между двумя объясняющими переменными приводит к

1) смещенности оценок коэффициентов полученных по методу наименьших квадратов

2) несостоятельности оценок коэффициентов полученных по методу наименьших квадратов

3) неэффективности оценок коэффициентов полученных по методу наименьших квадратов

4) значительной дисперсии оценок коэффициентов полученных по методу наименьших квадратов

5) равенству нулю оценок коэффициентов полученных по методу наименьших квадратов

8 Переменная y определяется величинами x1 и x2 и случайным членом u по следующей формуле y = α + β1x1 + β2x2 + u По данным выборки оценено следующее уравнение регрессии 11ˆ xbay += Переменные x1 и x2 положительно коррелированы Величины β1 и β2 положительны

Тогда 1) b1 всегда меньше чем β1 2) b1 всегда больше чем β1 3) оценка b1 смещена в сторону завышения 4) оценка b1 смещена в сторону занижения 5) b1 является несмещенной оценкой β1

9 Введение линейного ограничения на параметры в регрессионную модель 1) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение значимо 2) приводит к значительному сокращению суммы квадратов отклонений если

ограничение значимо 3) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение незначимо 4) приводит к значительному сокращению суммы квадратов отклонений если

ограничение незначимо 5) все перечисленное неверно

10 Тест Голдфелда-Квандта в модели y = α + βx + u используется для 1) обнаружения гетероскедастичности любого вида 2) обнаружения гетероскедастичности вида σui=γ xi 3) обнаружения гетероскедастичности вида σui= δ + γ xi

μ 4) проверки на некоррелированность значений случайного члена между собой 5) проверки на некоррелированность значений случайного члена и объясняющей

переменной

11 Оценена линейная регрессионная зависимость величины заработка респондента y от совокупности факторов (x1x2hellipxn) Исследователь предполагает что величина заработка зависит также от места проживания респондента которое может принадлежать к одному из трех типов крупный город малый город сельская местность Для того чтобы учесть это в модели нужно 1) ввести фиктивную переменную которая может принимать три разных значения 2) ввести фиктивную переменную которая может принимать два разных значения 3) ввести две фиктивные переменные каждая из которых может принимать два

разных значения 4) ввести три фиктивные переменные каждая из которых может принимать два

разных значения 5) ввести две фиктивные переменные каждая из которых может принимать три

разных значения 12 Оценена регрессионная зависимость величины спроса потребителей на VideoCD (VCD) от их дохода (Y) и от уровня цен на VideoCD (Pvcd) в виде log(VCD) = α + β1log(Y) + β2log(Pvcd) + u В выборку включены только те потребители у которых имеется персональный компьютер Далее исследователь предполагает что эластичности спроса на VideoCD по доходу и по цене зависят от наличия у потребителей DVD-проигрывателя Для того чтобы учесть это в модели нужно

1) ввести фиктивную переменную для свободного члена 2) ввести две фиктивные переменные для свободного члена 3) ввести одну общую фиктивную переменную для коэффициентов наклона 4) ввести две фиктивные переменные для коэффициентов наклона 5) ввести две фиктивные переменные по одной для свободного члена и для

коэффициентов наклона

Часть 2 (1 час 30 минут) Ответьте письменно на любые два из следующих трех вопросов 1 Исследователь интересуется факторами определяющими динамику потребления мяса (B) в США в 1960 ndash 1987 годах (фунты в год на душу населения) В качестве факторов он

рассматривает цену P (центы за фунт) и личный располагаемый доход (тысячи долларов в год в расчете на душу населения) Y 11 Вначале он строит модель парной регрессии потребления мяса от личного располагаемого дохода

)111()79(260483377ˆ 2 =sdot+= RYB (1)

В скобках приведены стандартные ошибки Оцените качество модели приведя обоснование своих суждений и выводов на основе t-тестов и F-теста (F-статистику рассчитайте двумя разными способами) Дайте интерпретацию коэффициентов модели 12 Затем он строит парную регрессию по ценам

)1190()874(03011503102ˆ 2 =sdot+= RPB (2)

Дайте интерпретацию коэффициентов модели и выскажите свое суждение о качестве модели 13 Не удовлетворенный полученным результатом исследователь попытался построить модель множественной регрессии одновременно по обоим исследованным факторам

)160()761()0410(6608808911537ˆ 2 =sdotminussdot+= RPYB (3)

Охарактеризуйте значимость отдельных факторов модели и дайте интерпретацию коэффициентов модели В чем причина различия между значениями коэффициентов при величине дохода в моделях (1) и (3) Какое из значений следует считать более правильным и почему 14 Можно ли считать значимым вклад фактора цены в модели (3) по сравнению с моделью (1) Как согласуется Ваш вывод с оценкой значимости модели (2) 15 Скорректированный коэффициент детерминации модели (1) равен 23702 =R тогда как для модели (3) он составляет 6302 =R Поясните смысл скорректированного коэффициента детерминации и прокомментируйте эти числа и различие между ними 16 Наконец исследователь решает использовать логарифмы для всех переменных в уравнении множественной регрессии

)060()1480()410(710)ˆ(340)ˆ(071593)(ˆ 2 =sdotminussdot+= RPLOGYLOGBGLO (4)

Как изменится интерпретация коэффициентов модели (4) по сравнению с моделью (3) Каким видом товара является мясо в соответствии с этой моделью (предмет первой необходимости предмет роскоши нормальное благо худшее благо товар Гиффена и тп) 2 Фирма управляет двумя предприятиями величина месячной прибыли (в сотнях тысяч рублей) которых за год описывается переменными P1 P2 Общая прибыль фирмы P складывается из прибыли обоих предприятий за вычетом некоторых дополнительных постоянных издержек и возможно отчислений из прибыли каждого из предприятий Имеется 13 помесячных наблюдений за полный год и январь следующего года

21 Регрессионная модель зависимости общей прибыли от прибыли предприятий выглядит следующим образом

)590()690)(712(470280109145 2 =sdot+sdot+minus= RPPP

(1)

Дайте содержательную интерпретацию модели Охарактеризуйте значимость каждого из факторов на основе t-статистик и значимость модели в целом на основе F-критерия Там где нужно выполните односторонний тест и объясните причину его использования 22 Как можно объяснить на содержательном уровне очевидное противоречие между значимостью отдельных факторов и значимостью модели в целом (подробно опишите в чем заключается это противоречие) 23 Что выражает различие значений двух коэффициентов при независимых переменных Является ли их соотношение мерой различия вкладов обоих предприятий А мерой различия предельных вкладов предприятий Можно ли принять гипотезу что каждый из факторов входит в уравнение с коэффициентом равным единице 24 Ковариационная матрица для переменных модели выглядит следующим образом

P P1 P2 P 4584986 9997390 9699030 P1 9997390 5753368 2481317 P2 9699030 2481317 7788488

Определите коэффициенты корреляции между переменными модели взятыми попарно Какие дополнительные выводы можно сделать из этих данных 25 Далее была оценена парная регрессия

())112(3801733 2 =sdot+minus= RPP

(2)

Воспользовавшись имеющимися данными рассчитайте коэффициент наклона и стандартную ошибку в модели (2) Рассматривая модель (1) как правильную объясните смещение коэффициента наклона в модели (2) пользуясь ковариационной матрицей 26 Если сгенерировать новую переменную P0=P1+P2 то можно получить следующую регрессионную зависимость

)340()72(450006126 2 =sdot+minus= RPP

(3)

Сравните модель (3) с моделью (1) Сформулируйте введенное линейное ограничение и проверьте его значимость Что можно сказать о наличии общих постоянных издержек а также отчислений от прибыли каждого из предприятий до перечисления в общий фонд 3 Рассматривается зависимость совокупных расходов на косметику в США от совокупного личного располагаемого дохода за 1959-1983 гг С этой целью строится ряд линейных регрессий

31 Уравнение зависимости уровня расходов на косметику от логарифма личного располагаемого дохода получилось следующим

)290()951(950)log(160234 2 =sdot+minus= RDPICOSM

(1)

Дайте интерпретацию модели и ее коэффициентов Запишите уравнение не используя логарифмы 32 Если наоборот взять логарифм только от величины расходов то уравнение принимает вид

)000130()100(83000140770)log( 2 =sdot+= RDPICOSM

(2)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 33 Модель в двойных логарифмах принимает вид

)070()480(900)log(061205)log( 2 =sdot+minus= RDPICOSM

(3)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 34 Если выполнить преобразование Зарембки сформировав новую переменную COSMZ взамен COSM то получим следующее линейное уравнение

)000090()0010(8900010050 2 =sdot+= RDPICOSMZ

(4)

В чем состоит преобразование Зарембки и для чего оно используется 35 Значение суммы квадратов остатков для модели (4) составило 00877 тогда как для модели (3) оно равно 021 Сопоставимы ли значения RSS и R2 в этих двух моделях Можно ли утверждать что одна из моделей имеет преимущество перед другой Приведите статистическое обоснование своего вывода Можно ли выбрать наилучшую из моделей (1)-(4) 36 Известно что альтернативным методом к методу Зарембки является процедура Бокса-Кокса Опишите ее смысл и последовательность действий для рассматриваемого примера

Заключительный экзамен Часть 1 (30 минут) В каждом из 12 вопросов обведите кружком ровно один ответ который вы считаете правильным 1 Укажите среди названных здесь статистических тестов те тесты которые могут

выполняться только для больших выборок I Тест Чоу на неудачу предсказания II Тест Спирмена на ранговую корреляцию III Тест χ2 для LR-статистики при оценивании по методу максимума

правдоподобия IV Тест Дарбина для уравнения с лаговой объясняющей переменной V Тест Голдфелда-Квандта

1) Только II III IV 2) Только II IV 3) Только I III 4) Только IV V 5) Только I II IV

2 Гипотеза о том что случайный член не подвержен автокорреляции первого порядка отвергается в пользу односторонней альтернативной гипотезы о его отрицательной автокоррелированности если 1) статистика Дарбина-Уотсона d близка к 2 2) статистика Дарбина-Уотсона d близка к 1 3) статистика Дарбина-Уотсона d близка к 0 или 4 4) статистика Дарбина-Уотсона d близка к 4 но не к 0 5) статистика Дарбина-Уотсона d близка к 0 но не к 4 3 Переменная yt зависит от переменной xt yt=α+βxt+ut Оценивается зависимость yt от переменной zt yt=a+bzt+et где zt=xt+vt (vt ndash ошибка измерения являющаяся случайной величиной с нулевым математическим ожиданием и постоянной дисперсией) Если истинное значение β равно 04 а теоретическая дисперсия xt в три раза больше теоретической дисперсии vt то предел по вероятности оценки b равен 1) 01 2) 02 3) 0267 4) 03 5) 0333 4 После преобразования Койка модель геометрически распределенного лага yt = α + βxt + βδxt-1 + βδ2xt-2 + βδ3xt-3 ++ ut приобретает вид

1) yt - δyt-1 = α (1-δ) + βxt + ut - δut-1 2) yt = α (1-δ) + βxt + ut - δut-1 3) yt = α + βxt + ut - δut-1 4) yt - δyt-1 = α + βxt-1 + ut-1 5) ни один из перечисленных

5 По 39 точкам оценена следующая формула производственной функции в которой отдельно рассмотрены две составляющие затрат основного капитала K1 - здания и сооружения и K2 - машины и оборудование а также две составляющие затрат труда L1 - затраты квалифицированного труда и L2 - затраты неквалифицированного труда Y ndash выпуск ln(Y)=-43 + 035ln(K1) + 026ln(K2) + 063ln(L1) + 058ln(L2) R2 =092 DW=174 (14) (003) (005) (041) (038) (в скобках приведены стандартные ошибки коэффициентов) Какой из выводов и дальнейших шагов представляется Вам верным 1) Нужно исключить фактор L (переменные L1 и L2) тк он оказался незначимым 2) Имеет место мультиколлинеарность поэтому нужно объединить факторы K1 и K2 3) Имеет место мультиколлинеарность поэтому нужно объединить факторы L1 и L2 4) Отклонения ei автокоррелированы нужно изменить формулу зависимости 5) Формула зависимости приемлема по всем приведенным параметрам и изменения не

нужны

6 Эконометрическая модель описана следующими уравнениями (1) y1 = α + βy2 + γx1 + ϕx2 + u1 (2) y2 = δ + τx1 + λx2 + u2 где y1 и y2 ndash эндогенные переменные x1 и x2 ndash экзогенные переменные и u1 и u2 ndash случайные члены удовлетворяющие условиям Гаусса-Маркова Выберите неверное утверждение

1) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут несмещенными

2) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут несмещенными

3) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут состоятельными

4) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут состоятельными

5) косвенный метод наименьших квадратов позволяет получить несмещенные оценки коэффициентов обоих уравнений

7 Дана следующая макроэкономическая модель Y = C + I + G - макроэкономическое тождество C = a + bY - функция потребления I = d ndash emiddotR-1 + fY - функция инвестиций (MP) = gY ndash hR - уравнение денежного рынка где эндогенными переменными являются доход Y потребление C инвестиции I и процентная ставка R Переменные G (государственные расходы) и (MP) (реальная денежная масса) ndash экзогенные Выберите верное утверждение из следующих 1) функция инвестиций неидентифицируема 2) функция потребления неидентифицируема 3) функция потребления однозначно идентифицируема 4) функция инвестиций однозначно идентифицируема 5) функция инвестиций сверхидентифицируема

8 Коэффициент Тейла в виде 2

p+T2

p+T

2p+Tp+T

ym1y

m1

)y - y(m1

=UΣ+Σ

Σ

ˆ

ˆ позволяет сравнить качество

сделанного на период (T+1hellipT+m) прогноза pTy +ˆ с качеством следующего прогноза 1) pTy +ˆ =0 для всех p=1hellipm 2) pTy +ˆ =yT для всех p=1hellipm 3)прогнозом по линейной функции оцененной за период (1hellipT) 4) прогнозом по экспоненте оцененной за период (1hellipT) 5) прогнозом по логарифмической функции оцененной за период (1hellipT)

9 Введение фиктивных переменных DT+p p=1hellipm при прогнозировании (DT+p=1 при t=T+p DT+p=0 при всех других t) позволяет

I Рассчитать ошибки предсказания для t=T+1hellip T+m II Рассчитать стандартные ошибки предсказания для t=T+1hellip T+m

III Выполнить F-тест на стабильность коэффициентов

1) Верно только I 2) Верно только II 3) Верно только I и II 4) Верно только I и III 5) Верно I II и III 10 При оценивании линейной регрессии по методу максимума правдоподобия оценки коэффициентов совпадают с полученными по МНК при следующих условиях 1) всегда 2) если случайный член нормально распределен и выполнены условия Гаусса-Маркова 3) если случайный член нормально распределен независимо от выполнения условий

Гаусса-Маркова 4) если случайный член не автокоррелирован при любом его распределении 5) вообще говоря эти оценки не совпадают независимо от выполнения условий Гаусса-

Маркова и распределения случайного члена 11 Логит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-1196+0169ASVABC Вероятность получения академической степени (Degree=1) при ASVABC=60 равна

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) 1690))6016909611exp(1(

)6016909611exp(2 sdotsdot+minus+

sdotminus

3) (1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus)0169

4) 2))6016909611exp(1()6016909611exp(

sdot+minus+sdotminus

5) ))6016909611(21exp(

21 2sdotminusminusπ

12 Пробит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-5787+00782ASVABC Увеличение вероятности p(Degreei=1) при увеличении ASVABC на один пункт при ASVABC=60 равно здесь

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) ))60078207875(21exp(

21 2sdotminusminusπ

3) 07820))60078207875(21exp(

21 2 sdotsdotminusminusπ

4) F(-5787+0078260) где F ndash функция стандартного нормального распределения 5) F(-5787+0078260)00782 где F ndash функция стандартного нормального

распределения Часть 2 (1 час 30 минут) Ответьте письменно на два из трех следующих вопросов

1 Исследователь располагает данными о продолжительности обучения респондента HGC результатах теста на познавательные способности ASVABC и о продолжительности обучения матери респондента HGCM для выборки 570 индивидов Он предполагает что продолжительность обучения респондента зависит как от результатов теста на познавательные способности так и от продолжительности обучения матери респондента

uHGCMASVABCHGC +++= 21 ββα (11) и что познавательные способности в свою очередь являются функцией успехов в учебе

vHGCASVBC ++= 1δγ (12) 1a [2 балла] Объясните разницу между структурными уравнениями и уравнениями в приведенной форме в модели одновременных уравнений 1b [2 балла] Выведите приведенную форму уравнения для HGC 1c [6 баллов] Выведите выражение для смещения (для больших выборок) оценки 1δ предполагая что уравнение (12) было оценено обычным методом наименьших квадратов и определите вероятное направление смещения 1d [3 балла] Объясните почему HGCM может быть использована в качестве инструмента для HGC во втором уравнении 1e [6 баллов] Продемонстрируйте что оценка метода инструментальных переменных для

1δ использующая в качестве инструмента HGCM является состоятельной предполагая что модель корректно определена 1f [6 баллов] Предположим теперь что корректной спецификацией второго уравнения является

vHGCMHGCASVBC ++++= 21 δδγ (13) Продемонстрируйте что оценка метода инструментальных переменных для 1δ будет несостоятельной выведите смещение для случая большой выборки и установите его направление (Указание учтите что приведенная форма уравнения для HGC в этом случае изменится)

2а [8 баллов] Случайная переменная принимает два возможных значения 0 и 1 с неизвестной вероятностью p того что она равна 1 В выборке имеется всего три наблюдения первое наблюдение равно 1 второе также 1 а третье равно 0 Выведите оценку максимального правдоподобия для p Следующая информация относится к остальным вопросам этого задания Переменная WORKING определена равной 1 если респондент имеет работу и равной 0 в противном случае Для оценивания зависимости переменной WORKING от уровня образования респондента HGC (продолжительность обучения респондента) был использован метод логит-анализа Исследование было выполнено отдельно для мужчин и женщин (в приведенных ниже результатах расчетов первая таблица соответствует женщинам а вторая ndash мужчинам указание на число проведенных итераций не приводится) logit working hgc if male=0 Logit Estimates Number of obs = 2726

chi2(l) = 7042 Prob gt chi2 = 00000

Log Likelihood = ndash15865519 Pseudo R2 = 00217 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 1511872 0186177 8121 0000 1146971 1876773 cons 1 ndash1049543 2448064 ndash4287 0000 ndash1529355 ndash5697314 logit working hgc if male=1 Logit Estimates Number of obs = 2573

chi2(l) = 7503 Prob gt chi2 = 00000

Log Likelihood = ndash80265424 Pseudo R2 = 00446 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 2499295 0306482 8155 0000 1898601 3099989 cons 1 ndash9670268 ndash3775658 ndash2561 0010 ndash1707042 ndash2270113 95 процентов респондентов имеют значение HGC в диапазоне 9-18 лет со средним значением HGC равным 133 и 132 лет для женщин и мужчин соответственно Исходя из логит-анализа предельный эффект HGC на вероятность наличия работы в среднем оценивается как 0030 и 0020 для женщин и мужчин соответственно Оценка регрессии метода наименьших квадратов WORKING по HGC дает коэффициент наклона 0029 и 0020 для женщин и мужчин соответственно Логистическая функция F(z) и ее производная f(z) даются выражениями

izezF minus+

=1

1)( и 2)1()( z

z

eezf minus

minus

+=

где z является линейной функцией характеристик респондента На графиках (см следующую страницу) представлены вероятность наличия работы и предельное влияние HGC на вероятность наличия работы для мужчин и женщин

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 8: Эконометрика

Интернет-ресурсы 1 httpeconlseacukie (И-1) 2 httpwwwoupcomukbesttextbookseconomicsdougherty2e (И-2) 3 httpwwwworthpublisherscommankiw (И-3) 4 httpwwwrecepru (И-4) Компьютерные программы и массивы данных Основной компьютерной программой используемой в курсе является программа Econometric Views (версии 31 и последующие) Используются также электронные таблицы Excel Для выполнения заданий в классе и домашних заданий используются массивы данных данные курса КрДоугерти в ЛШЭ (данные для оценивания функций заработка по опросу NSLY в США данные о спросе располагаемом доходе и относительных ценах по товарным группам в США за 1959-1994гг - данные имеются на сайте И-1) Данные о погодовой динамике основных макроэкономических показателей в США за 1931-1998гг данные имеются на сайте И-3 Данные о помесячной динамике основных макроэкономических показателей России за 1992-2002гг данные имеются на сайте И-4 Данные об оценках ВНП затрат труда и капитала в экономике СССР за 1928-1987гг Данные о динамике инвестиций и вводе основных производственных фондов в Российской Федерации в 1956-1991гг

Приложение 1 Примеры промежуточных и итоговых экзаменационных работ

Промежуточный экзамен Часть 1 Тесты множественного выбора 30 минут В каждом вопросе обведите цифру номера правильного ответа 1 Если объясняющая переменная x в модели парной линейной регрессии принимает

среднее в выборке значение x =Σxin то 1) наблюдаемая величина зависимой переменной y равна y =Σyin 2) рассчитанная по уравнению регрессии величина зависимой переменной y равна y =Σyin 3) рассчитанная по уравнению регрессии величина зависимой переменной y равна y =Σyin

в среднем но не в каждом конкретном случае 4) равенство y =a+b x свидетельствует об отсутствии корреляции между отклонениями 5) равенство y =a+b x свидетельствует о выполнении условий Гаусса-Маркова 2 В модели парной линейной регрессии при использовании метода наименьших

квадратов верны следующие из перечисленных утверждений I Квадрат коэффициента корреляции между фактическими и теоретическими

значениями зависимой переменной в выборке равен R2 II Квадрат коэффициента корреляции между зависимой переменной и

объясняющей переменной в выборке равен R2 III Доля остаточной (необъясненной) дисперсии зависимой переменной равна R2 1) Только I 2) Только II 3) Только I и III 4) Только I и II 5) I II и III

3 Уравнение Y=α+βk+(1-β)l+u где Y - темп прироста выпуска k - темп прироста затрат капитала и l - темп прироста затрат труда может быть оценено как модель линейной регрессии

1) непосредственно с помощью обычного МНК как зависимость Y от k и l со свободным членом

2) непосредственно с помощью обычного МНК как зависимость Y от k и l без свободного члена

3) как линейную зависимость (Y-k) от (l-k) со свободным членом 4) как линейную зависимость (Y-k) от (l-k) без свободного члена 5) невозможно оценить данную зависимость с помощью обычного МНК

требуется нелинейный МНК 4 В модели множественной линейной регрессии с двумя объясняющими переменными Y=α+β1x1+β2x2+u оценка коэффициента β1 по методу наименьших квадратов для заданной выборки не зависит от 1) наблюденных значений переменной x1 2) наблюденных значений переменной x2 3) наблюденных значений переменной Y 4) значения постоянного члена α

5) ковариации между x1 и Y 5 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 (b) y зависит только от x1 и (c) y зависит только от x2 При оценивании регрессий для каждой из этих моделей величины R2 получились равными R2

a R2b и R2

c соответственно Какое из следующих утверждений верно 1) R2

a = R2b + R2

c 2) R2

a gt R2b + R2

c 3) R2

a = R2b - R2

c 4) R2

a lt R2b + R2

c 5) R2

a может быть больше а может быть меньше чем R2b + R2

c 6 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 без свободного члена (b) y зависит только от x1 со свободным членом и (c) y зависит только от x2 со свободным членом При оценивании регрессий для каждой из этих моделей величины RSS получились равными RSSa RSSb и RSSc соответственно Какое из следующих утверждений верно 1) RSSa gt maxRSSb RSSc 2) RSSa gt RSSb + RSSc 3) RSSa lt minRSSb RSSc 4) RSSa lt RSSb + RSSc 5) RSSa может быть больше а может быть меньше чем RSSb + RSSc

7 В модели множественной линейной регрессии высокая корреляция между двумя объясняющими переменными приводит к

1) смещенности оценок коэффициентов полученных по методу наименьших квадратов

2) несостоятельности оценок коэффициентов полученных по методу наименьших квадратов

3) неэффективности оценок коэффициентов полученных по методу наименьших квадратов

4) значительной дисперсии оценок коэффициентов полученных по методу наименьших квадратов

5) равенству нулю оценок коэффициентов полученных по методу наименьших квадратов

8 Переменная y определяется величинами x1 и x2 и случайным членом u по следующей формуле y = α + β1x1 + β2x2 + u По данным выборки оценено следующее уравнение регрессии 11ˆ xbay += Переменные x1 и x2 положительно коррелированы Величины β1 и β2 положительны

Тогда 1) b1 всегда меньше чем β1 2) b1 всегда больше чем β1 3) оценка b1 смещена в сторону завышения 4) оценка b1 смещена в сторону занижения 5) b1 является несмещенной оценкой β1

9 Введение линейного ограничения на параметры в регрессионную модель 1) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение значимо 2) приводит к значительному сокращению суммы квадратов отклонений если

ограничение значимо 3) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение незначимо 4) приводит к значительному сокращению суммы квадратов отклонений если

ограничение незначимо 5) все перечисленное неверно

10 Тест Голдфелда-Квандта в модели y = α + βx + u используется для 1) обнаружения гетероскедастичности любого вида 2) обнаружения гетероскедастичности вида σui=γ xi 3) обнаружения гетероскедастичности вида σui= δ + γ xi

μ 4) проверки на некоррелированность значений случайного члена между собой 5) проверки на некоррелированность значений случайного члена и объясняющей

переменной

11 Оценена линейная регрессионная зависимость величины заработка респондента y от совокупности факторов (x1x2hellipxn) Исследователь предполагает что величина заработка зависит также от места проживания респондента которое может принадлежать к одному из трех типов крупный город малый город сельская местность Для того чтобы учесть это в модели нужно 1) ввести фиктивную переменную которая может принимать три разных значения 2) ввести фиктивную переменную которая может принимать два разных значения 3) ввести две фиктивные переменные каждая из которых может принимать два

разных значения 4) ввести три фиктивные переменные каждая из которых может принимать два

разных значения 5) ввести две фиктивные переменные каждая из которых может принимать три

разных значения 12 Оценена регрессионная зависимость величины спроса потребителей на VideoCD (VCD) от их дохода (Y) и от уровня цен на VideoCD (Pvcd) в виде log(VCD) = α + β1log(Y) + β2log(Pvcd) + u В выборку включены только те потребители у которых имеется персональный компьютер Далее исследователь предполагает что эластичности спроса на VideoCD по доходу и по цене зависят от наличия у потребителей DVD-проигрывателя Для того чтобы учесть это в модели нужно

1) ввести фиктивную переменную для свободного члена 2) ввести две фиктивные переменные для свободного члена 3) ввести одну общую фиктивную переменную для коэффициентов наклона 4) ввести две фиктивные переменные для коэффициентов наклона 5) ввести две фиктивные переменные по одной для свободного члена и для

коэффициентов наклона

Часть 2 (1 час 30 минут) Ответьте письменно на любые два из следующих трех вопросов 1 Исследователь интересуется факторами определяющими динамику потребления мяса (B) в США в 1960 ndash 1987 годах (фунты в год на душу населения) В качестве факторов он

рассматривает цену P (центы за фунт) и личный располагаемый доход (тысячи долларов в год в расчете на душу населения) Y 11 Вначале он строит модель парной регрессии потребления мяса от личного располагаемого дохода

)111()79(260483377ˆ 2 =sdot+= RYB (1)

В скобках приведены стандартные ошибки Оцените качество модели приведя обоснование своих суждений и выводов на основе t-тестов и F-теста (F-статистику рассчитайте двумя разными способами) Дайте интерпретацию коэффициентов модели 12 Затем он строит парную регрессию по ценам

)1190()874(03011503102ˆ 2 =sdot+= RPB (2)

Дайте интерпретацию коэффициентов модели и выскажите свое суждение о качестве модели 13 Не удовлетворенный полученным результатом исследователь попытался построить модель множественной регрессии одновременно по обоим исследованным факторам

)160()761()0410(6608808911537ˆ 2 =sdotminussdot+= RPYB (3)

Охарактеризуйте значимость отдельных факторов модели и дайте интерпретацию коэффициентов модели В чем причина различия между значениями коэффициентов при величине дохода в моделях (1) и (3) Какое из значений следует считать более правильным и почему 14 Можно ли считать значимым вклад фактора цены в модели (3) по сравнению с моделью (1) Как согласуется Ваш вывод с оценкой значимости модели (2) 15 Скорректированный коэффициент детерминации модели (1) равен 23702 =R тогда как для модели (3) он составляет 6302 =R Поясните смысл скорректированного коэффициента детерминации и прокомментируйте эти числа и различие между ними 16 Наконец исследователь решает использовать логарифмы для всех переменных в уравнении множественной регрессии

)060()1480()410(710)ˆ(340)ˆ(071593)(ˆ 2 =sdotminussdot+= RPLOGYLOGBGLO (4)

Как изменится интерпретация коэффициентов модели (4) по сравнению с моделью (3) Каким видом товара является мясо в соответствии с этой моделью (предмет первой необходимости предмет роскоши нормальное благо худшее благо товар Гиффена и тп) 2 Фирма управляет двумя предприятиями величина месячной прибыли (в сотнях тысяч рублей) которых за год описывается переменными P1 P2 Общая прибыль фирмы P складывается из прибыли обоих предприятий за вычетом некоторых дополнительных постоянных издержек и возможно отчислений из прибыли каждого из предприятий Имеется 13 помесячных наблюдений за полный год и январь следующего года

21 Регрессионная модель зависимости общей прибыли от прибыли предприятий выглядит следующим образом

)590()690)(712(470280109145 2 =sdot+sdot+minus= RPPP

(1)

Дайте содержательную интерпретацию модели Охарактеризуйте значимость каждого из факторов на основе t-статистик и значимость модели в целом на основе F-критерия Там где нужно выполните односторонний тест и объясните причину его использования 22 Как можно объяснить на содержательном уровне очевидное противоречие между значимостью отдельных факторов и значимостью модели в целом (подробно опишите в чем заключается это противоречие) 23 Что выражает различие значений двух коэффициентов при независимых переменных Является ли их соотношение мерой различия вкладов обоих предприятий А мерой различия предельных вкладов предприятий Можно ли принять гипотезу что каждый из факторов входит в уравнение с коэффициентом равным единице 24 Ковариационная матрица для переменных модели выглядит следующим образом

P P1 P2 P 4584986 9997390 9699030 P1 9997390 5753368 2481317 P2 9699030 2481317 7788488

Определите коэффициенты корреляции между переменными модели взятыми попарно Какие дополнительные выводы можно сделать из этих данных 25 Далее была оценена парная регрессия

())112(3801733 2 =sdot+minus= RPP

(2)

Воспользовавшись имеющимися данными рассчитайте коэффициент наклона и стандартную ошибку в модели (2) Рассматривая модель (1) как правильную объясните смещение коэффициента наклона в модели (2) пользуясь ковариационной матрицей 26 Если сгенерировать новую переменную P0=P1+P2 то можно получить следующую регрессионную зависимость

)340()72(450006126 2 =sdot+minus= RPP

(3)

Сравните модель (3) с моделью (1) Сформулируйте введенное линейное ограничение и проверьте его значимость Что можно сказать о наличии общих постоянных издержек а также отчислений от прибыли каждого из предприятий до перечисления в общий фонд 3 Рассматривается зависимость совокупных расходов на косметику в США от совокупного личного располагаемого дохода за 1959-1983 гг С этой целью строится ряд линейных регрессий

31 Уравнение зависимости уровня расходов на косметику от логарифма личного располагаемого дохода получилось следующим

)290()951(950)log(160234 2 =sdot+minus= RDPICOSM

(1)

Дайте интерпретацию модели и ее коэффициентов Запишите уравнение не используя логарифмы 32 Если наоборот взять логарифм только от величины расходов то уравнение принимает вид

)000130()100(83000140770)log( 2 =sdot+= RDPICOSM

(2)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 33 Модель в двойных логарифмах принимает вид

)070()480(900)log(061205)log( 2 =sdot+minus= RDPICOSM

(3)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 34 Если выполнить преобразование Зарембки сформировав новую переменную COSMZ взамен COSM то получим следующее линейное уравнение

)000090()0010(8900010050 2 =sdot+= RDPICOSMZ

(4)

В чем состоит преобразование Зарембки и для чего оно используется 35 Значение суммы квадратов остатков для модели (4) составило 00877 тогда как для модели (3) оно равно 021 Сопоставимы ли значения RSS и R2 в этих двух моделях Можно ли утверждать что одна из моделей имеет преимущество перед другой Приведите статистическое обоснование своего вывода Можно ли выбрать наилучшую из моделей (1)-(4) 36 Известно что альтернативным методом к методу Зарембки является процедура Бокса-Кокса Опишите ее смысл и последовательность действий для рассматриваемого примера

Заключительный экзамен Часть 1 (30 минут) В каждом из 12 вопросов обведите кружком ровно один ответ который вы считаете правильным 1 Укажите среди названных здесь статистических тестов те тесты которые могут

выполняться только для больших выборок I Тест Чоу на неудачу предсказания II Тест Спирмена на ранговую корреляцию III Тест χ2 для LR-статистики при оценивании по методу максимума

правдоподобия IV Тест Дарбина для уравнения с лаговой объясняющей переменной V Тест Голдфелда-Квандта

1) Только II III IV 2) Только II IV 3) Только I III 4) Только IV V 5) Только I II IV

2 Гипотеза о том что случайный член не подвержен автокорреляции первого порядка отвергается в пользу односторонней альтернативной гипотезы о его отрицательной автокоррелированности если 1) статистика Дарбина-Уотсона d близка к 2 2) статистика Дарбина-Уотсона d близка к 1 3) статистика Дарбина-Уотсона d близка к 0 или 4 4) статистика Дарбина-Уотсона d близка к 4 но не к 0 5) статистика Дарбина-Уотсона d близка к 0 но не к 4 3 Переменная yt зависит от переменной xt yt=α+βxt+ut Оценивается зависимость yt от переменной zt yt=a+bzt+et где zt=xt+vt (vt ndash ошибка измерения являющаяся случайной величиной с нулевым математическим ожиданием и постоянной дисперсией) Если истинное значение β равно 04 а теоретическая дисперсия xt в три раза больше теоретической дисперсии vt то предел по вероятности оценки b равен 1) 01 2) 02 3) 0267 4) 03 5) 0333 4 После преобразования Койка модель геометрически распределенного лага yt = α + βxt + βδxt-1 + βδ2xt-2 + βδ3xt-3 ++ ut приобретает вид

1) yt - δyt-1 = α (1-δ) + βxt + ut - δut-1 2) yt = α (1-δ) + βxt + ut - δut-1 3) yt = α + βxt + ut - δut-1 4) yt - δyt-1 = α + βxt-1 + ut-1 5) ни один из перечисленных

5 По 39 точкам оценена следующая формула производственной функции в которой отдельно рассмотрены две составляющие затрат основного капитала K1 - здания и сооружения и K2 - машины и оборудование а также две составляющие затрат труда L1 - затраты квалифицированного труда и L2 - затраты неквалифицированного труда Y ndash выпуск ln(Y)=-43 + 035ln(K1) + 026ln(K2) + 063ln(L1) + 058ln(L2) R2 =092 DW=174 (14) (003) (005) (041) (038) (в скобках приведены стандартные ошибки коэффициентов) Какой из выводов и дальнейших шагов представляется Вам верным 1) Нужно исключить фактор L (переменные L1 и L2) тк он оказался незначимым 2) Имеет место мультиколлинеарность поэтому нужно объединить факторы K1 и K2 3) Имеет место мультиколлинеарность поэтому нужно объединить факторы L1 и L2 4) Отклонения ei автокоррелированы нужно изменить формулу зависимости 5) Формула зависимости приемлема по всем приведенным параметрам и изменения не

нужны

6 Эконометрическая модель описана следующими уравнениями (1) y1 = α + βy2 + γx1 + ϕx2 + u1 (2) y2 = δ + τx1 + λx2 + u2 где y1 и y2 ndash эндогенные переменные x1 и x2 ndash экзогенные переменные и u1 и u2 ndash случайные члены удовлетворяющие условиям Гаусса-Маркова Выберите неверное утверждение

1) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут несмещенными

2) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут несмещенными

3) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут состоятельными

4) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут состоятельными

5) косвенный метод наименьших квадратов позволяет получить несмещенные оценки коэффициентов обоих уравнений

7 Дана следующая макроэкономическая модель Y = C + I + G - макроэкономическое тождество C = a + bY - функция потребления I = d ndash emiddotR-1 + fY - функция инвестиций (MP) = gY ndash hR - уравнение денежного рынка где эндогенными переменными являются доход Y потребление C инвестиции I и процентная ставка R Переменные G (государственные расходы) и (MP) (реальная денежная масса) ndash экзогенные Выберите верное утверждение из следующих 1) функция инвестиций неидентифицируема 2) функция потребления неидентифицируема 3) функция потребления однозначно идентифицируема 4) функция инвестиций однозначно идентифицируема 5) функция инвестиций сверхидентифицируема

8 Коэффициент Тейла в виде 2

p+T2

p+T

2p+Tp+T

ym1y

m1

)y - y(m1

=UΣ+Σ

Σ

ˆ

ˆ позволяет сравнить качество

сделанного на период (T+1hellipT+m) прогноза pTy +ˆ с качеством следующего прогноза 1) pTy +ˆ =0 для всех p=1hellipm 2) pTy +ˆ =yT для всех p=1hellipm 3)прогнозом по линейной функции оцененной за период (1hellipT) 4) прогнозом по экспоненте оцененной за период (1hellipT) 5) прогнозом по логарифмической функции оцененной за период (1hellipT)

9 Введение фиктивных переменных DT+p p=1hellipm при прогнозировании (DT+p=1 при t=T+p DT+p=0 при всех других t) позволяет

I Рассчитать ошибки предсказания для t=T+1hellip T+m II Рассчитать стандартные ошибки предсказания для t=T+1hellip T+m

III Выполнить F-тест на стабильность коэффициентов

1) Верно только I 2) Верно только II 3) Верно только I и II 4) Верно только I и III 5) Верно I II и III 10 При оценивании линейной регрессии по методу максимума правдоподобия оценки коэффициентов совпадают с полученными по МНК при следующих условиях 1) всегда 2) если случайный член нормально распределен и выполнены условия Гаусса-Маркова 3) если случайный член нормально распределен независимо от выполнения условий

Гаусса-Маркова 4) если случайный член не автокоррелирован при любом его распределении 5) вообще говоря эти оценки не совпадают независимо от выполнения условий Гаусса-

Маркова и распределения случайного члена 11 Логит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-1196+0169ASVABC Вероятность получения академической степени (Degree=1) при ASVABC=60 равна

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) 1690))6016909611exp(1(

)6016909611exp(2 sdotsdot+minus+

sdotminus

3) (1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus)0169

4) 2))6016909611exp(1()6016909611exp(

sdot+minus+sdotminus

5) ))6016909611(21exp(

21 2sdotminusminusπ

12 Пробит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-5787+00782ASVABC Увеличение вероятности p(Degreei=1) при увеличении ASVABC на один пункт при ASVABC=60 равно здесь

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) ))60078207875(21exp(

21 2sdotminusminusπ

3) 07820))60078207875(21exp(

21 2 sdotsdotminusminusπ

4) F(-5787+0078260) где F ndash функция стандартного нормального распределения 5) F(-5787+0078260)00782 где F ndash функция стандартного нормального

распределения Часть 2 (1 час 30 минут) Ответьте письменно на два из трех следующих вопросов

1 Исследователь располагает данными о продолжительности обучения респондента HGC результатах теста на познавательные способности ASVABC и о продолжительности обучения матери респондента HGCM для выборки 570 индивидов Он предполагает что продолжительность обучения респондента зависит как от результатов теста на познавательные способности так и от продолжительности обучения матери респондента

uHGCMASVABCHGC +++= 21 ββα (11) и что познавательные способности в свою очередь являются функцией успехов в учебе

vHGCASVBC ++= 1δγ (12) 1a [2 балла] Объясните разницу между структурными уравнениями и уравнениями в приведенной форме в модели одновременных уравнений 1b [2 балла] Выведите приведенную форму уравнения для HGC 1c [6 баллов] Выведите выражение для смещения (для больших выборок) оценки 1δ предполагая что уравнение (12) было оценено обычным методом наименьших квадратов и определите вероятное направление смещения 1d [3 балла] Объясните почему HGCM может быть использована в качестве инструмента для HGC во втором уравнении 1e [6 баллов] Продемонстрируйте что оценка метода инструментальных переменных для

1δ использующая в качестве инструмента HGCM является состоятельной предполагая что модель корректно определена 1f [6 баллов] Предположим теперь что корректной спецификацией второго уравнения является

vHGCMHGCASVBC ++++= 21 δδγ (13) Продемонстрируйте что оценка метода инструментальных переменных для 1δ будет несостоятельной выведите смещение для случая большой выборки и установите его направление (Указание учтите что приведенная форма уравнения для HGC в этом случае изменится)

2а [8 баллов] Случайная переменная принимает два возможных значения 0 и 1 с неизвестной вероятностью p того что она равна 1 В выборке имеется всего три наблюдения первое наблюдение равно 1 второе также 1 а третье равно 0 Выведите оценку максимального правдоподобия для p Следующая информация относится к остальным вопросам этого задания Переменная WORKING определена равной 1 если респондент имеет работу и равной 0 в противном случае Для оценивания зависимости переменной WORKING от уровня образования респондента HGC (продолжительность обучения респондента) был использован метод логит-анализа Исследование было выполнено отдельно для мужчин и женщин (в приведенных ниже результатах расчетов первая таблица соответствует женщинам а вторая ndash мужчинам указание на число проведенных итераций не приводится) logit working hgc if male=0 Logit Estimates Number of obs = 2726

chi2(l) = 7042 Prob gt chi2 = 00000

Log Likelihood = ndash15865519 Pseudo R2 = 00217 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 1511872 0186177 8121 0000 1146971 1876773 cons 1 ndash1049543 2448064 ndash4287 0000 ndash1529355 ndash5697314 logit working hgc if male=1 Logit Estimates Number of obs = 2573

chi2(l) = 7503 Prob gt chi2 = 00000

Log Likelihood = ndash80265424 Pseudo R2 = 00446 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 2499295 0306482 8155 0000 1898601 3099989 cons 1 ndash9670268 ndash3775658 ndash2561 0010 ndash1707042 ndash2270113 95 процентов респондентов имеют значение HGC в диапазоне 9-18 лет со средним значением HGC равным 133 и 132 лет для женщин и мужчин соответственно Исходя из логит-анализа предельный эффект HGC на вероятность наличия работы в среднем оценивается как 0030 и 0020 для женщин и мужчин соответственно Оценка регрессии метода наименьших квадратов WORKING по HGC дает коэффициент наклона 0029 и 0020 для женщин и мужчин соответственно Логистическая функция F(z) и ее производная f(z) даются выражениями

izezF minus+

=1

1)( и 2)1()( z

z

eezf minus

minus

+=

где z является линейной функцией характеристик респондента На графиках (см следующую страницу) представлены вероятность наличия работы и предельное влияние HGC на вероятность наличия работы для мужчин и женщин

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 9: Эконометрика

Приложение 1 Примеры промежуточных и итоговых экзаменационных работ

Промежуточный экзамен Часть 1 Тесты множественного выбора 30 минут В каждом вопросе обведите цифру номера правильного ответа 1 Если объясняющая переменная x в модели парной линейной регрессии принимает

среднее в выборке значение x =Σxin то 1) наблюдаемая величина зависимой переменной y равна y =Σyin 2) рассчитанная по уравнению регрессии величина зависимой переменной y равна y =Σyin 3) рассчитанная по уравнению регрессии величина зависимой переменной y равна y =Σyin

в среднем но не в каждом конкретном случае 4) равенство y =a+b x свидетельствует об отсутствии корреляции между отклонениями 5) равенство y =a+b x свидетельствует о выполнении условий Гаусса-Маркова 2 В модели парной линейной регрессии при использовании метода наименьших

квадратов верны следующие из перечисленных утверждений I Квадрат коэффициента корреляции между фактическими и теоретическими

значениями зависимой переменной в выборке равен R2 II Квадрат коэффициента корреляции между зависимой переменной и

объясняющей переменной в выборке равен R2 III Доля остаточной (необъясненной) дисперсии зависимой переменной равна R2 1) Только I 2) Только II 3) Только I и III 4) Только I и II 5) I II и III

3 Уравнение Y=α+βk+(1-β)l+u где Y - темп прироста выпуска k - темп прироста затрат капитала и l - темп прироста затрат труда может быть оценено как модель линейной регрессии

1) непосредственно с помощью обычного МНК как зависимость Y от k и l со свободным членом

2) непосредственно с помощью обычного МНК как зависимость Y от k и l без свободного члена

3) как линейную зависимость (Y-k) от (l-k) со свободным членом 4) как линейную зависимость (Y-k) от (l-k) без свободного члена 5) невозможно оценить данную зависимость с помощью обычного МНК

требуется нелинейный МНК 4 В модели множественной линейной регрессии с двумя объясняющими переменными Y=α+β1x1+β2x2+u оценка коэффициента β1 по методу наименьших квадратов для заданной выборки не зависит от 1) наблюденных значений переменной x1 2) наблюденных значений переменной x2 3) наблюденных значений переменной Y 4) значения постоянного члена α

5) ковариации между x1 и Y 5 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 (b) y зависит только от x1 и (c) y зависит только от x2 При оценивании регрессий для каждой из этих моделей величины R2 получились равными R2

a R2b и R2

c соответственно Какое из следующих утверждений верно 1) R2

a = R2b + R2

c 2) R2

a gt R2b + R2

c 3) R2

a = R2b - R2

c 4) R2

a lt R2b + R2

c 5) R2

a может быть больше а может быть меньше чем R2b + R2

c 6 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 без свободного члена (b) y зависит только от x1 со свободным членом и (c) y зависит только от x2 со свободным членом При оценивании регрессий для каждой из этих моделей величины RSS получились равными RSSa RSSb и RSSc соответственно Какое из следующих утверждений верно 1) RSSa gt maxRSSb RSSc 2) RSSa gt RSSb + RSSc 3) RSSa lt minRSSb RSSc 4) RSSa lt RSSb + RSSc 5) RSSa может быть больше а может быть меньше чем RSSb + RSSc

7 В модели множественной линейной регрессии высокая корреляция между двумя объясняющими переменными приводит к

1) смещенности оценок коэффициентов полученных по методу наименьших квадратов

2) несостоятельности оценок коэффициентов полученных по методу наименьших квадратов

3) неэффективности оценок коэффициентов полученных по методу наименьших квадратов

4) значительной дисперсии оценок коэффициентов полученных по методу наименьших квадратов

5) равенству нулю оценок коэффициентов полученных по методу наименьших квадратов

8 Переменная y определяется величинами x1 и x2 и случайным членом u по следующей формуле y = α + β1x1 + β2x2 + u По данным выборки оценено следующее уравнение регрессии 11ˆ xbay += Переменные x1 и x2 положительно коррелированы Величины β1 и β2 положительны

Тогда 1) b1 всегда меньше чем β1 2) b1 всегда больше чем β1 3) оценка b1 смещена в сторону завышения 4) оценка b1 смещена в сторону занижения 5) b1 является несмещенной оценкой β1

9 Введение линейного ограничения на параметры в регрессионную модель 1) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение значимо 2) приводит к значительному сокращению суммы квадратов отклонений если

ограничение значимо 3) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение незначимо 4) приводит к значительному сокращению суммы квадратов отклонений если

ограничение незначимо 5) все перечисленное неверно

10 Тест Голдфелда-Квандта в модели y = α + βx + u используется для 1) обнаружения гетероскедастичности любого вида 2) обнаружения гетероскедастичности вида σui=γ xi 3) обнаружения гетероскедастичности вида σui= δ + γ xi

μ 4) проверки на некоррелированность значений случайного члена между собой 5) проверки на некоррелированность значений случайного члена и объясняющей

переменной

11 Оценена линейная регрессионная зависимость величины заработка респондента y от совокупности факторов (x1x2hellipxn) Исследователь предполагает что величина заработка зависит также от места проживания респондента которое может принадлежать к одному из трех типов крупный город малый город сельская местность Для того чтобы учесть это в модели нужно 1) ввести фиктивную переменную которая может принимать три разных значения 2) ввести фиктивную переменную которая может принимать два разных значения 3) ввести две фиктивные переменные каждая из которых может принимать два

разных значения 4) ввести три фиктивные переменные каждая из которых может принимать два

разных значения 5) ввести две фиктивные переменные каждая из которых может принимать три

разных значения 12 Оценена регрессионная зависимость величины спроса потребителей на VideoCD (VCD) от их дохода (Y) и от уровня цен на VideoCD (Pvcd) в виде log(VCD) = α + β1log(Y) + β2log(Pvcd) + u В выборку включены только те потребители у которых имеется персональный компьютер Далее исследователь предполагает что эластичности спроса на VideoCD по доходу и по цене зависят от наличия у потребителей DVD-проигрывателя Для того чтобы учесть это в модели нужно

1) ввести фиктивную переменную для свободного члена 2) ввести две фиктивные переменные для свободного члена 3) ввести одну общую фиктивную переменную для коэффициентов наклона 4) ввести две фиктивные переменные для коэффициентов наклона 5) ввести две фиктивные переменные по одной для свободного члена и для

коэффициентов наклона

Часть 2 (1 час 30 минут) Ответьте письменно на любые два из следующих трех вопросов 1 Исследователь интересуется факторами определяющими динамику потребления мяса (B) в США в 1960 ndash 1987 годах (фунты в год на душу населения) В качестве факторов он

рассматривает цену P (центы за фунт) и личный располагаемый доход (тысячи долларов в год в расчете на душу населения) Y 11 Вначале он строит модель парной регрессии потребления мяса от личного располагаемого дохода

)111()79(260483377ˆ 2 =sdot+= RYB (1)

В скобках приведены стандартные ошибки Оцените качество модели приведя обоснование своих суждений и выводов на основе t-тестов и F-теста (F-статистику рассчитайте двумя разными способами) Дайте интерпретацию коэффициентов модели 12 Затем он строит парную регрессию по ценам

)1190()874(03011503102ˆ 2 =sdot+= RPB (2)

Дайте интерпретацию коэффициентов модели и выскажите свое суждение о качестве модели 13 Не удовлетворенный полученным результатом исследователь попытался построить модель множественной регрессии одновременно по обоим исследованным факторам

)160()761()0410(6608808911537ˆ 2 =sdotminussdot+= RPYB (3)

Охарактеризуйте значимость отдельных факторов модели и дайте интерпретацию коэффициентов модели В чем причина различия между значениями коэффициентов при величине дохода в моделях (1) и (3) Какое из значений следует считать более правильным и почему 14 Можно ли считать значимым вклад фактора цены в модели (3) по сравнению с моделью (1) Как согласуется Ваш вывод с оценкой значимости модели (2) 15 Скорректированный коэффициент детерминации модели (1) равен 23702 =R тогда как для модели (3) он составляет 6302 =R Поясните смысл скорректированного коэффициента детерминации и прокомментируйте эти числа и различие между ними 16 Наконец исследователь решает использовать логарифмы для всех переменных в уравнении множественной регрессии

)060()1480()410(710)ˆ(340)ˆ(071593)(ˆ 2 =sdotminussdot+= RPLOGYLOGBGLO (4)

Как изменится интерпретация коэффициентов модели (4) по сравнению с моделью (3) Каким видом товара является мясо в соответствии с этой моделью (предмет первой необходимости предмет роскоши нормальное благо худшее благо товар Гиффена и тп) 2 Фирма управляет двумя предприятиями величина месячной прибыли (в сотнях тысяч рублей) которых за год описывается переменными P1 P2 Общая прибыль фирмы P складывается из прибыли обоих предприятий за вычетом некоторых дополнительных постоянных издержек и возможно отчислений из прибыли каждого из предприятий Имеется 13 помесячных наблюдений за полный год и январь следующего года

21 Регрессионная модель зависимости общей прибыли от прибыли предприятий выглядит следующим образом

)590()690)(712(470280109145 2 =sdot+sdot+minus= RPPP

(1)

Дайте содержательную интерпретацию модели Охарактеризуйте значимость каждого из факторов на основе t-статистик и значимость модели в целом на основе F-критерия Там где нужно выполните односторонний тест и объясните причину его использования 22 Как можно объяснить на содержательном уровне очевидное противоречие между значимостью отдельных факторов и значимостью модели в целом (подробно опишите в чем заключается это противоречие) 23 Что выражает различие значений двух коэффициентов при независимых переменных Является ли их соотношение мерой различия вкладов обоих предприятий А мерой различия предельных вкладов предприятий Можно ли принять гипотезу что каждый из факторов входит в уравнение с коэффициентом равным единице 24 Ковариационная матрица для переменных модели выглядит следующим образом

P P1 P2 P 4584986 9997390 9699030 P1 9997390 5753368 2481317 P2 9699030 2481317 7788488

Определите коэффициенты корреляции между переменными модели взятыми попарно Какие дополнительные выводы можно сделать из этих данных 25 Далее была оценена парная регрессия

())112(3801733 2 =sdot+minus= RPP

(2)

Воспользовавшись имеющимися данными рассчитайте коэффициент наклона и стандартную ошибку в модели (2) Рассматривая модель (1) как правильную объясните смещение коэффициента наклона в модели (2) пользуясь ковариационной матрицей 26 Если сгенерировать новую переменную P0=P1+P2 то можно получить следующую регрессионную зависимость

)340()72(450006126 2 =sdot+minus= RPP

(3)

Сравните модель (3) с моделью (1) Сформулируйте введенное линейное ограничение и проверьте его значимость Что можно сказать о наличии общих постоянных издержек а также отчислений от прибыли каждого из предприятий до перечисления в общий фонд 3 Рассматривается зависимость совокупных расходов на косметику в США от совокупного личного располагаемого дохода за 1959-1983 гг С этой целью строится ряд линейных регрессий

31 Уравнение зависимости уровня расходов на косметику от логарифма личного располагаемого дохода получилось следующим

)290()951(950)log(160234 2 =sdot+minus= RDPICOSM

(1)

Дайте интерпретацию модели и ее коэффициентов Запишите уравнение не используя логарифмы 32 Если наоборот взять логарифм только от величины расходов то уравнение принимает вид

)000130()100(83000140770)log( 2 =sdot+= RDPICOSM

(2)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 33 Модель в двойных логарифмах принимает вид

)070()480(900)log(061205)log( 2 =sdot+minus= RDPICOSM

(3)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 34 Если выполнить преобразование Зарембки сформировав новую переменную COSMZ взамен COSM то получим следующее линейное уравнение

)000090()0010(8900010050 2 =sdot+= RDPICOSMZ

(4)

В чем состоит преобразование Зарембки и для чего оно используется 35 Значение суммы квадратов остатков для модели (4) составило 00877 тогда как для модели (3) оно равно 021 Сопоставимы ли значения RSS и R2 в этих двух моделях Можно ли утверждать что одна из моделей имеет преимущество перед другой Приведите статистическое обоснование своего вывода Можно ли выбрать наилучшую из моделей (1)-(4) 36 Известно что альтернативным методом к методу Зарембки является процедура Бокса-Кокса Опишите ее смысл и последовательность действий для рассматриваемого примера

Заключительный экзамен Часть 1 (30 минут) В каждом из 12 вопросов обведите кружком ровно один ответ который вы считаете правильным 1 Укажите среди названных здесь статистических тестов те тесты которые могут

выполняться только для больших выборок I Тест Чоу на неудачу предсказания II Тест Спирмена на ранговую корреляцию III Тест χ2 для LR-статистики при оценивании по методу максимума

правдоподобия IV Тест Дарбина для уравнения с лаговой объясняющей переменной V Тест Голдфелда-Квандта

1) Только II III IV 2) Только II IV 3) Только I III 4) Только IV V 5) Только I II IV

2 Гипотеза о том что случайный член не подвержен автокорреляции первого порядка отвергается в пользу односторонней альтернативной гипотезы о его отрицательной автокоррелированности если 1) статистика Дарбина-Уотсона d близка к 2 2) статистика Дарбина-Уотсона d близка к 1 3) статистика Дарбина-Уотсона d близка к 0 или 4 4) статистика Дарбина-Уотсона d близка к 4 но не к 0 5) статистика Дарбина-Уотсона d близка к 0 но не к 4 3 Переменная yt зависит от переменной xt yt=α+βxt+ut Оценивается зависимость yt от переменной zt yt=a+bzt+et где zt=xt+vt (vt ndash ошибка измерения являющаяся случайной величиной с нулевым математическим ожиданием и постоянной дисперсией) Если истинное значение β равно 04 а теоретическая дисперсия xt в три раза больше теоретической дисперсии vt то предел по вероятности оценки b равен 1) 01 2) 02 3) 0267 4) 03 5) 0333 4 После преобразования Койка модель геометрически распределенного лага yt = α + βxt + βδxt-1 + βδ2xt-2 + βδ3xt-3 ++ ut приобретает вид

1) yt - δyt-1 = α (1-δ) + βxt + ut - δut-1 2) yt = α (1-δ) + βxt + ut - δut-1 3) yt = α + βxt + ut - δut-1 4) yt - δyt-1 = α + βxt-1 + ut-1 5) ни один из перечисленных

5 По 39 точкам оценена следующая формула производственной функции в которой отдельно рассмотрены две составляющие затрат основного капитала K1 - здания и сооружения и K2 - машины и оборудование а также две составляющие затрат труда L1 - затраты квалифицированного труда и L2 - затраты неквалифицированного труда Y ndash выпуск ln(Y)=-43 + 035ln(K1) + 026ln(K2) + 063ln(L1) + 058ln(L2) R2 =092 DW=174 (14) (003) (005) (041) (038) (в скобках приведены стандартные ошибки коэффициентов) Какой из выводов и дальнейших шагов представляется Вам верным 1) Нужно исключить фактор L (переменные L1 и L2) тк он оказался незначимым 2) Имеет место мультиколлинеарность поэтому нужно объединить факторы K1 и K2 3) Имеет место мультиколлинеарность поэтому нужно объединить факторы L1 и L2 4) Отклонения ei автокоррелированы нужно изменить формулу зависимости 5) Формула зависимости приемлема по всем приведенным параметрам и изменения не

нужны

6 Эконометрическая модель описана следующими уравнениями (1) y1 = α + βy2 + γx1 + ϕx2 + u1 (2) y2 = δ + τx1 + λx2 + u2 где y1 и y2 ndash эндогенные переменные x1 и x2 ndash экзогенные переменные и u1 и u2 ndash случайные члены удовлетворяющие условиям Гаусса-Маркова Выберите неверное утверждение

1) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут несмещенными

2) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут несмещенными

3) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут состоятельными

4) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут состоятельными

5) косвенный метод наименьших квадратов позволяет получить несмещенные оценки коэффициентов обоих уравнений

7 Дана следующая макроэкономическая модель Y = C + I + G - макроэкономическое тождество C = a + bY - функция потребления I = d ndash emiddotR-1 + fY - функция инвестиций (MP) = gY ndash hR - уравнение денежного рынка где эндогенными переменными являются доход Y потребление C инвестиции I и процентная ставка R Переменные G (государственные расходы) и (MP) (реальная денежная масса) ndash экзогенные Выберите верное утверждение из следующих 1) функция инвестиций неидентифицируема 2) функция потребления неидентифицируема 3) функция потребления однозначно идентифицируема 4) функция инвестиций однозначно идентифицируема 5) функция инвестиций сверхидентифицируема

8 Коэффициент Тейла в виде 2

p+T2

p+T

2p+Tp+T

ym1y

m1

)y - y(m1

=UΣ+Σ

Σ

ˆ

ˆ позволяет сравнить качество

сделанного на период (T+1hellipT+m) прогноза pTy +ˆ с качеством следующего прогноза 1) pTy +ˆ =0 для всех p=1hellipm 2) pTy +ˆ =yT для всех p=1hellipm 3)прогнозом по линейной функции оцененной за период (1hellipT) 4) прогнозом по экспоненте оцененной за период (1hellipT) 5) прогнозом по логарифмической функции оцененной за период (1hellipT)

9 Введение фиктивных переменных DT+p p=1hellipm при прогнозировании (DT+p=1 при t=T+p DT+p=0 при всех других t) позволяет

I Рассчитать ошибки предсказания для t=T+1hellip T+m II Рассчитать стандартные ошибки предсказания для t=T+1hellip T+m

III Выполнить F-тест на стабильность коэффициентов

1) Верно только I 2) Верно только II 3) Верно только I и II 4) Верно только I и III 5) Верно I II и III 10 При оценивании линейной регрессии по методу максимума правдоподобия оценки коэффициентов совпадают с полученными по МНК при следующих условиях 1) всегда 2) если случайный член нормально распределен и выполнены условия Гаусса-Маркова 3) если случайный член нормально распределен независимо от выполнения условий

Гаусса-Маркова 4) если случайный член не автокоррелирован при любом его распределении 5) вообще говоря эти оценки не совпадают независимо от выполнения условий Гаусса-

Маркова и распределения случайного члена 11 Логит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-1196+0169ASVABC Вероятность получения академической степени (Degree=1) при ASVABC=60 равна

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) 1690))6016909611exp(1(

)6016909611exp(2 sdotsdot+minus+

sdotminus

3) (1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus)0169

4) 2))6016909611exp(1()6016909611exp(

sdot+minus+sdotminus

5) ))6016909611(21exp(

21 2sdotminusminusπ

12 Пробит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-5787+00782ASVABC Увеличение вероятности p(Degreei=1) при увеличении ASVABC на один пункт при ASVABC=60 равно здесь

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) ))60078207875(21exp(

21 2sdotminusminusπ

3) 07820))60078207875(21exp(

21 2 sdotsdotminusminusπ

4) F(-5787+0078260) где F ndash функция стандартного нормального распределения 5) F(-5787+0078260)00782 где F ndash функция стандартного нормального

распределения Часть 2 (1 час 30 минут) Ответьте письменно на два из трех следующих вопросов

1 Исследователь располагает данными о продолжительности обучения респондента HGC результатах теста на познавательные способности ASVABC и о продолжительности обучения матери респондента HGCM для выборки 570 индивидов Он предполагает что продолжительность обучения респондента зависит как от результатов теста на познавательные способности так и от продолжительности обучения матери респондента

uHGCMASVABCHGC +++= 21 ββα (11) и что познавательные способности в свою очередь являются функцией успехов в учебе

vHGCASVBC ++= 1δγ (12) 1a [2 балла] Объясните разницу между структурными уравнениями и уравнениями в приведенной форме в модели одновременных уравнений 1b [2 балла] Выведите приведенную форму уравнения для HGC 1c [6 баллов] Выведите выражение для смещения (для больших выборок) оценки 1δ предполагая что уравнение (12) было оценено обычным методом наименьших квадратов и определите вероятное направление смещения 1d [3 балла] Объясните почему HGCM может быть использована в качестве инструмента для HGC во втором уравнении 1e [6 баллов] Продемонстрируйте что оценка метода инструментальных переменных для

1δ использующая в качестве инструмента HGCM является состоятельной предполагая что модель корректно определена 1f [6 баллов] Предположим теперь что корректной спецификацией второго уравнения является

vHGCMHGCASVBC ++++= 21 δδγ (13) Продемонстрируйте что оценка метода инструментальных переменных для 1δ будет несостоятельной выведите смещение для случая большой выборки и установите его направление (Указание учтите что приведенная форма уравнения для HGC в этом случае изменится)

2а [8 баллов] Случайная переменная принимает два возможных значения 0 и 1 с неизвестной вероятностью p того что она равна 1 В выборке имеется всего три наблюдения первое наблюдение равно 1 второе также 1 а третье равно 0 Выведите оценку максимального правдоподобия для p Следующая информация относится к остальным вопросам этого задания Переменная WORKING определена равной 1 если респондент имеет работу и равной 0 в противном случае Для оценивания зависимости переменной WORKING от уровня образования респондента HGC (продолжительность обучения респондента) был использован метод логит-анализа Исследование было выполнено отдельно для мужчин и женщин (в приведенных ниже результатах расчетов первая таблица соответствует женщинам а вторая ndash мужчинам указание на число проведенных итераций не приводится) logit working hgc if male=0 Logit Estimates Number of obs = 2726

chi2(l) = 7042 Prob gt chi2 = 00000

Log Likelihood = ndash15865519 Pseudo R2 = 00217 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 1511872 0186177 8121 0000 1146971 1876773 cons 1 ndash1049543 2448064 ndash4287 0000 ndash1529355 ndash5697314 logit working hgc if male=1 Logit Estimates Number of obs = 2573

chi2(l) = 7503 Prob gt chi2 = 00000

Log Likelihood = ndash80265424 Pseudo R2 = 00446 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 2499295 0306482 8155 0000 1898601 3099989 cons 1 ndash9670268 ndash3775658 ndash2561 0010 ndash1707042 ndash2270113 95 процентов респондентов имеют значение HGC в диапазоне 9-18 лет со средним значением HGC равным 133 и 132 лет для женщин и мужчин соответственно Исходя из логит-анализа предельный эффект HGC на вероятность наличия работы в среднем оценивается как 0030 и 0020 для женщин и мужчин соответственно Оценка регрессии метода наименьших квадратов WORKING по HGC дает коэффициент наклона 0029 и 0020 для женщин и мужчин соответственно Логистическая функция F(z) и ее производная f(z) даются выражениями

izezF minus+

=1

1)( и 2)1()( z

z

eezf minus

minus

+=

где z является линейной функцией характеристик респондента На графиках (см следующую страницу) представлены вероятность наличия работы и предельное влияние HGC на вероятность наличия работы для мужчин и женщин

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 10: Эконометрика

5) ковариации между x1 и Y 5 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 (b) y зависит только от x1 и (c) y зависит только от x2 При оценивании регрессий для каждой из этих моделей величины R2 получились равными R2

a R2b и R2

c соответственно Какое из следующих утверждений верно 1) R2

a = R2b + R2

c 2) R2

a gt R2b + R2

c 3) R2

a = R2b - R2

c 4) R2

a lt R2b + R2

c 5) R2

a может быть больше а может быть меньше чем R2b + R2

c 6 У исследователя есть данные наблюдений трех экономических переменных y x1 и x2 и

он рассматривает три гипотезы (a) y зависит от x1 и x2 без свободного члена (b) y зависит только от x1 со свободным членом и (c) y зависит только от x2 со свободным членом При оценивании регрессий для каждой из этих моделей величины RSS получились равными RSSa RSSb и RSSc соответственно Какое из следующих утверждений верно 1) RSSa gt maxRSSb RSSc 2) RSSa gt RSSb + RSSc 3) RSSa lt minRSSb RSSc 4) RSSa lt RSSb + RSSc 5) RSSa может быть больше а может быть меньше чем RSSb + RSSc

7 В модели множественной линейной регрессии высокая корреляция между двумя объясняющими переменными приводит к

1) смещенности оценок коэффициентов полученных по методу наименьших квадратов

2) несостоятельности оценок коэффициентов полученных по методу наименьших квадратов

3) неэффективности оценок коэффициентов полученных по методу наименьших квадратов

4) значительной дисперсии оценок коэффициентов полученных по методу наименьших квадратов

5) равенству нулю оценок коэффициентов полученных по методу наименьших квадратов

8 Переменная y определяется величинами x1 и x2 и случайным членом u по следующей формуле y = α + β1x1 + β2x2 + u По данным выборки оценено следующее уравнение регрессии 11ˆ xbay += Переменные x1 и x2 положительно коррелированы Величины β1 и β2 положительны

Тогда 1) b1 всегда меньше чем β1 2) b1 всегда больше чем β1 3) оценка b1 смещена в сторону завышения 4) оценка b1 смещена в сторону занижения 5) b1 является несмещенной оценкой β1

9 Введение линейного ограничения на параметры в регрессионную модель 1) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение значимо 2) приводит к значительному сокращению суммы квадратов отклонений если

ограничение значимо 3) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение незначимо 4) приводит к значительному сокращению суммы квадратов отклонений если

ограничение незначимо 5) все перечисленное неверно

10 Тест Голдфелда-Квандта в модели y = α + βx + u используется для 1) обнаружения гетероскедастичности любого вида 2) обнаружения гетероскедастичности вида σui=γ xi 3) обнаружения гетероскедастичности вида σui= δ + γ xi

μ 4) проверки на некоррелированность значений случайного члена между собой 5) проверки на некоррелированность значений случайного члена и объясняющей

переменной

11 Оценена линейная регрессионная зависимость величины заработка респондента y от совокупности факторов (x1x2hellipxn) Исследователь предполагает что величина заработка зависит также от места проживания респондента которое может принадлежать к одному из трех типов крупный город малый город сельская местность Для того чтобы учесть это в модели нужно 1) ввести фиктивную переменную которая может принимать три разных значения 2) ввести фиктивную переменную которая может принимать два разных значения 3) ввести две фиктивные переменные каждая из которых может принимать два

разных значения 4) ввести три фиктивные переменные каждая из которых может принимать два

разных значения 5) ввести две фиктивные переменные каждая из которых может принимать три

разных значения 12 Оценена регрессионная зависимость величины спроса потребителей на VideoCD (VCD) от их дохода (Y) и от уровня цен на VideoCD (Pvcd) в виде log(VCD) = α + β1log(Y) + β2log(Pvcd) + u В выборку включены только те потребители у которых имеется персональный компьютер Далее исследователь предполагает что эластичности спроса на VideoCD по доходу и по цене зависят от наличия у потребителей DVD-проигрывателя Для того чтобы учесть это в модели нужно

1) ввести фиктивную переменную для свободного члена 2) ввести две фиктивные переменные для свободного члена 3) ввести одну общую фиктивную переменную для коэффициентов наклона 4) ввести две фиктивные переменные для коэффициентов наклона 5) ввести две фиктивные переменные по одной для свободного члена и для

коэффициентов наклона

Часть 2 (1 час 30 минут) Ответьте письменно на любые два из следующих трех вопросов 1 Исследователь интересуется факторами определяющими динамику потребления мяса (B) в США в 1960 ndash 1987 годах (фунты в год на душу населения) В качестве факторов он

рассматривает цену P (центы за фунт) и личный располагаемый доход (тысячи долларов в год в расчете на душу населения) Y 11 Вначале он строит модель парной регрессии потребления мяса от личного располагаемого дохода

)111()79(260483377ˆ 2 =sdot+= RYB (1)

В скобках приведены стандартные ошибки Оцените качество модели приведя обоснование своих суждений и выводов на основе t-тестов и F-теста (F-статистику рассчитайте двумя разными способами) Дайте интерпретацию коэффициентов модели 12 Затем он строит парную регрессию по ценам

)1190()874(03011503102ˆ 2 =sdot+= RPB (2)

Дайте интерпретацию коэффициентов модели и выскажите свое суждение о качестве модели 13 Не удовлетворенный полученным результатом исследователь попытался построить модель множественной регрессии одновременно по обоим исследованным факторам

)160()761()0410(6608808911537ˆ 2 =sdotminussdot+= RPYB (3)

Охарактеризуйте значимость отдельных факторов модели и дайте интерпретацию коэффициентов модели В чем причина различия между значениями коэффициентов при величине дохода в моделях (1) и (3) Какое из значений следует считать более правильным и почему 14 Можно ли считать значимым вклад фактора цены в модели (3) по сравнению с моделью (1) Как согласуется Ваш вывод с оценкой значимости модели (2) 15 Скорректированный коэффициент детерминации модели (1) равен 23702 =R тогда как для модели (3) он составляет 6302 =R Поясните смысл скорректированного коэффициента детерминации и прокомментируйте эти числа и различие между ними 16 Наконец исследователь решает использовать логарифмы для всех переменных в уравнении множественной регрессии

)060()1480()410(710)ˆ(340)ˆ(071593)(ˆ 2 =sdotminussdot+= RPLOGYLOGBGLO (4)

Как изменится интерпретация коэффициентов модели (4) по сравнению с моделью (3) Каким видом товара является мясо в соответствии с этой моделью (предмет первой необходимости предмет роскоши нормальное благо худшее благо товар Гиффена и тп) 2 Фирма управляет двумя предприятиями величина месячной прибыли (в сотнях тысяч рублей) которых за год описывается переменными P1 P2 Общая прибыль фирмы P складывается из прибыли обоих предприятий за вычетом некоторых дополнительных постоянных издержек и возможно отчислений из прибыли каждого из предприятий Имеется 13 помесячных наблюдений за полный год и январь следующего года

21 Регрессионная модель зависимости общей прибыли от прибыли предприятий выглядит следующим образом

)590()690)(712(470280109145 2 =sdot+sdot+minus= RPPP

(1)

Дайте содержательную интерпретацию модели Охарактеризуйте значимость каждого из факторов на основе t-статистик и значимость модели в целом на основе F-критерия Там где нужно выполните односторонний тест и объясните причину его использования 22 Как можно объяснить на содержательном уровне очевидное противоречие между значимостью отдельных факторов и значимостью модели в целом (подробно опишите в чем заключается это противоречие) 23 Что выражает различие значений двух коэффициентов при независимых переменных Является ли их соотношение мерой различия вкладов обоих предприятий А мерой различия предельных вкладов предприятий Можно ли принять гипотезу что каждый из факторов входит в уравнение с коэффициентом равным единице 24 Ковариационная матрица для переменных модели выглядит следующим образом

P P1 P2 P 4584986 9997390 9699030 P1 9997390 5753368 2481317 P2 9699030 2481317 7788488

Определите коэффициенты корреляции между переменными модели взятыми попарно Какие дополнительные выводы можно сделать из этих данных 25 Далее была оценена парная регрессия

())112(3801733 2 =sdot+minus= RPP

(2)

Воспользовавшись имеющимися данными рассчитайте коэффициент наклона и стандартную ошибку в модели (2) Рассматривая модель (1) как правильную объясните смещение коэффициента наклона в модели (2) пользуясь ковариационной матрицей 26 Если сгенерировать новую переменную P0=P1+P2 то можно получить следующую регрессионную зависимость

)340()72(450006126 2 =sdot+minus= RPP

(3)

Сравните модель (3) с моделью (1) Сформулируйте введенное линейное ограничение и проверьте его значимость Что можно сказать о наличии общих постоянных издержек а также отчислений от прибыли каждого из предприятий до перечисления в общий фонд 3 Рассматривается зависимость совокупных расходов на косметику в США от совокупного личного располагаемого дохода за 1959-1983 гг С этой целью строится ряд линейных регрессий

31 Уравнение зависимости уровня расходов на косметику от логарифма личного располагаемого дохода получилось следующим

)290()951(950)log(160234 2 =sdot+minus= RDPICOSM

(1)

Дайте интерпретацию модели и ее коэффициентов Запишите уравнение не используя логарифмы 32 Если наоборот взять логарифм только от величины расходов то уравнение принимает вид

)000130()100(83000140770)log( 2 =sdot+= RDPICOSM

(2)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 33 Модель в двойных логарифмах принимает вид

)070()480(900)log(061205)log( 2 =sdot+minus= RDPICOSM

(3)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 34 Если выполнить преобразование Зарембки сформировав новую переменную COSMZ взамен COSM то получим следующее линейное уравнение

)000090()0010(8900010050 2 =sdot+= RDPICOSMZ

(4)

В чем состоит преобразование Зарембки и для чего оно используется 35 Значение суммы квадратов остатков для модели (4) составило 00877 тогда как для модели (3) оно равно 021 Сопоставимы ли значения RSS и R2 в этих двух моделях Можно ли утверждать что одна из моделей имеет преимущество перед другой Приведите статистическое обоснование своего вывода Можно ли выбрать наилучшую из моделей (1)-(4) 36 Известно что альтернативным методом к методу Зарембки является процедура Бокса-Кокса Опишите ее смысл и последовательность действий для рассматриваемого примера

Заключительный экзамен Часть 1 (30 минут) В каждом из 12 вопросов обведите кружком ровно один ответ который вы считаете правильным 1 Укажите среди названных здесь статистических тестов те тесты которые могут

выполняться только для больших выборок I Тест Чоу на неудачу предсказания II Тест Спирмена на ранговую корреляцию III Тест χ2 для LR-статистики при оценивании по методу максимума

правдоподобия IV Тест Дарбина для уравнения с лаговой объясняющей переменной V Тест Голдфелда-Квандта

1) Только II III IV 2) Только II IV 3) Только I III 4) Только IV V 5) Только I II IV

2 Гипотеза о том что случайный член не подвержен автокорреляции первого порядка отвергается в пользу односторонней альтернативной гипотезы о его отрицательной автокоррелированности если 1) статистика Дарбина-Уотсона d близка к 2 2) статистика Дарбина-Уотсона d близка к 1 3) статистика Дарбина-Уотсона d близка к 0 или 4 4) статистика Дарбина-Уотсона d близка к 4 но не к 0 5) статистика Дарбина-Уотсона d близка к 0 но не к 4 3 Переменная yt зависит от переменной xt yt=α+βxt+ut Оценивается зависимость yt от переменной zt yt=a+bzt+et где zt=xt+vt (vt ndash ошибка измерения являющаяся случайной величиной с нулевым математическим ожиданием и постоянной дисперсией) Если истинное значение β равно 04 а теоретическая дисперсия xt в три раза больше теоретической дисперсии vt то предел по вероятности оценки b равен 1) 01 2) 02 3) 0267 4) 03 5) 0333 4 После преобразования Койка модель геометрически распределенного лага yt = α + βxt + βδxt-1 + βδ2xt-2 + βδ3xt-3 ++ ut приобретает вид

1) yt - δyt-1 = α (1-δ) + βxt + ut - δut-1 2) yt = α (1-δ) + βxt + ut - δut-1 3) yt = α + βxt + ut - δut-1 4) yt - δyt-1 = α + βxt-1 + ut-1 5) ни один из перечисленных

5 По 39 точкам оценена следующая формула производственной функции в которой отдельно рассмотрены две составляющие затрат основного капитала K1 - здания и сооружения и K2 - машины и оборудование а также две составляющие затрат труда L1 - затраты квалифицированного труда и L2 - затраты неквалифицированного труда Y ndash выпуск ln(Y)=-43 + 035ln(K1) + 026ln(K2) + 063ln(L1) + 058ln(L2) R2 =092 DW=174 (14) (003) (005) (041) (038) (в скобках приведены стандартные ошибки коэффициентов) Какой из выводов и дальнейших шагов представляется Вам верным 1) Нужно исключить фактор L (переменные L1 и L2) тк он оказался незначимым 2) Имеет место мультиколлинеарность поэтому нужно объединить факторы K1 и K2 3) Имеет место мультиколлинеарность поэтому нужно объединить факторы L1 и L2 4) Отклонения ei автокоррелированы нужно изменить формулу зависимости 5) Формула зависимости приемлема по всем приведенным параметрам и изменения не

нужны

6 Эконометрическая модель описана следующими уравнениями (1) y1 = α + βy2 + γx1 + ϕx2 + u1 (2) y2 = δ + τx1 + λx2 + u2 где y1 и y2 ndash эндогенные переменные x1 и x2 ndash экзогенные переменные и u1 и u2 ndash случайные члены удовлетворяющие условиям Гаусса-Маркова Выберите неверное утверждение

1) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут несмещенными

2) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут несмещенными

3) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут состоятельными

4) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут состоятельными

5) косвенный метод наименьших квадратов позволяет получить несмещенные оценки коэффициентов обоих уравнений

7 Дана следующая макроэкономическая модель Y = C + I + G - макроэкономическое тождество C = a + bY - функция потребления I = d ndash emiddotR-1 + fY - функция инвестиций (MP) = gY ndash hR - уравнение денежного рынка где эндогенными переменными являются доход Y потребление C инвестиции I и процентная ставка R Переменные G (государственные расходы) и (MP) (реальная денежная масса) ndash экзогенные Выберите верное утверждение из следующих 1) функция инвестиций неидентифицируема 2) функция потребления неидентифицируема 3) функция потребления однозначно идентифицируема 4) функция инвестиций однозначно идентифицируема 5) функция инвестиций сверхидентифицируема

8 Коэффициент Тейла в виде 2

p+T2

p+T

2p+Tp+T

ym1y

m1

)y - y(m1

=UΣ+Σ

Σ

ˆ

ˆ позволяет сравнить качество

сделанного на период (T+1hellipT+m) прогноза pTy +ˆ с качеством следующего прогноза 1) pTy +ˆ =0 для всех p=1hellipm 2) pTy +ˆ =yT для всех p=1hellipm 3)прогнозом по линейной функции оцененной за период (1hellipT) 4) прогнозом по экспоненте оцененной за период (1hellipT) 5) прогнозом по логарифмической функции оцененной за период (1hellipT)

9 Введение фиктивных переменных DT+p p=1hellipm при прогнозировании (DT+p=1 при t=T+p DT+p=0 при всех других t) позволяет

I Рассчитать ошибки предсказания для t=T+1hellip T+m II Рассчитать стандартные ошибки предсказания для t=T+1hellip T+m

III Выполнить F-тест на стабильность коэффициентов

1) Верно только I 2) Верно только II 3) Верно только I и II 4) Верно только I и III 5) Верно I II и III 10 При оценивании линейной регрессии по методу максимума правдоподобия оценки коэффициентов совпадают с полученными по МНК при следующих условиях 1) всегда 2) если случайный член нормально распределен и выполнены условия Гаусса-Маркова 3) если случайный член нормально распределен независимо от выполнения условий

Гаусса-Маркова 4) если случайный член не автокоррелирован при любом его распределении 5) вообще говоря эти оценки не совпадают независимо от выполнения условий Гаусса-

Маркова и распределения случайного члена 11 Логит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-1196+0169ASVABC Вероятность получения академической степени (Degree=1) при ASVABC=60 равна

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) 1690))6016909611exp(1(

)6016909611exp(2 sdotsdot+minus+

sdotminus

3) (1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus)0169

4) 2))6016909611exp(1()6016909611exp(

sdot+minus+sdotminus

5) ))6016909611(21exp(

21 2sdotminusminusπ

12 Пробит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-5787+00782ASVABC Увеличение вероятности p(Degreei=1) при увеличении ASVABC на один пункт при ASVABC=60 равно здесь

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) ))60078207875(21exp(

21 2sdotminusminusπ

3) 07820))60078207875(21exp(

21 2 sdotsdotminusminusπ

4) F(-5787+0078260) где F ndash функция стандартного нормального распределения 5) F(-5787+0078260)00782 где F ndash функция стандартного нормального

распределения Часть 2 (1 час 30 минут) Ответьте письменно на два из трех следующих вопросов

1 Исследователь располагает данными о продолжительности обучения респондента HGC результатах теста на познавательные способности ASVABC и о продолжительности обучения матери респондента HGCM для выборки 570 индивидов Он предполагает что продолжительность обучения респондента зависит как от результатов теста на познавательные способности так и от продолжительности обучения матери респондента

uHGCMASVABCHGC +++= 21 ββα (11) и что познавательные способности в свою очередь являются функцией успехов в учебе

vHGCASVBC ++= 1δγ (12) 1a [2 балла] Объясните разницу между структурными уравнениями и уравнениями в приведенной форме в модели одновременных уравнений 1b [2 балла] Выведите приведенную форму уравнения для HGC 1c [6 баллов] Выведите выражение для смещения (для больших выборок) оценки 1δ предполагая что уравнение (12) было оценено обычным методом наименьших квадратов и определите вероятное направление смещения 1d [3 балла] Объясните почему HGCM может быть использована в качестве инструмента для HGC во втором уравнении 1e [6 баллов] Продемонстрируйте что оценка метода инструментальных переменных для

1δ использующая в качестве инструмента HGCM является состоятельной предполагая что модель корректно определена 1f [6 баллов] Предположим теперь что корректной спецификацией второго уравнения является

vHGCMHGCASVBC ++++= 21 δδγ (13) Продемонстрируйте что оценка метода инструментальных переменных для 1δ будет несостоятельной выведите смещение для случая большой выборки и установите его направление (Указание учтите что приведенная форма уравнения для HGC в этом случае изменится)

2а [8 баллов] Случайная переменная принимает два возможных значения 0 и 1 с неизвестной вероятностью p того что она равна 1 В выборке имеется всего три наблюдения первое наблюдение равно 1 второе также 1 а третье равно 0 Выведите оценку максимального правдоподобия для p Следующая информация относится к остальным вопросам этого задания Переменная WORKING определена равной 1 если респондент имеет работу и равной 0 в противном случае Для оценивания зависимости переменной WORKING от уровня образования респондента HGC (продолжительность обучения респондента) был использован метод логит-анализа Исследование было выполнено отдельно для мужчин и женщин (в приведенных ниже результатах расчетов первая таблица соответствует женщинам а вторая ndash мужчинам указание на число проведенных итераций не приводится) logit working hgc if male=0 Logit Estimates Number of obs = 2726

chi2(l) = 7042 Prob gt chi2 = 00000

Log Likelihood = ndash15865519 Pseudo R2 = 00217 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 1511872 0186177 8121 0000 1146971 1876773 cons 1 ndash1049543 2448064 ndash4287 0000 ndash1529355 ndash5697314 logit working hgc if male=1 Logit Estimates Number of obs = 2573

chi2(l) = 7503 Prob gt chi2 = 00000

Log Likelihood = ndash80265424 Pseudo R2 = 00446 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 2499295 0306482 8155 0000 1898601 3099989 cons 1 ndash9670268 ndash3775658 ndash2561 0010 ndash1707042 ndash2270113 95 процентов респондентов имеют значение HGC в диапазоне 9-18 лет со средним значением HGC равным 133 и 132 лет для женщин и мужчин соответственно Исходя из логит-анализа предельный эффект HGC на вероятность наличия работы в среднем оценивается как 0030 и 0020 для женщин и мужчин соответственно Оценка регрессии метода наименьших квадратов WORKING по HGC дает коэффициент наклона 0029 и 0020 для женщин и мужчин соответственно Логистическая функция F(z) и ее производная f(z) даются выражениями

izezF minus+

=1

1)( и 2)1()( z

z

eezf minus

minus

+=

где z является линейной функцией характеристик респондента На графиках (см следующую страницу) представлены вероятность наличия работы и предельное влияние HGC на вероятность наличия работы для мужчин и женщин

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 11: Эконометрика

9 Введение линейного ограничения на параметры в регрессионную модель 1) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение значимо 2) приводит к значительному сокращению суммы квадратов отклонений если

ограничение значимо 3) приводит к незначительному сокращению суммы квадратов отклонений если

ограничение незначимо 4) приводит к значительному сокращению суммы квадратов отклонений если

ограничение незначимо 5) все перечисленное неверно

10 Тест Голдфелда-Квандта в модели y = α + βx + u используется для 1) обнаружения гетероскедастичности любого вида 2) обнаружения гетероскедастичности вида σui=γ xi 3) обнаружения гетероскедастичности вида σui= δ + γ xi

μ 4) проверки на некоррелированность значений случайного члена между собой 5) проверки на некоррелированность значений случайного члена и объясняющей

переменной

11 Оценена линейная регрессионная зависимость величины заработка респондента y от совокупности факторов (x1x2hellipxn) Исследователь предполагает что величина заработка зависит также от места проживания респондента которое может принадлежать к одному из трех типов крупный город малый город сельская местность Для того чтобы учесть это в модели нужно 1) ввести фиктивную переменную которая может принимать три разных значения 2) ввести фиктивную переменную которая может принимать два разных значения 3) ввести две фиктивные переменные каждая из которых может принимать два

разных значения 4) ввести три фиктивные переменные каждая из которых может принимать два

разных значения 5) ввести две фиктивные переменные каждая из которых может принимать три

разных значения 12 Оценена регрессионная зависимость величины спроса потребителей на VideoCD (VCD) от их дохода (Y) и от уровня цен на VideoCD (Pvcd) в виде log(VCD) = α + β1log(Y) + β2log(Pvcd) + u В выборку включены только те потребители у которых имеется персональный компьютер Далее исследователь предполагает что эластичности спроса на VideoCD по доходу и по цене зависят от наличия у потребителей DVD-проигрывателя Для того чтобы учесть это в модели нужно

1) ввести фиктивную переменную для свободного члена 2) ввести две фиктивные переменные для свободного члена 3) ввести одну общую фиктивную переменную для коэффициентов наклона 4) ввести две фиктивные переменные для коэффициентов наклона 5) ввести две фиктивные переменные по одной для свободного члена и для

коэффициентов наклона

Часть 2 (1 час 30 минут) Ответьте письменно на любые два из следующих трех вопросов 1 Исследователь интересуется факторами определяющими динамику потребления мяса (B) в США в 1960 ndash 1987 годах (фунты в год на душу населения) В качестве факторов он

рассматривает цену P (центы за фунт) и личный располагаемый доход (тысячи долларов в год в расчете на душу населения) Y 11 Вначале он строит модель парной регрессии потребления мяса от личного располагаемого дохода

)111()79(260483377ˆ 2 =sdot+= RYB (1)

В скобках приведены стандартные ошибки Оцените качество модели приведя обоснование своих суждений и выводов на основе t-тестов и F-теста (F-статистику рассчитайте двумя разными способами) Дайте интерпретацию коэффициентов модели 12 Затем он строит парную регрессию по ценам

)1190()874(03011503102ˆ 2 =sdot+= RPB (2)

Дайте интерпретацию коэффициентов модели и выскажите свое суждение о качестве модели 13 Не удовлетворенный полученным результатом исследователь попытался построить модель множественной регрессии одновременно по обоим исследованным факторам

)160()761()0410(6608808911537ˆ 2 =sdotminussdot+= RPYB (3)

Охарактеризуйте значимость отдельных факторов модели и дайте интерпретацию коэффициентов модели В чем причина различия между значениями коэффициентов при величине дохода в моделях (1) и (3) Какое из значений следует считать более правильным и почему 14 Можно ли считать значимым вклад фактора цены в модели (3) по сравнению с моделью (1) Как согласуется Ваш вывод с оценкой значимости модели (2) 15 Скорректированный коэффициент детерминации модели (1) равен 23702 =R тогда как для модели (3) он составляет 6302 =R Поясните смысл скорректированного коэффициента детерминации и прокомментируйте эти числа и различие между ними 16 Наконец исследователь решает использовать логарифмы для всех переменных в уравнении множественной регрессии

)060()1480()410(710)ˆ(340)ˆ(071593)(ˆ 2 =sdotminussdot+= RPLOGYLOGBGLO (4)

Как изменится интерпретация коэффициентов модели (4) по сравнению с моделью (3) Каким видом товара является мясо в соответствии с этой моделью (предмет первой необходимости предмет роскоши нормальное благо худшее благо товар Гиффена и тп) 2 Фирма управляет двумя предприятиями величина месячной прибыли (в сотнях тысяч рублей) которых за год описывается переменными P1 P2 Общая прибыль фирмы P складывается из прибыли обоих предприятий за вычетом некоторых дополнительных постоянных издержек и возможно отчислений из прибыли каждого из предприятий Имеется 13 помесячных наблюдений за полный год и январь следующего года

21 Регрессионная модель зависимости общей прибыли от прибыли предприятий выглядит следующим образом

)590()690)(712(470280109145 2 =sdot+sdot+minus= RPPP

(1)

Дайте содержательную интерпретацию модели Охарактеризуйте значимость каждого из факторов на основе t-статистик и значимость модели в целом на основе F-критерия Там где нужно выполните односторонний тест и объясните причину его использования 22 Как можно объяснить на содержательном уровне очевидное противоречие между значимостью отдельных факторов и значимостью модели в целом (подробно опишите в чем заключается это противоречие) 23 Что выражает различие значений двух коэффициентов при независимых переменных Является ли их соотношение мерой различия вкладов обоих предприятий А мерой различия предельных вкладов предприятий Можно ли принять гипотезу что каждый из факторов входит в уравнение с коэффициентом равным единице 24 Ковариационная матрица для переменных модели выглядит следующим образом

P P1 P2 P 4584986 9997390 9699030 P1 9997390 5753368 2481317 P2 9699030 2481317 7788488

Определите коэффициенты корреляции между переменными модели взятыми попарно Какие дополнительные выводы можно сделать из этих данных 25 Далее была оценена парная регрессия

())112(3801733 2 =sdot+minus= RPP

(2)

Воспользовавшись имеющимися данными рассчитайте коэффициент наклона и стандартную ошибку в модели (2) Рассматривая модель (1) как правильную объясните смещение коэффициента наклона в модели (2) пользуясь ковариационной матрицей 26 Если сгенерировать новую переменную P0=P1+P2 то можно получить следующую регрессионную зависимость

)340()72(450006126 2 =sdot+minus= RPP

(3)

Сравните модель (3) с моделью (1) Сформулируйте введенное линейное ограничение и проверьте его значимость Что можно сказать о наличии общих постоянных издержек а также отчислений от прибыли каждого из предприятий до перечисления в общий фонд 3 Рассматривается зависимость совокупных расходов на косметику в США от совокупного личного располагаемого дохода за 1959-1983 гг С этой целью строится ряд линейных регрессий

31 Уравнение зависимости уровня расходов на косметику от логарифма личного располагаемого дохода получилось следующим

)290()951(950)log(160234 2 =sdot+minus= RDPICOSM

(1)

Дайте интерпретацию модели и ее коэффициентов Запишите уравнение не используя логарифмы 32 Если наоборот взять логарифм только от величины расходов то уравнение принимает вид

)000130()100(83000140770)log( 2 =sdot+= RDPICOSM

(2)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 33 Модель в двойных логарифмах принимает вид

)070()480(900)log(061205)log( 2 =sdot+minus= RDPICOSM

(3)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 34 Если выполнить преобразование Зарембки сформировав новую переменную COSMZ взамен COSM то получим следующее линейное уравнение

)000090()0010(8900010050 2 =sdot+= RDPICOSMZ

(4)

В чем состоит преобразование Зарембки и для чего оно используется 35 Значение суммы квадратов остатков для модели (4) составило 00877 тогда как для модели (3) оно равно 021 Сопоставимы ли значения RSS и R2 в этих двух моделях Можно ли утверждать что одна из моделей имеет преимущество перед другой Приведите статистическое обоснование своего вывода Можно ли выбрать наилучшую из моделей (1)-(4) 36 Известно что альтернативным методом к методу Зарембки является процедура Бокса-Кокса Опишите ее смысл и последовательность действий для рассматриваемого примера

Заключительный экзамен Часть 1 (30 минут) В каждом из 12 вопросов обведите кружком ровно один ответ который вы считаете правильным 1 Укажите среди названных здесь статистических тестов те тесты которые могут

выполняться только для больших выборок I Тест Чоу на неудачу предсказания II Тест Спирмена на ранговую корреляцию III Тест χ2 для LR-статистики при оценивании по методу максимума

правдоподобия IV Тест Дарбина для уравнения с лаговой объясняющей переменной V Тест Голдфелда-Квандта

1) Только II III IV 2) Только II IV 3) Только I III 4) Только IV V 5) Только I II IV

2 Гипотеза о том что случайный член не подвержен автокорреляции первого порядка отвергается в пользу односторонней альтернативной гипотезы о его отрицательной автокоррелированности если 1) статистика Дарбина-Уотсона d близка к 2 2) статистика Дарбина-Уотсона d близка к 1 3) статистика Дарбина-Уотсона d близка к 0 или 4 4) статистика Дарбина-Уотсона d близка к 4 но не к 0 5) статистика Дарбина-Уотсона d близка к 0 но не к 4 3 Переменная yt зависит от переменной xt yt=α+βxt+ut Оценивается зависимость yt от переменной zt yt=a+bzt+et где zt=xt+vt (vt ndash ошибка измерения являющаяся случайной величиной с нулевым математическим ожиданием и постоянной дисперсией) Если истинное значение β равно 04 а теоретическая дисперсия xt в три раза больше теоретической дисперсии vt то предел по вероятности оценки b равен 1) 01 2) 02 3) 0267 4) 03 5) 0333 4 После преобразования Койка модель геометрически распределенного лага yt = α + βxt + βδxt-1 + βδ2xt-2 + βδ3xt-3 ++ ut приобретает вид

1) yt - δyt-1 = α (1-δ) + βxt + ut - δut-1 2) yt = α (1-δ) + βxt + ut - δut-1 3) yt = α + βxt + ut - δut-1 4) yt - δyt-1 = α + βxt-1 + ut-1 5) ни один из перечисленных

5 По 39 точкам оценена следующая формула производственной функции в которой отдельно рассмотрены две составляющие затрат основного капитала K1 - здания и сооружения и K2 - машины и оборудование а также две составляющие затрат труда L1 - затраты квалифицированного труда и L2 - затраты неквалифицированного труда Y ndash выпуск ln(Y)=-43 + 035ln(K1) + 026ln(K2) + 063ln(L1) + 058ln(L2) R2 =092 DW=174 (14) (003) (005) (041) (038) (в скобках приведены стандартные ошибки коэффициентов) Какой из выводов и дальнейших шагов представляется Вам верным 1) Нужно исключить фактор L (переменные L1 и L2) тк он оказался незначимым 2) Имеет место мультиколлинеарность поэтому нужно объединить факторы K1 и K2 3) Имеет место мультиколлинеарность поэтому нужно объединить факторы L1 и L2 4) Отклонения ei автокоррелированы нужно изменить формулу зависимости 5) Формула зависимости приемлема по всем приведенным параметрам и изменения не

нужны

6 Эконометрическая модель описана следующими уравнениями (1) y1 = α + βy2 + γx1 + ϕx2 + u1 (2) y2 = δ + τx1 + λx2 + u2 где y1 и y2 ndash эндогенные переменные x1 и x2 ndash экзогенные переменные и u1 и u2 ndash случайные члены удовлетворяющие условиям Гаусса-Маркова Выберите неверное утверждение

1) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут несмещенными

2) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут несмещенными

3) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут состоятельными

4) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут состоятельными

5) косвенный метод наименьших квадратов позволяет получить несмещенные оценки коэффициентов обоих уравнений

7 Дана следующая макроэкономическая модель Y = C + I + G - макроэкономическое тождество C = a + bY - функция потребления I = d ndash emiddotR-1 + fY - функция инвестиций (MP) = gY ndash hR - уравнение денежного рынка где эндогенными переменными являются доход Y потребление C инвестиции I и процентная ставка R Переменные G (государственные расходы) и (MP) (реальная денежная масса) ndash экзогенные Выберите верное утверждение из следующих 1) функция инвестиций неидентифицируема 2) функция потребления неидентифицируема 3) функция потребления однозначно идентифицируема 4) функция инвестиций однозначно идентифицируема 5) функция инвестиций сверхидентифицируема

8 Коэффициент Тейла в виде 2

p+T2

p+T

2p+Tp+T

ym1y

m1

)y - y(m1

=UΣ+Σ

Σ

ˆ

ˆ позволяет сравнить качество

сделанного на период (T+1hellipT+m) прогноза pTy +ˆ с качеством следующего прогноза 1) pTy +ˆ =0 для всех p=1hellipm 2) pTy +ˆ =yT для всех p=1hellipm 3)прогнозом по линейной функции оцененной за период (1hellipT) 4) прогнозом по экспоненте оцененной за период (1hellipT) 5) прогнозом по логарифмической функции оцененной за период (1hellipT)

9 Введение фиктивных переменных DT+p p=1hellipm при прогнозировании (DT+p=1 при t=T+p DT+p=0 при всех других t) позволяет

I Рассчитать ошибки предсказания для t=T+1hellip T+m II Рассчитать стандартные ошибки предсказания для t=T+1hellip T+m

III Выполнить F-тест на стабильность коэффициентов

1) Верно только I 2) Верно только II 3) Верно только I и II 4) Верно только I и III 5) Верно I II и III 10 При оценивании линейной регрессии по методу максимума правдоподобия оценки коэффициентов совпадают с полученными по МНК при следующих условиях 1) всегда 2) если случайный член нормально распределен и выполнены условия Гаусса-Маркова 3) если случайный член нормально распределен независимо от выполнения условий

Гаусса-Маркова 4) если случайный член не автокоррелирован при любом его распределении 5) вообще говоря эти оценки не совпадают независимо от выполнения условий Гаусса-

Маркова и распределения случайного члена 11 Логит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-1196+0169ASVABC Вероятность получения академической степени (Degree=1) при ASVABC=60 равна

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) 1690))6016909611exp(1(

)6016909611exp(2 sdotsdot+minus+

sdotminus

3) (1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus)0169

4) 2))6016909611exp(1()6016909611exp(

sdot+minus+sdotminus

5) ))6016909611(21exp(

21 2sdotminusminusπ

12 Пробит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-5787+00782ASVABC Увеличение вероятности p(Degreei=1) при увеличении ASVABC на один пункт при ASVABC=60 равно здесь

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) ))60078207875(21exp(

21 2sdotminusminusπ

3) 07820))60078207875(21exp(

21 2 sdotsdotminusminusπ

4) F(-5787+0078260) где F ndash функция стандартного нормального распределения 5) F(-5787+0078260)00782 где F ndash функция стандартного нормального

распределения Часть 2 (1 час 30 минут) Ответьте письменно на два из трех следующих вопросов

1 Исследователь располагает данными о продолжительности обучения респондента HGC результатах теста на познавательные способности ASVABC и о продолжительности обучения матери респондента HGCM для выборки 570 индивидов Он предполагает что продолжительность обучения респондента зависит как от результатов теста на познавательные способности так и от продолжительности обучения матери респондента

uHGCMASVABCHGC +++= 21 ββα (11) и что познавательные способности в свою очередь являются функцией успехов в учебе

vHGCASVBC ++= 1δγ (12) 1a [2 балла] Объясните разницу между структурными уравнениями и уравнениями в приведенной форме в модели одновременных уравнений 1b [2 балла] Выведите приведенную форму уравнения для HGC 1c [6 баллов] Выведите выражение для смещения (для больших выборок) оценки 1δ предполагая что уравнение (12) было оценено обычным методом наименьших квадратов и определите вероятное направление смещения 1d [3 балла] Объясните почему HGCM может быть использована в качестве инструмента для HGC во втором уравнении 1e [6 баллов] Продемонстрируйте что оценка метода инструментальных переменных для

1δ использующая в качестве инструмента HGCM является состоятельной предполагая что модель корректно определена 1f [6 баллов] Предположим теперь что корректной спецификацией второго уравнения является

vHGCMHGCASVBC ++++= 21 δδγ (13) Продемонстрируйте что оценка метода инструментальных переменных для 1δ будет несостоятельной выведите смещение для случая большой выборки и установите его направление (Указание учтите что приведенная форма уравнения для HGC в этом случае изменится)

2а [8 баллов] Случайная переменная принимает два возможных значения 0 и 1 с неизвестной вероятностью p того что она равна 1 В выборке имеется всего три наблюдения первое наблюдение равно 1 второе также 1 а третье равно 0 Выведите оценку максимального правдоподобия для p Следующая информация относится к остальным вопросам этого задания Переменная WORKING определена равной 1 если респондент имеет работу и равной 0 в противном случае Для оценивания зависимости переменной WORKING от уровня образования респондента HGC (продолжительность обучения респондента) был использован метод логит-анализа Исследование было выполнено отдельно для мужчин и женщин (в приведенных ниже результатах расчетов первая таблица соответствует женщинам а вторая ndash мужчинам указание на число проведенных итераций не приводится) logit working hgc if male=0 Logit Estimates Number of obs = 2726

chi2(l) = 7042 Prob gt chi2 = 00000

Log Likelihood = ndash15865519 Pseudo R2 = 00217 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 1511872 0186177 8121 0000 1146971 1876773 cons 1 ndash1049543 2448064 ndash4287 0000 ndash1529355 ndash5697314 logit working hgc if male=1 Logit Estimates Number of obs = 2573

chi2(l) = 7503 Prob gt chi2 = 00000

Log Likelihood = ndash80265424 Pseudo R2 = 00446 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 2499295 0306482 8155 0000 1898601 3099989 cons 1 ndash9670268 ndash3775658 ndash2561 0010 ndash1707042 ndash2270113 95 процентов респондентов имеют значение HGC в диапазоне 9-18 лет со средним значением HGC равным 133 и 132 лет для женщин и мужчин соответственно Исходя из логит-анализа предельный эффект HGC на вероятность наличия работы в среднем оценивается как 0030 и 0020 для женщин и мужчин соответственно Оценка регрессии метода наименьших квадратов WORKING по HGC дает коэффициент наклона 0029 и 0020 для женщин и мужчин соответственно Логистическая функция F(z) и ее производная f(z) даются выражениями

izezF minus+

=1

1)( и 2)1()( z

z

eezf minus

minus

+=

где z является линейной функцией характеристик респондента На графиках (см следующую страницу) представлены вероятность наличия работы и предельное влияние HGC на вероятность наличия работы для мужчин и женщин

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 12: Эконометрика

рассматривает цену P (центы за фунт) и личный располагаемый доход (тысячи долларов в год в расчете на душу населения) Y 11 Вначале он строит модель парной регрессии потребления мяса от личного располагаемого дохода

)111()79(260483377ˆ 2 =sdot+= RYB (1)

В скобках приведены стандартные ошибки Оцените качество модели приведя обоснование своих суждений и выводов на основе t-тестов и F-теста (F-статистику рассчитайте двумя разными способами) Дайте интерпретацию коэффициентов модели 12 Затем он строит парную регрессию по ценам

)1190()874(03011503102ˆ 2 =sdot+= RPB (2)

Дайте интерпретацию коэффициентов модели и выскажите свое суждение о качестве модели 13 Не удовлетворенный полученным результатом исследователь попытался построить модель множественной регрессии одновременно по обоим исследованным факторам

)160()761()0410(6608808911537ˆ 2 =sdotminussdot+= RPYB (3)

Охарактеризуйте значимость отдельных факторов модели и дайте интерпретацию коэффициентов модели В чем причина различия между значениями коэффициентов при величине дохода в моделях (1) и (3) Какое из значений следует считать более правильным и почему 14 Можно ли считать значимым вклад фактора цены в модели (3) по сравнению с моделью (1) Как согласуется Ваш вывод с оценкой значимости модели (2) 15 Скорректированный коэффициент детерминации модели (1) равен 23702 =R тогда как для модели (3) он составляет 6302 =R Поясните смысл скорректированного коэффициента детерминации и прокомментируйте эти числа и различие между ними 16 Наконец исследователь решает использовать логарифмы для всех переменных в уравнении множественной регрессии

)060()1480()410(710)ˆ(340)ˆ(071593)(ˆ 2 =sdotminussdot+= RPLOGYLOGBGLO (4)

Как изменится интерпретация коэффициентов модели (4) по сравнению с моделью (3) Каким видом товара является мясо в соответствии с этой моделью (предмет первой необходимости предмет роскоши нормальное благо худшее благо товар Гиффена и тп) 2 Фирма управляет двумя предприятиями величина месячной прибыли (в сотнях тысяч рублей) которых за год описывается переменными P1 P2 Общая прибыль фирмы P складывается из прибыли обоих предприятий за вычетом некоторых дополнительных постоянных издержек и возможно отчислений из прибыли каждого из предприятий Имеется 13 помесячных наблюдений за полный год и январь следующего года

21 Регрессионная модель зависимости общей прибыли от прибыли предприятий выглядит следующим образом

)590()690)(712(470280109145 2 =sdot+sdot+minus= RPPP

(1)

Дайте содержательную интерпретацию модели Охарактеризуйте значимость каждого из факторов на основе t-статистик и значимость модели в целом на основе F-критерия Там где нужно выполните односторонний тест и объясните причину его использования 22 Как можно объяснить на содержательном уровне очевидное противоречие между значимостью отдельных факторов и значимостью модели в целом (подробно опишите в чем заключается это противоречие) 23 Что выражает различие значений двух коэффициентов при независимых переменных Является ли их соотношение мерой различия вкладов обоих предприятий А мерой различия предельных вкладов предприятий Можно ли принять гипотезу что каждый из факторов входит в уравнение с коэффициентом равным единице 24 Ковариационная матрица для переменных модели выглядит следующим образом

P P1 P2 P 4584986 9997390 9699030 P1 9997390 5753368 2481317 P2 9699030 2481317 7788488

Определите коэффициенты корреляции между переменными модели взятыми попарно Какие дополнительные выводы можно сделать из этих данных 25 Далее была оценена парная регрессия

())112(3801733 2 =sdot+minus= RPP

(2)

Воспользовавшись имеющимися данными рассчитайте коэффициент наклона и стандартную ошибку в модели (2) Рассматривая модель (1) как правильную объясните смещение коэффициента наклона в модели (2) пользуясь ковариационной матрицей 26 Если сгенерировать новую переменную P0=P1+P2 то можно получить следующую регрессионную зависимость

)340()72(450006126 2 =sdot+minus= RPP

(3)

Сравните модель (3) с моделью (1) Сформулируйте введенное линейное ограничение и проверьте его значимость Что можно сказать о наличии общих постоянных издержек а также отчислений от прибыли каждого из предприятий до перечисления в общий фонд 3 Рассматривается зависимость совокупных расходов на косметику в США от совокупного личного располагаемого дохода за 1959-1983 гг С этой целью строится ряд линейных регрессий

31 Уравнение зависимости уровня расходов на косметику от логарифма личного располагаемого дохода получилось следующим

)290()951(950)log(160234 2 =sdot+minus= RDPICOSM

(1)

Дайте интерпретацию модели и ее коэффициентов Запишите уравнение не используя логарифмы 32 Если наоборот взять логарифм только от величины расходов то уравнение принимает вид

)000130()100(83000140770)log( 2 =sdot+= RDPICOSM

(2)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 33 Модель в двойных логарифмах принимает вид

)070()480(900)log(061205)log( 2 =sdot+minus= RDPICOSM

(3)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 34 Если выполнить преобразование Зарембки сформировав новую переменную COSMZ взамен COSM то получим следующее линейное уравнение

)000090()0010(8900010050 2 =sdot+= RDPICOSMZ

(4)

В чем состоит преобразование Зарембки и для чего оно используется 35 Значение суммы квадратов остатков для модели (4) составило 00877 тогда как для модели (3) оно равно 021 Сопоставимы ли значения RSS и R2 в этих двух моделях Можно ли утверждать что одна из моделей имеет преимущество перед другой Приведите статистическое обоснование своего вывода Можно ли выбрать наилучшую из моделей (1)-(4) 36 Известно что альтернативным методом к методу Зарембки является процедура Бокса-Кокса Опишите ее смысл и последовательность действий для рассматриваемого примера

Заключительный экзамен Часть 1 (30 минут) В каждом из 12 вопросов обведите кружком ровно один ответ который вы считаете правильным 1 Укажите среди названных здесь статистических тестов те тесты которые могут

выполняться только для больших выборок I Тест Чоу на неудачу предсказания II Тест Спирмена на ранговую корреляцию III Тест χ2 для LR-статистики при оценивании по методу максимума

правдоподобия IV Тест Дарбина для уравнения с лаговой объясняющей переменной V Тест Голдфелда-Квандта

1) Только II III IV 2) Только II IV 3) Только I III 4) Только IV V 5) Только I II IV

2 Гипотеза о том что случайный член не подвержен автокорреляции первого порядка отвергается в пользу односторонней альтернативной гипотезы о его отрицательной автокоррелированности если 1) статистика Дарбина-Уотсона d близка к 2 2) статистика Дарбина-Уотсона d близка к 1 3) статистика Дарбина-Уотсона d близка к 0 или 4 4) статистика Дарбина-Уотсона d близка к 4 но не к 0 5) статистика Дарбина-Уотсона d близка к 0 но не к 4 3 Переменная yt зависит от переменной xt yt=α+βxt+ut Оценивается зависимость yt от переменной zt yt=a+bzt+et где zt=xt+vt (vt ndash ошибка измерения являющаяся случайной величиной с нулевым математическим ожиданием и постоянной дисперсией) Если истинное значение β равно 04 а теоретическая дисперсия xt в три раза больше теоретической дисперсии vt то предел по вероятности оценки b равен 1) 01 2) 02 3) 0267 4) 03 5) 0333 4 После преобразования Койка модель геометрически распределенного лага yt = α + βxt + βδxt-1 + βδ2xt-2 + βδ3xt-3 ++ ut приобретает вид

1) yt - δyt-1 = α (1-δ) + βxt + ut - δut-1 2) yt = α (1-δ) + βxt + ut - δut-1 3) yt = α + βxt + ut - δut-1 4) yt - δyt-1 = α + βxt-1 + ut-1 5) ни один из перечисленных

5 По 39 точкам оценена следующая формула производственной функции в которой отдельно рассмотрены две составляющие затрат основного капитала K1 - здания и сооружения и K2 - машины и оборудование а также две составляющие затрат труда L1 - затраты квалифицированного труда и L2 - затраты неквалифицированного труда Y ndash выпуск ln(Y)=-43 + 035ln(K1) + 026ln(K2) + 063ln(L1) + 058ln(L2) R2 =092 DW=174 (14) (003) (005) (041) (038) (в скобках приведены стандартные ошибки коэффициентов) Какой из выводов и дальнейших шагов представляется Вам верным 1) Нужно исключить фактор L (переменные L1 и L2) тк он оказался незначимым 2) Имеет место мультиколлинеарность поэтому нужно объединить факторы K1 и K2 3) Имеет место мультиколлинеарность поэтому нужно объединить факторы L1 и L2 4) Отклонения ei автокоррелированы нужно изменить формулу зависимости 5) Формула зависимости приемлема по всем приведенным параметрам и изменения не

нужны

6 Эконометрическая модель описана следующими уравнениями (1) y1 = α + βy2 + γx1 + ϕx2 + u1 (2) y2 = δ + τx1 + λx2 + u2 где y1 и y2 ndash эндогенные переменные x1 и x2 ndash экзогенные переменные и u1 и u2 ndash случайные члены удовлетворяющие условиям Гаусса-Маркова Выберите неверное утверждение

1) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут несмещенными

2) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут несмещенными

3) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут состоятельными

4) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут состоятельными

5) косвенный метод наименьших квадратов позволяет получить несмещенные оценки коэффициентов обоих уравнений

7 Дана следующая макроэкономическая модель Y = C + I + G - макроэкономическое тождество C = a + bY - функция потребления I = d ndash emiddotR-1 + fY - функция инвестиций (MP) = gY ndash hR - уравнение денежного рынка где эндогенными переменными являются доход Y потребление C инвестиции I и процентная ставка R Переменные G (государственные расходы) и (MP) (реальная денежная масса) ndash экзогенные Выберите верное утверждение из следующих 1) функция инвестиций неидентифицируема 2) функция потребления неидентифицируема 3) функция потребления однозначно идентифицируема 4) функция инвестиций однозначно идентифицируема 5) функция инвестиций сверхидентифицируема

8 Коэффициент Тейла в виде 2

p+T2

p+T

2p+Tp+T

ym1y

m1

)y - y(m1

=UΣ+Σ

Σ

ˆ

ˆ позволяет сравнить качество

сделанного на период (T+1hellipT+m) прогноза pTy +ˆ с качеством следующего прогноза 1) pTy +ˆ =0 для всех p=1hellipm 2) pTy +ˆ =yT для всех p=1hellipm 3)прогнозом по линейной функции оцененной за период (1hellipT) 4) прогнозом по экспоненте оцененной за период (1hellipT) 5) прогнозом по логарифмической функции оцененной за период (1hellipT)

9 Введение фиктивных переменных DT+p p=1hellipm при прогнозировании (DT+p=1 при t=T+p DT+p=0 при всех других t) позволяет

I Рассчитать ошибки предсказания для t=T+1hellip T+m II Рассчитать стандартные ошибки предсказания для t=T+1hellip T+m

III Выполнить F-тест на стабильность коэффициентов

1) Верно только I 2) Верно только II 3) Верно только I и II 4) Верно только I и III 5) Верно I II и III 10 При оценивании линейной регрессии по методу максимума правдоподобия оценки коэффициентов совпадают с полученными по МНК при следующих условиях 1) всегда 2) если случайный член нормально распределен и выполнены условия Гаусса-Маркова 3) если случайный член нормально распределен независимо от выполнения условий

Гаусса-Маркова 4) если случайный член не автокоррелирован при любом его распределении 5) вообще говоря эти оценки не совпадают независимо от выполнения условий Гаусса-

Маркова и распределения случайного члена 11 Логит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-1196+0169ASVABC Вероятность получения академической степени (Degree=1) при ASVABC=60 равна

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) 1690))6016909611exp(1(

)6016909611exp(2 sdotsdot+minus+

sdotminus

3) (1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus)0169

4) 2))6016909611exp(1()6016909611exp(

sdot+minus+sdotminus

5) ))6016909611(21exp(

21 2sdotminusminusπ

12 Пробит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-5787+00782ASVABC Увеличение вероятности p(Degreei=1) при увеличении ASVABC на один пункт при ASVABC=60 равно здесь

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) ))60078207875(21exp(

21 2sdotminusminusπ

3) 07820))60078207875(21exp(

21 2 sdotsdotminusminusπ

4) F(-5787+0078260) где F ndash функция стандартного нормального распределения 5) F(-5787+0078260)00782 где F ndash функция стандартного нормального

распределения Часть 2 (1 час 30 минут) Ответьте письменно на два из трех следующих вопросов

1 Исследователь располагает данными о продолжительности обучения респондента HGC результатах теста на познавательные способности ASVABC и о продолжительности обучения матери респондента HGCM для выборки 570 индивидов Он предполагает что продолжительность обучения респондента зависит как от результатов теста на познавательные способности так и от продолжительности обучения матери респондента

uHGCMASVABCHGC +++= 21 ββα (11) и что познавательные способности в свою очередь являются функцией успехов в учебе

vHGCASVBC ++= 1δγ (12) 1a [2 балла] Объясните разницу между структурными уравнениями и уравнениями в приведенной форме в модели одновременных уравнений 1b [2 балла] Выведите приведенную форму уравнения для HGC 1c [6 баллов] Выведите выражение для смещения (для больших выборок) оценки 1δ предполагая что уравнение (12) было оценено обычным методом наименьших квадратов и определите вероятное направление смещения 1d [3 балла] Объясните почему HGCM может быть использована в качестве инструмента для HGC во втором уравнении 1e [6 баллов] Продемонстрируйте что оценка метода инструментальных переменных для

1δ использующая в качестве инструмента HGCM является состоятельной предполагая что модель корректно определена 1f [6 баллов] Предположим теперь что корректной спецификацией второго уравнения является

vHGCMHGCASVBC ++++= 21 δδγ (13) Продемонстрируйте что оценка метода инструментальных переменных для 1δ будет несостоятельной выведите смещение для случая большой выборки и установите его направление (Указание учтите что приведенная форма уравнения для HGC в этом случае изменится)

2а [8 баллов] Случайная переменная принимает два возможных значения 0 и 1 с неизвестной вероятностью p того что она равна 1 В выборке имеется всего три наблюдения первое наблюдение равно 1 второе также 1 а третье равно 0 Выведите оценку максимального правдоподобия для p Следующая информация относится к остальным вопросам этого задания Переменная WORKING определена равной 1 если респондент имеет работу и равной 0 в противном случае Для оценивания зависимости переменной WORKING от уровня образования респондента HGC (продолжительность обучения респондента) был использован метод логит-анализа Исследование было выполнено отдельно для мужчин и женщин (в приведенных ниже результатах расчетов первая таблица соответствует женщинам а вторая ndash мужчинам указание на число проведенных итераций не приводится) logit working hgc if male=0 Logit Estimates Number of obs = 2726

chi2(l) = 7042 Prob gt chi2 = 00000

Log Likelihood = ndash15865519 Pseudo R2 = 00217 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 1511872 0186177 8121 0000 1146971 1876773 cons 1 ndash1049543 2448064 ndash4287 0000 ndash1529355 ndash5697314 logit working hgc if male=1 Logit Estimates Number of obs = 2573

chi2(l) = 7503 Prob gt chi2 = 00000

Log Likelihood = ndash80265424 Pseudo R2 = 00446 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 2499295 0306482 8155 0000 1898601 3099989 cons 1 ndash9670268 ndash3775658 ndash2561 0010 ndash1707042 ndash2270113 95 процентов респондентов имеют значение HGC в диапазоне 9-18 лет со средним значением HGC равным 133 и 132 лет для женщин и мужчин соответственно Исходя из логит-анализа предельный эффект HGC на вероятность наличия работы в среднем оценивается как 0030 и 0020 для женщин и мужчин соответственно Оценка регрессии метода наименьших квадратов WORKING по HGC дает коэффициент наклона 0029 и 0020 для женщин и мужчин соответственно Логистическая функция F(z) и ее производная f(z) даются выражениями

izezF minus+

=1

1)( и 2)1()( z

z

eezf minus

minus

+=

где z является линейной функцией характеристик респондента На графиках (см следующую страницу) представлены вероятность наличия работы и предельное влияние HGC на вероятность наличия работы для мужчин и женщин

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 13: Эконометрика

21 Регрессионная модель зависимости общей прибыли от прибыли предприятий выглядит следующим образом

)590()690)(712(470280109145 2 =sdot+sdot+minus= RPPP

(1)

Дайте содержательную интерпретацию модели Охарактеризуйте значимость каждого из факторов на основе t-статистик и значимость модели в целом на основе F-критерия Там где нужно выполните односторонний тест и объясните причину его использования 22 Как можно объяснить на содержательном уровне очевидное противоречие между значимостью отдельных факторов и значимостью модели в целом (подробно опишите в чем заключается это противоречие) 23 Что выражает различие значений двух коэффициентов при независимых переменных Является ли их соотношение мерой различия вкладов обоих предприятий А мерой различия предельных вкладов предприятий Можно ли принять гипотезу что каждый из факторов входит в уравнение с коэффициентом равным единице 24 Ковариационная матрица для переменных модели выглядит следующим образом

P P1 P2 P 4584986 9997390 9699030 P1 9997390 5753368 2481317 P2 9699030 2481317 7788488

Определите коэффициенты корреляции между переменными модели взятыми попарно Какие дополнительные выводы можно сделать из этих данных 25 Далее была оценена парная регрессия

())112(3801733 2 =sdot+minus= RPP

(2)

Воспользовавшись имеющимися данными рассчитайте коэффициент наклона и стандартную ошибку в модели (2) Рассматривая модель (1) как правильную объясните смещение коэффициента наклона в модели (2) пользуясь ковариационной матрицей 26 Если сгенерировать новую переменную P0=P1+P2 то можно получить следующую регрессионную зависимость

)340()72(450006126 2 =sdot+minus= RPP

(3)

Сравните модель (3) с моделью (1) Сформулируйте введенное линейное ограничение и проверьте его значимость Что можно сказать о наличии общих постоянных издержек а также отчислений от прибыли каждого из предприятий до перечисления в общий фонд 3 Рассматривается зависимость совокупных расходов на косметику в США от совокупного личного располагаемого дохода за 1959-1983 гг С этой целью строится ряд линейных регрессий

31 Уравнение зависимости уровня расходов на косметику от логарифма личного располагаемого дохода получилось следующим

)290()951(950)log(160234 2 =sdot+minus= RDPICOSM

(1)

Дайте интерпретацию модели и ее коэффициентов Запишите уравнение не используя логарифмы 32 Если наоборот взять логарифм только от величины расходов то уравнение принимает вид

)000130()100(83000140770)log( 2 =sdot+= RDPICOSM

(2)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 33 Модель в двойных логарифмах принимает вид

)070()480(900)log(061205)log( 2 =sdot+minus= RDPICOSM

(3)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 34 Если выполнить преобразование Зарембки сформировав новую переменную COSMZ взамен COSM то получим следующее линейное уравнение

)000090()0010(8900010050 2 =sdot+= RDPICOSMZ

(4)

В чем состоит преобразование Зарембки и для чего оно используется 35 Значение суммы квадратов остатков для модели (4) составило 00877 тогда как для модели (3) оно равно 021 Сопоставимы ли значения RSS и R2 в этих двух моделях Можно ли утверждать что одна из моделей имеет преимущество перед другой Приведите статистическое обоснование своего вывода Можно ли выбрать наилучшую из моделей (1)-(4) 36 Известно что альтернативным методом к методу Зарембки является процедура Бокса-Кокса Опишите ее смысл и последовательность действий для рассматриваемого примера

Заключительный экзамен Часть 1 (30 минут) В каждом из 12 вопросов обведите кружком ровно один ответ который вы считаете правильным 1 Укажите среди названных здесь статистических тестов те тесты которые могут

выполняться только для больших выборок I Тест Чоу на неудачу предсказания II Тест Спирмена на ранговую корреляцию III Тест χ2 для LR-статистики при оценивании по методу максимума

правдоподобия IV Тест Дарбина для уравнения с лаговой объясняющей переменной V Тест Голдфелда-Квандта

1) Только II III IV 2) Только II IV 3) Только I III 4) Только IV V 5) Только I II IV

2 Гипотеза о том что случайный член не подвержен автокорреляции первого порядка отвергается в пользу односторонней альтернативной гипотезы о его отрицательной автокоррелированности если 1) статистика Дарбина-Уотсона d близка к 2 2) статистика Дарбина-Уотсона d близка к 1 3) статистика Дарбина-Уотсона d близка к 0 или 4 4) статистика Дарбина-Уотсона d близка к 4 но не к 0 5) статистика Дарбина-Уотсона d близка к 0 но не к 4 3 Переменная yt зависит от переменной xt yt=α+βxt+ut Оценивается зависимость yt от переменной zt yt=a+bzt+et где zt=xt+vt (vt ndash ошибка измерения являющаяся случайной величиной с нулевым математическим ожиданием и постоянной дисперсией) Если истинное значение β равно 04 а теоретическая дисперсия xt в три раза больше теоретической дисперсии vt то предел по вероятности оценки b равен 1) 01 2) 02 3) 0267 4) 03 5) 0333 4 После преобразования Койка модель геометрически распределенного лага yt = α + βxt + βδxt-1 + βδ2xt-2 + βδ3xt-3 ++ ut приобретает вид

1) yt - δyt-1 = α (1-δ) + βxt + ut - δut-1 2) yt = α (1-δ) + βxt + ut - δut-1 3) yt = α + βxt + ut - δut-1 4) yt - δyt-1 = α + βxt-1 + ut-1 5) ни один из перечисленных

5 По 39 точкам оценена следующая формула производственной функции в которой отдельно рассмотрены две составляющие затрат основного капитала K1 - здания и сооружения и K2 - машины и оборудование а также две составляющие затрат труда L1 - затраты квалифицированного труда и L2 - затраты неквалифицированного труда Y ndash выпуск ln(Y)=-43 + 035ln(K1) + 026ln(K2) + 063ln(L1) + 058ln(L2) R2 =092 DW=174 (14) (003) (005) (041) (038) (в скобках приведены стандартные ошибки коэффициентов) Какой из выводов и дальнейших шагов представляется Вам верным 1) Нужно исключить фактор L (переменные L1 и L2) тк он оказался незначимым 2) Имеет место мультиколлинеарность поэтому нужно объединить факторы K1 и K2 3) Имеет место мультиколлинеарность поэтому нужно объединить факторы L1 и L2 4) Отклонения ei автокоррелированы нужно изменить формулу зависимости 5) Формула зависимости приемлема по всем приведенным параметрам и изменения не

нужны

6 Эконометрическая модель описана следующими уравнениями (1) y1 = α + βy2 + γx1 + ϕx2 + u1 (2) y2 = δ + τx1 + λx2 + u2 где y1 и y2 ndash эндогенные переменные x1 и x2 ndash экзогенные переменные и u1 и u2 ndash случайные члены удовлетворяющие условиям Гаусса-Маркова Выберите неверное утверждение

1) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут несмещенными

2) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут несмещенными

3) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут состоятельными

4) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут состоятельными

5) косвенный метод наименьших квадратов позволяет получить несмещенные оценки коэффициентов обоих уравнений

7 Дана следующая макроэкономическая модель Y = C + I + G - макроэкономическое тождество C = a + bY - функция потребления I = d ndash emiddotR-1 + fY - функция инвестиций (MP) = gY ndash hR - уравнение денежного рынка где эндогенными переменными являются доход Y потребление C инвестиции I и процентная ставка R Переменные G (государственные расходы) и (MP) (реальная денежная масса) ndash экзогенные Выберите верное утверждение из следующих 1) функция инвестиций неидентифицируема 2) функция потребления неидентифицируема 3) функция потребления однозначно идентифицируема 4) функция инвестиций однозначно идентифицируема 5) функция инвестиций сверхидентифицируема

8 Коэффициент Тейла в виде 2

p+T2

p+T

2p+Tp+T

ym1y

m1

)y - y(m1

=UΣ+Σ

Σ

ˆ

ˆ позволяет сравнить качество

сделанного на период (T+1hellipT+m) прогноза pTy +ˆ с качеством следующего прогноза 1) pTy +ˆ =0 для всех p=1hellipm 2) pTy +ˆ =yT для всех p=1hellipm 3)прогнозом по линейной функции оцененной за период (1hellipT) 4) прогнозом по экспоненте оцененной за период (1hellipT) 5) прогнозом по логарифмической функции оцененной за период (1hellipT)

9 Введение фиктивных переменных DT+p p=1hellipm при прогнозировании (DT+p=1 при t=T+p DT+p=0 при всех других t) позволяет

I Рассчитать ошибки предсказания для t=T+1hellip T+m II Рассчитать стандартные ошибки предсказания для t=T+1hellip T+m

III Выполнить F-тест на стабильность коэффициентов

1) Верно только I 2) Верно только II 3) Верно только I и II 4) Верно только I и III 5) Верно I II и III 10 При оценивании линейной регрессии по методу максимума правдоподобия оценки коэффициентов совпадают с полученными по МНК при следующих условиях 1) всегда 2) если случайный член нормально распределен и выполнены условия Гаусса-Маркова 3) если случайный член нормально распределен независимо от выполнения условий

Гаусса-Маркова 4) если случайный член не автокоррелирован при любом его распределении 5) вообще говоря эти оценки не совпадают независимо от выполнения условий Гаусса-

Маркова и распределения случайного члена 11 Логит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-1196+0169ASVABC Вероятность получения академической степени (Degree=1) при ASVABC=60 равна

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) 1690))6016909611exp(1(

)6016909611exp(2 sdotsdot+minus+

sdotminus

3) (1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus)0169

4) 2))6016909611exp(1()6016909611exp(

sdot+minus+sdotminus

5) ))6016909611(21exp(

21 2sdotminusminusπ

12 Пробит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-5787+00782ASVABC Увеличение вероятности p(Degreei=1) при увеличении ASVABC на один пункт при ASVABC=60 равно здесь

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) ))60078207875(21exp(

21 2sdotminusminusπ

3) 07820))60078207875(21exp(

21 2 sdotsdotminusminusπ

4) F(-5787+0078260) где F ndash функция стандартного нормального распределения 5) F(-5787+0078260)00782 где F ndash функция стандартного нормального

распределения Часть 2 (1 час 30 минут) Ответьте письменно на два из трех следующих вопросов

1 Исследователь располагает данными о продолжительности обучения респондента HGC результатах теста на познавательные способности ASVABC и о продолжительности обучения матери респондента HGCM для выборки 570 индивидов Он предполагает что продолжительность обучения респондента зависит как от результатов теста на познавательные способности так и от продолжительности обучения матери респондента

uHGCMASVABCHGC +++= 21 ββα (11) и что познавательные способности в свою очередь являются функцией успехов в учебе

vHGCASVBC ++= 1δγ (12) 1a [2 балла] Объясните разницу между структурными уравнениями и уравнениями в приведенной форме в модели одновременных уравнений 1b [2 балла] Выведите приведенную форму уравнения для HGC 1c [6 баллов] Выведите выражение для смещения (для больших выборок) оценки 1δ предполагая что уравнение (12) было оценено обычным методом наименьших квадратов и определите вероятное направление смещения 1d [3 балла] Объясните почему HGCM может быть использована в качестве инструмента для HGC во втором уравнении 1e [6 баллов] Продемонстрируйте что оценка метода инструментальных переменных для

1δ использующая в качестве инструмента HGCM является состоятельной предполагая что модель корректно определена 1f [6 баллов] Предположим теперь что корректной спецификацией второго уравнения является

vHGCMHGCASVBC ++++= 21 δδγ (13) Продемонстрируйте что оценка метода инструментальных переменных для 1δ будет несостоятельной выведите смещение для случая большой выборки и установите его направление (Указание учтите что приведенная форма уравнения для HGC в этом случае изменится)

2а [8 баллов] Случайная переменная принимает два возможных значения 0 и 1 с неизвестной вероятностью p того что она равна 1 В выборке имеется всего три наблюдения первое наблюдение равно 1 второе также 1 а третье равно 0 Выведите оценку максимального правдоподобия для p Следующая информация относится к остальным вопросам этого задания Переменная WORKING определена равной 1 если респондент имеет работу и равной 0 в противном случае Для оценивания зависимости переменной WORKING от уровня образования респондента HGC (продолжительность обучения респондента) был использован метод логит-анализа Исследование было выполнено отдельно для мужчин и женщин (в приведенных ниже результатах расчетов первая таблица соответствует женщинам а вторая ndash мужчинам указание на число проведенных итераций не приводится) logit working hgc if male=0 Logit Estimates Number of obs = 2726

chi2(l) = 7042 Prob gt chi2 = 00000

Log Likelihood = ndash15865519 Pseudo R2 = 00217 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 1511872 0186177 8121 0000 1146971 1876773 cons 1 ndash1049543 2448064 ndash4287 0000 ndash1529355 ndash5697314 logit working hgc if male=1 Logit Estimates Number of obs = 2573

chi2(l) = 7503 Prob gt chi2 = 00000

Log Likelihood = ndash80265424 Pseudo R2 = 00446 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 2499295 0306482 8155 0000 1898601 3099989 cons 1 ndash9670268 ndash3775658 ndash2561 0010 ndash1707042 ndash2270113 95 процентов респондентов имеют значение HGC в диапазоне 9-18 лет со средним значением HGC равным 133 и 132 лет для женщин и мужчин соответственно Исходя из логит-анализа предельный эффект HGC на вероятность наличия работы в среднем оценивается как 0030 и 0020 для женщин и мужчин соответственно Оценка регрессии метода наименьших квадратов WORKING по HGC дает коэффициент наклона 0029 и 0020 для женщин и мужчин соответственно Логистическая функция F(z) и ее производная f(z) даются выражениями

izezF minus+

=1

1)( и 2)1()( z

z

eezf minus

minus

+=

где z является линейной функцией характеристик респондента На графиках (см следующую страницу) представлены вероятность наличия работы и предельное влияние HGC на вероятность наличия работы для мужчин и женщин

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 14: Эконометрика

31 Уравнение зависимости уровня расходов на косметику от логарифма личного располагаемого дохода получилось следующим

)290()951(950)log(160234 2 =sdot+minus= RDPICOSM

(1)

Дайте интерпретацию модели и ее коэффициентов Запишите уравнение не используя логарифмы 32 Если наоборот взять логарифм только от величины расходов то уравнение принимает вид

)000130()100(83000140770)log( 2 =sdot+= RDPICOSM

(2)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 33 Модель в двойных логарифмах принимает вид

)070()480(900)log(061205)log( 2 =sdot+minus= RDPICOSM

(3)

Дайте интерпретацию коэффициентов модели Запишите уравнение не используя логарифмы 34 Если выполнить преобразование Зарембки сформировав новую переменную COSMZ взамен COSM то получим следующее линейное уравнение

)000090()0010(8900010050 2 =sdot+= RDPICOSMZ

(4)

В чем состоит преобразование Зарембки и для чего оно используется 35 Значение суммы квадратов остатков для модели (4) составило 00877 тогда как для модели (3) оно равно 021 Сопоставимы ли значения RSS и R2 в этих двух моделях Можно ли утверждать что одна из моделей имеет преимущество перед другой Приведите статистическое обоснование своего вывода Можно ли выбрать наилучшую из моделей (1)-(4) 36 Известно что альтернативным методом к методу Зарембки является процедура Бокса-Кокса Опишите ее смысл и последовательность действий для рассматриваемого примера

Заключительный экзамен Часть 1 (30 минут) В каждом из 12 вопросов обведите кружком ровно один ответ который вы считаете правильным 1 Укажите среди названных здесь статистических тестов те тесты которые могут

выполняться только для больших выборок I Тест Чоу на неудачу предсказания II Тест Спирмена на ранговую корреляцию III Тест χ2 для LR-статистики при оценивании по методу максимума

правдоподобия IV Тест Дарбина для уравнения с лаговой объясняющей переменной V Тест Голдфелда-Квандта

1) Только II III IV 2) Только II IV 3) Только I III 4) Только IV V 5) Только I II IV

2 Гипотеза о том что случайный член не подвержен автокорреляции первого порядка отвергается в пользу односторонней альтернативной гипотезы о его отрицательной автокоррелированности если 1) статистика Дарбина-Уотсона d близка к 2 2) статистика Дарбина-Уотсона d близка к 1 3) статистика Дарбина-Уотсона d близка к 0 или 4 4) статистика Дарбина-Уотсона d близка к 4 но не к 0 5) статистика Дарбина-Уотсона d близка к 0 но не к 4 3 Переменная yt зависит от переменной xt yt=α+βxt+ut Оценивается зависимость yt от переменной zt yt=a+bzt+et где zt=xt+vt (vt ndash ошибка измерения являющаяся случайной величиной с нулевым математическим ожиданием и постоянной дисперсией) Если истинное значение β равно 04 а теоретическая дисперсия xt в три раза больше теоретической дисперсии vt то предел по вероятности оценки b равен 1) 01 2) 02 3) 0267 4) 03 5) 0333 4 После преобразования Койка модель геометрически распределенного лага yt = α + βxt + βδxt-1 + βδ2xt-2 + βδ3xt-3 ++ ut приобретает вид

1) yt - δyt-1 = α (1-δ) + βxt + ut - δut-1 2) yt = α (1-δ) + βxt + ut - δut-1 3) yt = α + βxt + ut - δut-1 4) yt - δyt-1 = α + βxt-1 + ut-1 5) ни один из перечисленных

5 По 39 точкам оценена следующая формула производственной функции в которой отдельно рассмотрены две составляющие затрат основного капитала K1 - здания и сооружения и K2 - машины и оборудование а также две составляющие затрат труда L1 - затраты квалифицированного труда и L2 - затраты неквалифицированного труда Y ndash выпуск ln(Y)=-43 + 035ln(K1) + 026ln(K2) + 063ln(L1) + 058ln(L2) R2 =092 DW=174 (14) (003) (005) (041) (038) (в скобках приведены стандартные ошибки коэффициентов) Какой из выводов и дальнейших шагов представляется Вам верным 1) Нужно исключить фактор L (переменные L1 и L2) тк он оказался незначимым 2) Имеет место мультиколлинеарность поэтому нужно объединить факторы K1 и K2 3) Имеет место мультиколлинеарность поэтому нужно объединить факторы L1 и L2 4) Отклонения ei автокоррелированы нужно изменить формулу зависимости 5) Формула зависимости приемлема по всем приведенным параметрам и изменения не

нужны

6 Эконометрическая модель описана следующими уравнениями (1) y1 = α + βy2 + γx1 + ϕx2 + u1 (2) y2 = δ + τx1 + λx2 + u2 где y1 и y2 ndash эндогенные переменные x1 и x2 ndash экзогенные переменные и u1 и u2 ndash случайные члены удовлетворяющие условиям Гаусса-Маркова Выберите неверное утверждение

1) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут несмещенными

2) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут несмещенными

3) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут состоятельными

4) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут состоятельными

5) косвенный метод наименьших квадратов позволяет получить несмещенные оценки коэффициентов обоих уравнений

7 Дана следующая макроэкономическая модель Y = C + I + G - макроэкономическое тождество C = a + bY - функция потребления I = d ndash emiddotR-1 + fY - функция инвестиций (MP) = gY ndash hR - уравнение денежного рынка где эндогенными переменными являются доход Y потребление C инвестиции I и процентная ставка R Переменные G (государственные расходы) и (MP) (реальная денежная масса) ndash экзогенные Выберите верное утверждение из следующих 1) функция инвестиций неидентифицируема 2) функция потребления неидентифицируема 3) функция потребления однозначно идентифицируема 4) функция инвестиций однозначно идентифицируема 5) функция инвестиций сверхидентифицируема

8 Коэффициент Тейла в виде 2

p+T2

p+T

2p+Tp+T

ym1y

m1

)y - y(m1

=UΣ+Σ

Σ

ˆ

ˆ позволяет сравнить качество

сделанного на период (T+1hellipT+m) прогноза pTy +ˆ с качеством следующего прогноза 1) pTy +ˆ =0 для всех p=1hellipm 2) pTy +ˆ =yT для всех p=1hellipm 3)прогнозом по линейной функции оцененной за период (1hellipT) 4) прогнозом по экспоненте оцененной за период (1hellipT) 5) прогнозом по логарифмической функции оцененной за период (1hellipT)

9 Введение фиктивных переменных DT+p p=1hellipm при прогнозировании (DT+p=1 при t=T+p DT+p=0 при всех других t) позволяет

I Рассчитать ошибки предсказания для t=T+1hellip T+m II Рассчитать стандартные ошибки предсказания для t=T+1hellip T+m

III Выполнить F-тест на стабильность коэффициентов

1) Верно только I 2) Верно только II 3) Верно только I и II 4) Верно только I и III 5) Верно I II и III 10 При оценивании линейной регрессии по методу максимума правдоподобия оценки коэффициентов совпадают с полученными по МНК при следующих условиях 1) всегда 2) если случайный член нормально распределен и выполнены условия Гаусса-Маркова 3) если случайный член нормально распределен независимо от выполнения условий

Гаусса-Маркова 4) если случайный член не автокоррелирован при любом его распределении 5) вообще говоря эти оценки не совпадают независимо от выполнения условий Гаусса-

Маркова и распределения случайного члена 11 Логит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-1196+0169ASVABC Вероятность получения академической степени (Degree=1) при ASVABC=60 равна

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) 1690))6016909611exp(1(

)6016909611exp(2 sdotsdot+minus+

sdotminus

3) (1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus)0169

4) 2))6016909611exp(1()6016909611exp(

sdot+minus+sdotminus

5) ))6016909611(21exp(

21 2sdotminusminusπ

12 Пробит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-5787+00782ASVABC Увеличение вероятности p(Degreei=1) при увеличении ASVABC на один пункт при ASVABC=60 равно здесь

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) ))60078207875(21exp(

21 2sdotminusminusπ

3) 07820))60078207875(21exp(

21 2 sdotsdotminusminusπ

4) F(-5787+0078260) где F ndash функция стандартного нормального распределения 5) F(-5787+0078260)00782 где F ndash функция стандартного нормального

распределения Часть 2 (1 час 30 минут) Ответьте письменно на два из трех следующих вопросов

1 Исследователь располагает данными о продолжительности обучения респондента HGC результатах теста на познавательные способности ASVABC и о продолжительности обучения матери респондента HGCM для выборки 570 индивидов Он предполагает что продолжительность обучения респондента зависит как от результатов теста на познавательные способности так и от продолжительности обучения матери респондента

uHGCMASVABCHGC +++= 21 ββα (11) и что познавательные способности в свою очередь являются функцией успехов в учебе

vHGCASVBC ++= 1δγ (12) 1a [2 балла] Объясните разницу между структурными уравнениями и уравнениями в приведенной форме в модели одновременных уравнений 1b [2 балла] Выведите приведенную форму уравнения для HGC 1c [6 баллов] Выведите выражение для смещения (для больших выборок) оценки 1δ предполагая что уравнение (12) было оценено обычным методом наименьших квадратов и определите вероятное направление смещения 1d [3 балла] Объясните почему HGCM может быть использована в качестве инструмента для HGC во втором уравнении 1e [6 баллов] Продемонстрируйте что оценка метода инструментальных переменных для

1δ использующая в качестве инструмента HGCM является состоятельной предполагая что модель корректно определена 1f [6 баллов] Предположим теперь что корректной спецификацией второго уравнения является

vHGCMHGCASVBC ++++= 21 δδγ (13) Продемонстрируйте что оценка метода инструментальных переменных для 1δ будет несостоятельной выведите смещение для случая большой выборки и установите его направление (Указание учтите что приведенная форма уравнения для HGC в этом случае изменится)

2а [8 баллов] Случайная переменная принимает два возможных значения 0 и 1 с неизвестной вероятностью p того что она равна 1 В выборке имеется всего три наблюдения первое наблюдение равно 1 второе также 1 а третье равно 0 Выведите оценку максимального правдоподобия для p Следующая информация относится к остальным вопросам этого задания Переменная WORKING определена равной 1 если респондент имеет работу и равной 0 в противном случае Для оценивания зависимости переменной WORKING от уровня образования респондента HGC (продолжительность обучения респондента) был использован метод логит-анализа Исследование было выполнено отдельно для мужчин и женщин (в приведенных ниже результатах расчетов первая таблица соответствует женщинам а вторая ndash мужчинам указание на число проведенных итераций не приводится) logit working hgc if male=0 Logit Estimates Number of obs = 2726

chi2(l) = 7042 Prob gt chi2 = 00000

Log Likelihood = ndash15865519 Pseudo R2 = 00217 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 1511872 0186177 8121 0000 1146971 1876773 cons 1 ndash1049543 2448064 ndash4287 0000 ndash1529355 ndash5697314 logit working hgc if male=1 Logit Estimates Number of obs = 2573

chi2(l) = 7503 Prob gt chi2 = 00000

Log Likelihood = ndash80265424 Pseudo R2 = 00446 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 2499295 0306482 8155 0000 1898601 3099989 cons 1 ndash9670268 ndash3775658 ndash2561 0010 ndash1707042 ndash2270113 95 процентов респондентов имеют значение HGC в диапазоне 9-18 лет со средним значением HGC равным 133 и 132 лет для женщин и мужчин соответственно Исходя из логит-анализа предельный эффект HGC на вероятность наличия работы в среднем оценивается как 0030 и 0020 для женщин и мужчин соответственно Оценка регрессии метода наименьших квадратов WORKING по HGC дает коэффициент наклона 0029 и 0020 для женщин и мужчин соответственно Логистическая функция F(z) и ее производная f(z) даются выражениями

izezF minus+

=1

1)( и 2)1()( z

z

eezf minus

minus

+=

где z является линейной функцией характеристик респондента На графиках (см следующую страницу) представлены вероятность наличия работы и предельное влияние HGC на вероятность наличия работы для мужчин и женщин

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 15: Эконометрика

1) Только II III IV 2) Только II IV 3) Только I III 4) Только IV V 5) Только I II IV

2 Гипотеза о том что случайный член не подвержен автокорреляции первого порядка отвергается в пользу односторонней альтернативной гипотезы о его отрицательной автокоррелированности если 1) статистика Дарбина-Уотсона d близка к 2 2) статистика Дарбина-Уотсона d близка к 1 3) статистика Дарбина-Уотсона d близка к 0 или 4 4) статистика Дарбина-Уотсона d близка к 4 но не к 0 5) статистика Дарбина-Уотсона d близка к 0 но не к 4 3 Переменная yt зависит от переменной xt yt=α+βxt+ut Оценивается зависимость yt от переменной zt yt=a+bzt+et где zt=xt+vt (vt ndash ошибка измерения являющаяся случайной величиной с нулевым математическим ожиданием и постоянной дисперсией) Если истинное значение β равно 04 а теоретическая дисперсия xt в три раза больше теоретической дисперсии vt то предел по вероятности оценки b равен 1) 01 2) 02 3) 0267 4) 03 5) 0333 4 После преобразования Койка модель геометрически распределенного лага yt = α + βxt + βδxt-1 + βδ2xt-2 + βδ3xt-3 ++ ut приобретает вид

1) yt - δyt-1 = α (1-δ) + βxt + ut - δut-1 2) yt = α (1-δ) + βxt + ut - δut-1 3) yt = α + βxt + ut - δut-1 4) yt - δyt-1 = α + βxt-1 + ut-1 5) ни один из перечисленных

5 По 39 точкам оценена следующая формула производственной функции в которой отдельно рассмотрены две составляющие затрат основного капитала K1 - здания и сооружения и K2 - машины и оборудование а также две составляющие затрат труда L1 - затраты квалифицированного труда и L2 - затраты неквалифицированного труда Y ndash выпуск ln(Y)=-43 + 035ln(K1) + 026ln(K2) + 063ln(L1) + 058ln(L2) R2 =092 DW=174 (14) (003) (005) (041) (038) (в скобках приведены стандартные ошибки коэффициентов) Какой из выводов и дальнейших шагов представляется Вам верным 1) Нужно исключить фактор L (переменные L1 и L2) тк он оказался незначимым 2) Имеет место мультиколлинеарность поэтому нужно объединить факторы K1 и K2 3) Имеет место мультиколлинеарность поэтому нужно объединить факторы L1 и L2 4) Отклонения ei автокоррелированы нужно изменить формулу зависимости 5) Формула зависимости приемлема по всем приведенным параметрам и изменения не

нужны

6 Эконометрическая модель описана следующими уравнениями (1) y1 = α + βy2 + γx1 + ϕx2 + u1 (2) y2 = δ + τx1 + λx2 + u2 где y1 и y2 ndash эндогенные переменные x1 и x2 ndash экзогенные переменные и u1 и u2 ndash случайные члены удовлетворяющие условиям Гаусса-Маркова Выберите неверное утверждение

1) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут несмещенными

2) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут несмещенными

3) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут состоятельными

4) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут состоятельными

5) косвенный метод наименьших квадратов позволяет получить несмещенные оценки коэффициентов обоих уравнений

7 Дана следующая макроэкономическая модель Y = C + I + G - макроэкономическое тождество C = a + bY - функция потребления I = d ndash emiddotR-1 + fY - функция инвестиций (MP) = gY ndash hR - уравнение денежного рынка где эндогенными переменными являются доход Y потребление C инвестиции I и процентная ставка R Переменные G (государственные расходы) и (MP) (реальная денежная масса) ndash экзогенные Выберите верное утверждение из следующих 1) функция инвестиций неидентифицируема 2) функция потребления неидентифицируема 3) функция потребления однозначно идентифицируема 4) функция инвестиций однозначно идентифицируема 5) функция инвестиций сверхидентифицируема

8 Коэффициент Тейла в виде 2

p+T2

p+T

2p+Tp+T

ym1y

m1

)y - y(m1

=UΣ+Σ

Σ

ˆ

ˆ позволяет сравнить качество

сделанного на период (T+1hellipT+m) прогноза pTy +ˆ с качеством следующего прогноза 1) pTy +ˆ =0 для всех p=1hellipm 2) pTy +ˆ =yT для всех p=1hellipm 3)прогнозом по линейной функции оцененной за период (1hellipT) 4) прогнозом по экспоненте оцененной за период (1hellipT) 5) прогнозом по логарифмической функции оцененной за период (1hellipT)

9 Введение фиктивных переменных DT+p p=1hellipm при прогнозировании (DT+p=1 при t=T+p DT+p=0 при всех других t) позволяет

I Рассчитать ошибки предсказания для t=T+1hellip T+m II Рассчитать стандартные ошибки предсказания для t=T+1hellip T+m

III Выполнить F-тест на стабильность коэффициентов

1) Верно только I 2) Верно только II 3) Верно только I и II 4) Верно только I и III 5) Верно I II и III 10 При оценивании линейной регрессии по методу максимума правдоподобия оценки коэффициентов совпадают с полученными по МНК при следующих условиях 1) всегда 2) если случайный член нормально распределен и выполнены условия Гаусса-Маркова 3) если случайный член нормально распределен независимо от выполнения условий

Гаусса-Маркова 4) если случайный член не автокоррелирован при любом его распределении 5) вообще говоря эти оценки не совпадают независимо от выполнения условий Гаусса-

Маркова и распределения случайного члена 11 Логит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-1196+0169ASVABC Вероятность получения академической степени (Degree=1) при ASVABC=60 равна

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) 1690))6016909611exp(1(

)6016909611exp(2 sdotsdot+minus+

sdotminus

3) (1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus)0169

4) 2))6016909611exp(1()6016909611exp(

sdot+minus+sdotminus

5) ))6016909611(21exp(

21 2sdotminusminusπ

12 Пробит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-5787+00782ASVABC Увеличение вероятности p(Degreei=1) при увеличении ASVABC на один пункт при ASVABC=60 равно здесь

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) ))60078207875(21exp(

21 2sdotminusminusπ

3) 07820))60078207875(21exp(

21 2 sdotsdotminusminusπ

4) F(-5787+0078260) где F ndash функция стандартного нормального распределения 5) F(-5787+0078260)00782 где F ndash функция стандартного нормального

распределения Часть 2 (1 час 30 минут) Ответьте письменно на два из трех следующих вопросов

1 Исследователь располагает данными о продолжительности обучения респондента HGC результатах теста на познавательные способности ASVABC и о продолжительности обучения матери респондента HGCM для выборки 570 индивидов Он предполагает что продолжительность обучения респондента зависит как от результатов теста на познавательные способности так и от продолжительности обучения матери респондента

uHGCMASVABCHGC +++= 21 ββα (11) и что познавательные способности в свою очередь являются функцией успехов в учебе

vHGCASVBC ++= 1δγ (12) 1a [2 балла] Объясните разницу между структурными уравнениями и уравнениями в приведенной форме в модели одновременных уравнений 1b [2 балла] Выведите приведенную форму уравнения для HGC 1c [6 баллов] Выведите выражение для смещения (для больших выборок) оценки 1δ предполагая что уравнение (12) было оценено обычным методом наименьших квадратов и определите вероятное направление смещения 1d [3 балла] Объясните почему HGCM может быть использована в качестве инструмента для HGC во втором уравнении 1e [6 баллов] Продемонстрируйте что оценка метода инструментальных переменных для

1δ использующая в качестве инструмента HGCM является состоятельной предполагая что модель корректно определена 1f [6 баллов] Предположим теперь что корректной спецификацией второго уравнения является

vHGCMHGCASVBC ++++= 21 δδγ (13) Продемонстрируйте что оценка метода инструментальных переменных для 1δ будет несостоятельной выведите смещение для случая большой выборки и установите его направление (Указание учтите что приведенная форма уравнения для HGC в этом случае изменится)

2а [8 баллов] Случайная переменная принимает два возможных значения 0 и 1 с неизвестной вероятностью p того что она равна 1 В выборке имеется всего три наблюдения первое наблюдение равно 1 второе также 1 а третье равно 0 Выведите оценку максимального правдоподобия для p Следующая информация относится к остальным вопросам этого задания Переменная WORKING определена равной 1 если респондент имеет работу и равной 0 в противном случае Для оценивания зависимости переменной WORKING от уровня образования респондента HGC (продолжительность обучения респондента) был использован метод логит-анализа Исследование было выполнено отдельно для мужчин и женщин (в приведенных ниже результатах расчетов первая таблица соответствует женщинам а вторая ndash мужчинам указание на число проведенных итераций не приводится) logit working hgc if male=0 Logit Estimates Number of obs = 2726

chi2(l) = 7042 Prob gt chi2 = 00000

Log Likelihood = ndash15865519 Pseudo R2 = 00217 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 1511872 0186177 8121 0000 1146971 1876773 cons 1 ndash1049543 2448064 ndash4287 0000 ndash1529355 ndash5697314 logit working hgc if male=1 Logit Estimates Number of obs = 2573

chi2(l) = 7503 Prob gt chi2 = 00000

Log Likelihood = ndash80265424 Pseudo R2 = 00446 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 2499295 0306482 8155 0000 1898601 3099989 cons 1 ndash9670268 ndash3775658 ndash2561 0010 ndash1707042 ndash2270113 95 процентов респондентов имеют значение HGC в диапазоне 9-18 лет со средним значением HGC равным 133 и 132 лет для женщин и мужчин соответственно Исходя из логит-анализа предельный эффект HGC на вероятность наличия работы в среднем оценивается как 0030 и 0020 для женщин и мужчин соответственно Оценка регрессии метода наименьших квадратов WORKING по HGC дает коэффициент наклона 0029 и 0020 для женщин и мужчин соответственно Логистическая функция F(z) и ее производная f(z) даются выражениями

izezF minus+

=1

1)( и 2)1()( z

z

eezf minus

minus

+=

где z является линейной функцией характеристик респондента На графиках (см следующую страницу) представлены вероятность наличия работы и предельное влияние HGC на вероятность наличия работы для мужчин и женщин

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 16: Эконометрика

6 Эконометрическая модель описана следующими уравнениями (1) y1 = α + βy2 + γx1 + ϕx2 + u1 (2) y2 = δ + τx1 + λx2 + u2 где y1 и y2 ndash эндогенные переменные x1 и x2 ndash экзогенные переменные и u1 и u2 ndash случайные члены удовлетворяющие условиям Гаусса-Маркова Выберите неверное утверждение

1) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут несмещенными

2) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут несмещенными

3) при непосредственном оценивании по МНК оценки коэффициентов уравнения (1) будут состоятельными

4) при непосредственном оценивании по МНК оценки коэффициентов уравнения (2) будут состоятельными

5) косвенный метод наименьших квадратов позволяет получить несмещенные оценки коэффициентов обоих уравнений

7 Дана следующая макроэкономическая модель Y = C + I + G - макроэкономическое тождество C = a + bY - функция потребления I = d ndash emiddotR-1 + fY - функция инвестиций (MP) = gY ndash hR - уравнение денежного рынка где эндогенными переменными являются доход Y потребление C инвестиции I и процентная ставка R Переменные G (государственные расходы) и (MP) (реальная денежная масса) ndash экзогенные Выберите верное утверждение из следующих 1) функция инвестиций неидентифицируема 2) функция потребления неидентифицируема 3) функция потребления однозначно идентифицируема 4) функция инвестиций однозначно идентифицируема 5) функция инвестиций сверхидентифицируема

8 Коэффициент Тейла в виде 2

p+T2

p+T

2p+Tp+T

ym1y

m1

)y - y(m1

=UΣ+Σ

Σ

ˆ

ˆ позволяет сравнить качество

сделанного на период (T+1hellipT+m) прогноза pTy +ˆ с качеством следующего прогноза 1) pTy +ˆ =0 для всех p=1hellipm 2) pTy +ˆ =yT для всех p=1hellipm 3)прогнозом по линейной функции оцененной за период (1hellipT) 4) прогнозом по экспоненте оцененной за период (1hellipT) 5) прогнозом по логарифмической функции оцененной за период (1hellipT)

9 Введение фиктивных переменных DT+p p=1hellipm при прогнозировании (DT+p=1 при t=T+p DT+p=0 при всех других t) позволяет

I Рассчитать ошибки предсказания для t=T+1hellip T+m II Рассчитать стандартные ошибки предсказания для t=T+1hellip T+m

III Выполнить F-тест на стабильность коэффициентов

1) Верно только I 2) Верно только II 3) Верно только I и II 4) Верно только I и III 5) Верно I II и III 10 При оценивании линейной регрессии по методу максимума правдоподобия оценки коэффициентов совпадают с полученными по МНК при следующих условиях 1) всегда 2) если случайный член нормально распределен и выполнены условия Гаусса-Маркова 3) если случайный член нормально распределен независимо от выполнения условий

Гаусса-Маркова 4) если случайный член не автокоррелирован при любом его распределении 5) вообще говоря эти оценки не совпадают независимо от выполнения условий Гаусса-

Маркова и распределения случайного члена 11 Логит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-1196+0169ASVABC Вероятность получения академической степени (Degree=1) при ASVABC=60 равна

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) 1690))6016909611exp(1(

)6016909611exp(2 sdotsdot+minus+

sdotminus

3) (1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus)0169

4) 2))6016909611exp(1()6016909611exp(

sdot+minus+sdotminus

5) ))6016909611(21exp(

21 2sdotminusminusπ

12 Пробит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-5787+00782ASVABC Увеличение вероятности p(Degreei=1) при увеличении ASVABC на один пункт при ASVABC=60 равно здесь

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) ))60078207875(21exp(

21 2sdotminusminusπ

3) 07820))60078207875(21exp(

21 2 sdotsdotminusminusπ

4) F(-5787+0078260) где F ndash функция стандартного нормального распределения 5) F(-5787+0078260)00782 где F ndash функция стандартного нормального

распределения Часть 2 (1 час 30 минут) Ответьте письменно на два из трех следующих вопросов

1 Исследователь располагает данными о продолжительности обучения респондента HGC результатах теста на познавательные способности ASVABC и о продолжительности обучения матери респондента HGCM для выборки 570 индивидов Он предполагает что продолжительность обучения респондента зависит как от результатов теста на познавательные способности так и от продолжительности обучения матери респондента

uHGCMASVABCHGC +++= 21 ββα (11) и что познавательные способности в свою очередь являются функцией успехов в учебе

vHGCASVBC ++= 1δγ (12) 1a [2 балла] Объясните разницу между структурными уравнениями и уравнениями в приведенной форме в модели одновременных уравнений 1b [2 балла] Выведите приведенную форму уравнения для HGC 1c [6 баллов] Выведите выражение для смещения (для больших выборок) оценки 1δ предполагая что уравнение (12) было оценено обычным методом наименьших квадратов и определите вероятное направление смещения 1d [3 балла] Объясните почему HGCM может быть использована в качестве инструмента для HGC во втором уравнении 1e [6 баллов] Продемонстрируйте что оценка метода инструментальных переменных для

1δ использующая в качестве инструмента HGCM является состоятельной предполагая что модель корректно определена 1f [6 баллов] Предположим теперь что корректной спецификацией второго уравнения является

vHGCMHGCASVBC ++++= 21 δδγ (13) Продемонстрируйте что оценка метода инструментальных переменных для 1δ будет несостоятельной выведите смещение для случая большой выборки и установите его направление (Указание учтите что приведенная форма уравнения для HGC в этом случае изменится)

2а [8 баллов] Случайная переменная принимает два возможных значения 0 и 1 с неизвестной вероятностью p того что она равна 1 В выборке имеется всего три наблюдения первое наблюдение равно 1 второе также 1 а третье равно 0 Выведите оценку максимального правдоподобия для p Следующая информация относится к остальным вопросам этого задания Переменная WORKING определена равной 1 если респондент имеет работу и равной 0 в противном случае Для оценивания зависимости переменной WORKING от уровня образования респондента HGC (продолжительность обучения респондента) был использован метод логит-анализа Исследование было выполнено отдельно для мужчин и женщин (в приведенных ниже результатах расчетов первая таблица соответствует женщинам а вторая ndash мужчинам указание на число проведенных итераций не приводится) logit working hgc if male=0 Logit Estimates Number of obs = 2726

chi2(l) = 7042 Prob gt chi2 = 00000

Log Likelihood = ndash15865519 Pseudo R2 = 00217 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 1511872 0186177 8121 0000 1146971 1876773 cons 1 ndash1049543 2448064 ndash4287 0000 ndash1529355 ndash5697314 logit working hgc if male=1 Logit Estimates Number of obs = 2573

chi2(l) = 7503 Prob gt chi2 = 00000

Log Likelihood = ndash80265424 Pseudo R2 = 00446 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 2499295 0306482 8155 0000 1898601 3099989 cons 1 ndash9670268 ndash3775658 ndash2561 0010 ndash1707042 ndash2270113 95 процентов респондентов имеют значение HGC в диапазоне 9-18 лет со средним значением HGC равным 133 и 132 лет для женщин и мужчин соответственно Исходя из логит-анализа предельный эффект HGC на вероятность наличия работы в среднем оценивается как 0030 и 0020 для женщин и мужчин соответственно Оценка регрессии метода наименьших квадратов WORKING по HGC дает коэффициент наклона 0029 и 0020 для женщин и мужчин соответственно Логистическая функция F(z) и ее производная f(z) даются выражениями

izezF minus+

=1

1)( и 2)1()( z

z

eezf minus

minus

+=

где z является линейной функцией характеристик респондента На графиках (см следующую страницу) представлены вероятность наличия работы и предельное влияние HGC на вероятность наличия работы для мужчин и женщин

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 17: Эконометрика

III Выполнить F-тест на стабильность коэффициентов

1) Верно только I 2) Верно только II 3) Верно только I и II 4) Верно только I и III 5) Верно I II и III 10 При оценивании линейной регрессии по методу максимума правдоподобия оценки коэффициентов совпадают с полученными по МНК при следующих условиях 1) всегда 2) если случайный член нормально распределен и выполнены условия Гаусса-Маркова 3) если случайный член нормально распределен независимо от выполнения условий

Гаусса-Маркова 4) если случайный член не автокоррелирован при любом его распределении 5) вообще говоря эти оценки не совпадают независимо от выполнения условий Гаусса-

Маркова и распределения случайного члена 11 Логит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-1196+0169ASVABC Вероятность получения академической степени (Degree=1) при ASVABC=60 равна

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) 1690))6016909611exp(1(

)6016909611exp(2 sdotsdot+minus+

sdotminus

3) (1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus)0169

4) 2))6016909611exp(1()6016909611exp(

sdot+minus+sdotminus

5) ))6016909611(21exp(

21 2sdotminusminusπ

12 Пробит-оценивание модели F(Zi)=p(Degreei=1| ASVABCiβ) дало результат Z=-5787+00782ASVABC Увеличение вероятности p(Degreei=1) при увеличении ASVABC на один пункт при ASVABC=60 равно здесь

1) 1)6016909611exp(

)6016909611exp(+sdot+minus

sdot+minus

2) ))60078207875(21exp(

21 2sdotminusminusπ

3) 07820))60078207875(21exp(

21 2 sdotsdotminusminusπ

4) F(-5787+0078260) где F ndash функция стандартного нормального распределения 5) F(-5787+0078260)00782 где F ndash функция стандартного нормального

распределения Часть 2 (1 час 30 минут) Ответьте письменно на два из трех следующих вопросов

1 Исследователь располагает данными о продолжительности обучения респондента HGC результатах теста на познавательные способности ASVABC и о продолжительности обучения матери респондента HGCM для выборки 570 индивидов Он предполагает что продолжительность обучения респондента зависит как от результатов теста на познавательные способности так и от продолжительности обучения матери респондента

uHGCMASVABCHGC +++= 21 ββα (11) и что познавательные способности в свою очередь являются функцией успехов в учебе

vHGCASVBC ++= 1δγ (12) 1a [2 балла] Объясните разницу между структурными уравнениями и уравнениями в приведенной форме в модели одновременных уравнений 1b [2 балла] Выведите приведенную форму уравнения для HGC 1c [6 баллов] Выведите выражение для смещения (для больших выборок) оценки 1δ предполагая что уравнение (12) было оценено обычным методом наименьших квадратов и определите вероятное направление смещения 1d [3 балла] Объясните почему HGCM может быть использована в качестве инструмента для HGC во втором уравнении 1e [6 баллов] Продемонстрируйте что оценка метода инструментальных переменных для

1δ использующая в качестве инструмента HGCM является состоятельной предполагая что модель корректно определена 1f [6 баллов] Предположим теперь что корректной спецификацией второго уравнения является

vHGCMHGCASVBC ++++= 21 δδγ (13) Продемонстрируйте что оценка метода инструментальных переменных для 1δ будет несостоятельной выведите смещение для случая большой выборки и установите его направление (Указание учтите что приведенная форма уравнения для HGC в этом случае изменится)

2а [8 баллов] Случайная переменная принимает два возможных значения 0 и 1 с неизвестной вероятностью p того что она равна 1 В выборке имеется всего три наблюдения первое наблюдение равно 1 второе также 1 а третье равно 0 Выведите оценку максимального правдоподобия для p Следующая информация относится к остальным вопросам этого задания Переменная WORKING определена равной 1 если респондент имеет работу и равной 0 в противном случае Для оценивания зависимости переменной WORKING от уровня образования респондента HGC (продолжительность обучения респондента) был использован метод логит-анализа Исследование было выполнено отдельно для мужчин и женщин (в приведенных ниже результатах расчетов первая таблица соответствует женщинам а вторая ndash мужчинам указание на число проведенных итераций не приводится) logit working hgc if male=0 Logit Estimates Number of obs = 2726

chi2(l) = 7042 Prob gt chi2 = 00000

Log Likelihood = ndash15865519 Pseudo R2 = 00217 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 1511872 0186177 8121 0000 1146971 1876773 cons 1 ndash1049543 2448064 ndash4287 0000 ndash1529355 ndash5697314 logit working hgc if male=1 Logit Estimates Number of obs = 2573

chi2(l) = 7503 Prob gt chi2 = 00000

Log Likelihood = ndash80265424 Pseudo R2 = 00446 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 2499295 0306482 8155 0000 1898601 3099989 cons 1 ndash9670268 ndash3775658 ndash2561 0010 ndash1707042 ndash2270113 95 процентов респондентов имеют значение HGC в диапазоне 9-18 лет со средним значением HGC равным 133 и 132 лет для женщин и мужчин соответственно Исходя из логит-анализа предельный эффект HGC на вероятность наличия работы в среднем оценивается как 0030 и 0020 для женщин и мужчин соответственно Оценка регрессии метода наименьших квадратов WORKING по HGC дает коэффициент наклона 0029 и 0020 для женщин и мужчин соответственно Логистическая функция F(z) и ее производная f(z) даются выражениями

izezF minus+

=1

1)( и 2)1()( z

z

eezf minus

minus

+=

где z является линейной функцией характеристик респондента На графиках (см следующую страницу) представлены вероятность наличия работы и предельное влияние HGC на вероятность наличия работы для мужчин и женщин

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 18: Эконометрика

1 Исследователь располагает данными о продолжительности обучения респондента HGC результатах теста на познавательные способности ASVABC и о продолжительности обучения матери респондента HGCM для выборки 570 индивидов Он предполагает что продолжительность обучения респондента зависит как от результатов теста на познавательные способности так и от продолжительности обучения матери респондента

uHGCMASVABCHGC +++= 21 ββα (11) и что познавательные способности в свою очередь являются функцией успехов в учебе

vHGCASVBC ++= 1δγ (12) 1a [2 балла] Объясните разницу между структурными уравнениями и уравнениями в приведенной форме в модели одновременных уравнений 1b [2 балла] Выведите приведенную форму уравнения для HGC 1c [6 баллов] Выведите выражение для смещения (для больших выборок) оценки 1δ предполагая что уравнение (12) было оценено обычным методом наименьших квадратов и определите вероятное направление смещения 1d [3 балла] Объясните почему HGCM может быть использована в качестве инструмента для HGC во втором уравнении 1e [6 баллов] Продемонстрируйте что оценка метода инструментальных переменных для

1δ использующая в качестве инструмента HGCM является состоятельной предполагая что модель корректно определена 1f [6 баллов] Предположим теперь что корректной спецификацией второго уравнения является

vHGCMHGCASVBC ++++= 21 δδγ (13) Продемонстрируйте что оценка метода инструментальных переменных для 1δ будет несостоятельной выведите смещение для случая большой выборки и установите его направление (Указание учтите что приведенная форма уравнения для HGC в этом случае изменится)

2а [8 баллов] Случайная переменная принимает два возможных значения 0 и 1 с неизвестной вероятностью p того что она равна 1 В выборке имеется всего три наблюдения первое наблюдение равно 1 второе также 1 а третье равно 0 Выведите оценку максимального правдоподобия для p Следующая информация относится к остальным вопросам этого задания Переменная WORKING определена равной 1 если респондент имеет работу и равной 0 в противном случае Для оценивания зависимости переменной WORKING от уровня образования респондента HGC (продолжительность обучения респондента) был использован метод логит-анализа Исследование было выполнено отдельно для мужчин и женщин (в приведенных ниже результатах расчетов первая таблица соответствует женщинам а вторая ndash мужчинам указание на число проведенных итераций не приводится) logit working hgc if male=0 Logit Estimates Number of obs = 2726

chi2(l) = 7042 Prob gt chi2 = 00000

Log Likelihood = ndash15865519 Pseudo R2 = 00217 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 1511872 0186177 8121 0000 1146971 1876773 cons 1 ndash1049543 2448064 ndash4287 0000 ndash1529355 ndash5697314 logit working hgc if male=1 Logit Estimates Number of obs = 2573

chi2(l) = 7503 Prob gt chi2 = 00000

Log Likelihood = ndash80265424 Pseudo R2 = 00446 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 2499295 0306482 8155 0000 1898601 3099989 cons 1 ndash9670268 ndash3775658 ndash2561 0010 ndash1707042 ndash2270113 95 процентов респондентов имеют значение HGC в диапазоне 9-18 лет со средним значением HGC равным 133 и 132 лет для женщин и мужчин соответственно Исходя из логит-анализа предельный эффект HGC на вероятность наличия работы в среднем оценивается как 0030 и 0020 для женщин и мужчин соответственно Оценка регрессии метода наименьших квадратов WORKING по HGC дает коэффициент наклона 0029 и 0020 для женщин и мужчин соответственно Логистическая функция F(z) и ее производная f(z) даются выражениями

izezF minus+

=1

1)( и 2)1()( z

z

eezf minus

minus

+=

где z является линейной функцией характеристик респондента На графиках (см следующую страницу) представлены вероятность наличия работы и предельное влияние HGC на вероятность наличия работы для мужчин и женщин

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 19: Эконометрика

2а [8 баллов] Случайная переменная принимает два возможных значения 0 и 1 с неизвестной вероятностью p того что она равна 1 В выборке имеется всего три наблюдения первое наблюдение равно 1 второе также 1 а третье равно 0 Выведите оценку максимального правдоподобия для p Следующая информация относится к остальным вопросам этого задания Переменная WORKING определена равной 1 если респондент имеет работу и равной 0 в противном случае Для оценивания зависимости переменной WORKING от уровня образования респондента HGC (продолжительность обучения респондента) был использован метод логит-анализа Исследование было выполнено отдельно для мужчин и женщин (в приведенных ниже результатах расчетов первая таблица соответствует женщинам а вторая ndash мужчинам указание на число проведенных итераций не приводится) logit working hgc if male=0 Logit Estimates Number of obs = 2726

chi2(l) = 7042 Prob gt chi2 = 00000

Log Likelihood = ndash15865519 Pseudo R2 = 00217 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 1511872 0186177 8121 0000 1146971 1876773 cons 1 ndash1049543 2448064 ndash4287 0000 ndash1529355 ndash5697314 logit working hgc if male=1 Logit Estimates Number of obs = 2573

chi2(l) = 7503 Prob gt chi2 = 00000

Log Likelihood = ndash80265424 Pseudo R2 = 00446 working Coef Std Err z P gt | z | [95 Conf Interval] hgc 1 2499295 0306482 8155 0000 1898601 3099989 cons 1 ndash9670268 ndash3775658 ndash2561 0010 ndash1707042 ndash2270113 95 процентов респондентов имеют значение HGC в диапазоне 9-18 лет со средним значением HGC равным 133 и 132 лет для женщин и мужчин соответственно Исходя из логит-анализа предельный эффект HGC на вероятность наличия работы в среднем оценивается как 0030 и 0020 для женщин и мужчин соответственно Оценка регрессии метода наименьших квадратов WORKING по HGC дает коэффициент наклона 0029 и 0020 для женщин и мужчин соответственно Логистическая функция F(z) и ее производная f(z) даются выражениями

izezF minus+

=1

1)( и 2)1()( z

z

eezf minus

minus

+=

где z является линейной функцией характеристик респондента На графиках (см следующую страницу) представлены вероятность наличия работы и предельное влияние HGC на вероятность наличия работы для мужчин и женщин

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 20: Эконометрика

Рис 1 Вероятность наличия работы как функция HGC

Рис 2 Предельное влияние HGC на вероятность наличия работы 2b [4 балла] Объясните почему логит-модель может рассматриваться как подходящая математическая спецификация для такого рода моделей 2с [3 балла] Объясните как оценивается предельное влияние продолжительности обучения на вероятность наличия работы на основе логит-регрессии 2d [3 балла] Как видно из Рис 2 предельное влияние продолжительности обучения ниже для мужчин для значительной части диапазона (HGC gt 9) Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2e [3 балла] Как можно видеть из рис 2 предельное влияние продолжительности обучения убывает с ростом HGC как для мужчин так и для женщин в диапазоне HGC gt 9 Обсудите приемлемость такого результата (указание никаких математических выкладок в этой части не требуется и баллы за них не добавляются) 2f [4 балла] Сравните оценки предельного влияния продолжительности обучения полученные с помощью логит-анализа с оценками метода наименьших квадратов

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 21: Эконометрика

3 Исследователь изучает прогностические свойства моделей регрессии по данным о затратах на образование в зависимости от времени (переменная TIME равная 1 для 1959 года) личном располагаемом доходе DPI и индексе цен на образовательные услуги 3a [2 балла] Объясните разницу между предсказанием и прогнозом применительно к рассматриваемым данным 3b [6 баллов] Исследователь строит регрессию расходов на образование по личному располагаемому доходу и индексу цен (расчеты выполнены в программе EViews 31) Dependent Variable EDUC Method Least Squares Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

R-squared 0987355 Mean dependent var 5779063Adjusted R-squared 0986483 SD dependent var 1818783SE of regression 2114590 Akaike info criterion 4424659Sum squared resid 1296733 Schwarz criterion 4562072Log likelihood -6779454 F-statistic 1132176Durbin-Watson stat 0462621 Prob(F-statistic) 0000000 Предсказание значений EDUC (переменная EDUCF) выполненное по построенной модели для четырех последующих лет дало следующие результаты

EDUCF EDUC 1991 8391171 9030000 1992 8612100 9310000 1993 8632668 9510000 1994 8815283 9700000

Результаты оценивания той же регрессии для 1959-1994 годов по методу Салкевера с фиктивными переменными d91 d92 d93 d94 определенными равными 1 только для соответствующих лет выглядят следующим образом Dependent Variable EDUC Method Least Squares Sample 1959 1994 Included observations 36

Variable Coefficient Std Error t-Statistic Prob C -1424189 2512958 -5667378 00000

DPI 0027975 0001521 1839055 00000PEDUC -0287045 0055257 -5194752 00000

D91 6388293 2396289 2665910 00124D92 6978997 2438620 2861863 00077D93 8773318 2512594 3491737 00016D94 8847170 2561074 3454477 00017

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 22: Эконометрика

R-squared 0991302 Mean dependent var 6180000Adjusted R-squared 0989503 SD dependent var 2063906SE of regression 2114590 Akaike info criterion 4508265Sum squared resid 1296733 Schwarz criterion 4816171Log likelihood -7414877 F-statistic 5508716Durbin-Watson stat 0615401 Prob(F-statistic) 0000000Dependent Variable EDUC Постройте доверительные интервалы (выбрав уровень значимости самостоятельно) для предсказания значения EDUC для 1991-1994 годов На этой основе обсудите свойства полученного предсказания 3c [4 балла] Обсудите сравнительные преимущества и недостатки различных подходов к оценке качества прогноза включая коэффициенты Тейла

)y(m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1 и

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

3d [5 баллов] Далее исследователь строит регрессию расходов на образование по времени Dependent Variable EDUC Method Least Squares Date 123002 Time 1328 Sample 1959 1990 Included observations 32

Variable Coefficient Std Error t-Statistic Prob C 2623528 1100393 2384175 00000

TIME 1912445 0058198 3286089 00000R-squared 0972969 Mean dependent var 5779063Adjusted R-squared 0972068 SD dependent var 1818783SE of regression 3039708 Akaike info criterion 5121861Sum squared resid 2771947 Schwarz criterion 5213470Log likelihood -7994978 F-statistic 1079838Durbin-Watson stat 0150184 Prob(F-statistic) 0000000 Соответствующие прогнозные значения представлены в таблице

EDUCF EDUC 1991 8934597 9030000 1992 9125841 9310000 1993 9317086 9510000 1994 9508330 9700000

Опишите процедуру построения доверительных интервалов для предсказания расходов на образование 3e [4 баллов] Объясните сущность теста Чоу на неудачу предсказания Выполните тест Чоу для множественной регрессии EDUC по переменным DPI и PEDUC учитывая что

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 23: Эконометрика

значение суммы квадратов остатков соответствующей регрессии выполненной для всего периода 1959-1994 составляет 2283452 3f [4 балла] Объясните сущность F-теста на стабильность коэффициентов Какая информация необходима для его выполнения в случае регрессии рассмотренной в пункте 3b (расчеты проводить не нужно) Приложение 2 Примеры заданий для работы в классе и домашних заданий

Задание для работы в классе 14

1 Оцените функцию спроса на жилье по набору данных для США (1959-1994гг) по первым 32 наблюдениям из выборки (то есть по данным за 1959-1990 гг) оставив последние четыре наблюдения для анализа предсказаний OUSHLG ˆ = α + β1LGDPI + β2LGPRHOUS 2 Постройте предсказание (пост-прогноз) значений LGHOUS для периода 1991-1994 гг с помощью полученного уравнения использовав действительные значения личного располагаемого дохода и относительных цен жилья в эти годы Сравните результат с фактическими значениями переменной LGHOUS рассмотрите абсолютные и относительные ошибки предсказания Также рассчитайте и сравните фактические и предсказанные абсолютные значения переменной HOUS (в млрд долл в ценах 1992 г) 3 Рассчитайте абсолютные и относительные ошибки предсказания по отдельным годам и всему периоду предсказания (для периода в целом рассмотрите показатели рассчитываемые программой Eviews - Root Mean Squared Error Mean Absolute Error Mean Absolute Percentage Error а также Bias Proportion Variance Proportion (см Help Forecasting (Single Equation)) Прокомментируйте полученные результаты 4 Рассчитайте два варианта коэффициента Тейла (U1 - см Учебник КрДоугерти U2 - см Руководство или Help к Eviews)

)y(

m1

)y - y(m1

=U2

p+T

2p+Tp+T

ΔΣ

ΔΔΣ ˆ1

ym1y

m1

)y - y(m1

=U2

p+T2

p+T

2p+Tp+T

Σ+Σ

Σ

ˆ

ˆ2

Сравните значения этих коэффициентов прокомментируйте их смысл и полученные результаты 5 Воспользуйтесь косвенным методом Салкевера для расчета предсказаний и их стандартных ошибок для логарифмической функции спроса по расходам на жилье Добавьте фиктивные переменные для последних четырех наблюдений и тем самым определите ошибки предсказания для соответствующих лет на основе регрессии оцененной по первым 32 наблюдениям Добавьте эти ошибки к фактическим исходам для получения предсказаний Постройте доверительный интервал для пост-прогнозов на 1991-1994 годы ( pTy +ˆ - tкрит times со lt yT+p lt pTy +ˆ + tкрит times со) где со - стандартная ошибка предсказания 6 Оценив логарифмическую функцию спроса для расходов на жилье для периодов 1959-

1990 и 1959-1994 годов выполните тест Чоу на неудачу предсказания

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14

Page 24: Эконометрика

1) - k - (TRSS

P)RSS - RSS( = 1) - k - TF(PT

TP+T

7 Оценив функцию спроса для расходов на жилье по данным для 1959-1994 1959-1990 и 1991-1994 годов выполните F-тест на устойчивость коэффициентов

8 Прокомментируйте результаты выполненных тестов В каких случаях полученное

предсказание может считаться удовлетворительным и в каких - нет

Домашнее задание 14 В файле Forecast_inf_rus содержатся помесячные данные для России за период август 1998г - август 2002г (файл в формате Excel находится на диске F (Teacher) в директории ECONOMETDATANEW данные взяты на сайте wwwreceporg) Это данные об обменном курсе рубльдоллар денежной массе М2 и М0 безработице инфляции

Требуется построить пост-прогноз для помесячной инфляции для России на январь-

август 2002 года Для этого требуется вначале построить некоторую регрессионную модель инфляции за предшествующий (необязательно весь) период для использования ее в нахождении предсказания (Помесячные темпы инфляции в этой модели могут зависеть например от темпов прироста денежной массы темпов изменения валютого курса динамики безработицы предшествующей инфляции и тп Если нужно используйте в модели временные лаги)

Используя построенную Вами модель инфляции для России за период

оканчивающийся декабрем 2001 года постройте предсказание темпов инфляции в период январь-август 2002 года

Оцените качество сделанного предсказания по годам и в целом Для построения

доверительных интервалов расчета и сравнения различных коэффициентов проведения статистических тестов воспользуйтесь руководством по занятию в классе 14


Recommended