Смекни!
smekni.com

Создание макроса на языке Statistica Visual Basic для проверки гипотезы о нормальности остатков регрессии (стр. 5 из 7)

Модуль MultipleRegression запускается из меню Statistics. Нажмите кнопку Variableна MultipleLinearRegression - Quicktab(Множественная линейная регрессия - Быстрая вкладка) (рис. 1) и выберите зависимую переменную (Dependentvariable) и несколько независимых переменных (Independentvariable) и затем нажмите кнопку ОК. Появится MultipleRegressionResults - диалог результатов регрессионного анализа (рис. 2). [Салманов, с. 249]


Рис. 1. Стартовая панель модуля MultipleRegression

Рис. 2. Окно результатов регрессионного анализа

Окно результатов анализа (MultipleRegressionResults) (рис. 2) имеет следующую структуру: верх окна - информационный. Он состоит из двух частей: в первой части содержится основная информация о результатах оценивания, во второй высвечиваются значимые регрессионные коэффициенты (significantbeta'sarehighlighted). Внизу окна расположены три вкладки: Quick-быстрый, Advanced-продвинутый и Residuals/assumptions/ prediction, на которыхнаходятся функциональные кнопки, позволяющие всесторонне просмотреть результаты анализа.[боровиков 136] Критерий для определения уровня статистической значимости может быть изменен в поле Alpha(значение по умолчанию 0,05) .[Салманов, с. 254]

Рассмотрим информационную часть окна. В ней содержатся краткие сведения о результатах анализа, а именно:

Dependent-имя зависимой переменной

No. of сases - число случаев, по которым построена регрессия

MultipleR - коэффициент множественной корреляции

R2 - коэффициент детерминации (квадрат коэффициента множественной корреляции)

adjustedR2 - скорректированный коэффициент детерминации

Standard error of estimate - стандартнаяошибкаоценки

Intercept - оценка свободного члена регрессии, значение коэффициента В0 в уравнении регрессии.

Std. Error- стандартная ошибка оценки свободного члена,
стандартная ошибка коэффициента В0 в уравнении регрессии.

t(df) andp-value- значение t-критерия и уровень р. t-критерий используется для проверки гипотезы о равенстве 0 свободного члена регрессии.

F - значения F-критерия.

df - число степеней свободы F-критерия.

р- уровень значимости. [боровиков 136-138]

Нажмите на Summary:Regressionresultsна вкладке Quicktab, чтобы отобразить электронную таблицу с бета-коэффициентами (рис. 3).

Рис. 3. Таблица коэффициентов уравнения регрессии и оценок их достоверности

Эта электронная таблица показывает стандартизированные бета-коэффициенты регрессии (Beta) и необработанные коэффициенты регрессии (В). Величина этих коэффициентов позволяет сравнивать относительный вклад каждой независимой переменной в предсказании зависимой переменной. Приводится также t-статистика и соответствующее значение вероятности (р) для проверки гипотезы о достоверности этих коэффициентов. [Салманов, с. 254-255]

После того как доказана адекватность модели, полученные результаты можно уверенно использовать для дальнейших действий. Анализ адекватности основывается на анализе остатков. [боровиков 139] Для анализа остатков на вкладке MultipleRegressionResults - Residuals/assumptions/predictiontabнажмите кнопку диалога ResidualAnalysis(рис. 4). [Салманов, с. 256] Здесь имеется возможность рассчитать статистику Дарбина-Уотсона, удаленные остатки, доверительные интервалы для предсказанных значений и многие другие статистики. Широкие возможности анализа остатков и выбросов включают многочисленные типы графиков, диаграмм рассеяния, гистограмм, графики на нормальной и полунормальной вероятностной бумаге и др.[exponenta.ru]

Рис. 4. Окно анализа остатков

Однако можно также применять все аналитические средства STATISTICA, чтобы далее исследовать остатки, создав автономную входную электронную таблицу остатков. [Салманов, с. 261]


3. СОЗДАНИЕ МАКРОСА ДЛЯ ПРОВЕРКИ ГИПОТЕЗЫ О НОРМАЛЬНОСТИ ОСТАТКОВ

3.1 Описание макроса

При построении модели множественной линейной регрессии особое внимание необходимо уделять проверке гипотезы о нормальном распределении остатков. Это связано с тем, что в условиях нормального распределения остатков оценки параметров модели, построенные методом наименьших квадратов, являются оптимальными. Если распределение отличается от нормального, то свойство оптимальности может быть утрачено. Например, в данных могут быть резко выделяющиеся наблюдения (выбросы), а метод наименьших квадратов чувствителен к выбросам.

В данной курсовой работе осуществлялось эконометрическое моделирование вторичного рынка жилья в г. Минске с использованием статистического пакета Statistica 6.0., обладающего широкими возможностями для построения регрессионных моделей. Пакет Statistica 6.0. содержит встроенный язык программирования VBA, позволяющий создавать дополнительные модули для статистического анализа.

В ходе выполнения множественного регрессионного анализа в модуле MultipleRegression исследование остатков на нормальность можно осуществить лишь графическими методами с использованием нормальных графиков вероятности, доступных из диалога ResidualAnalysis. Однако на основании графической информации можно сделать лишь предположение о виде распределения остатков. Для проверки остатков на соответствие их нормальному распределению необходимо создать автономную входную электронную таблицу остатков, а затем вызвать модуль DistributionFitting (Подбор распределения). Нажав кнопку Graph, мы получим результаты применения критерия хи-квадрат, а также гистограмму с проведенной на ней предполагаемой нормальной кривой, на основании которых можно сделать вывод о виде распределения остатков.

Таким образом, при осуществлении множественного регрессионного анализа в пакете Statistica 6.0. необходимо использовать 2 отдельных модуля (MultipleRegression и DistributionFitting), создавая при этом дополнительную входную электронную таблицу остатков, что требует значительных затрат времени.

Для решения всех вышеперечисленных проблем на языке VBA было написано 2 модуля. Первый модуль (CREATE_MACROS) создает пользовательскую панель инструментов (Приложение Б), а второй (regres-normal) - автоматизирует процесс проверки гипотезы о нормальности остатков регрессии (Приложение А).

После запуска программы CREATE_MACROS, новая панель инструментов CUSTOM будет добавлена к существующей инсталляционной версии STATISTICA. Созданная панель инструментов состоит из 1 главного элемента - кнопки «Нормальность остатков». Чтобы удалить новый элемент панели инструментов, выберите Настройка (Customize) из менюСервис (Tools) для отображения диалога Настройка (Customize). На вкладке Панели инструментов (Toolbarstab), подсветите новый элемент и Удалите (Delete) его (рис. 1.1).

Рис. 1.1. Удаление пользовательской панели инструментов


Для запуска модуля regres-normal необходимо нажать кнопку “Нормальность остатков” на панели инструментов (рис. 1), после чего появится диалог MultipleRegression.ResidualAnalysis(рис. 2). Критерий для определения уровня статистической значимости может быть изменен в поле Alpha (значение по умолчанию 0,05). При нажатии кнопки Variablesотобразится диалог Selectdependentandindependentvariablelists(рис. 3) для выбора зависимой и списка независимых переменных. После нажатия кнопки OKна экране появятся результаты выполнения программы (рис.4).

Рис. 1. Кнопка “Нормальностьостатков” для запуска модуля

Рис. 2. Стартовая панель модуля

Рис. 3. Окно выбора переменных для анализа


Рис.4. Результаты выполнения программы

Программа вычисляет следующий набор статистик:

1. Таблицы результатов оценивания регрессионной модели. Они содержат значения коэффициентов модели (В), бета-коэффициенты (Beta), их стандартные ошибки, значения критерия Стьюдента для проверки гипотезы о достоверности этих коэффициентов (

и
), коэффициенты корреляции R и детерминации R2, значение критерия Фишера (F, p) для проверки гипотезы о достоверности R и другое.

2. Таблицу результатов анализа остатков, содержащую наблюдаемые (ObservedValue) и предсказанные по модели (PredictedValue) значения зависимой переменной, остатки (Residual) и другое.